Theo tài liệu chính thức về việc ngừng phát hành mô hình của Anthropic, Claude Haiku 3 (model ID: claude-3-haiku-20240307) đã chính thức ngừng cung cấp dịch vụ vào ngày 19/4/2026. Sau ngày này, mọi yêu cầu API tới mô hình đó sẽ trả về lỗi trực tiếp; Anthropic sẽ không tự động chuyển hướng lưu lượng sang phiên bản mới, và các nhà phát triển phải chủ động cập nhật model ID trong mã nguồn lên Haiku 4.5. Đây là sự kiện chấm dứt vòng đời đầu tiên của một mô hình Claude quy mô lớn trong năm nay.
Phạm vi ảnh hưởng chủ yếu nhắm vào các ứng dụng nhẹ
Claude Haiku 3 được ra mắt vào tháng 3/2024, là mô hình rẻ nhất và nhanh nhất của Anthropic thời điểm đó, được sử dụng rộng rãi cho các tác vụ tần suất cao nhưng nhẹ như bot chăm sóc khách hàng, tóm tắt, phân loại, kiểm duyệt nội dung. Đến hôm nay, sau hai năm, nhiều SaaS cỡ vừa và nhỏ và các công cụ nội bộ vẫn đang dùng mô hình này, vì prompt và chi phí đã được tinh chỉnh sâu; việc thay thế cần phải chạy lại QA. Thời gian thông báo ngừng dịch của đợt này đã bắt đầu từ tháng 2; Anthropic đã gửi ít nhất 60 ngày thông báo trước cho tất cả khách hàng theo hợp đồng doanh nghiệp thông qua thông báo chính thức, email và cảnh báo trên dashboard.
Hai thay đổi mang tính phá vỡ khi chuyển sang Haiku 4.5
Phương án thay thế mà phía chính thức khuyến nghị là Claude Haiku 4.5, nhưng việc di chuyển không chỉ là sửa một chuỗi ký tự. Nhà phát triển cần lưu ý hai thay đổi mang tính phá vỡ: một là hai tham số lấy mẫu temperature và top_p hiện chỉ cho phép chọn một trong hai; nếu mã nguồn hiện có đã đặt rõ ràng cả hai giá trị, API của Anthropic sẽ trả về lỗi; hai là Haiku 4.5 bổ sung refusal stop reason, khi mô hình từ chối phản hồi sẽ trả về dấu ấn này, thay vì như Haiku 3 trực tiếp báo error hoặc trả về placeholder — mã sản phẩm phải xử lý refusal như một nhánh đường đi bình thường.
Ngoài ra, tranh cãi về việc hóa đơn tăng ngầm do thay đổi tokenizer của Opus 4.7 tuần trước cũng có thể áp dụng cho Haiku 4.5 — dù rate card hiển thị giá per-token thấp hơn, mức tiêu thụ token cho các tác vụ nghiệp vụ thực tế có thể khác đi do tokenizer không giống nhau; khuyến nghị mọi kế hoạch di chuyển nên đo thực nghiệm đối chiếu chi phí vào đúng ngày chuyển đổi.
Quản lý vòng đời mô hình AI trở thành bài học bắt buộc đối với doanh nghiệp
Lời nhắc ngừng dịch lần này phản ánh một thay đổi mang tính cấu trúc trong hạ tầng AI doanh nghiệp: LLM đã chuyển từ giai đoạn “mua một lần” sang “quản lý phiên bản liên tục”, tương tự như dịch vụ đám mây và hệ điều hành. Trang deprecation chính thức của Anthropic cũng dự báo rằng Claude Opus 4 và Sonnet 4 sẽ ngừng vào ngày 15/6/2026, do đó tiến độ dày đặc. Các điều khoản mua AI của doanh nghiệp nên bổ sung các mục hợp đồng như “thời gian hỗ trợ tối thiểu”, “mô hình thay thế có sẵn tự động”, “hỗ trợ chi phí cho thử nghiệm di chuyển”, v.v.; nếu không, dịch vụ sản xuất có thể bị gián đoạn do mô hình bị loại bỏ.
Khuyến nghị hành động cho nhà phát triển Đài Loan và đội ngũ SaaS
Ba hành động ngay lập tức: thứ nhất, tìm kiếm tất cả kho mã và tệp cấu hình, thay claude-3-haiku-20240307 bằng claude-haiku-4-5; thứ hai, kiểm tra xem trong lệnh gọi API có đặt đồng thời temperature và top_p hay không, giữ lại chỉ một; thứ ba, trong handler bổ sung nhánh xử lý cho refusal stop reason, tránh lỗi ngoài ý muốn hiển thị cho người dùng (user-facing). Đối với các tổ chức có hợp đồng doanh nghiệp tính phí theo mức sử dụng, việc theo dõi biến động tiêu thụ token trong tuần chuyển đổi cũng là cần thiết, để tránh chi phí vượt dự kiến do khác biệt tokenizer.
Bài viết này: Claude Haiku 3 chính thức ngừng vào 4/19 — Anthropic buộc phải di chuyển sang Haiku 4.5, nhà phát triển cần thay model ID và thiết lập tham số. Xuất hiện sớm nhất tại 鏈新聞 ABMedia.
Bài viết liên quan
Báo cáo mới nhất của A16z: Tại sao blockchain là mảnh hạ tầng còn thiếu đối với các tác nhân AI?
Moonshot AI Ra mắt Kimi K2.6 với Năng lực Nâng cao về Lập trình và Agent
Optiver nắm giữ cổ phần tại Eden Block, quỹ VC tập trung vào Crypto và AI
Cerebras Nộp Lại Hồ Sơ IPO Nasdaq Sau Khi Vượt Qua Rà Soát An Ninh Quốc Gia Liên Quan Đến Quan Hệ Với UAE
OpenAI Sắp Phát Hành Mô Hình Hình Ảnh Mới Với Khả Năng Nâng Cao Trong Vài Tuần Tới
Kevin Warsh là người được đề cử đầu tiên cho chức Chủ tịch Cục Dự trữ Liên bang (Fed) với danh xưng “Tech Bro”: phe lạc quan về AI, nắm giữ cổ phần của SpaceX và Polymarket