Anthropic cho biết, quá trình kiểm tra nội bộ cho thấy Claude Fable 5 không gây ra rủi ro an ninh mạng nào đặc biệt, và Claude Mythos 5 sẽ quay lại toàn cầu vào ngày 02/07/2024.
Thông báo này được đưa ra cùng lúc với sự trở lại của Fable 5 trên toàn thế giới, sau 18 ngày tạm dừng do lệnh kiểm soát xuất khẩu của Mỹ vào ngày 12/06/2024. Anthropic đã kiểm tra các mô hình đối thủ để đánh giá thực sự mức độ nguy hiểm dẫn tới lệnh hạn chế này.
Fable 5 và Mythos 5 được ra mắt vào ngày 09/06/2024, sử dụng cùng một mô hình cốt lõi nhưng Fable 5 thì mở rộng cho cộng đồng, còn Mythos 5 chỉ giới hạn cho một số đối tác tin cậy trong dự án Project Glasswing với mục đích phòng thủ an ninh mạng.
Lệnh kiểm soát xuất khẩu được ban hành sau khi các nhà nghiên cứu của Amazon tìm ra cách vượt qua các lớp bảo vệ của Fable 5. Kỹ thuật này đã khiến mô hình xác định được các điểm yếu phần mềm và thậm chí còn thể hiện một exploit thực tế trong một số trường hợp.
Claude Fable 5 will be available again globally tomorrow.After a series of productive conversations with the US government, we're redeploying the model with a new set of classifiers to target and block more cybersecurity tasks. In the near term, some routine tasks like coding…
— Anthropic (@AnthropicAI) July 1, 2026
Kết quả kiểm tra của Anthropic cho thấy, Claude Opus 4.8, GPT-5.5 và Kimi K2.7 cũng có thể phát hiện được các lỗ hổng mà Fable 5 từng phát hiện như trong báo cáo của Amazon. Tất cả các mô hình được kiểm tra đều có thể tái hiện lại cách khai thác lỗ hổng đó.
Điều này cho thấy lệnh kiểm soát thực chất nhắm đến một vấn đề chung trong ngành AI chứ không riêng với Fable 5. Tuy nhiên, Anthropic vẫn phát triển bộ lọc mạnh hơn để ngăn chặn kỹ thuật này, và hiện tại bộ lọc này còn kiểm tra gắt gao hơn với cả các yêu cầu lập trình và debug thông thường.
Fable 5 được Anthropic tích hợp biện pháp bảo vệ an toàn cao nhất từ trước đến nay. Bộ lọc này sẽ tự động chặn những yêu cầu chỉ cần có yếu tố rủi ro, không chỉ giới hạn với những yêu cầu rõ ràng là nguy hiểm. Sau khi có báo cáo của Amazon, bộ lọc mới đã được huấn luyện để chặn thủ thuật vượt bảo vệ trên hơn 99% số trường hợp, theo công bố từ Anthropic. Các yêu cầu bị chặn giờ đây sẽ tự động chuyển sang Opus 4.8 xử lý.
Tuy nhiên, việc tăng cường bảo vệ này cũng gây ảnh hưởng nhất định. Anthropic thừa nhận rằng bộ lọc có thể đánh dấu nhầm cả những yêu cầu lập trình và sửa lỗi vô hại, và cho biết sẽ tiếp tục điều chỉnh để giảm các trường hợp cảnh báo nhầm. Mythos 5, với số lượng biện pháp bảo vệ ít hơn, chỉ được mở lại cho các tổ chức đã được chính phủ phê duyệt vào ngày 26/06/2024.
Dữ liệu của chính Anthropic lại đặt ra một câu hỏi lớn hơn: Nếu những mô hình kém mạnh hơn đã có thể làm được điều mà Fable 5 từng bị cấm, thì tiêu chuẩn gì sẽ được các cơ quan quản lý áp dụng mỗi khi một mô hình AI tiên tiến mới được ra mắt?