Tradingkey - Ngày 28/5, Anthropic đã ra mắt mô hình AI chủ lực mới nhất Claude Opus 4.8, phiên bản nâng cấp từ sản phẩm hàng đầu Opus 4.7 của hãng.
Theo dữ liệu chính thức từ Anthropic, Opus 4.8 đạt hiệu suất vượt trội trong nhiều bài kiểm tra chuẩn (benchmark) tổng hợp chuyên biệt cho AI, vượt qua cả ChatGPT-5.5 của OpenAI và Gemini 3.1 Pro của Google (GOOGL).
Về độ tin cậy của mô hình, Anthropic cho biết mô hình tiền Opus 4,8 "trung thực" hơn: nó đã giảm đáng kể xác suất đưa ra thông tin sai lệch như một sự thật khi thiếu các thông tin hỗ trợ đầy đủ. Khi mô hình phát hiện "sự không chắc chắn trong chính công việc của mình", nó sẽ chủ động thông báo cho người dùng, đồng thời giảm đáng kể việc đưa ra các khẳng định không có căn cứ.
Ngoài các nâng cấp mô hình cốt lõi, Anthropic đã ra mắt các tính năng mới trên toàn bộ bộ sản phẩm của mình. Những tính năng này bao gồm khả năng quy trình làm việc năng động, có thể đồng thời huy động hàng trăm tác nhân phụ nhỏ để cộng tác và đưa ra kết quả cuối cùng.
Về kiểm soát chi phí và hiệu quả, các tính năng mới cho phép người dùng điều chỉnh "mức độ tham gia" của Claude khi thực hiện nhiệm vụ, từ đó giảm thời gian hoặc chi phí dành cho các chức năng cụ thể.
Chẳng hạn, trong các trình duyệt và Claude Cowork, người dùng có thể điều chỉnh linh hoạt để cho phép AI tăng mức độ tham gia đối với các hoạt động yêu cầu tư duy sâu, đồng thời giảm mức độ tham gia đối với các tác vụ cần hoàn thành nhanh chóng. Mức độ tham gia thấp hơn này sẽ trực tiếp làm giảm số lượng token mà người dùng tiêu thụ trong các lần trò chuyện với AI và xem lại hội thoại.
Về tính sẵn có và giá thị trường, mức giá cho người dùng thông thường vẫn nhất quán với Opus 4,7, ở mức 5 USD trên mỗi triệu token đầu vào và 25 USD trên mỗi triệu token đầu ra. Ngoài ra, chế độ Fast mode có giá 10 USD trên mỗi triệu token đầu vào và 50 USD trên mỗi triệu token đầu ra.