Anthropic và OpenAI vừa mở ra một “mặt trận” mới trong cuộc ganh đua của mình khi cùng nhắm đến lĩnh vực nghiên cứu khoa học. Vào ngày thứ Ba, Anthropic chính thức giới thiệu Claude Science – một nền tảng AI hỗ trợ công việc nghiên cứu; còn OpenAI tung ra GeneBench-Pro – bộ tiêu chuẩn đánh giá AI cho lĩnh vực sinh học tính toán.
Việc ra mắt các sản phẩm cùng ngày đã đưa cuộc đua AI vượt xa các chatbot hay công cụ lập trình, tiến vào cả phòng thí nghiệm. Một bên công bố công cụ mà các nhà khoa học có thể ứng dụng ngay hôm nay, bên còn lại tạo ra thước đo để kiểm tra mức độ tiến bộ của công nghệ hiện tại.
Claude Science tổng hợp các cơ sở dữ liệu, mã nguồn cũng như sức mạnh tính toán mà các nhà khoa học cần để nghiên cứu vào chung một ứng dụng duy nhất. Ứng dụng này kết nối hơn 60 cơ sở dữ liệu khoa học thuộc các lĩnh vực như genomics (giải mã gen), proteomics (nghiên cứu protein) và cheminformatics (tin học hóa học).
Introducing Claude Science, a new app designed with every stage of research in mind. Artifacts traced to their code, environments managed on demand, and 60+ optional scientific databases that you can connect.Available now in beta. pic.twitter.com/HKhLknxLJO
— Claude (@claudeai) June 30, 2026
Claude Science chỉ là một ứng dụng, không phải một mô hình AI mới. Sản phẩm ra mắt trong khi hai mô hình mạnh nhất của Anthropic là Fable 5 và Mythos 5 vẫn còn bị giới hạn theo quy định xuất khẩu của Mỹ. Mọi kết quả do ứng dụng tạo ra đều có thể kiểm chứng và truy vết ngược về đoạn mã đã sinh ra kết quả đó.
Bộ công cụ này là sự tiếp nối cho hướng phát triển về khoa học đời sống mà Anthropic đã khởi xướng từ tháng 10/2025. Trong giai đoạn thử nghiệm, ông Jérôme Lecoq tại Viện Allen cho biết Claude Science giúp rút ngắn quá trình tổng hợp các bài đánh giá khoa học từ tận hai năm xuống chỉ còn vài tháng.
Anthropic cũng sẽ hỗ trợ tối đa 50 dự án nghiên cứu, với mỗi dự án nhận được khoản ngân sách lên tới 30,000 USD dưới dạng tín dụng sử dụng nền tảng.
Ngay sau khi Claude Science của Anthropic được công bố, OpenAI cũng ra mắt GeneBench-Pro, nhằm kiểm tra khả năng đánh giá và suy luận của các mô hình AI trước những thách thức trong nghiên cứu sinh học thực tiễn.
We’re introducing GeneBench-Pro, a research-level benchmark for a harder kind of AI progress: how well agents can navigate messy biological data, choose the right analysis path, and make judgment calls that real computational research depends on.https://t.co/AsilnnSxnE
— OpenAI (@OpenAI) June 30, 2026
Bộ tiêu chuẩn này bao gồm 129 vấn đề thuộc các lĩnh vực như genomics, sinh học định lượng và y học chuyển giao.
Mô hình mạnh nhất của OpenAI là GPT-5.6 Sol có thể giải được 28.7% số bài toán ở cấp độ suy luận cao nhất, và đạt 31.5% khi ở chế độ Pro. Trước đó, việc phát hành GPT-5.6 theo từng giai đoạn cũng diễn ra theo yêu cầu từ Washington.
GPT-5 từng đạt dưới 5% với phiên bản GeneBench đầu tiên, trong khi Opus 4.8 của Anthropic đạt được 16% ở bài kiểm tra khó hơn rất nhiều này.
Theo dõi chúng tôi trên X để không bỏ lỡ tin tức mới nhất
Sự khác biệt cho thấy hai hướng tiếp cận nhưng cùng chung mục tiêu. Anthropic hướng đến việc tạo ra sản phẩm hữu ích để các nhà khoa học ứng dụng hàng ngày, còn OpenAI tập trung phát triển công cụ để đo lường khả năng suy luận của AI với dữ liệu phức tạp, thiếu rõ ràng.
Cả hai sản phẩm đều ra mắt trong bối cảnh các mô hình AI từ Trung Quốc đang tiến bộ nhanh trong lĩnh vực nghiên cứu. Tuy vậy, số liệu do chính OpenAI công bố cho thấy mô hình tốt nhất vẫn thất bại trong phần lớn các bài kiểm tra GeneBench-Pro.
Áp lực cạnh tranh vừa đến từ địa chính trị, vừa đến từ lĩnh vực khoa học. Các quy định hạn chế xuất khẩu của Mỹ còn khiến Anthropic phải cân nhắc tìm địa điểm đặt máy chủ mới ở nước ngoài cho các mô hình của mình.
Các chuyên gia đánh giá rằng, với mỗi vấn đề thuộc GeneBench-Pro, người chuyên môn phải mất từ 20 đến 40 tiếng làm việc, chi phí lên đến hàng ngàn USD. Trong khi đó, OpenAI cho biết mô hình của họ chỉ mất vài USD cho một lần phân tích tương tự.
Ông Aubrey de Grey – chuyên gia về lão hóa sinh học – tin rằng AI sẽ giúp loại bỏ nhiều nút thắt lớn trong nghiên cứu, dù những đột phá diện rộng vẫn còn cần thêm thời gian.
“Chúng ta sẽ sớm chứng kiến AI loại bỏ các khâu chậm trễ nhất của quy trình nghiên cứu, đặc biệt là phát triển thuốc – những thứ trước đây thường khiến toàn bộ quá trình bị trì hoãn,” ông Aubrey de Grey – Chủ tịch kiêm Giám đốc Khoa học của Tổ chức Longevity Escape Velocity Foundation chia sẻ trong một tập podcast với BeInCrypto.
Tuy nhiên, ông de Grey nhấn mạnh rằng, việc chuyển đổi nghiên cứu nhanh chóng thành những phương pháp điều trị được cấp phép vẫn phải phụ thuộc vào quy trình quản lý và sự chấp nhận rủi ro nơi công chúng.
Một số chuyên gia cho rằng quá trình thay đổi này đã bắt đầu rất rõ rệt. Giáo sư Derya Unutmaz (chuyên về miễn dịch học) chia sẻ trong cùng buổi toạ đàm BeInCrypto rằng AI hiện nay còn chính xác hơn cả những đánh giá của chính ông dựa trên kinh nghiệm 35 năm.
“Cá nhân tôi tin tưởng AI hơn là ý tưởng chuyên môn của bản thân – dù đã có hơn 35 năm trong nghề.”
Ông cho rằng sự phụ thuộc vào AI này sẽ xuất hiện phổ biến trong y học thực hành thời gian tới.
“Chẳng dùng AI trong y khoa không chỉ là không đúng về mặt đạo đức mà tôi tin rằng sắp tới, điều này còn bị coi là lạm dụng nghề nghiệp.”
Dù vậy, sự lạc quan này vẫn đi trước thực tế về các tiêu chuẩn đánh giá. Những tháng tới sẽ trả lời liệu cộng đồng khoa học có thực sự áp dụng các công cụ AI này rộng rãi, và liệu kết quả của GeneBench-Pro có được cải thiện hay không.