Anthropic và OpenAI mang cuộc chiến AI vào lĩnh vực nghiên cứu khoa học

Nguồn Beincrypto

Anthropic và OpenAI vừa mở ra một “mặt trận” mới trong cuộc ganh đua của mình khi cùng nhắm đến lĩnh vực nghiên cứu khoa học. Vào ngày thứ Ba, Anthropic chính thức giới thiệu Claude Science – một nền tảng AI hỗ trợ công việc nghiên cứu; còn OpenAI tung ra GeneBench-Pro – bộ tiêu chuẩn đánh giá AI cho lĩnh vực sinh học tính toán.

Việc ra mắt các sản phẩm cùng ngày đã đưa cuộc đua AI vượt xa các chatbot hay công cụ lập trình, tiến vào cả phòng thí nghiệm. Một bên công bố công cụ mà các nhà khoa học có thể ứng dụng ngay hôm nay, bên còn lại tạo ra thước đo để kiểm tra mức độ tiến bộ của công nghệ hiện tại.

Claude Science của Anthropic làm được gì

Claude Science tổng hợp các cơ sở dữ liệu, mã nguồn cũng như sức mạnh tính toán mà các nhà khoa học cần để nghiên cứu vào chung một ứng dụng duy nhất. Ứng dụng này kết nối hơn 60 cơ sở dữ liệu khoa học thuộc các lĩnh vực như genomics (giải mã gen), proteomics (nghiên cứu protein) và cheminformatics (tin học hóa học).

Claude Science chỉ là một ứng dụng, không phải một mô hình AI mới. Sản phẩm ra mắt trong khi hai mô hình mạnh nhất của Anthropic là Fable 5 và Mythos 5 vẫn còn bị giới hạn theo quy định xuất khẩu của Mỹ. Mọi kết quả do ứng dụng tạo ra đều có thể kiểm chứng và truy vết ngược về đoạn mã đã sinh ra kết quả đó.

Bộ công cụ này là sự tiếp nối cho hướng phát triển về khoa học đời sống mà Anthropic đã khởi xướng từ tháng 10/2025. Trong giai đoạn thử nghiệm, ông Jérôme Lecoq tại Viện Allen cho biết Claude Science giúp rút ngắn quá trình tổng hợp các bài đánh giá khoa học từ tận hai năm xuống chỉ còn vài tháng.

Anthropic cũng sẽ hỗ trợ tối đa 50 dự án nghiên cứu, với mỗi dự án nhận được khoản ngân sách lên tới 30,000 USD dưới dạng tín dụng sử dụng nền tảng.

GeneBench-Pro của OpenAI đặt ra tiêu chuẩn mới

Ngay sau khi Claude Science của Anthropic được công bố, OpenAI cũng ra mắt GeneBench-Pro, nhằm kiểm tra khả năng đánh giá và suy luận của các mô hình AI trước những thách thức trong nghiên cứu sinh học thực tiễn.

Bộ tiêu chuẩn này bao gồm 129 vấn đề thuộc các lĩnh vực như genomics, sinh học định lượng và y học chuyển giao.

Mô hình mạnh nhất của OpenAI là GPT-5.6 Sol có thể giải được 28.7% số bài toán ở cấp độ suy luận cao nhất, và đạt 31.5% khi ở chế độ Pro. Trước đó, việc phát hành GPT-5.6 theo từng giai đoạn cũng diễn ra theo yêu cầu từ Washington.

GPT-5 từng đạt dưới 5% với phiên bản GeneBench đầu tiên, trong khi Opus 4.8 của Anthropic đạt được 16% ở bài kiểm tra khó hơn rất nhiều này.

Theo dõi chúng tôi trên X để không bỏ lỡ tin tức mới nhất

Hai chiến lược, chung một cuộc đua

Sự khác biệt cho thấy hai hướng tiếp cận nhưng cùng chung mục tiêu. Anthropic hướng đến việc tạo ra sản phẩm hữu ích để các nhà khoa học ứng dụng hàng ngày, còn OpenAI tập trung phát triển công cụ để đo lường khả năng suy luận của AI với dữ liệu phức tạp, thiếu rõ ràng.

Cả hai sản phẩm đều ra mắt trong bối cảnh các mô hình AI từ Trung Quốc đang tiến bộ nhanh trong lĩnh vực nghiên cứu. Tuy vậy, số liệu do chính OpenAI công bố cho thấy mô hình tốt nhất vẫn thất bại trong phần lớn các bài kiểm tra GeneBench-Pro.

Áp lực cạnh tranh vừa đến từ địa chính trị, vừa đến từ lĩnh vực khoa học. Các quy định hạn chế xuất khẩu của Mỹ còn khiến Anthropic phải cân nhắc tìm địa điểm đặt máy chủ mới ở nước ngoài cho các mô hình của mình.

Các chuyên gia đánh giá rằng, với mỗi vấn đề thuộc GeneBench-Pro, người chuyên môn phải mất từ 20 đến 40 tiếng làm việc, chi phí lên đến hàng ngàn USD. Trong khi đó, OpenAI cho biết mô hình của họ chỉ mất vài USD cho một lần phân tích tương tự.

Ông Aubrey de Grey – chuyên gia về lão hóa sinh học – tin rằng AI sẽ giúp loại bỏ nhiều nút thắt lớn trong nghiên cứu, dù những đột phá diện rộng vẫn còn cần thêm thời gian.

“Chúng ta sẽ sớm chứng kiến AI loại bỏ các khâu chậm trễ nhất của quy trình nghiên cứu, đặc biệt là phát triển thuốc – những thứ trước đây thường khiến toàn bộ quá trình bị trì hoãn,” ông Aubrey de Grey – Chủ tịch kiêm Giám đốc Khoa học của Tổ chức Longevity Escape Velocity Foundation chia sẻ trong một tập podcast với BeInCrypto.

Tuy nhiên, ông de Grey nhấn mạnh rằng, việc chuyển đổi nghiên cứu nhanh chóng thành những phương pháp điều trị được cấp phép vẫn phải phụ thuộc vào quy trình quản lý và sự chấp nhận rủi ro nơi công chúng.

Các nhà khoa học kỳ vọng AI được áp dụng nhanh hơn

Một số chuyên gia cho rằng quá trình thay đổi này đã bắt đầu rất rõ rệt. Giáo sư Derya Unutmaz (chuyên về miễn dịch học) chia sẻ trong cùng buổi toạ đàm BeInCrypto rằng AI hiện nay còn chính xác hơn cả những đánh giá của chính ông dựa trên kinh nghiệm 35 năm.

“Cá nhân tôi tin tưởng AI hơn là ý tưởng chuyên môn của bản thân – dù đã có hơn 35 năm trong nghề.”

Ông cho rằng sự phụ thuộc vào AI này sẽ xuất hiện phổ biến trong y học thực hành thời gian tới.

“Chẳng dùng AI trong y khoa không chỉ là không đúng về mặt đạo đức mà tôi tin rằng sắp tới, điều này còn bị coi là lạm dụng nghề nghiệp.”

Dù vậy, sự lạc quan này vẫn đi trước thực tế về các tiêu chuẩn đánh giá. Những tháng tới sẽ trả lời liệu cộng đồng khoa học có thực sự áp dụng các công cụ AI này rộng rãi, và liệu kết quả của GeneBench-Pro có được cải thiện hay không.

Tuyên bố miễn trừ trách nhiệm: Chỉ dành cho mục đích thông tin. Hiệu suất trong quá khứ không đảm bảo cho kết quả trong tương lai.
placeholder
Dự báo Bảng lương Phi nông nghiệp tháng 6: Liệu Cố vấn Kinh tế Nhà Trắng đã đưa ra gợi ý sớm? Chứng khoán Mỹ, đồng USD và vàng sẽ phản ứng ra sao?Khi tháng 6 dần khép lại, sự chú ý của thị trường đang chuyển hướng sang báo cáo bảng lương phi nông nghiệp tháng 6 sắp tới của Mỹ, dự kiến công bố vào thứ Năm tuần này (ngày 2/7). Dữ liệ
Tác giả  TradingKey
12 giờ trước
Khi tháng 6 dần khép lại, sự chú ý của thị trường đang chuyển hướng sang báo cáo bảng lương phi nông nghiệp tháng 6 sắp tới của Mỹ, dự kiến công bố vào thứ Năm tuần này (ngày 2/7). Dữ liệ
placeholder
Tin nóng: Đồng yên Nhật lao dốc xuống dưới 162,00, mức thấp mới trong bốn thập kỷ so với USDCặp USD/JPY tăng vọt vượt qua ngưỡng tâm lý quan trọng 162,00, đạt mức cao mới trong bốn thập kỷ trong phiên giao dịch châu Á vào thứ Ba. Tuy nhiên, kỳ vọng về một sự can thiệp có thể từ các nhà chức trách Nhật Bản hạn chế đà tăng tiếp theo.
Tác giả  FXStreet
19 giờ trước
Cặp USD/JPY tăng vọt vượt qua ngưỡng tâm lý quan trọng 162,00, đạt mức cao mới trong bốn thập kỷ trong phiên giao dịch châu Á vào thứ Ba. Tuy nhiên, kỳ vọng về một sự can thiệp có thể từ các nhà chức trách Nhật Bản hạn chế đà tăng tiếp theo.
placeholder
Katayama của Nhật Bản: Sẽ phản ứng phù hợp với biến động tiền tệ bất cứ lúc nào khi cần thiếtBộ trưởng Tài chính Nhật Bản Satsuki Katayama cho biết vào thứ Ba rằng chính phủ của bà “sẽ phản ứng thích hợp với các biến động tiền tệ bất cứ lúc nào khi cần thiết”
Tác giả  FXStreet
19 giờ trước
Bộ trưởng Tài chính Nhật Bản Satsuki Katayama cho biết vào thứ Ba rằng chính phủ của bà “sẽ phản ứng thích hợp với các biến động tiền tệ bất cứ lúc nào khi cần thiết”
placeholder
WTI giảm xuống dưới mức 70,00$ do bất ổn trong đàm phán ngừng bắn Mỹ-IranGiá dầu thô Mỹ West Texas Intermediate (WTI), chỉ số chuẩn dầu thô của Mỹ, đang giao dịch quanh mức 69,80$ trong đầu phiên giao dịch châu Âu vào thứ Hai. Giá WTI giảm do sự không chắc chắn xung quanh các cuộc đàm phán Mỹ-Iran.
Tác giả  FXStreet
Hôm qua 08: 39
Giá dầu thô Mỹ West Texas Intermediate (WTI), chỉ số chuẩn dầu thô của Mỹ, đang giao dịch quanh mức 69,80$ trong đầu phiên giao dịch châu Âu vào thứ Hai. Giá WTI giảm do sự không chắc chắn xung quanh các cuộc đàm phán Mỹ-Iran.
placeholder
Vàng giảm gần 4.050$ giữa bối cảnh không chắc chắn trong các cuộc đàm phán Mỹ - IranGiá vàng (XAU/USD) thu hút một số người bán quanh mức 4.060$ trong giờ giao dịch châu Á vào thứ Hai. Kim loại quý giảm giá trong bối cảnh bất ổn xoay quanh các cuộc đàm phán Mỹ-Iran và kỳ vọng diều hâu của Cục Dự trữ Liên bang Mỹ (Fed). Dữ liệu Bảng lương phi nông nghiệp (NFP) của Mỹ sẽ là tâm điểm vào cuối ngày thứ Năm.
Tác giả  FXStreet
Hôm qua 02: 31
Giá vàng (XAU/USD) thu hút một số người bán quanh mức 4.060$ trong giờ giao dịch châu Á vào thứ Hai. Kim loại quý giảm giá trong bối cảnh bất ổn xoay quanh các cuộc đàm phán Mỹ-Iran và kỳ vọng diều hâu của Cục Dự trữ Liên bang Mỹ (Fed). Dữ liệu Bảng lương phi nông nghiệp (NFP) của Mỹ sẽ là tâm điểm vào cuối ngày thứ Năm.
goTop
quote