Thứ Tư, Tháng 6 18, 2025

Claude 3.7 Sonnet của Anthropic nhắm vào OpenAI và DeepSeek trong trận chiến lớn kế tiếp của AI

Anthropic vừa tung “cảnh báo” đến OpenAI, DeepSeek và toàn ngành AI bằng việc ra mắt Claude 3.7 Sonnet, một mô hình cho phép người dùng kiểm soát mức độ “suy nghĩ” của AI trước khi sinh phản hồi. Cùng với đó, công ty cũng giới thiệu Claude Code, một tác tử mã lệnh AI. Đây là động thái thể hiện quyết tâm mạnh mẽ của Anthropic nhằm tấn công thị trường AI doanh nghiệp — bước đi có thể tái định hình cách các công ty xây dựng phần mềm và tự động hóa công việc.

Cạnh tranh đang trở nên khốc liệt. Tháng trước, DeepSeek gây chấn động khi tung ra một mô hình AI có khả năng tương đương hệ thống của Mỹ nhưng với chi phí thấp hơn nhiều, khiến giá cổ phiếu Nvidia giảm 17%, dấy lên lo ngại về vị thế dẫn đầu của Mỹ trong lĩnh vực AI. Giờ đây, Anthropic đặt cược rằng khả năng kiểm soát chính xác mức suy luận của AI — chứ không chỉ chạy nhanh hay tiết kiệm chi phí — sẽ giúp họ chiếm ưu thế.

“Chúng tôi tin rằng suy luận là yếu tố trung tâm của AI, không phải thứ tách biệt mà bạn phải trả tiền riêng để dùng,” Dianne Penn, quản lý sản phẩm mảng nghiên cứu tại Anthropic, nói trong cuộc phỏng vấn cùng VentureBeat. “Giống như con người, AI cũng nên đảm đương cả phản hồi nhanh lẫn nhiệm vụ suy luận phức tạp. Chẳng hạn, với câu hỏi ‘Mấy giờ rồi?’ nó có thể đáp tức thì. Nhưng để lập kế hoạch chuyến đi hai tuần ở Ý và ăn kiêng gluten, nó sẽ cần thời gian xử lý nhiều hơn.”

Bà nói thêm: “Chúng tôi không xem suy luận, lập kế hoạch hay tự sửa lỗi là những năng lực tách rời. Vì thế, mô hình lý tưởng cần tự nhận ra khi nào bài toán đòi hỏi tư duy phức tạp và điều chỉnh phù hợp, chứ không buộc người dùng phải chọn chế độ suy luận khác nhau.”

Dữ liệu đánh giá cho thấy tầm nhìn tham vọng của Anthropic. Ở chế độ “suy luận kéo dài,” Claude 3.7 Sonnet đạt độ chính xác 78,2% trên các bài toán suy luận bậc sau đại học, cạnh tranh với mô hình mới nhất của OpenAI và vượt qua DeepSeek R1.

Nhưng chỉ số thực tế hơn là kết quả trong ứng dụng đời thực. Mô hình này đạt 81,2% ở các bài kiểm tra dùng công cụ phục vụ bán lẻ, với độ tuân thủ hướng dẫn lên tới 93,2% — những mảng đối thủ đang trầy trật hoặc chưa công bố kết quả.

Trong khi DeepSeek và OpenAI dẫn đầu các chuẩn toán học truyền thống, cách Claude 3.7 xử lý “một mô hình duy nhất” cho cả phản hồi nhanh và phân tích sâu cho thấy doanh nghiệp có thể không cần phải duy trì nhiều hệ thống AI riêng cho các loại nhiệm vụ khác nhau.

Cách tiếp cận “lai” của Anthropic và tiềm năng thay đổi hạ tầng doanh nghiệp

Thời điểm ra mắt của Anthropic đặc biệt quan trọng. Tháng trước, DeepSeek xuất hiện và “gây sóng gió” ở Thung lũng Silicon, chứng minh năng lực suy luận AI có thể đạt được với ít tài nguyên tính toán hơn nhiều so với tưởng tượng. Điều này thách thức những niềm tin cốt lõi về chi phí phát triển AI và nhu cầu hạ tầng. Khi DeepSeek công bố kết quả, giá cổ phiếu Nvidia giảm 17% trong một ngày, nhà đầu tư nghi ngờ liệu chip đắt đỏ có thực sự là nền tảng không thể thiếu cho AI cao cấp.

Với doanh nghiệp, mọi thứ đang rất căng. Họ đầu tư hàng triệu đôla tích hợp AI vào quy trình, đặt cược xem lối tiếp cận nào sẽ thắng. Giải pháp “lai” của Anthropic mang đến một lựa chọn trung dung hấp dẫn: có thể tinh chỉnh hiệu suất AI dựa trên nhiệm vụ, từ phản hồi tức thì cho dịch vụ khách hàng tới phân tích tài chính phức tạp. Chi phí hệ thống vẫn giữ nguyên mức giá cũ của Anthropic: 3 đôla cho mỗi triệu token đầu vào, 15 đôla cho mỗi triệu token đầu ra, bất kể thêm tính năng suy luận.

“Khách hàng của chúng tôi muốn tạo ra giá trị cho khách hàng của họ,” Michael Gerstenhaber, giám đốc nền tảng tại Anthropic, nói. “Sử dụng cùng một mô hình và gợi ý nó theo những cách khác nhau cho phép, ví dụ, Thomson Reuters làm nghiên cứu luật, trong khi các đối tác coding như Cursor hay GitHub tận dụng mô hình để phát triển ứng dụng.”

Cách tiếp cận “lai” của Anthropic vừa là tiến hóa kỹ thuật, vừa là chiến lược. Trong lúc OpenAI duy trì nhiều mô hình tách biệt, còn DeepSeek tập trung tối ưu chi phí, Anthropic theo đuổi hệ thống “thống nhất,” xử lý cả tác vụ thường và suy luận phức tạp. Triết lý này có thể thay đổi cách doanh nghiệp triển khai AI, loại bỏ nhu cầu vận hành đồng thời nhiều mô hình “chuyên dụng.”

Giới thiệu Claude Code: Trợ lý nhà phát triển mới của AI

Anthropic hôm nay cũng ra mắt Claude Code, công cụ dòng lệnh cho phép lập trình viên giao cho AI nhiệm vụ kỹ thuật phức tạp. Hệ thống yêu cầu con người phê duyệt trước khi xác nhận thay đổi mã, phản ánh mối quan tâm ngày càng tăng về phát triển AI “có trách nhiệm.”

“Bạn vẫn phải chấp nhận thay đổi mà Claude đề xuất. Bạn là người kiểm duyệt và tay vẫn đặt trên tay lái,” Penn lưu ý. “Cơ bản là có một danh sách kiểm tra để mô hình thực hiện hành động.”

Công bố này diễn ra trong bối cảnh cạnh tranh mạnh về phát triển AI. Các nhà nghiên cứu Stanford vừa tạo mô hình suy luận mã nguồn mở với chi phí dưới 50 đôla, còn Microsoft tích hợp mô hình o3 mini của OpenAI vào Azure. Thành công của DeepSeek cũng thúc đẩy cách tiếp cận mới, như kỹ thuật “model distillation” nhằm tiếp tục giảm chi phí.

Từ Pokémon đến doanh nghiệp: Kiểm chứng trí tuệ AI mới

Penn minh họa bước tiến AI bằng ví dụ bất ngờ: “Chúng tôi cho những phiên bản khác nhau của Claude chơi Pokémon… Phiên bản này đã đến Thành phố Vermilion, tóm gọn nhiều Pokémon và còn cày cấp. Nó chọn Pokémon phù hợp để đấu đối thủ.”

“Tôi nghĩ bạn sẽ thấy chúng tôi tiếp tục đổi mới, nâng cao chất lượng suy luận, hướng tới những thứ như ‘dynamic reasoning,’” Penn nói. “Từ trước, chúng tôi luôn coi đó là phần cốt lõi của trí tuệ, thay vì thứ gì rời rạc.”

Thử thách thật sự với cách tiếp cận Anthropic nằm ở việc doanh nghiệp chấp nhận hay không. Dù chơi Pokémon nghe có vẻ nhỏ nhặt, nó minh họa loại trí tuệ linh hoạt mà doanh nghiệp cần: AI xử lý cả nhiệm vụ thường lẫn quyết định chiến lược phức tạp, mà không phải chuyển đổi mô hình riêng. Các phiên bản Claude cũ từng bó tay khi rời thị trấn khởi đầu, còn bản mới giờ xây chiến lược, quản lý tài nguyên và đưa ra quyết định chiến thuật — kỹ năng phản ánh chính xác độ phức tạp trong doanh nghiệp.

Với khách hàng doanh nghiệp, đó có thể là khác biệt giữa duy trì nhiều hệ thống AI riêng lẻ và triển khai một giải pháp thống nhất, mạnh mẽ. Vài tháng tới sẽ cho thấy liệu “cược” vào AI thống nhất của Anthropic sẽ tái định hình thị trường doanh nghiệp hay chỉ là thí nghiệm khác trong sự phát triển chóng mặt của ngành.

BÌNH LUẬN

Vui lòng nhập bình luận của bạn
Vui lòng nhập tên của bạn ở đây

Tin nóng tuần này

Ericsson và AWS bắt tay tạo ra mạng di động “tự chữa lành” nhờ AI

Liên minh giữa hai ông lớn viễn thông và...

Meta đầu tư 14,8 tỷ USD vào Scale AI: Cảnh báo “lách luật” và độc quyền AI?

Thương vụ trị giá 14,8 tỷ USD không chỉ...

Databricks mở mã nguồn công cụ ETL khai báo, tăng tốc xây dựng pipeline tới 90%

Databricks công bố mở mã nguồn công cụ Spark...

Google DeepMind ra mắt mô hình AI thay đổi vĩnh viễn dự báo bão

DeepMind hợp tác với Trung tâm Bão Quốc gia...

Microsoft và OpenAI “chia tay”: Ai sẽ nắm giữ quyền lực AI toàn cầu?

Mối quan hệ từng được ví như “bromance” công...

Chủ đề

Bài viết liên quan

Danh mục phổ biến

Language »