Mẫu Opus 4 chủ lực của công ty đã tập trung vào một dự án tái cấu trúc mã nguồn mở phức tạp trong gần bảy giờ trong quá trình thử nghiệm tại Rakuten — một bước đột phá biến AI từ một công cụ phản ứng nhanh thành một cộng tác viên thực sự có khả năng giải quyết các dự án kéo dài cả ngày.
Màn trình diễn marathon này đánh dấu bước nhảy vọt vượt xa khả năng tập trung chỉ trong vài phút của các mô hình AI trước đây. Những hàm ý về mặt công nghệ rất sâu sắc: Hệ thống AI hiện có thể xử lý các dự án kỹ thuật phần mềm phức tạp từ khi hình thành đến khi hoàn thành, duy trì bối cảnh và sự tập trung trong suốt một ngày làm việc.
Anthropic tuyên bố Claude Opus 4 đã đạt được điểm số 72,5% trên SWE-bench , một chuẩn mực kỹ thuật phần mềm nghiêm ngặt, vượt trội hơn GPT-4.1 của OpenAI , đạt 54,6% khi ra mắt vào tháng 4. Thành tích này khẳng định Anthropic là một đối thủ đáng gờm trên thị trường AI ngày càng đông đúc.

Vượt ra ngoài những câu trả lời nhanh chóng: cuộc cách mạng lý luận biến đổi AI
Ngành công nghiệp AI đã chuyển hướng mạnh mẽ sang các mô hình lý luận vào năm 2025. Các hệ thống này xử lý vấn đề theo phương pháp trước khi phản hồi, mô phỏng quá trình suy nghĩ giống con người thay vì chỉ đơn giản là so khớp mẫu với dữ liệu đào tạo.
OpenAI đã khởi xướng sự thay đổi này với dòng sản phẩm “o” vào tháng 12 năm ngoái, tiếp theo là Gemini 2.5 Pro của Google với khả năng “ Deep Think ” thử nghiệm. Mô hình R1 của DeepSeek bất ngờ chiếm được thị phần với khả năng giải quyết vấn đề đặc biệt với mức giá cạnh tranh.
Sự thay đổi này báo hiệu một sự tiến hóa cơ bản trong cách mọi người sử dụng AI. Theo báo cáo Xu hướng sử dụng mô hình AI mùa xuân năm 2025 của Poe , việc sử dụng mô hình lý luận đã tăng gấp năm lần chỉ trong bốn tháng, tăng từ 2% lên 10% trong tất cả các tương tác AI. Người dùng ngày càng coi AI là đối tác tư duy cho các vấn đề phức tạp hơn là một hệ thống trả lời câu hỏi đơn giản.

Các mô hình mới của Claude tạo nên sự khác biệt bằng cách tích hợp việc sử dụng công cụ trực tiếp vào quá trình lập luận của chúng. Phương pháp nghiên cứu và lập luận đồng thời này phản ánh nhận thức của con người chặt chẽ hơn so với các hệ thống trước đây thu thập thông tin trước khi bắt đầu phân tích. Khả năng tạm dừng, tìm kiếm dữ liệu và kết hợp các phát hiện mới trong quá trình lập luận tạo ra trải nghiệm giải quyết vấn đề tự nhiên và hiệu quả hơn.
Kiến trúc chế độ kép cân bằng tốc độ với độ sâu
Anthropic đã giải quyết một điểm ma sát dai dẳng trong trải nghiệm người dùng AI bằng cách tiếp cận kết hợp của mình . Cả hai mô hình Claude 4 đều cung cấp phản hồi gần như ngay lập tức cho các truy vấn đơn giản và tư duy mở rộng cho các vấn đề phức tạp — loại bỏ sự chậm trễ gây khó chịu mà các mô hình lý luận trước đây áp đặt cho ngay cả những câu hỏi đơn giản.
Chức năng chế độ kép này bảo toàn các tương tác nhanh nhạy mà người dùng mong đợi trong khi mở khóa các khả năng phân tích sâu hơn khi cần. Hệ thống phân bổ động các nguồn lực tư duy dựa trên mức độ phức tạp của nhiệm vụ, tạo ra sự cân bằng mà các mô hình lý luận trước đó không đạt được.
Sự bền bỉ của bộ nhớ là một bước đột phá khác. Các mô hình Claude 4 có thể trích xuất thông tin chính từ các tài liệu, tạo các tệp tóm tắt và duy trì kiến thức này trong các phiên khi được cấp quyền phù hợp. Khả năng này giải quyết “vấn đề mất trí nhớ” đã hạn chế tính hữu ích của AI trong các dự án dài hạn, trong đó ngữ cảnh phải được duy trì trong nhiều ngày hoặc nhiều tuần.
Việc triển khai kỹ thuật hoạt động tương tự như cách các chuyên gia con người phát triển hệ thống quản lý kiến thức, với AI tự động sắp xếp thông tin thành các định dạng có cấu trúc được tối ưu hóa để truy xuất trong tương lai. Cách tiếp cận này cho phép Claude xây dựng sự hiểu biết ngày càng tinh tế về các lĩnh vực phức tạp trong các giai đoạn tương tác kéo dài.
Bối cảnh cạnh tranh ngày càng gay gắt khi các nhà lãnh đạo AI tranh giành thị phần
Thời điểm công bố của Anthropic làm nổi bật tốc độ cạnh tranh ngày càng tăng trong lĩnh vực AI tiên tiến. Chỉ năm tuần sau khi OpenAI ra mắt dòng GPT-4.1 , Anthropic đã phản công bằng các mô hình thách thức hoặc vượt trội hơn về các số liệu chính. Google đã cập nhật dòng Gemini 2.5 của mình vào đầu tháng này, trong khi Meta gần đây đã phát hành các mô hình Llama 4 có khả năng đa phương thức và cửa sổ ngữ cảnh 10 triệu mã thông báo.
Mỗi phòng thí nghiệm lớn đã tạo ra những thế mạnh riêng biệt trong thị trường ngày càng chuyên biệt này. OpenAI dẫn đầu về lý luận chung và tích hợp công cụ , Google vượt trội về hiểu biết đa phương thức và Anthropic hiện đang giành ngôi vương về hiệu suất bền vững và các ứng dụng mã hóa chuyên nghiệp .
Những tác động chiến lược đối với khách hàng doanh nghiệp là rất đáng kể. Các tổ chức hiện phải đối mặt với những quyết định ngày càng phức tạp về việc triển khai hệ thống AI nào cho các trường hợp sử dụng cụ thể, không có mô hình nào thống trị tất cả các số liệu. Sự phân mảnh này có lợi cho những khách hàng tinh vi có thể tận dụng thế mạnh AI chuyên biệt trong khi thách thức các công ty đang tìm kiếm các giải pháp đơn giản, thống nhất.
Tích hợp doanh nghiệp sâu hơn khi các công cụ dành cho nhà phát triển trưởng thành
Anthropic đã mở rộng khả năng tích hợp Claude vào quy trình phát triển với bản phát hành chung của Claude Code . Hệ thống hiện hỗ trợ các tác vụ nền thông qua GitHub Actions và tích hợp gốc với môi trường VS Code và JetBrains , hiển thị các chỉnh sửa mã được đề xuất trực tiếp trong tệp của nhà phát triển.
Quyết định của GitHub khi đưa Claude Sonnet 4 làm mô hình cơ sở cho một tác nhân mã hóa mới trong GitHub Copilot mang lại sự xác thực đáng kể cho thị trường. Quan hệ đối tác này với nền tảng phát triển của Microsoft cho thấy các công ty công nghệ lớn đang đa dạng hóa quan hệ đối tác AI của họ thay vì chỉ dựa vào một nhà cung cấp duy nhất.
Anthropic đã bổ sung các bản phát hành mô hình của mình bằng các khả năng API mới dành cho nhà phát triển: công cụ thực thi mã, trình kết nối MCP, API Tệp và bộ nhớ đệm nhắc nhở trong tối đa một giờ. Các tính năng này cho phép tạo ra các tác nhân AI tinh vi hơn có thể tồn tại trong các quy trình làm việc phức tạp—điều cần thiết để áp dụng cho doanh nghiệp.
Những thách thức về tính minh bạch xuất hiện khi các mô hình ngày càng tinh vi hơn
Bài báo nghiên cứu tháng 4 của Anthropic, “ Các mô hình lý luận không phải lúc nào cũng nói những gì chúng nghĩ ”, đã tiết lộ những mô hình đáng lo ngại về cách các hệ thống này truyền đạt quá trình suy nghĩ của chúng. Nghiên cứu của họ phát hiện ra rằng Claude 3.7 Sonnet chỉ đề cập đến những gợi ý quan trọng mà nó sử dụng để giải quyết vấn đề chỉ 25% thời gian — đặt ra những câu hỏi quan trọng về tính minh bạch của lý luận AI.
Nghiên cứu này nêu bật một thách thức ngày càng lớn: khi các mô hình trở nên có khả năng hơn, chúng cũng trở nên mờ đục hơn. Phiên mã hóa tự động kéo dài bảy giờ giới thiệu sức bền của Claude Opus 4 cũng chứng minh con người sẽ khó khăn như thế nào để kiểm tra đầy đủ các chuỗi lý luận mở rộng như vậy.
Ngành công nghiệp hiện đang phải đối mặt với một nghịch lý là năng lực ngày càng tăng thì tính minh bạch lại giảm. Giải quyết căng thẳng này sẽ đòi hỏi những cách tiếp cận mới đối với giám sát AI cân bằng giữa hiệu suất với khả năng giải thích — một thách thức mà bản thân Anthropic đã thừa nhận nhưng vẫn chưa giải quyết được hoàn toàn.
Tương lai của sự hợp tác AI bền vững đang hình thành
Phiên làm việc tự động kéo dài bảy giờ của Claude Opus 4 cung cấp cái nhìn thoáng qua về vai trò tương lai của AI trong công việc tri thức. Khi các mô hình phát triển sự tập trung mở rộng và cải thiện trí nhớ, chúng ngày càng giống những người cộng tác hơn là các công cụ — có khả năng làm việc phức tạp, bền vững với sự giám sát tối thiểu của con người.
Tiến trình này chỉ ra sự thay đổi sâu sắc trong cách các tổ chức sẽ cấu trúc công việc tri thức. Các nhiệm vụ trước đây đòi hỏi sự chú ý liên tục của con người giờ đây có thể được giao cho các hệ thống AI duy trì sự tập trung và bối cảnh trong nhiều giờ hoặc thậm chí nhiều ngày. Tác động kinh tế và tổ chức sẽ rất đáng kể, đặc biệt là trong các lĩnh vực như phát triển phần mềm, nơi tình trạng thiếu hụt nhân tài vẫn tiếp diễn và chi phí lao động vẫn cao.
Khi Claude 4 xóa nhòa ranh giới giữa trí tuệ con người và máy móc, chúng ta phải đối mặt với một thực tế mới tại nơi làm việc. Thách thức của chúng ta không còn là tự hỏi liệu AI có thể sánh ngang với kỹ năng của con người hay không, mà là thích nghi với tương lai khi những đồng đội năng suất nhất của chúng ta có thể là kỹ thuật số thay vì con người.