Thứ Bảy, Tháng 8 9, 2025

Nước cờ chiến lược của OpenAI: SDK của Agents và lý do tại sao nó thay đổi mọi thứ đối với AI doanh nghiệp

OpenAI đã định hình lại bối cảnh AI doanh nghiệp vào thứ Ba với việc phát hành nền tảng xây dựng tác nhân toàn diện – một gói kết hợp API Responses được cải tiến, các công cụ tích hợp mạnh mẽ và SDK Agents nguồn mở.

Mặc dù thông báo này có thể bị lu mờ bởi các tiêu đề AI khác — Google tiết lộ mô hình Gemma 3 mã nguồn mở ấn tượng và sự xuất hiện của Manus, một công ty khởi nghiệp Trung Quốc có nền tảng tác nhân tự động khiến những người quan sát kinh ngạc — nhưng rõ ràng đây là một động thái quan trọng mà các doanh nghiệp cần lưu ý. Nó hợp nhất một hệ sinh thái API phức tạp trước đây bị phân mảnh thành một khuôn khổ thống nhất, sẵn sàng cho sản xuất.

Đối với các nhóm AI doanh nghiệp, những hàm ý có khả năng rất sâu sắc: Các dự án trước đây đòi hỏi nhiều khuôn khổ, cơ sở dữ liệu vector chuyên biệt và logic phối hợp phức tạp giờ đây có thể đạt được thông qua một nền tảng chuẩn hóa duy nhất. Nhưng có lẽ tiết lộ nhiều nhất là sự thừa nhận ngầm của OpenAI rằng việc giải quyết các vấn đề về độ tin cậy của tác nhân AI đòi hỏi chuyên môn bên ngoài. Sự thay đổi này diễn ra trong bối cảnh ngày càng có nhiều bằng chứng cho thấy các nhà phát triển bên ngoài đang tìm ra các giải pháp sáng tạo cho độ tin cậy của tác nhân — điều mà bản phát hành Manus gây sốc cũng đã chứng minh rõ ràng.

Một cách tiếp cận thống nhất để phát triển tác nhân

Về cốt lõi, thông báo này thể hiện chiến lược toàn diện của OpenAI nhằm cung cấp một ngăn xếp hoàn chỉnh, sẵn sàng cho sản xuất để xây dựng các tác nhân AI. Bản phát hành này đưa một số khả năng chính vào một khuôn khổ thống nhất:

  1. API phản hồi được xây dựng dựa trên API hoàn thành trò chuyện nhưng bổ sung khả năng tích hợp liền mạch để sử dụng công cụ, với thiết kế giao diện được cải thiện để tạo tác nhân;
  2. Các công cụ tích hợp bao gồm tìm kiếm trên web, tìm kiếm tệp và sử dụng máy tính (công nghệ đằng sau tính năng Operator của OpenAI);
  3. SDK Agents nguồn mở để sắp xếp quy trình làm việc của một tác nhân và nhiều tác nhân với chức năng chuyển giao.

Điều làm cho thông báo này mang tính chuyển đổi là cách nó giải quyết tình trạng phân mảnh đã gây khó khăn cho quá trình phát triển AI của doanh nghiệp. Các công ty quyết định chuẩn hóa định dạng API và SDK mở của OpenAI sẽ không còn phải ghép nối các khuôn khổ khác nhau, quản lý kỹ thuật nhắc nhở phức tạp hoặc vật lộn với các tác nhân không đáng tin cậy.

“Từ ‘đáng tin cậy’ rất quan trọng”, Sam Witteveen, đồng sáng lập của Red Dragon, một nhà phát triển độc lập của các tác nhân AI, cho biết trong một cuộc trò chuyện gần đây với tôi trên một podcast video chuyên sâu về bản phát hành. “Chúng tôi đã nói về điều đó nhiều lần… hầu hết các tác nhân đều không đáng tin cậy. Và vì vậy OpenAI đang xem xét, ‘Được rồi, làm thế nào để chúng ta đưa loại độ tin cậy này vào?’”

Sau thông báo, Jeff Weinstein, giám đốc sản phẩm của công ty thanh toán Stripe đã nói với X rằng Stripe đã chứng minh được ứng dụng thực tế của SDK Agents mới của OpenAI bằng cách phát hành bộ công cụ cho phép các nhà phát triển tích hợp các dịch vụ tài chính của Stripe vào quy trình làm việc của agentic. Sự tích hợp này cho phép tạo ra các tác nhân AI có khả năng tự động hóa thanh toán cho nhà thầu bằng cách kiểm tra các tệp để xem ai cần thanh toán hay không, cũng như thanh toán và các giao dịch khác.

Ý nghĩa chiến lược đối với OpenAI và thị trường

Bản phát hành này tiết lộ một sự thay đổi đáng kể trong chiến lược của OpenAI. Sau khi thiết lập được vị thế dẫn đầu với các mô hình nền tảng, công ty hiện đang củng cố vị thế của mình trong hệ sinh thái tác nhân thông qua một số động thái được tính toán:

1. Mở cửa cho sự đổi mới bên ngoài

OpenAI thừa nhận rằng ngay cả nguồn lực rộng lớn của họ cũng không đủ để vượt qua sự đổi mới của cộng đồng. Việc ra mắt các công cụ và SDK nguồn mở cho thấy một sự nhượng bộ chiến lược lớn.

Thời điểm phát hành trùng với sự xuất hiện của Manus, gây ấn tượng với cộng đồng AI với một nền tảng tác nhân tự động rất có năng lực — chứng minh khả năng sử dụng các mô hình hiện có từ Claude và Qwen, về cơ bản cho thấy sự tích hợp thông minh và kỹ thuật nhanh chóng có thể đạt được độ tin cậy mà ngay cả các phòng thí nghiệm AI lớn cũng đang phải vật lộn.

“Có lẽ ngay cả OpenAI cũng không phải là người giỏi nhất trong việc tạo ra Operator,” Witteveen lưu ý, ám chỉ đến công cụ duyệt web mà OpenAI đã phát hành vào cuối tháng 1 , nhưng chúng tôi thấy rằng nó có lỗi và kém hơn so với đối thủ Proxy . “Có lẽ công ty khởi nghiệp Trung Quốc này có một số thủ thuật hay trong lời nhắc của họ, hoặc bất cứ thứ gì, mà họ có thể sử dụng các công cụ nguồn mở này.”

Bài học rút ra rất rõ ràng: OpenAI cần sự đổi mới của cộng đồng để cải thiện độ tin cậy. Bất kỳ nhóm nào, dù giỏi đến đâu, dù là OpenAI, Anthropic, Google — họ cũng không thể thử nghiệm nhiều thứ như cộng đồng nguồn mở.

2. Bảo vệ thị trường doanh nghiệp thông qua chuẩn hóa API

Định dạng API của OpenAI đã nổi lên như một tiêu chuẩn thực tế cho các giao diện mô hình ngôn ngữ lớn (LLM), được hỗ trợ bởi nhiều nhà cung cấp bao gồm Gemini của Google và Llama của Meta. Sự thay đổi của OpenAI trong API của họ rất quan trọng vì nhiều bên thứ ba sẽ tham gia và hỗ trợ những thay đổi khác này.

Bằng cách kiểm soát tiêu chuẩn API trong khi làm cho nó có khả năng mở rộng hơn, OpenAI có vẻ sẽ tạo ra hiệu ứng mạng mạnh mẽ. Khách hàng doanh nghiệp có thể áp dụng Agents SDK vì biết rằng nó hoạt động với nhiều mô hình, nhưng OpenAI vẫn giữ vị trí trung tâm của hệ sinh thái.

3. Củng cố đường ống RAG

Công cụ tìm kiếm tệp thách thức các công ty cơ sở dữ liệu như Pinecone, Chroma, Weaviate và các công ty khác. OpenAI hiện cung cấp một công cụ retrieval-augmented generation (RAG) hoàn chỉnh ngay khi xuất xưởng. Câu hỏi bây giờ là điều gì sẽ xảy ra với danh sách dài các nhà cung cấp RAG hoặc các nhà cung cấp dịch vụ sắp xếp tác nhân khác xuất hiện với nguồn tài trợ lớn để theo đuổi cơ hội AI doanh nghiệp — nếu bạn có thể có được nhiều thứ này thông qua một tiêu chuẩn duy nhất như OpenAI.

Nói cách khác, các doanh nghiệp có thể cân nhắc hợp nhất nhiều mối quan hệ với nhà cung cấp thành một nhà cung cấp API duy nhất, OpenAI. Các công ty có thể tải lên bất kỳ tài liệu dữ liệu nào họ muốn sử dụng với các mô hình nền tảng hàng đầu của OpenAI — và tìm kiếm tất cả trong API. Mặc dù các doanh nghiệp có thể gặp phải những hạn chế so với các cơ sở dữ liệu RAG chuyên dụng như Pinecone, các công cụ tìm kiếm tệp và web tích hợp của OpenAI cung cấp các trích dẫn và URL rõ ràng — điều này rất quan trọng đối với các doanh nghiệp ưu tiên tính minh bạch và chính xác.

Khả năng trích dẫn này rất quan trọng đối với môi trường doanh nghiệp nơi tính minh bạch và xác minh là điều cần thiết – cho phép người dùng theo dõi chính xác thông tin đến từ đâu và xác thực tính chính xác của thông tin đó so với các tài liệu gốc.

Phép tính ra quyết định của doanh nghiệp

Đối với những người ra quyết định trong doanh nghiệp, thông báo này mang đến cơ hội hợp lý hóa quá trình phát triển tác nhân AI nhưng cũng đòi hỏi phải đánh giá cẩn thận về khả năng gắn kết với nhà cung cấp và tích hợp với các hệ thống hiện có.

1. Yêu cầu về độ tin cậy

Việc áp dụng các tác nhân AI trong doanh nghiệp đã chậm lại do lo ngại về độ tin cậy. Ví dụ, công cụ sử dụng máy tính của OpenAI đạt 87% trên chuẩn WebVoyager đối với các tác vụ dựa trên trình duyệt nhưng chỉ đạt 38,1% trên OSWorld đối với các tác vụ hệ điều hành.

Ngay cả OpenAI cũng thừa nhận hạn chế này trong thông báo của mình, nói rằng nên có sự giám sát của con người. Tuy nhiên, bằng cách cung cấp các công cụ và tính năng quan sát để theo dõi và gỡ lỗi hiệu suất của tác nhân, các doanh nghiệp hiện có thể tự tin triển khai các tác nhân với các rào cản phù hợp.

2. Câu hỏi khóa

Trong khi việc áp dụng hệ sinh thái đại lý của OpenAI mang lại những lợi thế ngay lập tức, nó lại làm dấy lên mối lo ngại về việc bị khóa chặt vào nhà cung cấp. Như Ashpreet Bedi, người sáng lập AgnoAGI, đã chỉ ra sau thông báo : “API Responses được thiết kế có chủ đích để ngăn các nhà phát triển chuyển đổi nhà cung cấp bằng cách thay đổi base_url.”

Tuy nhiên, OpenAI đã có một nhượng bộ đáng kể khi cho phép Agents SDK của mình hoạt động với các mô hình từ các nhà cung cấp khác. SDK hỗ trợ các mô hình bên ngoài, miễn là chúng cung cấp điểm cuối API theo kiểu Chat Completions. Cách tiếp cận đa mô hình này cung cấp cho các doanh nghiệp một số tính linh hoạt trong khi vẫn giữ OpenAI ở vị trí trung tâm.

3. Lợi thế cạnh tranh của full stack

Bản phát hành toàn diện – từ công cụ đến API đến SDK – tạo ra lợi thế hấp dẫn cho OpenAI so với các đối thủ cạnh tranh như Anthropic hoặc Google, những công ty có cách tiếp cận từng phần hơn để phát triển tác nhân.

Đây chính là điểm Google, nói riêng, đã bỏ lỡ. Họ đã thử nhiều cách khác nhau để thực hiện việc này từ trong các dịch vụ đám mây hiện tại của họ, nhưng vẫn chưa đạt đến mức mà ai đó có thể tải lên PDF và sử dụng Google Gemini cho RAG.

Tác động đến hệ sinh thái đại lý

Thông báo này định hình lại đáng kể bối cảnh cho các công ty xây dựng trong không gian đại lý. Những công ty như LangChain và CrewAI, những công ty đã xây dựng các khuôn khổ để phát triển đại lý, hiện phải đối mặt với sự cạnh tranh trực tiếp từ Agents SDK của OpenAI. Không giống như OpenAI, các công ty này không có một doanh nghiệp LLM nền tảng lớn, đang phát triển để hỗ trợ các khuôn khổ của họ. Động lực này có thể đẩy nhanh quá trình hợp nhất trong không gian khuôn khổ đại lý, với các nhà phát triển có động lực lớn đang hướng tới giải pháp sẵn sàng sản xuất của OpenAI.

Trong khi đó, OpenAI kiếm tiền từ việc sử dụng của nhà phát triển, tính phí (.3) cho mỗi cuộc gọi đối với GPT-4o và (.2.5) cho GPT-4o-mini đối với tìm kiếm trên web, với giá tăng lên .5 cho mỗi cuộc gọi đối với tìm kiếm ngữ cảnh cao — khiến giá cả trở nên cạnh tranh.

Bằng cách cung cấp sự phối hợp tích hợp thông qua Agents SDK, OpenAI tham gia cạnh tranh trực tiếp với các nền tảng tập trung vào sự phối hợp của tác nhân. Sự hỗ trợ của SDK cho các quy trình làm việc của nhiều tác nhân với sự chuyển giao, lan can và theo dõi tạo ra một giải pháp hoàn chỉnh cho nhu cầu của doanh nghiệp.

Liệu khả năng sản xuất đã gần kề chưa?

Còn quá sớm để nói các giải pháp mới hoạt động tốt như thế nào. Mọi người hiện mới bắt đầu sử dụng Agents SDK cho sản xuất. Mặc dù bản phát hành có tính toàn diện, vẫn còn nhiều câu hỏi vì những nỗ lực trước đây của OpenAI trong việc xây dựng các khuôn khổ tác nhân, như Swarm thử nghiệm và API Assistants, không đáp ứng đầy đủ nhu cầu của doanh nghiệp. 

Đối với dịch vụ mã nguồn mở, không rõ liệu OpenAI có chấp nhận yêu cầu kéo và mã được gửi từ những người bên ngoài hay không.

Tuy nhiên, việc ngừng sử dụng API Trợ lý (dự kiến ​​vào giữa năm 2026) cho thấy sự tự tin của OpenAI vào phương pháp tiếp cận mới. Không giống như API Trợ lý, vốn không quá phổ biến, API Phản hồi và SDK Đại lý mới có vẻ được thiết kế chu đáo hơn dựa trên phản hồi của nhà phát triển.

Một bước ngoặt chiến lược thực sự

Trong khi OpenAI từ lâu đã đi đầu trong phát triển mô hình nền tảng, thông báo này thể hiện một bước ngoặt chiến lược; công ty có khả năng trở thành nền tảng trung tâm cho việc phát triển và triển khai tác nhân.

Bằng cách cung cấp một ngăn xếp hoàn chỉnh từ công cụ đến phối hợp, OpenAI đang định vị mình để nắm bắt giá trị doanh nghiệp được tạo ra trên các mô hình của mình. Đồng thời, cách tiếp cận nguồn mở với Agents SDK thừa nhận rằng ngay cả OpenAI cũng không thể đổi mới đủ nhanh khi tách biệt.

Đối với những người ra quyết định của doanh nghiệp, thông điệp rất rõ ràng: OpenAI đang dốc toàn lực vào các tác nhân như là ranh giới tiếp theo của quá trình phát triển AI. Cho dù xây dựng các tác nhân tùy chỉnh nội bộ hay làm việc với các đối tác, các doanh nghiệp hiện có một con đường gắn kết hơn, sẵn sàng sản xuất — mặc dù con đường này đặt OpenAI vào trung tâm chiến lược AI của họ.

Cuộc chiến AI đã bước vào giai đoạn mới. Cuộc đua xây dựng các mô hình nền tảng mạnh mẽ nhất đã phát triển thành cuộc chiến giành quyền kiểm soát hệ sinh thái tác nhân — và với bản phát hành toàn diện này, OpenAI vừa thực hiện động thái quyết định nhất từ ​​trước đến nay để đưa mọi con đường đến với các tác nhân AI doanh nghiệp chạy qua nền tảng của mình.

BÌNH LUẬN

Vui lòng nhập bình luận của bạn
Vui lòng nhập tên của bạn ở đây

Tin nóng tuần này

Apple Mất Một Lãnh Đạo AI Quan Trọng Vào Tay Meta

Apple đang phải đối mặt với một vết thương...

Phá vỡ nút thắt lưu trữ của AI và tăng cường suy luận ở biên

Trong sự kiện Transform 2025 của VentureBeat , Greg Matson, giám...

OpenAI Từ Chối Việc Giao Dịch Cổ Phiếu Token Hoá Của Robinhood

Robinhood đã bắt đầu cung cấp cổ phiếu token...

Chủ đề

Bài viết liên quan

Danh mục phổ biến

Language »