Thứ Hai, Tháng 7 21, 2025

OpenAI cập nhật Operator lên o3, khiến gói đăng ký ChatGPT Pro trị giá 200 đô la hàng tháng trở nên hấp dẫn hơn

Ngày nay, công ty đã nâng cấp trình duyệt web tự động Operator và tác nhân điều khiển con trỏ trong ChatGPT từ việc sử dụng mô hình ngôn ngữ lớn đa phương thức GPT-4o trước đây sang 
mô hình lý luận o3 mới hơn và mạnh mẽ hơn .

Bản cập nhật được phát hành trên toàn cầu vào ngày hôm nay, 23 tháng 5 năm 2025, có sẵn dưới dạng “bản xem trước nghiên cứu” dành cho những người đăng ký trả phí gói ChatGPT Pro trị giá 200 đô la Mỹ/tháng của OpenAI.

Về cơ bản, đó là cách OpenAI muốn nói rằng sản phẩm của họ vẫn chưa được “hoàn thiện” hay “hoàn hảo hoàn toàn” — nó vẫn có thể còn nhiều khiếm khuyết và vấn đề.

Nhưng khi đối thủ Google cung cấp gói đăng ký AI hàng đầu của riêng mình với mức giá gần 250 đô la Mỹ thường xuyên (hiện đang giảm giá xuống còn 125 đô la trong ba tháng đầu tiên) để truy cập vào các mô hình đa phương thức Gemini, tạo hình ảnh Imagen và tạo video Veo mới nhất, thì gói ChatGPT Pro của OpenAI đột nhiên có vẻ phải chăng hơn khi so sánh.

Trình điều hành của OpenAI là gì và dùng để làm gì?

Operator lần đầu tiên ra mắt vào tháng 1 năm 2025 như bước đi đầu tiên của OpenAI vào các tác nhân bán tự động, cụ thể là Computer Using Agents (CUA). Ý tưởng là vượt ra ngoài giao diện chatbot của ChatGPT và cho phép các mô hình AI mạnh mẽ của OpenAI bắt đầu thực hiện nhiều hành động hơn thay mặt cho người dùng.

Do đó, Operator được thiết kế để tự động trỏ, nhấp, cuộn và nhập để hoàn thành các tác vụ dựa trên web như đặt chỗ ăn tối, lập danh sách mua sắm hoặc đặt vé sự kiện. Khả năng đại lý này cho phép nó hoàn thành các tác vụ của người dùng trực tiếp thông qua giao diện trình duyệt, từ đặt chỗ đến thu thập dữ liệu trực tuyến.

Vì mục đích an toàn, riêng tư và bảo mật, Operator không sử dụng bất kỳ trình duyệt web nào hiện có trên PC hoặc Mac của người dùng. Thay vào đó, nó chạy trên trình duyệt ảo lưu trữ trên đám mây có thể truy cập thông qua một trang web độc lập—operator.chatgpt.com—nơi người dùng có thể nhập yêu cầu và quan sát tác nhân thực hiện các tác vụ theo thời gian thực.

Nó kết hợp khả năng thị giác, lý luận và tương tác dựa trên GPT-4o, đánh dấu một hướng đi mới cho OpenAI trong AI tác nhân.

Sản phẩm được ra mắt dưới dạng bản xem trước nghiên cứu dành cho những người đăng ký ChatGPT Pro và có các biện pháp an toàn tích hợp như xác nhận của người dùng, Chế độ theo dõi và các hạn chế trên các nền tảng web có rủi ro cao.

Nó cũng đang được thử nghiệm trong bối cảnh doanh nghiệp, bao gồm lập kế hoạch du lịch và dịch vụ dân sự, chứng minh tiềm năng của nó trong cả môi trường người tiêu dùng và doanh nghiệp.

o3 cung cấp độ chính xác, cấu trúc và tỷ lệ thành công được cải thiện

Với bản cập nhật này, OpenAI hướng đến mục tiêu nâng cao hiệu suất trên một số khía cạnh chính. Operator mới dựa trên o3 chứng minh tính bền bỉ và độ chính xác được cải thiện trong quá trình tương tác trên trình duyệt.

Về mặt thực tế, điều này có nghĩa là nó có nhiều khả năng hoàn thành nhiệm vụ của người dùng thành công hơn và ít cần phải sửa lỗi hoặc lặp lại hơn. Hơn nữa, người dùng có thể mong đợi phản hồi rõ ràng hơn, có cấu trúc hơn và toàn diện hơn.

Trong các đánh giá so sánh, mô hình mới cho thấy lợi thế ưu tiên rõ rệt so với mô hình tiền nhiệm. Các nghiên cứu về sở thích của con người cho thấy người dùng ưa chuộng mô hình o3 vì phong cách, tính toàn diện và rõ ràng của nó. Nó cũng hoạt động mạnh mẽ trong việc tuân theo hướng dẫn và hiệu quả, mặc dù kết quả về tính chính xác thực tế cân bằng hơn giữa các phiên bản.

Hiệu suất trên các điểm chuẩn đánh giá của bên thứ ba phản ánh những cải tiến này. Trên điểm chuẩn OSWorld đo lường mức độ hoàn thành các tác vụ dựa trên trình duyệt, mô hình o3 đạt 42,9 điểm so với 38,1 của phiên bản trước.

Tuy nhiên, OpenAI lưu ý rằng do những hạn chế trong hệ thống chấm điểm tự động, mức tăng hiệu suất thực tế có thể chỉ đạt gần 20 phần trăm!

Trên WebArena, mô hình mới đạt được số điểm là 62,9, tăng từ 48,1. Sự cải thiện đáng kể nhất xuất hiện trên chuẩn GAIA, trong đó mô hình o3 đạt 62,2, vượt xa số điểm 12,3 của mô hình trước đó.

So sánh nhiệm vụ song song minh họa thêm những lợi ích này. Trong một ví dụ liên quan đến yêu cầu đặt chỗ nhà hàng, mô hình mới cung cấp danh sách rõ ràng và chi tiết hơn về các đặt chỗ khả dụng, bao gồm địa điểm, xếp hạng Michelin và ghi chú chỗ ngồi, được trình bày trong một bảng được định dạng tốt. Phiên bản trước, mặc dù có chức năng, nhưng cung cấp ít thông tin hơn theo cách kém tổ chức hơn, theo hình ảnh đi kèm với ghi chú phát hành của Nhà điều hành o3 mới :

Các biện pháp bảo vệ vẫn được duy trì, cũng như các lưu ý cảnh báo chung về việc sử dụng các giao dịch tài chính nhạy cảm và quyền truy cập tài khoản

Mô hình o3 cũng kế thừa các biện pháp an toàn được giới thiệu trong các phiên bản trước, đồng thời tinh chỉnh thêm vai trò của nó như một hệ thống tác nhân.

OpenAI đã tích hợp chương trình đào tạo nâng cao chống lại việc thực thi tác vụ có hại, lỗ hổng tiêm mã độc nhanh chóng và các lỗi liên quan đến ý định của người dùng.

Đánh giá cho thấy mô hình hiện xác nhận 94% các hành động nhạy cảm trước khi thực hiện, với 100% xác nhận trong các giao dịch tài chính. Khả năng bị tiêm ngay cũng đã giảm từ 23% xuống 20%.

Đáng chú ý là o3 Operator duy trì ranh giới thận trọng đối với một số tương tác web có rủi ro cao, chẳng hạn như email hoặc nền tảng tài chính, nơi có thể yêu cầu người dùng giám sát thông qua Chế độ theo dõi hoặc từ chối rõ ràng để tiếp tục. Các biện pháp này là một phần của phương pháp tiếp cận theo lớp đối với an toàn kết hợp tính mạnh mẽ ở cấp độ mô hình với giám sát thời gian thực.

Trong khi bản nâng cấp lên Operator đánh dấu sự cải tiến về mặt kỹ thuật, nó cũng phản ánh cam kết liên tục của OpenAI đối với việc triển khai AI có trách nhiệm.

Khả năng thực hiện các hành động thực tế của hệ thống cũng tiềm ẩn những rủi ro mới và nhóm phát triển tiếp tục cải tiến các giao thức an toàn của mình cho phù hợp.

Theo tài liệu thẻ hệ thống o3 được cập nhật của OpenAI , mô hình vẫn nằm dưới ngưỡng khả năng rủi ro cao trong các danh mục như sử dụng sai mục đích sinh học và hóa học và không có môi trường mã hóa gốc hoặc quyền truy cập thiết bị đầu cuối, giúp giảm thêm các vectơ sử dụng sai mục đích tiềm ẩn.

Operator vẫn là bản xem trước nghiên cứu và chỉ có thể truy cập được đối với người dùng ChatGPT Pro. Phiên bản API Responses của Operator sẽ tiếp tục dựa trên mô hình GPT-4o, ít nhất là cho đến hiện tại.

Ý nghĩa đối với những người ra quyết định kỹ thuật của doanh nghiệp

Phiên bản Operator nâng cấp sẽ cải thiện đáng kể quy trình làm việc của các chuyên gia trong lĩnh vực kỹ thuật AI, điều phối, quản lý dữ liệu và bảo mật CNTT.

Đối với những người xây dựng hoặc bảo trì các mô hình học máy, độ chính xác được cải thiện và đầu ra có cấu trúc của mô hình sẽ giúp giảm chi phí xác thực thử nghiệm và khắc phục sự cố.

Trong bối cảnh phối hợp, nó cung cấp một công cụ thực tế, đáng tin cậy để tự động hóa các thành phần dựa trên trình duyệt của các đường ống phức tạp.

Các kỹ sư dữ liệu có thể phân công các tương tác thủ công trên web, chẳng hạn như xác minh và thu thập dữ liệu, một cách tự tin hơn, dành thời gian cho công việc tối ưu hóa cấp cao hơn.

Trong khi đó, các chuyên gia bảo mật có được cách an toàn hơn để mô phỏng hành vi của người dùng trong các cuộc kiểm tra và diễn tập ứng phó sự cố, nhờ vào các cơ chế an toàn theo từng lớp của mô hình.

Trong các lĩnh vực này, Operator dựa trên o3 giới thiệu cả khả năng nâng cấp và khuôn khổ giảm thiểu rủi ro, giúp nó trở thành sự bổ sung thiết thực cho bộ công cụ kỹ thuật hiện đại.

BÌNH LUẬN

Vui lòng nhập bình luận của bạn
Vui lòng nhập tên của bạn ở đây

Tin nóng tuần này

Apple Mất Một Lãnh Đạo AI Quan Trọng Vào Tay Meta

Apple đang phải đối mặt với một vết thương...

Phá vỡ nút thắt lưu trữ của AI và tăng cường suy luận ở biên

Trong sự kiện Transform 2025 của VentureBeat , Greg Matson, giám...

OpenAI Từ Chối Việc Giao Dịch Cổ Phiếu Token Hoá Của Robinhood

Robinhood đã bắt đầu cung cấp cổ phiếu token...

Chủ đề

Bài viết liên quan

Danh mục phổ biến

Language »