Các công ty doanh nghiệp cần quan tâm nghiêm túc đến Deep Research của OpenAI. Sản phẩm này tích hợp những tính năng mới mạnh mẽ đến mức có thể khiến nhiều người rơi vào cảnh thất nghiệp.
Deep Research đi đầu xu hướng đang tăng: tích hợp các mô hình ngôn ngữ lớn (LLM) với công cụ tìm kiếm và những công cụ khác để mở rộng khả năng. (Khi bài viết này vừa khởi thảo, Elon Musk cùng xAI cũng giới thiệu Grok 3, tuyên bố sở hữu khả năng tương tự, bao gồm Deep Search. Thế nhưng vẫn còn quá sớm để đánh giá thực tế, vì phần lớn người đăng ký chưa được thử Grok 3.)
Deep Research của OpenAI, ra mắt ngày 3/2, yêu cầu gói Pro trên OpenAI (giá 200 đô la mỗi tháng) và hiện chỉ có tại Mỹ. Có lẽ hạn chế này đã cản trở cộng đồng nhà phát triển toàn cầu tiếp cận, vốn thường rất nhanh mổ xẻ các cải tiến AI mới.
Khi người dùng kích hoạt chế độ Deep Research, họ có thể hỏi mô hình hàng đầu o3 của OpenAI bất kỳ câu hỏi nào. Kết quả? Một báo cáo thường vượt trội so với sản phẩm của nhà phân tích chuyên nghiệp, cung cấp nhanh hơn và chi phí rẻ hơn rất nhiều.
Cách Deep Research vận hành
Dù Deep Research được bàn tán nhiều, tác động toàn diện của nó vẫn chưa ngấm hết. Phản ứng ban đầu cho thấy khả năng nghiên cứu ấn tượng, dù đôi khi nó “ảo tưởng” (hallucination) về tài liệu tham khảo. Đã có trường hợp người dùng kể rằng anh ta dùng nó để hỗ trợ vợ đang bị ung thư vú. Anh ta nói Deep Research còn phân tích sâu hơn cả bác sĩ về lý do tại sao trị xạ lại phù hợp. Tổng hợp ý kiến, giáo sư AI của Wharton, ông Ethan Mollick, nhận xét: lợi ích của Deep Research vượt xa sai sót đôi lúc, vì việc kiểm tra lại thực tế cũng mất ít thời gian hơn rất nhiều so với việc tự làm.
Các tổ chức tài chính đã tìm cơ hội áp dụng. Một ngân hàng top 12 tại Mỹ, BNY, xem xét dùng Deep Research cho báo cáo rủi ro tín dụng. Ảnh hưởng của nó sẽ lan sang mọi ngành, từ y tế đến bán lẻ, sản xuất, quản lý chuỗi cung ứng — bất cứ lĩnh vực nào dựa trên tri thức.
Một tác tử nghiên cứu thông minh hơn
Không giống những mô hình AI truyền thống cố gắng trả lời nhanh trong một lần, Deep Research trước tiên đặt câu hỏi để làm rõ. Nó có thể hỏi bốn hay nhiều hơn để chắc chắn hiểu đúng ý bạn. Tiếp đó, nó xây dựng kế hoạch nghiên cứu, thực hiện nhiều lượt tìm kiếm, rồi sửa đổi dựa trên thông tin mới, lặp lại đến khi tạo ra một báo cáo đầy đủ, định dạng hoàn chỉnh. Thời gian dao động từ vài phút đến nửa giờ, độ dài từ 1500 đến 20000 từ, thường kèm 15 đến 30 trích dẫn cùng URL, ít nhất theo trải nghiệm cá nhân của tôi suốt hơn tuần qua.
Công nghệ đằng sau Deep Research: LLM suy luận và agentic RAG
Deep Research kết hợp hai công nghệ theo cách chưa từng có ở một sản phẩm cho đại chúng.
- LLM suy luận (reasoning): Đầu tiên là mô hình o3 hiện đại của OpenAI, dẫn đầu về tư duy logic và quy trình “chuỗi suy nghĩ” (chain of thought) kéo dài. Khi công bố vào tháng 12/2024, o3 ghi 87,5% trên ARC-AGI, một chuẩn siêu khó để đo lường khả năng giải quyết vấn đề mới lạ. Điều thú vị là o3 chưa được phát hành độc lập cho các nhà phát triển. CEO của OpenAI, Sam Altman, đã tuyên bố tuần trước rằng mô hình thay vào đó sẽ được tích hợp trong “hệ thống trí tuệ hợp nhất,” kết hợp với công cụ tác tử (agentic) như tìm kiếm, tác tử lập trình… Deep Research chính là ví dụ cho kiểu sản phẩm này. Dù các đối thủ như DeepSeek-R1 tiệm cận khả năng của o3 (lý do khiến cộng đồng khá hào hứng dạo gần đây), OpenAI vẫn được coi là nhỉnh hơn chút.
- Agentic RAG: Thứ hai, agentic RAG (Retrieval Augmented Generation) là công nghệ đã có khoảng một năm, dùng các tác tử để tự tìm thông tin bối cảnh từ nhiều nguồn, kể cả tìm kiếm trên internet. Nó có thể sử dụng các tác tử gọi công cụ (tool-calling) để tìm dữ liệu ngoài web qua API, hoặc tác tử lập trình để thực thi chuỗi xử lý phức tạp hiệu quả hơn, hay truy vấn cơ sở dữ liệu. Giai đoạn đầu, Deep Research của OpenAI chủ yếu tìm kiếm web, nhưng lãnh đạo hãng gợi ý rằng về sau nó sẽ tham chiếu nhiều nguồn hơn.
Lợi thế cạnh tranh của OpenAI (và giới hạn)
Dù những công nghệ này không phải mới, OpenAI đã tinh chỉnh chúng — nhờ lợi thế dẫn đầu, nguồn tài trợ khổng lồ và mô hình phát triển đóng — đưa Deep Research lên tầm cao mới. Họ cũng khai thác phản hồi từ hơn 300 triệu người dùng ChatGPT. OpenAI dẫn đầu nghiên cứu về các phương pháp xác minh tuần tự để có kết quả tốt hơn. Rõ ràng họ đã triển khai tìm kiếm theo cách thú vị, có thể vay mượn từ Bing hay công nghệ khác của Microsoft.
Tuy Deep Research vẫn “bịa” kết quả tìm kiếm, tần suất này ít hơn so với đối thủ, có thể một phần vì o3 giảm tỉ lệ “ảo tưởng” xuống 8%, mức thấp trong ngành. Bên cạnh đó, vẫn có cách cải thiện hơn nữa, như đặt ngưỡng tin cậy, bắt buộc trích dẫn…
Tuy nhiên, lợi thế và năng lực của OpenAI cũng có giới hạn. Chưa đầy hai ngày sau khi Deep Research ra mắt, HuggingFace giới thiệu “Open Deep Research” nguồn mở, kết hợp mô hình hàng đầu và khả năng agentic miễn phí, ra kết quả không quá kém cạnh. “Hào lũy” công nghệ không cao. Đối thủ mã nguồn mở như DeepSeek dường như sẽ vẫn bám sát, còn Microsoft với Magentic One cung cấp một khung tương tự hầu hết chức năng tác tử của OpenAI, chỉ là hai ví dụ.
Ngoài ra, Deep Research bị hạn chế ở những lĩnh vực thông tin ít xuất hiện trên mạng, nơi kiến thức chủ yếu tồn tại trong cơ sở dữ liệu riêng hay trong đầu các chuyên gia. Nó không hữu ích nếu bạn đang làm việc cho quỹ đầu tư phòng hộ phải tự liên hệ chuyên gia, thu thập thông tin khó tiếp cận. Như Ben Thompson nhận định, Deep Research của OpenAI có thể tác động đến phân khúc phân tích viên kỹ năng thấp, chứ không đe dọa công việc của “cao thủ.”
Sản phẩm “thông minh” nhất từ trước đến nay
Khi gộp khả năng suy luận “top-tier” với RAG tự trị, việc tạo ra một sản phẩm mạnh mẽ như Deep Research là điều dễ hiểu. Deep Research của OpenAI đạt 26,6% trên Humanity’s Last Exam, được xem là chuẩn đánh giá “thông minh” tốt nhất hiện tại. Đây là một tiêu chuẩn tương đối mới, thiết kế để làm khó mọi mô hình AI, gồm 3000 câu hỏi cho 100 chủ đề khác nhau. Với kết quả này, Deep Research bỏ xa Perplexity’s Deep Research (20,5%) và các mô hình trước đó như o3 mini (13%) hay DeepSeek-R1 (9,4%) (không kết hợp RAG tác tử). Phản hồi ban đầu cho thấy OpenAI dẫn trước cả về chất lượng lẫn độ sâu. Google Deep Research chưa được kiểm tra trên chuẩn này, nhưng theo đánh giá sơ bộ, OpenAI vẫn dẫn đầu.
Khác biệt: sản phẩm AI đầu tiên đủ sức đe dọa công ăn việc làm
Điểm khác biệt của Deep Research là khả năng “xóa sổ” công việc. Sam Witteveen, đồng sáng lập Red Dragon và là nhà phát triển AI tác tử, chia sẻ trong video trao đổi cùng tôi rằng nhiều người sẽ phản ứng: “Trời ơi, tôi chỉ tốn 200 đô la mà có báo cáo tương đương công ty tư vấn top 4, lẽ ra phải trả 20000 đô la.” Anh ấy cho rằng đây sẽ gây xáo trộn lớn, trong đó có việc con người mất việc.
Nhắc lại cuộc trò chuyện tôi có tuần rồi với ông Sarthak Pattanaik, trưởng bộ phận kỹ thuật và AI tại BNY, một ngân hàng lớn ở New York. Ông Pattanaik không đề cập công khai về ảnh hưởng của Deep Research đến biên chế, vì đây là chủ đề tế nhị. Tuy nhiên, ông thấy ứng dụng của Deep Research trong báo cáo “underwriting” tín dụng và công việc “cao cấp,” tác động đến nhiều nhóm như so sánh nhà cung cấp, so sánh sản phẩm. “Điều này không ảnh hưởng mọi công việc, nhưng sẽ tác động công việc về chiến lược, nghiên cứu…,” ông nói. “Ví dụ, bất cứ thứ gì thiên về “system two thinking,” mang tính khám phá, nơi đáp án đúng chỉ được xác định khi bạn đủ bối cảnh, tôi nghĩ đó là cơ hội.”
Góc nhìn lịch sử: mất việc và tạo việc làm
Cách mạng công nghệ thường thay đổi lao động trong ngắn hạn, nhưng tạo ra ngành nghề mới về lâu dài. Từ xe hơi thay thế xe ngựa, hay máy tính tự động hóa công việc văn thư, thị trường việc làm luôn vận động. Những cơ hội do công nghệ đột phá thường mang đến nhu cầu nhân sự mới. Công ty không nắm bắt cải tiến này có thể tụt lại.
CEO của OpenAI, Sam Altman, cũng thừa nhận mối liên hệ giữa Deep Research và việc làm, dù gián tiếp. Tại AI Summit Paris tuần trước, khi ông được hỏi về tầm nhìn Trí tuệ nhân tạo tổng quát (AGI) — nơi AI làm được hầu hết công việc của con người — thì câu trả lời đầu tiên ông nhắc đến chính là Deep Research: “Tôi nghĩ mô hình có thể thực hiện khoảng 1 con số phần trăm công việc trong nền kinh tế toàn cầu ngay lúc này, tuyên bố nghe thật điên rồ. Một năm trước, chẳng ai nghĩ khả năng này cận kề.” (xem phút thứ 3 của video). Ông nói thêm: “Chỉ mất 50 xu chi phí tính toán nhưng lại tương đương khối lượng 500 hay 5000 đô la lao động. Các công ty đang triển khai để làm việc hiệu quả hơn hẳn.”
Kết luận: kỷ nguyên mới cho lĩnh vực tri thức
Deep Research là cột mốc cho AI trong ngành nghề dùng tri thức. Bằng cách kết hợp khả năng suy luận hàng đầu với năng lực nghiên cứu tự động, OpenAI tạo ra công cụ thông minh hơn, nhanh hơn, chi phí thấp hơn nhiều so với phân tích viên con người.
Tác động này rất lớn, từ tài chính, y tế đến ra quyết định doanh nghiệp. Tổ chức biết tận dụng công nghệ này sẽ có ưu thế vượt trội. Ai phớt lờ sẽ tự chuốc lấy rủi ro.