Thứ Bảy, Tháng 4 19, 2025

Các mô hình GPT-4.1 mới của OpenAI có thể xử lý một triệu mã thông báo và giải quyết các vấn đề mã hóa tốt hơn bao giờ hết

Công ty AI có trụ sở tại San Francisco đã giới thiệu ba mô hình — GPT-4.1, GPT-4.1 mini và GPT-4.1 nano — tất cả đều có sẵn ngay lập tức thông qua API của công ty. Dòng sản phẩm mới này hoạt động tốt hơn trong các tác vụ kỹ thuật phần mềm, tuân theo hướng dẫn chính xác hơn và có thể xử lý tới một triệu mã thông báo ngữ cảnh, tương đương với khoảng 750.000 từ.

“GPT-4.1 cung cấp hiệu suất vượt trội với chi phí thấp hơn”, Kevin Weil, giám đốc sản phẩm tại OpenAI, cho biết trong thông báo hôm thứ Hai. “Những mô hình này tốt hơn GPT-4o ở hầu hết mọi khía cạnh”.

Có lẽ điều quan trọng nhất đối với khách hàng doanh nghiệp là giá cả: GPT-4.1 sẽ có giá thấp hơn 26% so với phiên bản tiền nhiệm, trong khi phiên bản nano nhẹ trở thành sản phẩm có giá cả phải chăng nhất của OpenAI với giá chỉ 12 xu cho một triệu token.

Những cải tiến của GPT-4.1 nhắm vào những điểm khó khăn nhất của các nhà phát triển doanh nghiệp

Trong một cuộc phỏng vấn thẳng thắn với VentureBeat, Michelle Pokrass, người đứng đầu nghiên cứu sau đào tạo tại OpenAI, đã nhấn mạnh rằng các ứng dụng kinh doanh thực tế thúc đẩy quá trình phát triển.

“GPT-4.1 được đào tạo với một mục tiêu: hữu ích cho các nhà phát triển”, Pokrass nói với VentureBeat. “Chúng tôi thấy GPT-4.1 tốt hơn nhiều trong việc tuân theo các loại hướng dẫn mà các doanh nghiệp sử dụng trong thực tế, giúp triển khai các ứng dụng sẵn sàng cho sản xuất dễ dàng hơn nhiều”.

Sự tập trung vào tiện ích thực tế này được phản ánh trong kết quả chuẩn. Trên SWE-bench Verified , đo lường khả năng kỹ thuật phần mềm, GPT-4.1 đạt 54,6% — cải thiện đáng kể 21,4 điểm phần trăm so với GPT-4o.

Đối với các doanh nghiệp phát triển các tác nhân AI hoạt động độc lập trên các tác vụ phức tạp, những cải tiến trong hướng dẫn sau đây đặc biệt có giá trị. Trên chuẩn MultiChallenge của Scale, GPT-4.1 đạt 38,3%, vượt trội hơn GPT-4o 10,5 điểm phần trăm.

Tại sao chiến lược mô hình ba tầng của OpenAI lại thách thức các đối thủ cạnh tranh như Google và Anthropic

Việc giới thiệu ba mẫu máy riêng biệt với các mức giá khác nhau hướng đến thị trường AI đa dạng. GPT-4.1 hàng đầu hướng đến các ứng dụng doanh nghiệp phức tạp, trong khi các phiên bản mini và nano hướng đến các trường hợp sử dụng mà tốc độ và hiệu quả chi phí là ưu tiên hàng đầu.

“Không phải tất cả các tác vụ đều cần trí thông minh cao nhất hoặc khả năng hàng đầu”, Pokrass nói với VentureBeat. “Nano sẽ là mô hình chủ lực cho các trường hợp sử dụng như tự động hoàn thành, phân loại, trích xuất dữ liệu hoặc bất kỳ thứ gì khác mà tốc độ là mối quan tâm hàng đầu”.

Đồng thời, OpenAI đã công bố kế hoạch ngừng sử dụng GPT-4.5 Preview — mô hình lớn nhất và đắt nhất của công ty được phát hành chỉ hai tháng trước — khỏi API của mình vào ngày 14 tháng 7. Công ty định vị GPT-4.1 là giải pháp thay thế tiết kiệm chi phí hơn, mang lại “hiệu suất được cải thiện hoặc tương tự trên nhiều khả năng chính với chi phí và độ trễ thấp hơn nhiều”.

Động thái này cho phép OpenAI thu hồi lại tài nguyên điện toán đồng thời cung cấp cho các nhà phát triển một giải pháp thay thế hiệu quả hơn cho dịch vụ đắt đỏ nhất của mình, với mức giá 75 đô la cho một triệu token đầu vào và 150 đô la cho một triệu token đầu ra.

Kết quả thực tế: Thomson Reuters, Carlyle và Windsurf đang tận dụng GPT-4.1 như thế nào

Một số khách hàng doanh nghiệp đã thử nghiệm các mô hình trước khi ra mắt đã báo cáo những cải tiến đáng kể trong lĩnh vực cụ thể của họ.

Thomson Reuters đã thấy độ chính xác của việc xem xét nhiều tài liệu được cải thiện 17% khi sử dụng GPT-4.1 với trợ lý AI pháp lý của mình, CoCounsel . Sự cải tiến này đặc biệt có giá trị đối với các quy trình làm việc pháp lý phức tạp liên quan đến các tài liệu dài với mối quan hệ sắc thái giữa các điều khoản.

Công ty tài chính Carlyle báo cáo hiệu suất tốt hơn 50% khi trích xuất dữ liệu tài chính chi tiết từ các tài liệu dày đặc — một khả năng quan trọng để phân tích đầu tư và ra quyết định.

Varun Mohan, CEO của nhà cung cấp công cụ lập trình Windsurf (trước đây là Codeium), đã chia sẻ số liệu hiệu suất chi tiết trong buổi thông báo.

Mohan cho biết: “Chúng tôi thấy rằng GPT-4.1 giảm 40% số lần cần phải đọc các tệp không cần thiết so với các mô hình hàng đầu khác và cũng sửa đổi các tệp không cần thiết ít hơn 70%”. “Mô hình này cũng ít chi tiết hơn một cách đáng ngạc nhiên… GPT-4.1 ít chi tiết hơn 50% so với các mô hình hàng đầu khác”.

Bối cảnh triệu token: Những gì doanh nghiệp có thể làm với khả năng xử lý tăng gấp 8 lần

Cả ba mô hình đều có cửa sổ ngữ cảnh là một triệu mã thông báo — lớn hơn tám lần so với giới hạn 128.000 mã thông báo của GPT-4o. Khả năng mở rộng này cho phép các mô hình xử lý nhiều tài liệu dài hoặc toàn bộ cơ sở mã cùng một lúc.

Trong một cuộc trình diễn, OpenAI đã cho thấy GPT-4.1 phân tích tệp nhật ký máy chủ NASA gồm 450.000 mã thông báo từ năm 1995, xác định một mục nhập bất thường ẩn sâu trong dữ liệu. Khả năng này đặc biệt có giá trị đối với các tác vụ liên quan đến các tập dữ liệu lớn, chẳng hạn như kho lưu trữ mã hoặc bộ sưu tập tài liệu của công ty.

Tuy nhiên, OpenAI thừa nhận sự suy giảm hiệu suất với các đầu vào cực lớn. Trong thử nghiệm OpenAI-MRCR nội bộ , độ chính xác đã giảm từ khoảng 84% với 8.000 mã thông báo xuống còn 50% với một triệu mã thông báo.

Bối cảnh AI doanh nghiệp đang thay đổi như thế nào khi Google, Anthropic và OpenAI cạnh tranh để giành được các nhà phát triển

Bản phát hành này ra mắt khi sự cạnh tranh trong không gian AI doanh nghiệp đang nóng lên. Google gần đây đã ra mắt Gemini 2.5 Pro với cửa sổ ngữ cảnh một triệu token tương đương, trong khi Claude 3.7 Sonnet của Anthropic đã thu hút được sự chú ý của các doanh nghiệp đang tìm kiếm các giải pháp thay thế cho các dịch vụ của OpenAI.

Công ty khởi nghiệp AI của Trung Quốc DeepSeek gần đây cũng đã nâng cấp mô hình của mình, tạo thêm áp lực cho OpenAI để duy trì vị trí dẫn đầu.

Pokrass cho biết: “Thật tuyệt khi thấy những cải tiến trong việc hiểu ngữ cảnh dài đã chuyển thành hiệu suất tốt hơn trên các ngành dọc cụ thể như phân tích pháp lý và trích xuất dữ liệu tài chính”. “Chúng tôi thấy rằng việc kiểm tra các mô hình của mình vượt ra ngoài các chuẩn mực học thuật và đảm bảo chúng hoạt động tốt với các doanh nghiệp và nhà phát triển là rất quan trọng”.

Bước tiếp theo: OpenAI tập trung vào các công cụ AI thực tế dành cho doanh nghiệp và nhà phát triển

Bằng cách phát hành các mô hình này cụ thể thông qua API của mình thay vì ChatGPT, OpenAI thể hiện cam kết của mình đối với các nhà phát triển và khách hàng doanh nghiệp. Công ty có kế hoạch dần dần tích hợp các tính năng từ GPT-4.1 vào ChatGPT theo thời gian, nhưng trọng tâm chính vẫn là cung cấp các công cụ mạnh mẽ cho các doanh nghiệp xây dựng các ứng dụng chuyên biệt.

Để khuyến khích nghiên cứu sâu hơn về xử lý ngữ cảnh dài, OpenAI đang phát hành hai tập dữ liệu đánh giá: OpenAI-MRCR để kiểm tra khả năng đồng tham chiếu nhiều vòng và Graphwalks để đánh giá lý luận phức tạp trên các tài liệu dài.

Đối với những người ra quyết định trong doanh nghiệp, họ GPT-4.1 cung cấp một cách tiếp cận thực tế và tiết kiệm chi phí hơn để triển khai AI. Khi các tổ chức tiếp tục tích hợp AI vào hoạt động của mình, những cải tiến về độ tin cậy, tính đặc hiệu và hiệu quả này có thể đẩy nhanh quá trình áp dụng trong các ngành công nghiệp vẫn cân nhắc chi phí triển khai so với lợi ích tiềm năng.

Trong khi các đối thủ cạnh tranh theo đuổi các mô hình lớn hơn, tốn kém hơn, thì sự thay đổi chiến lược của OpenAI với GPT-4.1 cho thấy tương lai của AI có thể không thuộc về các mô hình lớn nhất, mà là các mô hình hiệu quả nhất. Bước đột phá thực sự có thể không nằm ở các chuẩn mực, mà là ở việc đưa AI cấp doanh nghiệp đến gần hơn với nhiều doanh nghiệp hơn bao giờ hết.

BÌNH LUẬN

Vui lòng nhập bình luận của bạn
Vui lòng nhập tên của bạn ở đây

Tin nóng tuần này

So Sánh ChatGPT o3, o4-mini, GPT-4o và GPT-4.5: Mô Hình Nào Hoạt Động Tốt Nhất?

OpenAI đã làm dày thêm danh sách mô hình...

Meta FAIR Ra Mắt 5 Dự Án AI Mới, Hướng Tới Trí Tuệ Máy Giống Với Con Người

Nhóm Nghiên cứu AI Cốt lõi FAIR (Fundamental AI...

Thông báo, tin tức và nhiều thông tin khác của NVIDIA từ GTC 2025

Cuộc cách mạng AI đang tăng tốc nhờ các...

Chủ đề

Bài viết liên quan

Danh mục phổ biến

Language »