Thứ Ba, Tháng 6 17, 2025

OpenAI mang GPT-4.1 và 4.1 mini đến ChatGPT — những điều doanh nghiệp cần biết

Nó cũng thêm GPT-4.1 mini, thay thế GPT-4o mini làm mặc định cho tất cả người dùng ChatGPT, bao gồm cả những người dùng miễn phí. Phiên bản “mini” cung cấp tham số quy mô nhỏ hơn và do đó, phiên bản ít mạnh hơn với các tiêu chuẩn an toàn tương tự.

Cả hai mô hình đều có sẵn thông qua mục thả xuống “thêm mô hình” ở góc trên cùng của cửa sổ trò chuyện trong ChatGPT, giúp người dùng linh hoạt lựa chọn giữa GPT-4.1, GPT-4.1 mini và các mô hình lý luận như o3, o4-mini và o4-mini-high.

Ban đầu chỉ dành cho các nhà phát triển phần mềm và AI của bên thứ ba thông qua giao diện lập trình ứng dụng (API) của OpenAI, GPT-4.1 đã được thêm vào ChatGPT sau khi nhận được phản hồi mạnh mẽ từ người dùng.

Michelle Pokrass, người đứng đầu nghiên cứu đào tạo sau đào tạo của OpenAI, đã xác nhận trên X rằng sự thay đổi này được thúc đẩy bởi nhu cầu, bà viết: “ban đầu chúng tôi dự định chỉ giữ lại mô hình api này nhưng tất cả các bạn đều muốn nó trong chatgpt 🙂 chúc các bạn viết code vui vẻ!”

Giám đốc sản phẩm của OpenAI, Kevin Weil đã đăng trên X rằng: “Chúng tôi xây dựng nó cho các nhà phát triển, vì vậy nó rất tốt trong việc lập trình và làm theo hướng dẫn—hãy thử xem!”

Một mô hình tập trung vào doanh nghiệp

GPT-4.1 được thiết kế ngay từ đầu để mang lại tính thực tiễn ở cấp độ doanh nghiệp.

Ra mắt vào tháng 4 năm 2025 cùng với GPT-4.1 mini và nano , dòng sản phẩm này ưu tiên nhu cầu của nhà phát triển và các trường hợp sử dụng sản xuất.

GPT-4.1 cải thiện 21,4 điểm so với GPT-4o trên chuẩn mực kỹ thuật phần mềm SWE-bench Verified và tăng 10,5 điểm trên các tác vụ theo hướng dẫn trong chuẩn mực MultiChallenge của Scale. Nó cũng giảm độ dài dòng xuống 50% so với các mô hình khác, một đặc điểm được người dùng doanh nghiệp khen ngợi trong quá trình thử nghiệm ban đầu.

Bối cảnh, tốc độ và quyền truy cập mô hình

GPT-4.1 hỗ trợ các cửa sổ ngữ cảnh chuẩn cho ChatGPT: 8.000 mã thông báo cho người dùng miễn phí, 32.000 mã thông báo cho người dùng Plus và 128.000 mã thông báo cho người dùng Pro.

Theo nhà phát triển Angel Bogado đăng trên X, các giới hạn này tương tự như những giới hạn được sử dụng trong các mô hình ChatGPT trước đó, mặc dù vẫn đang có kế hoạch tăng thêm kích thước ngữ cảnh.

Trong khi các phiên bản API của GPT-4.1 có thể xử lý tới một triệu mã thông báo, khả năng mở rộng này vẫn chưa khả dụng trong ChatGPT, mặc dù đã có gợi ý về khả năng hỗ trợ trong tương lai.

Khả năng ngữ cảnh mở rộng này cho phép người dùng API đưa toàn bộ cơ sở mã hoặc các tài liệu pháp lý và tài chính lớn vào mô hình—hữu ích khi xem xét các hợp đồng có nhiều tài liệu hoặc phân tích các tệp nhật ký lớn.

OpenAI đã thừa nhận hiệu suất giảm đôi chút khi sử dụng lượng dữ liệu đầu vào cực lớn, nhưng các trường hợp thử nghiệm của doanh nghiệp cho thấy hiệu suất ổn định lên đến hàng trăm nghìn mã thông báo.

Đánh giá và an toàn

OpenAI cũng đã ra mắt trang web Trung tâm đánh giá an toàn để cung cấp cho người dùng quyền truy cập vào các số liệu hiệu suất chính trên nhiều mô hình.

GPT-4.1 cho thấy kết quả vững chắc trong các đánh giá này. Trong các bài kiểm tra độ chính xác thực tế, nó đạt 0,40 điểm trên chuẩn SimpleQA và 0,63 điểm trên PersonQA, vượt trội hơn một số phiên bản trước.

Nó cũng đạt 0,99 điểm trong thang đo “không an toàn” của OpenAI trong các bài kiểm tra từ chối tiêu chuẩn và 0,86 điểm trong các lời nhắc khó hơn.

Tuy nhiên, trong bài kiểm tra bẻ khóa StrongReject—một chuẩn mực học thuật về độ an toàn trong điều kiện bất lợi—GPT-4.1 đạt 0,23 điểm, thấp hơn các mô hình như GPT-4o-mini và o3.

Tuy nhiên, ứng dụng này đạt điểm 0,96 trong các lời nhắc bẻ khóa do con người thực hiện, cho thấy mức độ an toàn thực tế cao hơn khi sử dụng thông thường.

Về tuân thủ hướng dẫn, GPT-4.1 tuân theo hệ thống phân cấp được xác định của OpenAI (hệ thống trên nhà phát triển, nhà phát triển trên tin nhắn của người dùng) với điểm số 0,71 để giải quyết xung đột tin nhắn giữa hệ thống và người dùng. Nó cũng hoạt động tốt trong việc bảo vệ các cụm từ được bảo vệ và tránh việc tiết lộ giải pháp trong các tình huống hướng dẫn.

Bối cảnh hóa GPT-4.1 so với các phiên bản trước

Việc phát hành GPT-4.1 diễn ra sau khi xem xét kỹ lưỡng GPT-4.5 , ra mắt vào tháng 2 năm 2025 dưới dạng bản xem trước nghiên cứu. Mô hình đó nhấn mạnh vào việc học không giám sát tốt hơn, cơ sở kiến ​​thức phong phú hơn và giảm ảo giác—giảm từ 61,8% trong GPT-4o xuống còn 37,1%. Nó cũng cho thấy những cải tiến về sắc thái cảm xúc và văn bản dài, nhưng nhiều người dùng thấy những cải tiến này không đáng kể.

Bất chấp những lợi ích này, GPT-4.5 đã bị chỉ trích vì giá cao — lên tới 180 đô la cho một triệu token đầu ra thông qua API — và hiệu suất kém trong các chuẩn mực toán học và mã hóa so với các mô hình o-series của OpenAI. Các số liệu trong ngành lưu ý rằng mặc dù GPT-4.5 mạnh hơn về khả năng giao tiếp chung và tạo nội dung, nhưng lại kém hiệu quả trong các ứng dụng dành riêng cho nhà phát triển.

Ngược lại, GPT-4.1 được coi là giải pháp thay thế nhanh hơn, tập trung hơn. Mặc dù thiếu kiến ​​thức sâu rộng và mô hình cảm xúc mở rộng của GPT-4.5, nhưng nó được điều chỉnh tốt hơn để hỗ trợ mã hóa thực tế và tuân thủ hướng dẫn của người dùng đáng tin cậy hơn.

Trên API của OpenAI, GPT-4.1 hiện có giá là 2,00 đô la cho một triệu mã thông báo đầu vào, 0,50 đô la cho một triệu mã thông báo đầu vào được lưu trong bộ nhớ đệm và 8,00 đô la cho một triệu mã thông báo đầu ra.

Đối với những ai muốn cân bằng giữa tốc độ và trí thông minh với chi phí thấp hơn, GPT-4.1 mini có giá 0,40 đô la cho một triệu mã thông báo đầu vào, 0,10 đô la cho một triệu mã thông báo đầu vào được lưu trong bộ nhớ đệm và 1,60 đô la cho một triệu mã thông báo đầu ra.

Các mô hình Flash-Lite và Flash của Google có giá khởi điểm từ 0,075–0,10 đô la cho một triệu mã thông báo đầu vào và 0,30–0,40 đô la cho một triệu mã thông báo đầu ra, thấp hơn một phần mười chi phí so với mức giá cơ bản của GPT-4.1.

Nhưng trong khi GPT-4.1 có giá cao hơn, nó cung cấp các chuẩn mực kỹ thuật phần mềm mạnh hơn và hướng dẫn chính xác hơn, điều này có thể rất quan trọng đối với các tình huống triển khai doanh nghiệp đòi hỏi độ tin cậy hơn chi phí. Cuối cùng, GPT-4.1 của OpenAI mang lại trải nghiệm cao cấp về độ chính xác và hiệu suất phát triển, trong khi các mô hình Gemini của Google hấp dẫn các doanh nghiệp có ý thức về chi phí cần các tầng mô hình linh hoạt và khả năng đa phương thức.

Điều đó có ý nghĩa gì đối với những người ra quyết định của doanh nghiệp

Việc giới thiệu GPT-4.1 mang lại những lợi ích cụ thể cho các nhóm doanh nghiệp quản lý triển khai LLM, điều phối và vận hành dữ liệu:

  • Các kỹ sư AI giám sát triển khai LLM có thể mong đợi tốc độ được cải thiện và tuân thủ hướng dẫn. Đối với các nhóm quản lý toàn bộ vòng đời LLM—từ tinh chỉnh mô hình đến khắc phục sự cố—GPT-4.1 cung cấp bộ công cụ phản hồi nhanh hơn và hiệu quả hơn. Nó đặc biệt phù hợp với các nhóm tinh gọn đang chịu áp lực phải triển khai các mô hình hiệu suất cao một cách nhanh chóng mà không ảnh hưởng đến tính an toàn hoặc tuân thủ.
  • Các nhà điều phối AI tập trung vào thiết kế đường ống có thể mở rộng sẽ đánh giá cao tính mạnh mẽ của GPT-4.1 trước hầu hết các lỗi do người dùng gây ra và hiệu suất mạnh mẽ của nó trong các thử nghiệm phân cấp thông báo. Điều này giúp dễ dàng tích hợp vào các hệ thống điều phối ưu tiên tính nhất quán, xác thực mô hình và độ tin cậy hoạt động.
  • Các kỹ sư dữ liệu chịu trách nhiệm duy trì chất lượng dữ liệu cao và tích hợp các công cụ mới sẽ được hưởng lợi từ tỷ lệ ảo giác thấp hơn và độ chính xác thực tế cao hơn của GPT-4.1. Hành vi đầu ra có thể dự đoán được hơn của nó hỗ trợ xây dựng quy trình làm việc dữ liệu đáng tin cậy, ngay cả khi nguồn lực của nhóm bị hạn chế.
  • Các chuyên gia bảo mật CNTT được giao nhiệm vụ nhúng bảo mật trên các đường ống DevOps có thể thấy giá trị trong khả năng chống bẻ khóa phổ biến của GPT-4.1 và hành vi đầu ra được kiểm soát của nó. Mặc dù điểm số chống bẻ khóa học thuật của nó vẫn còn chỗ để cải thiện, nhưng hiệu suất cao của mô hình chống lại các khai thác do con người tạo ra giúp hỗ trợ tích hợp an toàn vào các công cụ nội bộ.

Trong các vai trò này, việc GPT-4.1 được định vị là mô hình được tối ưu hóa về tính rõ ràng, tuân thủ và hiệu quả triển khai khiến nó trở thành lựa chọn hấp dẫn cho các doanh nghiệp vừa muốn cân bằng hiệu suất với nhu cầu vận hành.

Một bước tiến mới

Trong khi GPT-4.5 đại diện cho một cột mốc mở rộng trong phát triển mô hình, GPT-4.1 tập trung vào tiện ích. Nó không phải là đắt nhất hoặc đa phương thức nhất, nhưng nó mang lại lợi ích có ý nghĩa trong các lĩnh vực quan trọng đối với doanh nghiệp: độ chính xác, hiệu quả triển khai và chi phí.

Việc định vị lại này phản ánh xu hướng rộng hơn của ngành – tránh xa việc xây dựng các mô hình lớn nhất bằng mọi giá và hướng tới việc tạo ra các mô hình có khả năng dễ tiếp cận và thích ứng hơn. GPT-4.1 đáp ứng nhu cầu đó, cung cấp một công cụ linh hoạt, sẵn sàng sản xuất cho các nhóm đang cố gắng nhúng AI sâu hơn vào hoạt động kinh doanh của họ.

Khi OpenAI tiếp tục phát triển các mô hình cung cấp của mình, GPT-4.1 đại diện cho một bước tiến trong việc dân chủ hóa AI tiên tiến cho môi trường doanh nghiệp. Đối với những người ra quyết định cân bằng khả năng với ROI, nó cung cấp một con đường rõ ràng hơn để triển khai mà không ảnh hưởng đến hiệu suất hoặc sự an toàn.

BÌNH LUẬN

Vui lòng nhập bình luận của bạn
Vui lòng nhập tên của bạn ở đây

Tin nóng tuần này

Databricks mở mã nguồn công cụ ETL khai báo, tăng tốc xây dựng pipeline tới 90%

Databricks công bố mở mã nguồn công cụ Spark...

Google DeepMind ra mắt mô hình AI thay đổi vĩnh viễn dự báo bão

DeepMind hợp tác với Trung tâm Bão Quốc gia...

Microsoft và OpenAI “chia tay”: Ai sẽ nắm giữ quyền lực AI toàn cầu?

Mối quan hệ từng được ví như “bromance” công...

OpenAI tung o3-pro, giảm giá o3 đến 80%

Model mới cùng chiến lược giá mạnh tay của...

Meta đầu tư 15 tỷ USD vào Scale AI, theo đuổi tham vọng siêu trí tuệ

Meta đang tái định hướng chiến lược AI bằng...

Chủ đề

Bài viết liên quan

Danh mục phổ biến

Language »