Thứ Bảy, Tháng 4 19, 2025

OpenAI giảm giá GPT-4.1, châm ngòi cho cuộc chiến giá AI giữa các gã khổng lồ công nghệ

Nâng cấp hiệu suất với giá Costco

Dòng GPT-4.1 mới tự hào có những nâng cấp nghiêm túc, bao gồm tỷ lệ thắng 54,6% trên chuẩn mã hóa SWE-bench, đánh dấu bước nhảy vọt đáng kể so với các phiên bản trước. Nhưng tiếng vang không chỉ là về chuẩn tốt hơn. Các thử nghiệm thực tế của Qodo.ai trên các yêu cầu kéo GitHub thực tế cho thấy GPT-4.1 đánh bại Claude 3.7 Sonnet của Anthropic trong 54,9% trường hợp, chủ yếu là nhờ ít lỗi dương tính giả hơn và các đề xuất mã chính xác, có liên quan hơn.

Cấu trúc giá mới của OpenAI — hướng đến khả năng chi trả một cách công khai—cuối cùng có thể giúp các nhóm cảnh giác với chi phí AI tăng cao có thể thay đổi tình hình:

Người mẫuChi phí đầu vào (trên mỗi Mtok)Chi phí đầu ra (trên mỗi Mtok)
GPT-4.12,00 đô la8,00 đô la
GPT-4.1 nhỏ0,40 đô la1,60 đô la
GPT-4.1 nano0,10 đô la0,40 đô la

Điểm nổi bật ở đây là gì? Giảm giá lưu trữ đệm 75% hào phóng, thực sự khuyến khích các nhà phát triển tối ưu hóa việc tái sử dụng nhanh chóng—đặc biệt có lợi cho mã hóa lặp lại và các tác nhân đàm thoại.

Cảm thấy nóng

Các mô hình Claude của Anthropic đã khẳng định được vị thế của mình bằng cách cân bằng giữa công suất và chi phí. Nhưng mức giá táo bạo của GPT-4.1 đã làm giảm đáng kể vị thế thị trường của họ:

Người mẫuChi phí đầu vào (trên mỗi Mtok)Chi phí đầu ra (trên mỗi Mtok)
Claude 3.7 Sonnet3,00 đô la15,00 đô la
Claude 3.5 Haiku0,80 đô la4,00 đô la
Claude 3 Opus15,00 đô la75,00 đô la

Anthropic vẫn cung cấp mức chiết khấu hấp dẫn cho bộ nhớ đệm (lên đến 90% trong một số trường hợp), nhưng lợi thế về giá cơ bản của GPT-4.1 và những cải tiến về bộ nhớ đệm dành cho nhà phát triển đưa OpenAI trở thành lựa chọn thân thiện với ngân sách hơn, đặc biệt hấp dẫn đối với các công ty khởi nghiệp và nhóm nhỏ hơn.

Những cạm bẫy tài chính tiềm ẩn

Sự phức tạp về giá của Gemini đang ngày càng trở nên khét tiếng trong giới lập trình viên. Theo Prompt Shield, cấu trúc phân tầng của Gemini—đặc biệt là với phiên bản 2.5 Pro mạnh mẽ—có thể nhanh chóng leo thang thành cơn ác mộng tài chính do phụ phí cho các đầu vào và đầu ra dài gấp đôi vượt quá ngưỡng ngữ cảnh nhất định:

Người mẫuChi phí đầu vào (trên mỗi Mtok)Chi phí đầu ra (trên mỗi Mtok)
Gemini 2.5 Pro ≤200k1,25 đô la10,00 đô la
Gemini 2.5 Pro >200k2,50 đô la15,00 đô la
Song Tử 2.0 Flash0,10 đô la0,40 đô la

Hơn nữa, Gemini không có chức năng tự động tắt tính năng thanh toán, mà Prompt Shield cho biết sẽ khiến các nhà phát triển dễ bị tấn công Từ chối Ví – các yêu cầu độc hại được thiết kế để cố tình làm tăng hóa đơn đám mây của bạn, mà các biện pháp bảo vệ hiện tại của Gemini không thể giảm thiểu hoàn toàn. Mức giá có thể dự đoán được và không gây bất ngờ của GPT-4.1 dường như là một biện pháp đối phó chiến lược với sự phức tạp và rủi ro tiềm ẩn của Gemini.

Bối cảnh là vua

Dòng Grok của xAI, được Elon Musk ủng hộ, gần đây đã công bố giá API cho các mẫu mới nhất của mình vào tuần trước :

Người mẫuChi phí đầu vào cho mỗi MtokĐầu ra (trên Mtok)
Grok-33,00 đô la15,00 đô la
Grok-3 Fast-Beta5,00 đô la25,00 đô la
Grok-3 Mini-Nhanh0,60 đô la4,00 đô la

Một yếu tố phức tạp với Grok là cửa sổ ngữ cảnh của nó. Musk đã quảng cáo rằng Grok 3 có thể xử lý 1 triệu token (tương tự như tuyên bố của GPT-4.1), nhưng API hiện tại thực sự chỉ xử lý tối đa 131k token , kém xa so với lời hứa đó. Sự khác biệt này đã gây ra một số lời chỉ trích từ người dùng trên X, chỉ ra một chút tiếp thị quá nhiệt tình từ phía xAI. 

Đối với các nhà phát triển đang đánh giá Grok so với GPT-4.1, điều này đáng chú ý: GPT-4.1 cung cấp toàn bộ bối cảnh 1M như đã quảng cáo, trong khi API của Grok có thể không (ít nhất là khi ra mắt). Về mặt minh bạch giá cả, mô hình của xAI khá đơn giản trên lý thuyết, nhưng những hạn chế và nhu cầu phải trả nhiều hơn cho dịch vụ “nhanh” cho thấy sự đánh đổi của một công ty nhỏ hơn đang cố gắng cạnh tranh với những gã khổng lồ trong ngành.

Windsurf đặt cược lớn vào sự hấp dẫn của nhà phát triển GPT-4.1

Thể hiện sự tự tin cao độ vào những lợi thế thực tế của GPT-4.1, Windsurf—IDE hỗ trợ AI—đã cung cấp bản dùng thử GPT-4.1 miễn phí, không giới hạn chưa từng có trong một tuần . Đây không chỉ là sự hào phóng; mà là một canh bạc chiến lược rằng một khi các nhà phát triển trải nghiệm trực tiếp khả năng và tiết kiệm chi phí của GPT-4.1, việc quay lại các mô hình đắt tiền hơn hoặc kém khả năng hơn sẽ là một sự bán hàng khó khăn.

Kỷ nguyên mới của giá cả cạnh tranh AI

GPT-4.1 của OpenAI không chỉ làm thay đổi trò chơi định giá mà còn có khả năng thiết lập các tiêu chuẩn mới cho cộng đồng phát triển AI. Với các đầu ra chính xác, đáng tin cậy được xác minh bằng các chuẩn mực bên ngoài, tính minh bạch về giá đơn giản và các biện pháp bảo vệ tích hợp chống lại chi phí mất kiểm soát, GPT-4.1 đưa ra một lập luận thuyết phục để trở thành lựa chọn mặc định trong các API mô hình đóng.

Các nhà phát triển nên chuẩn bị tinh thần—không chỉ cho AI rẻ hơn, mà còn cho hiệu ứng domino mà cuộc cách mạng về giá này có thể gây ra khi Anthropic, Google và xAI cố gắng bắt kịp. Đối với các nhóm trước đây bị giới hạn bởi chi phí, độ phức tạp hoặc cả hai, GPT-4.1 có thể chỉ là chất xúc tác cho làn sóng đổi mới mới do AI cung cấp.

BÌNH LUẬN

Vui lòng nhập bình luận của bạn
Vui lòng nhập tên của bạn ở đây

Tin nóng tuần này

So Sánh ChatGPT o3, o4-mini, GPT-4o và GPT-4.5: Mô Hình Nào Hoạt Động Tốt Nhất?

OpenAI đã làm dày thêm danh sách mô hình...

Meta FAIR Ra Mắt 5 Dự Án AI Mới, Hướng Tới Trí Tuệ Máy Giống Với Con Người

Nhóm Nghiên cứu AI Cốt lõi FAIR (Fundamental AI...

Thông báo, tin tức và nhiều thông tin khác của NVIDIA từ GTC 2025

Cuộc cách mạng AI đang tăng tốc nhờ các...

Chủ đề

Bài viết liên quan

Danh mục phổ biến

Language »