Ant Group, công ty thuộc sở hữu của Alibaba, đang chuyển sang sử dụng chip bán dẫn nội địa để huấn luyện các mô hình trí tuệ nhân tạo (AI), nhằm giảm chi phí và hạn chế sự phụ thuộc vào công nghệ bị kiểm soát từ Mỹ theo các nguồn tin thân cận.
Huấn Luyện AI Với Chip Trung Quốc: Kết Quả Đạt Mức Tương Đương Nvidia H800
Ant đã sử dụng chip từ các nhà cung cấp trong nước bao gồm các đơn vị liên quan đến Alibaba và Huawei để huấn luyện mô hình ngôn ngữ lớn (LLM) theo phương pháp MoE (Mixture of Experts).
Kết quả thu được, theo nguồn tin, có thể so sánh với những gì đạt được khi dùng chip Nvidia H800 dòng GPU hiệu năng cao nhưng đang bị hạn chế xuất khẩu sang Trung Quốc.
Hiện tại, Ant vẫn dùng một phần GPU Nvidia, nhưng đang chuyển dần sang các lựa chọn thay thế từ AMD và các nhà sản xuất chip Trung Quốc để phục vụ cho thế hệ mô hình mới của họ.
MoE Cách Tiếp Cận Chi Phí Thấp Cho Mô Hình AI Cỡ Lớn
Mô hình MoE là kỹ thuật phân chia tác vụ thành các tập dữ liệu nhỏ, được xử lý song song bởi các “chuyên gia” riêng biệt trong hệ thống.
Cách tiếp cận này giúp tăng hiệu suất huấn luyện và giảm chi phí tài nguyên, đang được sử dụng bởi các ông lớn như Google, DeepSeek (startup tại Hàng Châu), và giờ đây là Ant Group.
Ant đã công bố nghiên cứu mô tả kết quả mô hình huấn luyện, cho biết một số bài test cho thấy hiệu năng tốt hơn cả Meta, tuy nhiên, các kết quả này chưa được kiểm chứng độc lập.
Mục tiêu nghiên cứu được nêu rõ trong tiêu đề bài báo:
“Huấn luyện mô hình ở quy mô lớn mà không cần GPU cao cấp.”
Chi Phí Huấn Luyện Giảm Gần 20% Nhờ Chip Nội Địa
Theo Ant Group, để huấn luyện 1.000 tỷ token (đơn vị dữ liệu AI dùng để học), chi phí khi dùng phần cứng truyền thống là khoảng 6,35 triệu Nhân dân tệ (~880.000 USD).
Với giải pháp tối ưu bằng chip giá rẻ hơn, chi phí này giảm còn 5,1 triệu Nhân dân tệ (~707.000 USD) tiết kiệm gần 20%.
Theo báo cáo của Business Insider, chi phí vận hành mô hình mã nguồn mở của Ant rẻ hơn từ 20 đến 40 lần so với các mô hình tương đương từ OpenAI, trích dẫn phân tích từ Bernstein.
Nova Act Và Tư Duy Khác Biệt Với Nvidia
Trái với hướng đi của Nvidia vốn tập trung phát triển GPU ngày càng mạnh hơn với nhiều lõi và bộ nhớ hơn Ant lại chọn cách tối ưu mô hình để giảm chi phí và khai thác phần cứng phổ thông.
CEO Nvidia Jensen Huang từng tuyên bố rằng:
“Nhu cầu tính toán sẽ còn tăng, kể cả khi có các mô hình tiết kiệm tài nguyên hơn như DeepSeek R1. Doanh nghiệp sẽ tiếp tục tìm đến GPU mạnh để tối đa hóa doanh thu.”
Tuy nhiên, Ant và các công ty Trung Quốc dường như đang chọn hướng đi ngược lại: giảm chi phí bằng cách tối ưu mô hình cho phần cứng nội địa rẻ hơn.
Ứng Dụng Thực Tế Và Mã Nguồn Mở
Ant cho biết họ sẽ ứng dụng hai mô hình mới là Ling-Plus (290 tỷ tham số) và Ling-Lite (16,8 tỷ tham số) cho các lĩnh vực như tài chính và y tế.
Đầu năm nay, Ant đã mua lại Haodf.com, một nền tảng y tế trực tuyến tại Trung Quốc bước đi thể hiện tham vọng áp dụng AI vào chăm sóc sức khỏe.
Họ cũng vận hành các sản phẩm AI khác như:
- Zhixiaobao: Trợ lý ảo
- Maxiaocai: Nền tảng tư vấn tài chính tự động
“Chỉ cần tìm được điểm yếu của đối thủ, bạn vẫn có thể chiến thắng. Ứng dụng thực tế mới là điều quan trọng,” – Robin Yu, Giám đốc công nghệ tại hãng AI Shengshang Tech chia sẻ.
Thách Thức Kỹ Thuật Vẫn Còn
Mặc dù đạt được những kết quả khả quan, nhóm nghiên cứu của Ant thừa nhận rằng:
- Việc huấn luyện mô hình MoE vẫn rất khó khăn
- Chỉ cần thay đổi nhỏ về phần cứng hoặc cấu trúc mô hình, hiệu suất có thể trở nên không ổn định, thậm chí tăng mạnh tỷ lệ lỗi
Kết Luận
Việc Ant Group sử dụng chip nội địa và tối ưu chi phí huấn luyện AI đánh dấu một bước tiến đáng chú ý trong cuộc đua công nghệ giữa Trung Quốc và Mỹ.
Dù chưa vượt mặt các tên tuổi như OpenAI hay Nvidia, chiến lược của Ant cho thấy:
- AI hiệu quả không nhất thiết phải dựa vào GPU cao cấp
- Với cách tiếp cận đúng, doanh nghiệp vẫn có thể tạo ra mô hình mạnh với chi phí hợp lý
Trong bối cảnh căng thẳng công nghệ và hạn chế xuất khẩu giữa Mỹ – Trung, giải pháp của Ant có thể mở đường cho các doanh nghiệp Trung Quốc độc lập hơn về công nghệ, đồng thời thúc đẩy đổi mới sáng tạo với nguồn lực nội địa.
Tìm hiểu thêm tại: https://chatgpt.com/