Những phát triển gần đây từ các công ty như DeepSeek cho thấy Trung Quốc đã nhanh chóng thích nghi và vượt qua các hạn chế quốc tế như thế nào thông qua các phương pháp sáng tạo để phát triển AI.
Theo Lee Kai-fu, CEO của công ty khởi nghiệp Trung Quốc 01.AI và cựu giám đốc Google Trung Quốc, khoảng cách giữa năng lực AI của Trung Quốc và Mỹ đã thu hẹp đáng kể.
“Trước đây, tôi nghĩ là chậm từ sáu đến chín tháng và chậm hơn trong mọi thứ. Còn bây giờ tôi nghĩ là chậm hơn ba tháng trong một số công nghệ cốt lõi, nhưng chậm hơn trong một số lĩnh vực cụ thể”, Lee nói với Reuters trong một cuộc phỏng vấn gần đây.
DeepSeek đã nổi lên như một đứa con tinh thần cho làn sóng đổi mới AI mới của Trung Quốc. Vào ngày 20 tháng 1 năm 2025, khi Donald Trump nhậm chức Tổng thống Hoa Kỳ, DeepSeek đã lặng lẽ ra mắt mô hình R1 của mình .
Mô hình ngôn ngữ lớn mã nguồn mở, chi phí thấp này được cho là có thể cạnh tranh hoặc vượt trội hơn ChatGPT-4 của OpenAI, nhưng lại được phát triển với chi phí chỉ bằng một phần nhỏ.
Hiệu quả thuật toán cao hơn ưu thế phần cứng
Điều khiến những thành tựu của DeepSeek trở nên đặc biệt quan trọng là cách chúng đạt được mặc dù bị hạn chế tiếp cận với silicon mới nhất. Thay vì bị hạn chế bởi các biện pháp kiểm soát xuất khẩu của Hoa Kỳ, sự đổi mới AI của Trung Quốc đã phát triển mạnh mẽ bằng cách tập trung vào hiệu quả thuật toán và các phương pháp tiếp cận mới đối với kiến trúc mô hình.
Các khía cạnh khác nhau của phương pháp tiếp cận sáng tạo này đã được chứng minh thêm khi DeepSeek phát hành phiên bản V3 nâng cấp vào ngày 25 tháng 3 năm 2025. DeepSeek-V3-0324 có khả năng suy luận nâng cao và hiệu suất được cải thiện trong nhiều điểm chuẩn.
Mô hình này cho thấy sức mạnh đặc biệt về toán học, đạt 59,4 điểm trong Kỳ thi Toán học mời của Mỹ (AIME) so với 39,6 điểm của mô hình trước đó. Mô hình này cũng cải thiện 10 điểm trên LiveCodeBench lên 49,2.
Giảng viên Kuittinen Petri của Đại học Häme đã lưu ý trên nền tảng truyền thông xã hội X rằng “DeepSeek đang thực hiện tất cả những điều này chỉ với [khoảng] 2% [nguồn] tiền của OpenAI.”
Khi ông nhắc mô hình mới tạo trang chủ phản hồi cho một công ty AI, nó đã tạo ra một trang web đầy đủ chức năng, thân thiện với thiết bị di động chỉ với 958 dòng mã.
Phản ứng của thị trường và tác động toàn cầu
Thị trường tài chính đã nhận thấy sự thay đổi trong bối cảnh AI. Khi DeepSeek ra mắt mô hình R1 vào tháng 1, Nasdaq của Mỹ đã giảm 3,1%, trong khi S&P 500 giảm 1,5% – một dấu hiệu cho thấy các nhà đầu tư nhận ra tác động tiềm tàng của sự đổi mới AI của Trung Quốc đối với các công ty công nghệ phương Tây đã thành danh.
Những diễn biến này mang đến những cơ hội và thách thức cho cộng đồng toàn cầu nói chung. Việc Trung Quốc tập trung vào các mô hình mã nguồn mở, tiết kiệm chi phí có thể dân chủ hóa khả năng tiếp cận các năng lực AI tiên tiến cho các nền kinh tế mới nổi.
Cả Trung Quốc và Hoa Kỳ đều đang đầu tư mạnh vào cơ sở hạ tầng AI. Chính quyền Trump đã công bố Dự án Stargate trị giá 500 tỷ đô la và Trung Quốc dự kiến đầu tư hơn 10 nghìn tỷ nhân dân tệ (1,4 nghìn tỷ đô la Mỹ) vào công nghệ vào năm 2030.
Sự phức tạp của chuỗi cung ứng và các cân nhắc về môi trường
Bối cảnh AI đang phát triển tạo ra những phức tạp địa chính trị mới. Các quốc gia như Hàn Quốc nêu bật tình hình này. Là nhà sản xuất chất bán dẫn lớn thứ hai thế giới, Hàn Quốc đã phụ thuộc nhiều hơn vào Trung Quốc vào năm 2023 đối với năm trong số sáu nguyên liệu thô quan trọng nhất cần thiết cho sản xuất chip.
Các công ty như Toyota, SK Hynix, Samsung và LG Chem vẫn dễ bị tổn thương do sự thống trị chuỗi cung ứng của Trung Quốc. Khi sự phát triển của AI tăng tốc, những tác động về môi trường cũng hiện rõ.
Theo nhóm nghiên cứu, Viện Tiến bộ, việc duy trì vị trí dẫn đầu về AI sẽ đòi hỏi Hoa Kỳ phải xây dựng năm cụm máy tính gigawatt trong năm năm. Đến năm 2030, các trung tâm dữ liệu có thể tiêu thụ 10% điện năng của Hoa Kỳ, gấp đôi mức 4% được ghi nhận vào năm 2023.
Tương tự, Greenpeace Đông Á ước tính mức tiêu thụ điện cho cơ sở hạ tầng kỹ thuật số của Trung Quốc sẽ tăng vọt 289% vào năm 2035.
Con đường phía trước trong phát triển AI
Sự xuất hiện của DeepSeek đã thách thức các giả định về hiệu quả của các hạn chế công nghệ. Như Lee Kai-fu đã quan sát, các lệnh trừng phạt bán dẫn của Washington là một “con dao hai lưỡi” tạo ra những thách thức ngắn hạn nhưng cuối cùng buộc các công ty Trung Quốc phải đổi mới trong điều kiện hạn chế.
Jasper Zhang, huy chương vàng Olympic toán học với bằng tiến sĩ từ Đại học California, Berkeley, đã thử nghiệm DeepSeek-V3-0324 với một bài toán AIME 2025 và báo cáo rằng “nó đã giải quyết bài toán một cách suôn sẻ”. Zhang bày tỏ sự tin tưởng rằng “các mô hình AI nguồn mở cuối cùng sẽ chiến thắng”, đồng thời nói thêm rằng công ty khởi nghiệp Hyperbolic của ông hiện hỗ trợ mô hình mới trên nền tảng đám mây của mình.
Các chuyên gia trong ngành hiện đang suy đoán rằng DeepSeek có thể phát hành mô hình R2 trước thời hạn. Li Bangzhu, người sáng lập AIcpb.com, một trang web theo dõi mức độ phổ biến của các ứng dụng AI, lưu ý rằng “khả năng mã hóa mạnh hơn nhiều và phiên bản mới có thể mở đường cho việc ra mắt R2”. R2 dự kiến sẽ được phát hành vào đầu tháng 5, theo Reuters .
Cả hai quốc gia đều đang mở rộng ranh giới của những gì có thể. Những tác động này vượt ra ngoài biên giới của họ để tác động đến kinh tế toàn cầu, an ninh và chính sách môi trường.