“Thật là một năm tuyệt vời, và chúng ta có rất nhiều điều đáng kinh ngạc để nói đến,” Huang nói với khán giả chật kín, khi nói chuyện với khán giả đã tăng theo cấp số nhân khi AI chuyển đổi từ một công nghệ thích hợp thành một lực lượng cơ bản định hình lại toàn bộ các ngành công nghiệp. Mức cược đặc biệt cao trong năm nay sau
sự hỗn loạn của thị trường do công ty khởi nghiệp Trung Quốc
DeepSeek phát hành mô hình lý luận R1 hiệu quả cao, khiến
cổ phiếu của Nvidia lao dốc vào đầu năm nay trong bối cảnh lo ngại về khả năng giảm nhu cầu đối với GPU đắt tiền của công ty.
Trong bối cảnh này, Huang đã đưa ra tầm nhìn toàn diện về tương lai của Nvidia, nhấn mạnh lộ trình rõ ràng cho điện toán trung tâm dữ liệu, những tiến bộ trong khả năng suy luận của AI và những động thái táo bạo vào lĩnh vực robot và xe tự hành. Bài thuyết trình đã vẽ nên bức tranh về một công ty đang nỗ lực duy trì vị thế thống lĩnh của mình trong cơ sở hạ tầng AI trong khi mở rộng sang các lãnh thổ mới nơi công nghệ của công ty có thể tạo ra giá trị. Cổ phiếu của Nvidia đã giảm trong suốt bài thuyết trình, đóng cửa thấp hơn 3% trong ngày, cho thấy các nhà đầu tư có thể đã hy vọng vào những thông báo thậm chí còn ấn tượng hơn.
Nhưng nếu thông điệp của Huang rõ ràng thì đó là: AI không hề chậm lại, và Nvidia cũng vậy. Từ những con chip đột phá đến việc thúc đẩy AI vật lý, đây là năm điểm quan trọng nhất rút ra từ GTC 2025.
Nền tảng Blackwell tăng tốc sản xuất với hiệu suất tăng 40 lần so với Hopper
Theo Huang, trọng tâm của chiến lược điện toán AI của Nvidia, nền tảng Blackwell , hiện đang được “sản xuất toàn diện”, đồng thời nhấn mạnh rằng “nhu cầu của khách hàng là rất lớn”. Đây là một cột mốc quan trọng sau những gì mà Huang trước đây mô tả là “trục trặc” trong giai đoạn đầu sản xuất.
Huang đã đưa ra một so sánh nổi bật giữa Blackwell và người tiền nhiệm của nó, Hopper : “Blackwell NVLink 72 với Dynamo có hiệu suất AI factory gấp 40 lần Hopper.” Bước nhảy vọt về hiệu suất này đặc biệt quan trọng đối với khối lượng công việc suy luận, được Huang định vị là “một trong những khối lượng công việc quan trọng nhất trong thập kỷ tới khi chúng ta mở rộng quy mô AI”.
Hiệu suất tăng lên vào thời điểm quan trọng đối với ngành công nghiệp, vì các mô hình AI lý luận như R1 của DeepSeek đòi hỏi nhiều tính toán hơn đáng kể so với các mô hình ngôn ngữ lớn truyền thống. Huang minh họa điều này bằng một cuộc trình diễn so sánh cách tiếp cận của LLM truyền thống đối với cách sắp xếp chỗ ngồi trong đám cưới (439 mã thông báo, nhưng sai) so với cách tiếp cận của mô hình lý luận (gần 9.000 mã thông báo, nhưng đúng).
“Lượng tính toán mà chúng ta phải thực hiện trong AI lớn hơn nhiều nhờ AI lý luận và đào tạo các hệ thống AI lý luận và hệ thống tác nhân”, Huang giải thích, trực tiếp đề cập đến thách thức do các mô hình hiệu quả hơn như DeepSeek đặt ra. Thay vì định vị các mô hình hiệu quả là mối đe dọa đối với mô hình kinh doanh của Nvidia, Huang đã định hình chúng như là động lực thúc đẩy nhu cầu tính toán tăng lên — thực sự biến một điểm yếu tiềm ẩn thành một điểm mạnh.
Kiến trúc Rubin thế hệ tiếp theo được công bố với lộ trình rõ ràng trong nhiều năm
Trong một động thái được thiết kế rõ ràng nhằm mang lại sự tin tưởng cho khách hàng doanh nghiệp và nhà cung cấp dịch vụ đám mây vào lộ trình dài hạn của Nvidia, Huang đã vạch ra lộ trình chi tiết cho cơ sở hạ tầng điện toán AI đến năm 2027. Đây là mức độ minh bạch khác thường về các sản phẩm tương lai đối với một công ty phần cứng, nhưng phản ánh chu kỳ lập kế hoạch dài hạn cần thiết cho cơ sở hạ tầng AI.
Huang tuyên bố: “Chúng tôi có lộ trình hàng năm được vạch ra để bạn có thể lập kế hoạch cho cơ sở hạ tầng AI của mình”, đồng thời nhấn mạnh tầm quan trọng của khả năng dự đoán đối với những khách hàng thực hiện khoản đầu tư vốn lớn.
Lộ trình bao gồm Blackwell Ultra ra mắt vào nửa cuối năm 2025, cung cấp hiệu suất AI cao hơn 1,5 lần so với chip Blackwell hiện tại. Tiếp theo là Vera Rubin , được đặt theo tên nhà thiên văn học đã phát hiện ra vật chất tối, vào nửa cuối năm 2026. Rubin sẽ có CPU mới nhanh gấp đôi so với CPU Grace hiện tại , cùng với kiến trúc mạng và hệ thống bộ nhớ mới.
“Về cơ bản, mọi thứ đều hoàn toàn mới, ngoại trừ khung xe”, Huang giải thích về nền tảng Vera Rubin.
Lộ trình mở rộng hơn nữa đến Rubin Ultra vào nửa cuối năm 2027, mà Huang mô tả là “mở rộng cực độ” cung cấp sức mạnh tính toán gấp 14 lần so với các hệ thống hiện tại. “Bạn có thể thấy Rubin sẽ giảm chi phí đáng kể”, ông lưu ý, giải quyết những lo ngại về kinh tế của cơ sở hạ tầng AI.
Lộ trình chi tiết này đóng vai trò là câu trả lời của Nvidia cho những lo ngại của thị trường về tính cạnh tranh và tính bền vững của các khoản đầu tư vào AI, qua đó cho khách hàng và nhà đầu tư biết rằng công ty có một con đường rõ ràng để tiến về phía trước bất kể hiệu quả của mô hình AI phát triển như thế nào.
Nvidia Dynamo nổi lên như ‘hệ điều hành’ cho các nhà máy AI
Một trong những thông báo quan trọng nhất là Nvidia Dynamo , một hệ thống phần mềm nguồn mở được thiết kế để tối ưu hóa suy luận AI. Huang mô tả nó là “về cơ bản là hệ điều hành của một nhà máy AI”, vẽ ra sự tương đồng với cách các trung tâm dữ liệu truyền thống dựa vào các hệ điều hành như VMware để điều phối các ứng dụng doanh nghiệp.
Dynamo giải quyết thách thức phức tạp trong việc quản lý khối lượng công việc AI trên các hệ thống GPU phân tán, xử lý các tác vụ như song song đường ống, song song tenxơ, song song chuyên gia, xử lý hàng loạt trong khi bay, suy luận phân tách và quản lý khối lượng công việc. Những thách thức kỹ thuật này ngày càng trở nên quan trọng khi các mô hình AI ngày càng phức tạp hơn và các phương pháp tiếp cận dựa trên lý luận đòi hỏi nhiều tính toán hơn.
Hệ thống này lấy tên từ máy phát điện, mà Huang lưu ý là “thiết bị đầu tiên bắt đầu cuộc Cách mạng Công nghiệp gần đây nhất, cuộc cách mạng công nghiệp năng lượng”. Sự so sánh này định vị Dynamo là công nghệ nền tảng cho cuộc cách mạng AI.
Bằng cách biến Dynamo thành mã nguồn mở, Nvidia đang cố gắng củng cố hệ sinh thái của mình và đảm bảo phần cứng của mình vẫn là nền tảng được ưa chuộng cho khối lượng công việc AI, ngay cả khi việc tối ưu hóa phần mềm ngày càng trở nên quan trọng đối với hiệu suất và hiệu quả. Các đối tác bao gồm Perplexity hiện đang làm việc với Nvidia để triển khai Dynamo.
“Chúng tôi rất vui khi có nhiều đối tác đang hợp tác với chúng tôi trong dự án này”, Huang cho biết, đặc biệt nhấn mạnh Perplexity là “một trong những đối tác yêu thích của tôi” vì “công việc mang tính cách mạng mà họ thực hiện”.
Phương pháp nguồn mở là một động thái chiến lược nhằm duy trì vị trí trung tâm của Nvidia trong hệ sinh thái AI, đồng thời thừa nhận tầm quan trọng của việc tối ưu hóa phần mềm bên cạnh hiệu suất phần cứng thô.
Trí tuệ nhân tạo vật lý và robot chiếm vị trí trung tâm với mô hình Groot N1 nguồn mở
Trong khoảnh khắc có thể được coi là ấn tượng nhất về mặt thị giác của bài phát biểu quan trọng, Huang đã tiết lộ một bước tiến đáng kể vào lĩnh vực robot và AI vật lý, đạt đến đỉnh điểm với sự xuất hiện của “Blue”, một chú robot lấy cảm hứng từ Star Wars bước lên sân khấu và tương tác với Huang.
Huang giải thích rằng: “Vào cuối thập kỷ này, thế giới sẽ thiếu ít nhất 50 triệu lao động”, đồng thời định vị ngành robot là giải pháp cho tình trạng thiếu hụt lao động toàn cầu và là cơ hội thị trường lớn.
Công ty đã công bố Nvidia Isaac Groot N1 , được mô tả là “mô hình nền tảng mở, có thể tùy chỉnh hoàn toàn đầu tiên trên thế giới dành cho kỹ năng và lý luận tổng quát của giống người”. Việc biến mô hình này thành mã nguồn mở thể hiện một động thái quan trọng nhằm đẩy nhanh quá trình phát triển trong lĩnh vực robot, tương tự như cách các chương trình LLM mã nguồn mở đã thúc đẩy quá trình phát triển AI nói chung.
Bên cạnh Groot N1, Nvidia đã công bố quan hệ đối tác với Google DeepMind và Disney Research để phát triển Newton, một công cụ vật lý nguồn mở cho mô phỏng robot. Huang giải thích nhu cầu về “một công cụ vật lý được thiết kế cho các vật thể rất mịn, cứng và mềm, được thiết kế để có thể đào tạo phản hồi xúc giác và các kỹ năng vận động tinh và điều khiển bộ truyền động”.
Việc tập trung vào mô phỏng để đào tạo robot tuân theo cùng một mô hình đã được chứng minh là thành công trong phát triển xe tự hành, sử dụng dữ liệu tổng hợp và học tăng cường để đào tạo các mô hình AI mà không bị hạn chế bởi việc thu thập dữ liệu vật lý.
Huang giải thích, mô tả cách công nghệ mô phỏng của Nvidia cho phép đào tạo robot ở quy mô lớn như thế nào: “Sử dụng Omniverse để điều khiển Cosmos và Cosmos để tạo ra vô số môi trường, cho phép chúng tôi tạo ra dữ liệu có cơ sở, được chúng tôi kiểm soát và đồng thời vô hạn một cách có hệ thống”.
Những thông báo về robot này thể hiện sự mở rộng của Nvidia từ công nghệ AI truyền thống sang thế giới thực, có khả năng mở ra những thị trường và ứng dụng mới cho công nghệ của mình.
Quan hệ đối tác của GM báo hiệu bước tiến lớn vào xe tự hành và AI công nghiệp
Để hoàn thiện chiến lược mở rộng AI từ trung tâm dữ liệu ra thế giới thực của Nvidia, Huang đã công bố mối quan hệ hợp tác quan trọng với General Motors để “xây dựng đội xe tự lái trong tương lai”.
“GM đã chọn Nvidia để hợp tác với họ để xây dựng đội xe tự lái trong tương lai của họ”, Huang tuyên bố. “Thời đại của xe tự hành đã đến, và chúng tôi mong muốn được hợp tác với GM AI trong cả ba lĩnh vực: AI cho sản xuất, để họ có thể cách mạng hóa cách thức sản xuất của mình; AI cho doanh nghiệp, để họ có thể cách mạng hóa cách thức làm việc, thiết kế ô tô và mô phỏng ô tô; và sau đó là AI cho trong ô tô”.
Quan hệ đối tác này là một sự tín nhiệm đáng kể vào công nghệ xe tự hành của Nvidia từ nhà sản xuất ô tô lớn nhất nước Mỹ. Huang lưu ý rằng Nvidia đã nghiên cứu xe tự lái trong hơn một thập kỷ, lấy cảm hứng từ hiệu suất đột phá của AlexNet trong các cuộc thi về thị giác máy tính.
“Khoảnh khắc tôi nhìn thấy AlexNet là khoảnh khắc đầy cảm hứng và phấn khích, khiến chúng tôi quyết định dồn toàn lực vào việc chế tạo xe tự lái”, Huang nhớ lại.
Bên cạnh quan hệ đối tác với GM, Nvidia đã công bố Halos, được mô tả là “một hệ thống an toàn toàn diện” cho xe tự hành. Huang nhấn mạnh rằng an toàn là ưu tiên “hiếm khi được chú ý” nhưng đòi hỏi công nghệ “từ silicon đến hệ thống, phần mềm hệ thống, thuật toán, phương pháp luận”.
Các thông báo về ô tô mở rộng phạm vi hoạt động của Nvidia từ các trung tâm dữ liệu đến nhà máy và phương tiện, định vị công ty để nắm bắt giá trị trên toàn bộ nền tảng AI và nhiều ngành công nghiệp.
Kiến trúc sư của hành động thứ hai của AI: Sự phát triển chiến lược của Nvidia vượt ra ngoài chip
GTC 2025 tiết lộ quá trình chuyển đổi của Nvidia từ nhà sản xuất GPU sang công ty cơ sở hạ tầng AI đầu cuối. Thông qua lộ trình Blackwell-to-Rubin, Huang đã báo hiệu rằng Nvidia sẽ không từ bỏ sự thống trị về mặt tính toán của mình, trong khi sự chuyển hướng sang phần mềm nguồn mở ( Dynamo ) và các mô hình ( Groot N1 ) thừa nhận rằng phần cứng đơn thuần không thể đảm bảo tương lai của công ty.
Nvidia đã khéo léo định hình lại thách thức về hiệu quả của DeepSeek , lập luận rằng các mô hình hiệu quả hơn sẽ thúc đẩy khả năng tính toán tổng thể lớn hơn khi lý luận AI mở rộng – mặc dù các nhà đầu tư vẫn còn hoài nghi, khiến cổ phiếu giảm mặc dù có lộ trình toàn diện.
Điều khiến Nvidia trở nên khác biệt là tầm nhìn của Huang vượt ra ngoài silicon. Sáng kiến về robot không chỉ là bán chip; mà là tạo ra các mô hình điện toán mới đòi hỏi nguồn tài nguyên điện toán khổng lồ. Tương tự như vậy, quan hệ đối tác với GM định vị Nvidia ở trung tâm của quá trình chuyển đổi AI ô tô trên toàn bộ quá trình sản xuất, thiết kế và bản thân các phương tiện.
Thông điệp của Huang rất rõ ràng: Nvidia cạnh tranh về tầm nhìn, không chỉ về giá. Khi điện toán mở rộng từ trung tâm dữ liệu sang các thiết bị vật lý, Nvidia đặt cược rằng việc kiểm soát toàn bộ ngăn xếp AI—từ silicon đến mô phỏng—sẽ xác định ranh giới tiếp theo của điện toán. Trong thế giới của Huang, cuộc cách mạng AI chỉ mới bắt đầu và lần này, nó đang bước ra khỏi phòng máy chủ.