DeepSeek-V3 hiện chạy ở tốc độ 20 token mỗi giây trên Mac Studio và đó là cơn ác mộng đối với OpenAI

Điều khiến lần ra mắt này đặc biệt đáng chú ý là giấy phép MIT của mẫu máy này
– cho phép sử dụng miễn phí cho mục đích thương mại – và các báo cáo ban đầu cho thấy máy có thể chạy trực tiếp trên phần cứng dành cho người tiêu dùng, cụ thể là
Mac Studio của Apple với
chip M3 Ultra .

“DeepSeek-V3-0324 mới trong 4-bit chạy ở tốc độ > 20 token/giây trên M3 Ultra 512GB với mlx-lm!” nhà nghiên cứu AI Awni Hannun đã viết trên phương tiện truyền thông xã hội. Trong khi Mac Studio trị giá 9.499 đô la có thể mở rộng định nghĩa về “phần cứng tiêu dùng”, khả năng chạy một mô hình lớn như vậy tại địa phương là một sự thay đổi lớn so với các yêu cầu của trung tâm dữ liệu thường liên quan đến AI tiên tiến.

Chiến lược ra mắt bí mật của DeepSeek làm gián đoạn kỳ vọng của thị trường AI

Mô hình 685 tỷ tham số này không có sách trắng, bài đăng trên blog hoặc quảng cáo tiếp thị đi kèm — chỉ là một tệp README trống và mô hình tự cân nhắc. Cách tiếp cận này trái ngược hoàn toàn với các đợt ra mắt sản phẩm được dàn dựng cẩn thận thường thấy ở các công ty AI phương Tây, nơi mà nhiều tháng cường điệu thường diễn ra trước khi phát hành thực tế.

Những người thử nghiệm ban đầu báo cáo những cải tiến đáng kể so với phiên bản trước. Nhà nghiên cứu AI Xeophon tuyên bố trong một bài đăng trên X.com: “Đã thử nghiệm DeepSeek V3 mới trên băng ghế nội bộ của tôi và nó có bước nhảy vọt lớn về tất cả các số liệu trong tất cả các bài kiểm tra. Hiện tại, nó là mô hình không lý luận tốt nhất, soán ngôi Sonnet 3.5.”

Yêu cầu này, nếu được xác thực bằng thử nghiệm rộng hơn, sẽ đưa mô hình mới của DeepSeek lên trên Claude Sonnet 3.5 của Anthropic, một trong những hệ thống AI thương mại được kính trọng nhất. Và không giống như Sonnet, yêu cầu đăng ký, trọng số của DeepSeek-V3-0324 có sẵn miễn phí để bất kỳ ai cũng có thể tải xuống và sử dụng.

Kiến trúc đột phá của DeepSeek V3-0324 đạt được hiệu quả vô song như thế nào

DeepSeek-V3-0324 sử dụng kiến trúc hỗn hợp chuyên gia (MoE) về cơ bản tái hiện cách thức hoạt động của các mô hình ngôn ngữ lớn. Các mô hình truyền thống kích hoạt toàn bộ số lượng tham số của chúng cho mọi tác vụ, nhưng cách tiếp cận của DeepSeek chỉ kích hoạt khoảng 37 tỷ trong số 685 tỷ tham số của nó trong các tác vụ cụ thể.

Kích hoạt có chọn lọc này đại diện cho sự thay đổi mô hình về hiệu quả của mô hình. Bằng cách chỉ kích hoạt các tham số “chuyên gia” có liên quan nhất cho từng tác vụ cụ thể, DeepSeek đạt được hiệu suất tương đương với các mô hình được kích hoạt hoàn toàn lớn hơn nhiều trong khi giảm đáng kể nhu cầu tính toán.

Mô hình kết hợp hai công nghệ đột phá bổ sung: Multi-Head Latent Attention (MLA) và Multi-Token Prediction (MTP). MLA tăng cường khả năng duy trì ngữ cảnh của mô hình trên các đoạn văn bản dài, trong khi MTP tạo ra nhiều token cho mỗi bước thay vì cách tiếp cận từng cái một thông thường. Cùng nhau, những cải tiến này tăng tốc độ đầu ra lên gần 80%.

Simon Willison , một nhà sáng tạo công cụ dành cho nhà phát triển, đã lưu ý trong một bài đăng trên blog rằng phiên bản lượng tử 4 bit giúp giảm dung lượng lưu trữ xuống còn 352GB, giúp chạy được trên phần cứng tiêu dùng cao cấp như Mac Studio với chip M3 Ultra .

Điều này thể hiện một sự thay đổi đáng kể có khả năng xảy ra trong việc triển khai AI. Trong khi cơ sở hạ tầng AI truyền thống thường dựa vào nhiều GPU Nvidia tiêu thụ nhiều kilowatt điện, Mac Studio chỉ sử dụng chưa đến 200 watt trong quá trình suy luận. Khoảng cách hiệu quả này cho thấy ngành công nghiệp AI có thể cần phải xem xét lại các giả định về yêu cầu cơ sở hạ tầng để có hiệu suất mô hình hàng đầu.

Cuộc cách mạng AI nguồn mở của Trung Quốc thách thức mô hình khu vườn khép kín của Thung lũng Silicon

Chiến lược phát hành của DeepSeek minh họa cho sự khác biệt cơ bản trong triết lý kinh doanh AI giữa các công ty Trung Quốc và phương Tây. Trong khi các công ty hàng đầu của Hoa Kỳ như OpenAI và Anthropic giữ các mô hình của họ sau các bức tường phí, các công ty AI Trung Quốc ngày càng chấp nhận cấp phép nguồn mở dễ dàng.

Cách tiếp cận này đang nhanh chóng chuyển đổi hệ sinh thái AI của Trung Quốc. Tính khả dụng mở của các mô hình tiên tiến tạo ra hiệu ứng nhân lên, cho phép các công ty khởi nghiệp, nhà nghiên cứu và nhà phát triển xây dựng dựa trên công nghệ AI tinh vi mà không cần chi phí vốn lớn. Điều này đã đẩy nhanh khả năng AI của Trung Quốc với tốc độ khiến các nhà quan sát phương Tây phải kinh ngạc.

Logic kinh doanh đằng sau chiến lược này phản ánh thực tế thị trường tại Trung Quốc. Với nhiều đối thủ cạnh tranh được tài trợ tốt, việc duy trì phương pháp tiếp cận độc quyền trở nên ngày càng khó khăn khi các đối thủ cạnh tranh cung cấp các khả năng tương tự miễn phí. Nguồn mở tạo ra các con đường giá trị thay thế thông qua sự lãnh đạo hệ sinh thái, dịch vụ API và các giải pháp doanh nghiệp được xây dựng trên các mô hình nền tảng có sẵn miễn phí.

Ngay cả những gã khổng lồ công nghệ Trung Quốc đã thành danh cũng nhận ra sự thay đổi này. Baidu đã công bố kế hoạch biến loạt mô hình Ernie 4.5 thành mã nguồn mở vào tháng 6, trong khi Alibaba và Tencent đã phát hành các mô hình AI mã nguồn mở với các khả năng chuyên biệt. Phong trào này hoàn toàn trái ngược với chiến lược lấy API làm trung tâm được các nhà lãnh đạo phương Tây áp dụng.

Phương pháp tiếp cận nguồn mở cũng giải quyết những thách thức độc đáo mà các công ty AI Trung Quốc phải đối mặt. Với những hạn chế về quyền truy cập vào chip Nvidia tiên tiến , các công ty Trung Quốc đã nhấn mạnh vào hiệu quả và tối ưu hóa để đạt được hiệu suất cạnh tranh với các nguồn lực tính toán hạn chế hơn. Sự đổi mới do nhu cầu thúc đẩy này hiện đã trở thành một lợi thế cạnh tranh tiềm năng.

DeepSeek V3-0324: Nền tảng cho cuộc cách mạng lý luận AI

Thời điểm và đặc điểm của DeepSeek-V3-0324 cho thấy nó sẽ đóng vai trò là nền tảng cho DeepSeek-R2 , một mô hình tập trung vào lý luận được cải tiến dự kiến ra mắt trong vòng hai tháng tới. Điều này tuân theo mô hình đã được thiết lập của DeepSeek, trong đó các mô hình cơ sở của nó đi trước các mô hình lý luận chuyên biệt trong vài tuần.

“Điều này phù hợp với cách họ phát hành V3 vào dịp Giáng sinh, sau đó là R1 vài tuần sau đó. R2 được đồn đoán là sẽ ra mắt vào tháng 4 nên có thể là thời điểm này”, người dùng Reddit mxforest lưu ý .

Những hàm ý của một mô hình lý luận nguồn mở tiên tiến không thể được cường điệu hóa. Các mô hình lý luận hiện tại như o1 của OpenAI và R1 của DeepSeek đại diện cho khả năng AI tiên tiến, chứng minh khả năng giải quyết vấn đề chưa từng có trong các lĩnh vực từ toán học đến mã hóa. Việc cung cấp công nghệ này miễn phí sẽ dân chủ hóa quyền truy cập vào các hệ thống AI hiện chỉ giới hạn ở những người có ngân sách lớn.

Mô hình R2 tiềm năng xuất hiện trong bối cảnh có những tiết lộ quan trọng về nhu cầu tính toán của các mô hình lý luận. CEO của Nvidia, Jensen Huang gần đây đã lưu ý rằng mô hình R1 của DeepSeek “ tiêu thụ nhiều hơn 100 lần so với AI không lý luận ”, trái ngược với các giả định trước đó của ngành về hiệu quả. Điều này cho thấy thành tựu đáng chú ý đằng sau các mô hình của DeepSeek, mang lại hiệu suất cạnh tranh trong khi hoạt động dưới những hạn chế về tài nguyên lớn hơn so với các đối tác phương Tây của chúng.

Nếu DeepSeek-R2 đi theo quỹ đạo do R1 đặt ra, nó có thể là một thách thức trực tiếp đối với GPT-5 , mô hình chủ lực tiếp theo của OpenAI được đồn đoán sẽ ra mắt trong những tháng tới. Sự tương phản giữa cách tiếp cận khép kín, được tài trợ mạnh mẽ của OpenAI và chiến lược mở, tiết kiệm tài nguyên của DeepSeek thể hiện hai tầm nhìn đối lập cho tương lai của AI.

Cách trải nghiệm DeepSeek V3-0324: Hướng dẫn đầy đủ dành cho nhà phát triển và người dùng

Đối với những người háo hức thử nghiệm DeepSeek-V3-0324 , có một số con đường tùy thuộc vào nhu cầu kỹ thuật và nguồn lực. Trọng số mô hình hoàn chỉnh có sẵn từ Hugging Face , mặc dù kích thước 641GB khiến việc tải xuống trực tiếp chỉ khả thi đối với những người có nhiều tài nguyên lưu trữ và tính toán.

Đối với hầu hết người dùng, các tùy chọn dựa trên đám mây cung cấp điểm vào dễ tiếp cận nhất. OpenRouter cung cấp quyền truy cập API miễn phí vào mô hình, với giao diện trò chuyện thân thiện với người dùng. Chỉ cần chọn DeepSeek V3 0324 làm mô hình để bắt đầu thử nghiệm.

Giao diện trò chuyện riêng của DeepSeek tại chat.deepseek.com có thể cũng đã được cập nhật lên phiên bản mới, mặc dù công ty chưa xác nhận rõ ràng điều này. Người dùng đầu tiên báo cáo rằng mô hình có thể truy cập thông qua nền tảng này với hiệu suất được cải thiện so với các phiên bản trước.

Các nhà phát triển muốn tích hợp mô hình vào các ứng dụng có thể truy cập mô hình thông qua nhiều nhà cung cấp suy luận khác nhau. Hyperbolic Labs đã công bố khả năng cung cấp ngay lập tức với tư cách là “nhà cung cấp suy luận đầu tiên phục vụ mô hình này trên Hugging Face”, trong khi OpenRouter cung cấp quyền truy cập API tương thích với OpenAI SDK .

Mô hình mới của DeepSeek ưu tiên độ chính xác về mặt kỹ thuật hơn là sự nồng nhiệt trong giao tiếp

Những người dùng đầu tiên đã báo cáo một sự thay đổi đáng chú ý trong phong cách giao tiếp của mô hình. Trong khi các mô hình DeepSeek trước đây được khen ngợi vì giọng điệu trò chuyện giống con người, “ V3-0324 ” thể hiện một tính cách chính thức hơn, thiên về kỹ thuật.

“Chỉ mình tôi thấy phiên bản này ít giống con người hơn thôi sao?” người dùng Reddit nother_level hỏi . “Với tôi, điều khiến deepseek v3 khác biệt so với những phiên bản khác là nó giống con người hơn. Giống như giọng điệu, từ ngữ và những thứ tương tự, nó không nghe như người máy như những llm khác nhưng giờ với phiên bản này, nó giống như những llm khác nghe như người máy vậy.”

Một người dùng khác, AppearanceHeavy6724 , nói thêm: “Đúng vậy, chắc chắn là nó đã mất đi nét quyến rũ xa cách, nó có vẻ quá trí thức so với lợi ích của chính nó.”

Sự thay đổi tính cách này có thể phản ánh những lựa chọn thiết kế có chủ đích của các kỹ sư DeepSeek. Việc chuyển sang phong cách giao tiếp phân tích, chính xác hơn cho thấy sự định vị lại chiến lược của mô hình cho các ứng dụng chuyên nghiệp và kỹ thuật thay vì cuộc trò chuyện thông thường. Điều này phù hợp với xu hướng chung của ngành, vì các nhà phát triển AI ngày càng nhận ra rằng các trường hợp sử dụng khác nhau được hưởng lợi từ các phong cách tương tác khác nhau.

Đối với các nhà phát triển xây dựng các ứng dụng chuyên biệt, phong cách giao tiếp chính xác hơn này thực sự có thể là một lợi thế, cung cấp đầu ra rõ ràng hơn và nhất quán hơn để tích hợp vào quy trình làm việc chuyên nghiệp. Tuy nhiên, nó có thể hạn chế sức hấp dẫn của mô hình đối với các ứng dụng hướng đến khách hàng, nơi sự ấm áp và khả năng tiếp cận được coi trọng.

Chiến lược nguồn mở của DeepSeek đang tái thiết bối cảnh AI toàn cầu như thế nào

Cách tiếp cận của DeepSeek đối với việc phát triển và phân phối AI không chỉ là một thành tựu kỹ thuật — mà còn thể hiện một tầm nhìn khác biệt về cách công nghệ tiên tiến nên lan truyền trong xã hội. Bằng cách cung cấp AI tiên tiến miễn phí theo giấy phép cho phép, DeepSeek cho phép đổi mới theo cấp số nhân mà các mô hình đóng vốn có hạn chế.

Triết lý này đang nhanh chóng thu hẹp khoảng cách AI được nhận thức giữa Trung Quốc và Hoa Kỳ. Chỉ vài tháng trước, hầu hết các nhà phân tích ước tính Trung Quốc tụt hậu 1-2 năm so với khả năng AI của Hoa Kỳ. Ngày nay, khoảng cách đó đã thu hẹp đáng kể xuống còn khoảng 3-6 tháng, với một số lĩnh vực đang tiến gần đến sự ngang bằng hoặc thậm chí là vị trí dẫn đầu của Trung Quốc.

Sự tương đồng với tác động của Android lên hệ sinh thái di động thật đáng kinh ngạc. Quyết định của Google về việc cung cấp Android miễn phí đã tạo ra một nền tảng cuối cùng đạt được thị phần toàn cầu thống trị. Tương tự như vậy, các mô hình AI nguồn mở có thể vượt trội hơn các hệ thống đóng thông qua tính phổ biến tuyệt đối và sự đổi mới tập thể của hàng nghìn người đóng góp.

Những hàm ý này vượt ra ngoài sự cạnh tranh trên thị trường đến những câu hỏi cơ bản về khả năng tiếp cận công nghệ. Các nhà lãnh đạo AI phương Tây ngày càng phải đối mặt với sự chỉ trích vì tập trung các khả năng tiên tiến vào các tập đoàn và cá nhân có nhiều nguồn lực. Cách tiếp cận của DeepSeek phân bổ các khả năng này rộng rãi hơn, có khả năng đẩy nhanh việc áp dụng AI toàn cầu.

Khi DeepSeek-V3-0324 tìm đường vào các phòng nghiên cứu và máy trạm phát triển trên toàn thế giới, cuộc cạnh tranh không còn chỉ đơn thuần là xây dựng AI mạnh mẽ nhất, mà là cho phép nhiều người nhất xây dựng bằng AI. Trong cuộc đua đó, bản phát hành lặng lẽ của DeepSeek nói lên rất nhiều điều về tương lai của trí tuệ nhân tạo. Công ty chia sẻ công nghệ của mình một cách tự do nhất cuối cùng có thể có ảnh hưởng lớn nhất đến cách AI định hình lại thế giới của chúng ta.

DeepSeek-V3 hiện chạy ở tốc độ 20 token mỗi giây trên Mac Studio và đó là cơn ác mộng đối với OpenAI

Chiến lược ra mắt bí mật của DeepSeek làm gián đoạn kỳ vọng của thị trường AI

Kiến trúc đột phá của DeepSeek V3-0324 đạt được hiệu quả vô song như thế nào

Cuộc cách mạng AI nguồn mở của Trung Quốc thách thức mô hình khu vườn khép kín của Thung lũng Silicon

DeepSeek V3-0324: Nền tảng cho cuộc cách mạng lý luận AI

Cách trải nghiệm DeepSeek V3-0324: Hướng dẫn đầy đủ dành cho nhà phát triển và người dùng

Mô hình mới của DeepSeek ưu tiên độ chính xác về mặt kỹ thuật hơn là sự nồng nhiệt trong giao tiếp

Chiến lược nguồn mở của DeepSeek đang tái thiết bối cảnh AI toàn cầu như thế nào

BÌNH LUẬN Hủy trả lời

Chủ đề

Bài viết liên quan

Menu

Tin nổi bật

Liên hệ với chúng tôi