Chủ Nhật, Tháng 4 20, 2025

Cohere hướng đến các doanh nghiệp toàn cầu với mô hình Command A đa ngôn ngữ mới chỉ cần 2 GPU

Là phiên bản kế nhiệm của 
Command-R, ra mắt vào tháng 3 năm 2024 và 
Command R+ ra mắt sau đó, Command A phát triển dựa trên trọng tâm của Cohere về thế hệ tăng cường truy xuất (RAG), sử dụng công cụ bên ngoài và hiệu quả AI doanh nghiệp — đặc biệt là về mặt tính toán và tốc độ đưa ra câu trả lời.

Điều đó sẽ khiến nó trở thành một lựa chọn hấp dẫn cho các doanh nghiệp muốn tận dụng lợi thế của AI mà không tốn nhiều chi phí, cũng như cho các ứng dụng cần phản hồi nhanh chóng — chẳng hạn như tài chính, sức khỏe, y học, khoa học và luật pháp.

Với tốc độ nhanh hơn, yêu cầu phần cứng thấp hơn và khả năng đa ngôn ngữ mở rộng, Command A định vị mình là giải pháp thay thế mạnh mẽ cho các mô hình như GPT-4o và DeepSeek-V3 — các LLM cổ điển, không phải là các mô hình lý luận mới đang làm khuynh đảo ngành AI gần đây.

Không giống như phiên bản trước, hỗ trợ độ dài ngữ cảnh là 128.000 mã thông báo (tham chiếu đến lượng thông tin mà LLM có thể xử lý trong một lần trao đổi đầu vào/đầu ra, tương đương với một cuốn tiểu thuyết dày 300 trang), Command A tăng gấp đôi độ dài ngữ cảnh lên 256.000 mã thông báo (tương đương với 600 trang văn bản) đồng thời cải thiện hiệu quả tổng thể và tính sẵn sàng của doanh nghiệp.

Công ty này cũng vừa cho ra mắt một mô hình thị giác đa ngôn ngữ nguồn mở (chỉ dành cho mục đích nghiên cứu) có tên là Aya Vision vào đầu tháng này .

Một bước tiến từ Command-R

Khi Command-R ra mắt vào đầu năm 2024, nó đã giới thiệu những cải tiến quan trọng như hiệu suất RAG được tối ưu hóa, khả năng truy xuất kiến ​​thức tốt hơn và triển khai AI với chi phí thấp hơn.

Giải pháp này đã thu hút được sự chú ý của các doanh nghiệp, tích hợp vào các giải pháp kinh doanh từ các công ty như Oracle, Notion, Scale AI, Accenture và McKinsey, mặc dù báo cáo tháng 11 năm 2024 của Menlo Ventures khảo sát mức độ áp dụng của doanh nghiệp cho thấy thị phần của Cohere trong số các doanh nghiệp chỉ ở mức khiêm tốn 3%, thấp hơn nhiều so với OpenAI (34%), Anthropic (24%) và thậm chí cả các công ty khởi nghiệp nhỏ như Mistral (5%).

Hiện nay, trong nỗ lực trở thành một điểm thu hút doanh nghiệp lớn hơn, Command A đẩy mạnh những khả năng này hơn nữa. Theo Cohere, nó:

  • Phù hợp hoặc vượt trội hơn GPT-4o và DeepSeek-V3 của OpenAI trong các tác vụ kinh doanh, STEM và mã hóa
  • Chỉ hoạt động trên hai GPU (A100 hoặc H100), cải thiện hiệu quả đáng kể so với các mẫu máy yêu cầu tới 32 GPU
  • Đạt được tốc độ tạo mã thông báo nhanh hơn, tạo ra 156 mã thông báo mỗi giây — nhanh hơn 1,75 lần so với GPT-4o và nhanh hơn 2,4 lần so với DeepSeek-V3
  • Giảm độ trễ, với thời gian đến mã thông báo đầu tiên là 6.500ms, so với 7.460ms của GPT-4o và 14.740ms của DeepSeek-V3
  • Tăng cường khả năng AI đa ngôn ngữ, với khả năng so sánh phương ngữ tiếng Ả Rập được cải thiện và mở rộng hỗ trợ cho 23 ngôn ngữ toàn cầu.

Cohere lưu ý trong tài liệu dành cho nhà phát triển trực tuyến rằng: “Command A là Chatty. Theo mặc định, mô hình là tương tác và được tối ưu hóa cho cuộc trò chuyện, nghĩa là nó dài dòng và sử dụng markdown để làm nổi bật mã. Để ghi đè hành vi này, các nhà phát triển nên sử dụng phần mở đầu yêu cầu mô hình chỉ cần cung cấp câu trả lời và không sử dụng markdown hoặc các dấu khối mã.”

Được xây dựng cho doanh nghiệp

Cohere tiếp tục chiến lược ưu tiên doanh nghiệp với Command A, đảm bảo tích hợp liền mạch vào môi trường kinh doanh. Các tính năng chính bao gồm:

  • Thế hệ tăng cường truy xuất nâng cao (RAG) : Cho phép phản hồi có thể xác minh, độ chính xác cao cho các ứng dụng doanh nghiệp
  • Sử dụng công cụ Agentic : Hỗ trợ quy trình làm việc phức tạp bằng cách tích hợp với các công cụ doanh nghiệp
  • Tích hợp nền tảng North AI : Hoạt động với nền tảng North AI của Cohere, cho phép các doanh nghiệp tự động hóa các tác vụ bằng các tác nhân AI an toàn, cấp doanh nghiệp
  • Khả năng mở rộng và hiệu quả về chi phí : Triển khai riêng rẻ hơn tới 50% so với truy cập dựa trên API.

Đa ngôn ngữ và hiệu suất cao bằng tiếng Ả Rập

Một tính năng nổi bật của Command A là khả năng tạo ra các phản hồi chính xác trên 23 ngôn ngữ được nói nhiều nhất trên thế giới, bao gồm cả việc xử lý tốt hơn các phương ngữ tiếng Ả Rập. Các ngôn ngữ được hỗ trợ (theo tài liệu dành cho nhà phát triển trên trang web của Cohere ) là:

  • Tiếng Anh
  • Tiếng Pháp
  • Tiếng Tây Ban Nha
  • Tiếng Ý
  • Tiếng Đức
  • Tiếng Bồ Đào Nha
  • Tiếng Nhật
  • Hàn Quốc
  • Tiếng Trung Quốc
  • Tiếng Ả Rập
  • Tiếng Nga
  • Đánh bóng
  • Thổ Nhĩ Kỳ
  • Tiếng Việt
  • Tiếng Hà Lan
  • Tiếng Séc
  • Tiếng Indonesia
  • Tiếng Ukraina
  • Tiếng Rumani
  • Tiếng Hy Lạp
  • Tiếng Hin-ddi
  • Tiếng Do Thái
  • Tiếng Ba T

Trong đánh giá chuẩn mực:

  • Command A đạt độ chính xác 98,2% khi phản hồi lời nhắc bằng tiếng Ả Rập với tiếng Anh — cao hơn cả DeepSeek-V3 (94,9%) và GPT-4o (92,2%).
  • Nó vượt trội hơn hẳn so với các đối thủ cạnh tranh về tính nhất quán của phương ngữ, đạt điểm ADI2 là 24,7, so với 15,9 (GPT-4o) và 15,7 (DeepSeek-V3).

Được xây dựng để có tốc độ và hiệu quả

Tốc độ là yếu tố quan trọng khi triển khai AI cho doanh nghiệp và Command A đã được thiết kế để mang lại kết quả nhanh hơn nhiều đối thủ cạnh tranh.

  • Tốc độ truyền phát mã thông báo cho 100K yêu cầu ngữ cảnh: 73 mã thông báo/giây (so với GPT-4o ở mức 38/giây và DeepSeek-V3 ở mức 32/giây)
  • Tạo mã thông báo đầu tiên nhanh hơn: Giảm đáng kể thời gian phản hồi so với các mô hình quy mô lớn khác

Giá cả và tính khả dụng

Command A hiện đã có trên nền tảng Cohere và có trọng số mở chỉ dành cho mục đích nghiên cứu trên Hugging Face theo giấy phép Creative Commons Ghi công phi thương mại 4.0 quốc tế (CC-by-NC 4.0) , với sự hỗ trợ rộng rãi hơn từ các nhà cung cấp đám mây sẽ sớm ra mắt.

  • Đầu vào token: 2,50 đô la cho một triệu
  • Mã thông báo đầu ra: 10,00 đô la cho một triệu

Triển khai riêng tư và tại chỗ có sẵn theo yêu cầu.

Phản ứng của ngành

Một số nhà nghiên cứu AI và thành viên nhóm Cohere đã chia sẻ sự nhiệt tình của họ đối với Command A.

Dwaraknath Ganesan, người đào tạo trước tại Cohere, đã bình luận về X: “Cực kỳ phấn khích khi tiết lộ những gì chúng tôi đã làm trong vài tháng qua! Command A thật tuyệt vời. Có thể triển khai trên chỉ 2 GPU H100! Chiều dài ngữ cảnh 256K, hỗ trợ đa ngôn ngữ mở rộng, sử dụng công cụ agentic… rất tự hào về điều này.”

Pierre Richemond, nhà nghiên cứu AI tại Cohere, cho biết thêm: “Command A là mô hình GPT-4o/DeepSeek v3 mới của chúng tôi, có trọng số mở 111B với độ dài ngữ cảnh 256K đã được tối ưu hóa để mang lại hiệu quả trong các trường hợp sử dụng của doanh nghiệp”.

Dựa trên nền tảng của Command-R, Command A của Cohere đại diện cho bước tiếp theo trong AI doanh nghiệp có khả năng mở rộng và tiết kiệm chi phí.

Với tốc độ nhanh hơn, cửa sổ ngữ cảnh rộng hơn, khả năng xử lý đa ngôn ngữ được cải thiện và chi phí triển khai thấp hơn, giải pháp này cung cấp cho doanh nghiệp một giải pháp thay thế mạnh mẽ cho các mô hình AI hiện có.

BÌNH LUẬN

Vui lòng nhập bình luận của bạn
Vui lòng nhập tên của bạn ở đây

Tin nóng tuần này

So Sánh ChatGPT o3, o4-mini, GPT-4o và GPT-4.5: Mô Hình Nào Hoạt Động Tốt Nhất?

OpenAI đã làm dày thêm danh sách mô hình...

Meta FAIR Ra Mắt 5 Dự Án AI Mới, Hướng Tới Trí Tuệ Máy Giống Với Con Người

Nhóm Nghiên cứu AI Cốt lõi FAIR (Fundamental AI...

Thông báo, tin tức và nhiều thông tin khác của NVIDIA từ GTC 2025

Cuộc cách mạng AI đang tăng tốc nhờ các...

Chủ đề

Bài viết liên quan

Danh mục phổ biến

Language »