Thứ Bảy, Tháng 4 19, 2025

Cohere ra mắt Embed 4: Mô hình tìm kiếm đa phương thức mới xử lý các tài liệu dài 200 trang

Cohere’s Embed 4 xây dựng dựa trên các bản cập nhật đa phương thức của Embed 3 và bổ sung thêm nhiều khả năng xung quanh dữ liệu phi cấu trúc. Nhờ có cửa sổ ngữ cảnh 128.000 mã thông báo, các tổ chức có thể tạo nhúng cho các tài liệu có khoảng 200 trang. 

Cohere cho biết trong một bài đăng trên blog rằng: “Các mô hình nhúng hiện tại không thể hiểu được các tài liệu kinh doanh đa phương thức phức tạp, khiến các công ty phải phát triển các đường ống xử lý dữ liệu phức tạp chỉ cải thiện được một chút độ chính xác”. “Embed 4 giải quyết vấn đề này, cho phép các doanh nghiệp và nhân viên của họ đưa ra những hiểu biết sâu sắc ẩn giấu trong vô số thông tin không thể tìm kiếm”.

Các doanh nghiệp có thể triển khai Embed 4 trên các đám mây riêng ảo hoặc các ngăn xếp công nghệ tại chỗ để tăng cường bảo mật dữ liệu. 

Các công ty có thể tạo nhúng để chuyển đổi tài liệu hoặc dữ liệu khác của họ thành biểu diễn số cho các trường hợp RAG us e. Sau đó, các tác nhân có thể tham chiếu các nhúng này để trả lời lời nhắc. 

Kiến thức chuyên ngành

Embed 4 “xuất sắc trong các ngành được quản lý” như tài chính, chăm sóc sức khỏe và sản xuất, công ty cho biết. Cohere, chủ yếu tập trung vào các trường hợp sử dụng AI của doanh nghiệp, cho biết các mô hình của họ xem xét nhu cầu bảo mật của các ngành được quản lý và có sự hiểu biết sâu sắc về doanh nghiệp.

Công ty đã đào tạo Embed 4 “để có thể chống lại dữ liệu thực tế nhiễu loạn” theo nghĩa là nó vẫn chính xác bất chấp “những điểm không hoàn hảo” của dữ liệu doanh nghiệp, chẳng hạn như lỗi chính tả và vấn đề định dạng. 

“Nó cũng có hiệu suất cao trong việc tìm kiếm trên các tài liệu được quét và chữ viết tay. Các định dạng này phổ biến trong giấy tờ pháp lý, hóa đơn bảo hiểm và biên lai chi phí. Khả năng này loại bỏ nhu cầu chuẩn bị dữ liệu phức tạp hoặc các đường ống xử lý trước, giúp doanh nghiệp tiết kiệm thời gian và chi phí hoạt động”, Cohere cho biết. 

Các tổ chức có thể sử dụng Embed 4 cho các bài thuyết trình cho nhà đầu tư, hồ sơ thẩm định, báo cáo thử nghiệm lâm sàng, hướng dẫn sửa chữa và tài liệu sản phẩm.

Mô hình này hỗ trợ hơn 100 ngôn ngữ, giống như phiên bản trước của mô hình. 

Agora, một khách hàng của Cohere, đã sử dụng Embed 4 cho công cụ tìm kiếm AI của mình và nhận thấy rằng mô hình này có thể đưa ra các sản phẩm có liên quan.

“Dữ liệu thương mại điện tử rất phức tạp, bao gồm hình ảnh và mô tả văn bản nhiều mặt. Có thể thể hiện sản phẩm của chúng tôi trong một nhúng hợp nhất giúp tìm kiếm của chúng tôi nhanh hơn và công cụ nội bộ của chúng tôi hiệu quả hơn”, Param Jaggi, Nhà sáng lập Agora, cho biết trong bài đăng trên blog. 

Các trường hợp sử dụng tác nhân

Cohere lập luận rằng các mô hình như Embed 4 sẽ cải thiện các trường hợp sử dụng tác nhân và tuyên bố nó có thể là “công cụ tìm kiếm tối ưu” cho các tác nhân và trợ lý AI trên toàn doanh nghiệp.

Cohere cho biết: “Ngoài độ chính xác cao trên các loại dữ liệu, mô hình này còn mang lại hiệu quả cấp doanh nghiệp”. “Điều này cho phép mở rộng quy mô để đáp ứng nhu cầu của các tổ chức lớn”.

Cohere cho biết thêm rằng Embed 4 tạo ra các dữ liệu nhúng được nén để cắt giảm chi phí lưu trữ cao. 

Nhúng và tìm kiếm dựa trên RAG cho phép tác nhân tham chiếu các tài liệu cụ thể để thực hiện các nhiệm vụ liên quan đến yêu cầu. Nhiều người tin rằng chúng cung cấp kết quả chính xác hơn, đảm bảo các tác nhân không trả lời bằng câu trả lời không chính xác hoặc ảo giác. 

Các mô hình nhúng khác mà Cohere phải cạnh tranh bao gồm Qodo-Embed-1-1.5B của Qodo và các mô hình từ Voyage AI , được nhà cung cấp cơ sở dữ liệu MongoDB mua lại gần đây .  

BÌNH LUẬN

Vui lòng nhập bình luận của bạn
Vui lòng nhập tên của bạn ở đây

Tin nóng tuần này

So Sánh ChatGPT o3, o4-mini, GPT-4o và GPT-4.5: Mô Hình Nào Hoạt Động Tốt Nhất?

OpenAI đã làm dày thêm danh sách mô hình...

Meta FAIR Ra Mắt 5 Dự Án AI Mới, Hướng Tới Trí Tuệ Máy Giống Với Con Người

Nhóm Nghiên cứu AI Cốt lõi FAIR (Fundamental AI...

Thông báo, tin tức và nhiều thông tin khác của NVIDIA từ GTC 2025

Cuộc cách mạng AI đang tăng tốc nhờ các...

Chủ đề

Bài viết liên quan

Danh mục phổ biến

Language »