Thứ Bảy, Tháng 8 9, 2025

Qodo tung mô hình nhúng mã nguồn mở, vượt qua OpenAI và Salesforce

Qodo, một nền tảng AI về chất lượng mã (trước đây gọi là Codium), vừa công bố Qodo-Embed-1-1.5B, mô hình nhúng mã nguồn mở mới mang lại hiệu suất hàng đầu, với quy mô và mức độ tiêu tốn tài nguyên nhỏ hơn nhiều so với các giải pháp cạnh tranh.

Mục đích của mô hình này là nâng cao khả năng tìm kiếm, truy xuất và hiểu mã, với 1,5 tỉ tham số và kết quả dẫn đầu ở các chuẩn ngành, vượt qua các mô hình lớn hơn của OpenAI và Salesforce.

Đối với các đội phát triển doanh nghiệp phải quản lý kho mã khổng lồ và phức tạp, sáng kiến của Qodo là một bước tiến trong quy trình kỹ thuật phần mềm. Nhờ khả năng tìm mã chính xác và hiệu quả, Qodo-Embed-1-1.5B giải quyết thách thức lớn về bối cảnh (context) khi viết phần mềm ở quy mô lớn với sự hỗ trợ của AI.

Tại sao mô hình nhúng mã lại quan trọng cho doanh nghiệp

Các giải pháp AI hỗ trợ viết mã thường tập trung vào khả năng sinh mã (code generation), trong khi mô hình ngôn ngữ lớn (LLM) đang thu hút chú ý nhờ khả năng tự viết mã.

Tuy vậy, theo lời Itamar Friedman, CEO và đồng sáng lập Qodo (trong cuộc gọi video phỏng vấn với chúng tôi), “Với phần mềm doanh nghiệp lên tới hàng chục, thậm chí hàng trăm triệu dòng lệnh, chỉ tạo ra mã chưa đủ. Bạn còn phải đảm bảo mã đó chất lượng cao, chạy đúng và tích hợp với hệ thống.”

Mô hình nhúng mã đóng vai trò cốt lõi trong quy trình phát triển có AI hỗ trợ, giúp hệ thống dễ dàng tìm và lấy đúng đoạn mã cần thiết. Điều này đặc biệt quan trọng cho tổ chức lớn, nơi có hàng triệu dòng mã trải dài qua nhiều đội, nhiều kho lưu trữ (repo) và nhiều ngôn ngữ lập trình.

“Trong bối cảnh AI xây dựng phần mềm, ngữ cảnh là yếu tố sống còn,” Friedman nói. “Đặc biệt, để lấy đúng ngữ cảnh trong kho mã khổng lồ, cần cơ chế tìm kiếm hiệu quả.”

Qodo-Embed-1-1.5B mang lại hiệu suất và tính hiệu quả

Qodo-Embed-1-1.5B nổi bật nhờ cân bằng tốt giữa tốc độ và độ chính xác. Nhiều mô hình hàng đầu hiện nay có hàng tỉ tham số (ví dụ, “text-embedding-3-large” của OpenAI có 7 tỉ), còn Qodo’s model dù chỉ 1,5 tỉ tham số nhưng lại vượt trội về kết quả.

Trên Code Information Retrieval Benchmark (CoIR), một tiêu chuẩn cho truy xuất mã đa ngôn ngữ và đa tác vụ, Qodo-Embed-1-1.5B ghi điểm 70,06, cao hơn “SFR-Embedding-2_R” (67,41) của Salesforce và “text-embedding-3-large” (65,17) của OpenAI.

Với doanh nghiệp tìm giải pháp AI tiết kiệm chi phí, hiệu suất này rất quan trọng. Nhờ khả năng chạy trên GPU giá thấp, mô hình đưa chức năng truy xuất mã nâng cao đến nhiều đội phát triển hơn, giúp giảm chi phí hạ tầng và nâng cao chất lượng, năng suất phần mềm.

Giải quyết tính phức tạp, tinh tế và đặc thù của mã

Một trở ngại lớn trong phát triển phần mềm hỗ trợ AI là đoạn mã giống nhau bề ngoài nhưng chức năng khác hẳn. Friedman minh họa bằng ví dụ đơn giản mà quan trọng:

“Một vấn đề thường gặp là hai hàm gần như giống hệt nhau — chẳng hạn ‘withdraw’ và ‘deposit’ — chỉ khác nhau dấu cộng hoặc trừ. Chúng cần nằm gần nhau trên không gian vector, nhưng vẫn phải tách biệt rõ ràng.”

Thách thức cốt lõi của mô hình nhúng mã là đảm bảo những đoạn mã khác nhau về chức năng không bị xếp nhầm. “Cần một mô hình nhúng đủ hiểu mã để tìm đúng bối cảnh, không đưa nhầm hàm tương tự về mặt cú pháp nhưng sai về logic, dẫn đến hậu quả nghiêm trọng.”

BÌNH LUẬN

Vui lòng nhập bình luận của bạn
Vui lòng nhập tên của bạn ở đây

Tin nóng tuần này

Apple Mất Một Lãnh Đạo AI Quan Trọng Vào Tay Meta

Apple đang phải đối mặt với một vết thương...

Phá vỡ nút thắt lưu trữ của AI và tăng cường suy luận ở biên

Trong sự kiện Transform 2025 của VentureBeat , Greg Matson, giám...

OpenAI Từ Chối Việc Giao Dịch Cổ Phiếu Token Hoá Của Robinhood

Robinhood đã bắt đầu cung cấp cổ phiếu token...

Chủ đề

Bài viết liên quan

Danh mục phổ biến

Language »