Công ty cho biết họ muốn “đẩy giới hạn của các mô hình AI đa phương thức và lập luận”, đồng thời tích hợp các mô hình này vào hệ sinh thái sản phẩm của Baidu, bao gồm Baidu Search và ứng dụng Wenxiaoyan, để nâng cao trải nghiệm người dùng.
Đặc biệt, Baidu cung cấp ERNIE 4.5 miễn phí cho cá nhân thông qua ERNIE Bot, một động thái nhằm cạnh tranh trực tiếp với các đối thủ AI hàng đầu hiện nay.
ERNIE 4.5: Mô Hình AI Đa Phương Thức Thế Hệ Mới
ERNIE 4.5 là mô hình AI nền tảng đa phương thức thế hệ mới, được tối ưu hóa để cải thiện khả năng hiểu nội dung đa phương tiện.
Mô hình này cải thiện các khả năng cốt lõi như:
Hiểu và tạo ngôn ngữ
Lập luận và ghi nhớ thông tin
Hạn chế hiện tượng “ảo giác” AI
Cải thiện khả năng logic và lập trình
Một tính năng quan trọng của ERNIE 4.5 là khả năng tích hợp nhiều loại nội dung, bao gồm văn bản, hình ảnh, âm thanh và video. Mô hình này thậm chí có thể hiểu được nội dung phức tạp như meme trên internet và tranh biếm họa, thể hiện khả năng nhận thức ngữ cảnh mạnh mẽ.
Baidu tuyên bố rằng ERNIE 4.5 vượt trội hơn GPT-4.5 trên nhiều tiêu chuẩn đánh giá, đồng thời có giá rẻ hơn đến 99% so với GPT-4.5.

Các cải tiến của ERNIE 4.5 được hỗ trợ bởi các công nghệ tiên tiến như:
FlashMask Kỹ thuật che mặt nạ động (dynamic attention masking).
Hỗn hợp chuyên gia đa phương thức dị thể (heterogeneous multimodal mixture-of-experts).
Nén biểu diễn không gian thời gian (spatiotemporal representation compression).
Xây dựng dữ liệu huấn luyện dựa trên tri thức (knowledge-centric training data construction).
Huấn luyện hậu kỳ cải tiến bằng cơ chế tự phản hồi (self-feedback enhanced post-training).
ERNIE X1: Mô Hình AI Lập Luận Sâu Thế Hệ Mới
ERNIE X1 là mô hình lập luận sâu tiên tiến của Baidu, tập trung vào khả năng hiểu biết, lập kế hoạch, phản ánh và tiến hóa.
Baidu mô tả ERNIE X1 là mô hình lập luận đa phương thức đầu tiên có khả năng sử dụng công cụ, đặc biệt xuất sắc trong các lĩnh vực như:
Hỏi đáp tri thức tiếng Trung
Sáng tạo văn học
Tính toán phức tạp
Các công cụ hỗ trợ của ERNIE X1 bao gồm:
Tìm kiếm nâng cao
Hỏi đáp tài liệu
Hiểu hình ảnh
Tạo hình ảnh AI
Đọc và phân tích trang web
Những khả năng này được hỗ trợ bởi các công nghệ như:
Học tăng cường lũy tiến (progressive reinforcement learning).
Phương pháp huấn luyện tích hợp chuỗi suy nghĩ và hành động (end-to-end training with chain of thought and action integration).
Hệ thống phần thưởng đa chiều thống nhất (unified multi-faceted reward system).
Ứng Dụng Doanh Nghiệp và Khả Năng Triển Khai
Đối với doanh nghiệp và nhà phát triển, ERNIE 4.5 hiện đã có sẵn qua API trên nền tảng Qianfan của Baidu AI Cloud, với mức giá cạnh tranh.
ERNIE X1 cũng sẽ sớm được triển khai trên nền tảng này, mang đến các giải pháp AI mạnh mẽ hơn cho các tổ chức cần tích hợp AI vào hệ thống của họ.
Baidu dự đoán rằng năm 2025 sẽ là một năm quan trọng đối với sự phát triển của các mô hình ngôn ngữ lớn, và công ty sẽ tiếp tục đầu tư vào AI, trung tâm dữ liệu và hạ tầng điện toán đám mây để mở rộng năng lực AI và phát triển thế hệ mô hình tiếp theo.
Baidu Đang Định Hình Cuộc Đua AI Ở Trung Quốc
Với việc ra mắt ERNIE 4.5 và ERNIE X1, Baidu không chỉ nâng cao khả năng AI của mình mà còn tạo ra áp lực lớn lên các đối thủ như OpenAI, DeepSeek và Alibaba.
Bằng cách giảm đáng kể chi phí sử dụng AI và tích hợp trực tiếp vào hệ sinh thái sản phẩm của mình, Baidu đang hướng đến mục tiêu mở rộng ứng dụng AI vào đời sống và doanh nghiệp.
Sự phát triển này báo hiệu một năm 2025 đầy cạnh tranh trong lĩnh vực AI, khi các công ty công nghệ hàng đầu tiếp tục tìm cách cải thiện khả năng mô hình, tối ưu hóa chi phí và mở rộng thị phần.
Tìm hiểu thêm tại: https://chatgpt.com/