Thứ Bảy, Tháng 8 9, 2025

Anthropic ra mắt chế độ giọng nói đàm thoại Claude trên thiết bị di động để tìm kiếm Google Docs, Drive, Calendar của bạn

Ngoài ra, công ty khởi nghiệp AI cạnh tranh với OpenAI (và được thành lập bởi một số thành viên đào tẩu) cũng đang mở rộng chức năng tìm kiếm trên web cho tất cả người dùng theo gói miễn phí.

Những bản cập nhật này nhằm mục đích giúp Claude trở nên linh hoạt hơn và dễ tiếp cận hơn với nhiều đối tượng hơn.

“Việc triển khai giọng nói ở giai đoạn đầu nhưng tôi thấy rất thú vị và hữu ích”, Alex Albert, Trưởng phòng Quan hệ Claude của Anthropic, đã viết trên mạng xã hội X. “Hãy cho chúng tôi biết bạn thích nó như thế nào (cả ưu và nhược điểm) để chúng tôi có thể cải thiện nó tốt hơn trong tương lai!”

Tuy nhiên, giao diện giọng nói đàm thoại của Claude hiện chỉ giới hạn ở tiếng Anh và vẫn chưa có thông tin nào về việc hỗ trợ API cho tính năng này hay hỗ trợ web – nghĩa là tính năng này hiện chỉ giới hạn cho người dùng ứng dụng di động cá nhân.

Đánh vào điểm yếu của OpenAI

Theo Anthropic, chế độ giọng nói Claude mới sẽ được triển khai trong vài tuần tới cho tất cả người dùng ứng dụng di động.

Trong khi đối thủ OpenAI đã cung cấp chế độ giọng nói đàm thoại trên ChatGPT từ cuối năm 2023 và nâng cấp đáng kể nhiều lần, chế độ đàm thoại mới của Claude đã đưa nó lên ngang bằng và hơn thế nữa, cung cấp các tính năng mà OpenAI không có.

Như đã trình bày trong video quảng cáo được đăng trên X , người dùng ứng dụng di động của Claude giờ đây có thể yêu cầu Claude kiểm tra Lịch Google, Gmail và Google Docs của họ thông qua giao diện giọng nói để biết thông tin cụ thể mà chatbot sẽ tóm tắt và đọc lại cho họ nghe, bao gồm các cuộc hẹn sắp tới và tài liệu thuyết trình.

Trong khi giao diện đàm thoại và tìm kiếm trên web có sẵn cho người dùng gói miễn phí của Claude, thì tính năng tích hợp với các ứng dụng và công cụ bên ngoài chỉ dành cho người đăng ký trả phí cho gói Claude Pro (20 đô la mỗi tháng hoặc 214,99 đô la mỗi năm trả trước) và Claude Max (100 đô la mỗi tháng cho mỗi người dùng).

Giống như OpenAI, người dùng có thể chọn từ nhiều tùy chọn giọng nói khác nhau — trong trường hợp của Claude, chúng được gọi là “Buttery, Airy, Mellow, Glassy và Rounded” — mỗi tùy chọn có tông giọng, trọng âm và nét độc đáo riêng biệt khi trò chuyện.

Các cuộc trò chuyện bằng giọng nói tạo ra bản ghi chép đầy đủ và tóm tắt chế độ giọng nói. Ngoài ra, Claude cung cấp các ghi chú trực quan nắm bắt những hiểu biết chính từ mỗi cuộc thảo luận, giúp người dùng dễ dàng xem lại và xem lại các điểm quan trọng.

Chuyển đổi liền mạch giữa văn bản và giọng nói, cùng với hỗ trợ đa phương tiện

Một tính năng đáng chú ý của chế độ giọng nói là khả năng chuyển đổi liền mạch giữa tương tác văn bản và giọng nói mà không làm mất ngữ cảnh hội thoại. Tính linh hoạt này hỗ trợ các tùy chọn và trường hợp sử dụng khác nhau của người dùng.

Ngoài đối thoại bằng giọng nói, chế độ giọng nói còn xử lý các tương tác đa phương tiện phong phú. Người dùng có thể thảo luận về tài liệu, hình ảnh và thông tin phức tạp bằng lệnh thoại trong khi Claude duy trì luồng hội thoại. Điều này cho phép tương tác sâu hơn với nội dung và dễ dàng truy cập vào thông tin chi tiết hơn.

Đối với người dùng Pro Plan trở lên, chế độ giọng nói cũng tích hợp các nguồn thông tin cá nhân—như email, sự kiện lịch và tài liệu—cùng với kết quả tìm kiếm trên web theo thời gian thực. Sự kết hợp các nguồn dữ liệu này mang lại trải nghiệm đàm thoại toàn diện và có thể hành động hơn.

Tìm kiếm trên web cho tất cả

Song song với việc triển khai chế độ giọng nói, Anthropic đã mở rộng quyền truy cập vào tìm kiếm trên web bằng cách cung cấp cho tất cả người dùng các gói miễn phí. Khả năng mới này cho phép Claude sử dụng dữ liệu internet theo thời gian thực, cung cấp phản hồi mới hơn và chính xác hơn cho các câu hỏi về tin tức nóng hổi, ​​xu hướng thị trường và các chủ đề năng động khác.

Tìm kiếm trên web các gói miễn phí bổ sung vào bộ công cụ tích hợp và nguồn kiến ​​thức ngày càng phong phú của Claude, giúp người dùng dễ dàng nhận được câu trả lời phù hợp và cập nhật thông tin.

Tầm nhìn rộng hơn của Anthropic

Anthropic lưu ý rằng công nghệ giọng nói không phải là lĩnh vực mới của công ty.

Ngoài tính năng chuyển giọng nói thành văn bản trong ứng dụng di động của Claude, Anthropic còn hỗ trợ dịch vụ phiên âm Alexa+ của Amazon và Otter AI.

Những trải nghiệm này cung cấp thông tin cho sự phát triển của chế độ giọng nói mới và tiềm năng tích hợp của nó với các khía cạnh khác trong cuộc sống số của người dùng.

Các bản cập nhật này là sự bổ sung cho nhiều cải tiến khác của Claude, bao gồm việc ra mắt Claude 4, tích hợp với Google Workspace và mở rộng khả năng nghiên cứu.

Một bước tiến hướng tới tương tác người dùng linh hoạt hơn

Anthropic nhấn mạnh sự dễ dàng khi người dùng có thể bắt đầu cuộc trò chuyện bằng giọng nói và yêu cầu Claude tóm tắt các mục trong lịch hoặc tìm kiếm tài liệu, chứng minh khả năng mở rộng của nền tảng.

Anthropic cũng đã chia sẻ các tài sản truyền thông để cung cấp thêm tài nguyên cho người dùng muốn tìm hiểu thêm về các bản cập nhật.

Với việc triển khai chế độ giọng nói trong phiên bản beta và tìm kiếm trên web hiện được bao gồm trong các gói miễn phí, Anthropic tiếp tục mở rộng chức năng và khả năng truy cập của các dịch vụ AI của Claude. Những bản cập nhật này đại diện cho một bước tiến khác trong việc làm cho AI đàm thoại thích ứng hơn và phù hợp hơn với các tác vụ hàng ngày của người dùng.

BÌNH LUẬN

Vui lòng nhập bình luận của bạn
Vui lòng nhập tên của bạn ở đây

Tin nóng tuần này

Apple Mất Một Lãnh Đạo AI Quan Trọng Vào Tay Meta

Apple đang phải đối mặt với một vết thương...

Phá vỡ nút thắt lưu trữ của AI và tăng cường suy luận ở biên

Trong sự kiện Transform 2025 của VentureBeat , Greg Matson, giám...

OpenAI Từ Chối Việc Giao Dịch Cổ Phiếu Token Hoá Của Robinhood

Robinhood đã bắt đầu cung cấp cổ phiếu token...

Chủ đề

Bài viết liên quan

Danh mục phổ biến

Language »