Chuyển từ cuộc họp sang cột mốc
Mọi người đều biết Zoom là công nghệ dành cho các cuộc họp. Nhưng mục đích của cuộc họp là gì?
Trong bối cảnh kinh doanh, chắc chắn có những cuộc họp không có mục đích, nhưng đó phải là những trường hợp ngoại lệ. Các cuộc họp phải hướng đến một điều gì đó, có thể là một mục hành động hoặc một số cột mốc khác.
“Trong kỷ nguyên AI đại lý, cuối cùng công nghệ cũng đạt đến điểm mà chúng ta có thể chuyển đổi từ cuộc họp sang cột mốc quan trọng”, Giám đốc công nghệ của Zoom Xuedong (XD) Huang chia sẻ với VentureBeat trong một cuộc phỏng vấn độc quyền.
Hôm nay, Zoom công bố chiến lược AI đại lý tích cực bao gồm một loạt các dịch vụ mới. Bản cập nhật giới thiệu các khả năng đại lý hứa hẹn sẽ biến các cuộc họp từ sự kiện giao tiếp thành quy trình làm việc hướng đến hành động, cùng với AI Studio mới cho phép các doanh nghiệp tạo ra các đại lý AI tùy chỉnh.
Sự tiến hóa kỹ thuật ẩn giấu đằng sau AI của Zoom
Trước khi gia nhập Zoom, Huang đã dành 30 năm tại Microsoft, làm việc về công nghệ giọng nói cũng như dịch vụ Azure OpenAI của Microsoft. Ông đã mang theo rất nhiều bài học kinh nghiệm từ kinh nghiệm đó khi gia nhập Zoom vào năm 2023.
Dưới sự chỉ đạo của Huang, Zoom bắt đầu lặng lẽ xây dựng một kiến trúc AI được thiết kế để tạo điều kiện thuận lợi cho các tác vụ thay vì chỉ tóm tắt các cuộc hội thoại. Zoom đã công khai tuyên bố hợp tác với Anthropic vào tháng 5 năm 2023 — nhưng đó không phải là mô hình ngôn ngữ lớn (LLM) duy nhất được sử dụng tại Zoom.
Trong khi Microsoft Teams thường dựa vào OpenAI thông qua dịch vụ Microsoft OpenAI Azure và Google Meet được Google Gemini hỗ trợ, Zoom lại có cách tiếp cận không thiên vị đối với LLM.
Huang giải thích rằng khi Zoom ra mắt phiên bản đầu tiên của AI vào năm 2023, nó không dựa trên bất kỳ LLM nào. Thay vào đó, công ty bắt đầu bằng cách tiếp cận liên kết, sử dụng nhiều LLM bao gồm mô hình ngôn ngữ nhỏ (SLM) do chính công ty xây dựng.
Huang cho biết: “Chúng tôi đã hợp tác với những mô hình tốt nhất hiện có, bao gồm OpenAI và Anthropic, nhưng chúng tôi cũng đã xây dựng mô hình ngôn ngữ tham số 2 tỷ được tùy chỉnh cao của riêng mình”.
Zoom’s AI Companion sử dụng phương pháp tiếp cận liên kết trong đó mô hình Zoom nhỏ hơn được sử dụng kết hợp với các mô hình ngôn ngữ lớn hơn, hàng đầu trong ngành. Mô hình nhỏ hơn ban đầu đánh giá và xử lý dữ liệu đầu vào, sau đó các kết quả một phần được chuyển đến các mô hình lớn hơn để tạo ra đầu ra cuối cùng. Phương pháp tiếp cận này cho phép Zoom tận dụng thế mạnh của cả mô hình tùy chỉnh nhỏ hơn và các mô hình lớn hơn, mạnh hơn, đồng thời giảm chi phí và cải thiện hiệu suất.
Mô hình ngôn ngữ nhỏ đóng vai trò trung tâm trong hành trình AI của Zoom
Có lẽ khía cạnh hấp dẫn nhất về mặt kỹ thuật trong chiến lược AI của Zoom là tập trung vào SLM. Thay vì đi theo xu hướng của ngành là chắt lọc các mô hình nhỏ hơn từ các mô hình lớn hơn, Zoom đã xây dựng mô hình 2 tỷ tham số của mình hoàn toàn từ đầu.
Lợi thế kỹ thuật của cách tiếp cận này trở nên rõ ràng khi tùy chỉnh cho các miền cụ thể. “Khi bạn tùy chỉnh, bạn sẽ phải nỗ lực nhiều hơn, chỉ là khó để điều khiển một con tàu lớn hơn”, Huang giải thích.
Hóa ra, khả năng tùy chỉnh mô hình nhỏ là một thành phần quan trọng đối với sự phát triển của các quy trình làm việc AI đại lý cụ thể. Nhìn về phía trước, Zoom hình dung SLM của mình cuối cùng sẽ chạy trực tiếp trên thiết bị của người dùng, cho phép bảo mật tốt hơn và trải nghiệm được cá nhân hóa hơn.
AI companion 2.0: Agentic AI biến cuộc họp thành cột mốc quan trọng
Trọng tâm của các bản cập nhật của Zoom là AI Companion 2.0, chuyển đổi khả năng AI của Zoom từ hỗ trợ cuộc họp thành các chức năng hoàn toàn mang tính đại lý. Với 2.0, Zoom đang phát triển từ trợ lý thành AI mang tính đại lý có khả năng suy luận, ghi nhớ và thực hiện nhiệm vụ.
AI Companion tiên tiến hiện có thể thực hiện các hành động nhiều bước thay mặt cho người dùng, sắp xếp các tác vụ như lên lịch họp, tạo video clip và tạo tài liệu.
Các cập nhật chính bao gồm:
- Kỹ năng chuyên môn : Quản lý lịch, tạo clip, hỗ trợ viết nâng cao;
- Quản lý tác vụ : Tự động phát hiện các mục hành động từ các cuộc họp và cuộc trò chuyện;
- Cải tiến cuộc họp : chương trình nghị sự hỗ trợ AI, ghi chú trực tiếp và ghi âm giọng nói;
- Tạo tài liệu : Tài liệu tham khảo nâng cao và tạo bảng dữ liệu tự động trong Zoom Docs;
- Đại lý ảo : Khả năng tự phục vụ cho dịch vụ khách hàng với cả hỗ trợ trò chuyện và giọng nói;
- Giải pháp cho ngành : Các công cụ chuyên dụng dành cho nhân viên tuyến đầu, chuyên gia chăm sóc sức khỏe và nhà giáo dục;
- Zoom Drive : Kho lưu trữ trung tâm mới cho các tài liệu họp và năng suất;
- Hình đại diện tùy chỉnh : Hình đại diện video do AI tạo ra để tạo clip thuyết trình.
Hầu hết các tính năng sẽ được triển khai trong khoảng thời gian từ tháng 3 đến tháng 7 năm 2025. Trong khi AI Companion tiêu chuẩn được bao gồm mà không mất thêm chi phí cho người dùng trả phí, thì các tác nhân chuyên biệt và cấu hình tùy chỉnh sẽ yêu cầu trả thêm phí.
“Đối với chúng tôi, khía cạnh quan trọng nhất của AI agentic thực sự là cho phép luồng thông tin hướng đến hành động”, Huang cho biết. “Điều đó có nghĩa là khi bạn họp, nhiệm vụ hành động sẽ chảy vào Docs hoặc trò chuyện hoặc vào các hành động khác mà bạn phải thực hiện”.
AI Studio: Xây dựng các tác nhân tùy chỉnh cho doanh nghiệp
Trong khi Zoom cung cấp nhiều khả năng AI khác nhau ngay lập tức cho người dùng, Huang nhận ra rằng các doanh nghiệp thường cần nhiều tùy chọn tùy chỉnh hơn.
Đó là lúc AI Studio xuất hiện, cho phép các công ty tạo ra các tác nhân AI tùy chỉnh phù hợp với nhu cầu kinh doanh cụ thể. Những tác nhân này có thể được tích hợp sâu với kiến thức và quy trình công việc cụ thể của công ty.
Ví dụ, Huang đã nêu chi tiết một ứng dụng thực tế cho chính sách nguồn nhân lực. Các doanh nghiệp có thể sử dụng AI Studio để tải lên tất cả các tài liệu chính sách nhân sự nội bộ của mình. Sau đó, AI companion sẽ được đào tạo về thông tin chính sách nhân sự cụ thể của công ty này, cho phép AI companion trả lời chính xác các câu hỏi của nhân viên về các hướng dẫn và quy trình nhân sự.
Quản trị viên CNTT cũng có thể sử dụng AI Studio để kết nối người bạn đồng hành với các cơ sở kiến thức nội bộ khác, như tài liệu hỗ trợ CNTT. Mục tiêu là cho phép các công ty tạo ra các tác nhân AI được tích hợp sâu với các quy trình, dữ liệu và quy trình làm việc của riêng họ, biến người bạn đồng hành AI thành một công cụ năng suất có giá trị và được tùy chỉnh.
Ý nghĩa đối với những người ra quyết định về AI của doanh nghiệp
Đối với những người ra quyết định kỹ thuật đang đánh giá các giải pháp AI về năng suất, phương pháp của Zoom cung cấp một số cân nhắc đặc biệt so với các giải pháp thay thế từ Microsoft, Google và các nhà cung cấp khác.
Mô hình luồng thông tin hướng đến hành động có thể phù hợp hơn với các tổ chức nơi các cuộc họp là phương tiện cộng tác chính và nơi việc hoàn thành nhiệm vụ bị cản trở bởi sự phân mảnh thông tin trên nhiều công cụ khác nhau. Các công ty có khối lượng cuộc họp lớn có thể thấy giá trị đặc biệt trong khả năng kết nối các cuộc trò chuyện với các hành động tiếp theo của Zoom.
Ngoài ra, phương pháp AI liên kết kết hợp SLM và LLM đưa ra một kiến trúc đáng nghiên cứu — có khả năng cung cấp nền kinh tế tốt hơn trong khi vẫn duy trì chất lượng. Khi chi phí AI trở thành mối quan tâm ngày càng tăng đối với các doanh nghiệp đang mở rộng quy mô triển khai AI của mình, phương pháp cân bằng này có thể chứng minh được ảnh hưởng.
Đối với các doanh nghiệp đang tìm cách dẫn đầu trong việc áp dụng AI, sự phát triển của Zoom từ công cụ họp thành nền tảng năng suất toàn diện mang lại những bài học giá trị về cách xây dựng dựa trên thế mạnh hiện có thay vì chỉ thêm AI vào quy trình làm việc hiện có. Bằng cách tận dụng sự thống trị của cuộc họp để tái hiện toàn bộ trải nghiệm năng suất, Zoom đang chứng minh cách kết hợp chuyên môn trong lĩnh vực với khả năng AI để tạo ra các giải pháp giải quyết các vấn đề kinh doanh cụ thể thay vì trợ lý AI chung chung.