Chủ Nhật, Tháng 6 15, 2025

Apple đạt được bước tiến lớn về AI với công nghệ tạo hình ảnh cạnh tranh với DALL-E và Midjourney

Sự tiến bộ này, được nêu chi tiết trong một bài báo nghiên cứu được công bố tuần trước, giới thiệu “ 
STARFlow ”, một hệ thống do các nhà nghiên cứu của Apple phát triển với sự hợp tác của các đối tác học thuật, kết hợp luồng chuẩn hóa với bộ biến đổi hồi quy tự động để đạt được cái mà nhóm gọi là “hiệu suất cạnh tranh” với các mô hình khuếch tán hiện đại.

Bước đột phá này diễn ra vào thời điểm quan trọng đối với Apple, công ty đã phải đối mặt với nhiều chỉ trích về những khó khăn trong việc phát triển trí tuệ nhân tạo. Tại Hội nghị các nhà phát triển toàn cầu diễn ra vào thứ Hai , công ty chỉ tiết lộ những bản cập nhật AI khiêm tốn cho nền tảng Apple Intelligence của mình , làm nổi bật áp lực cạnh tranh mà nhiều người cho rằng công ty đang tụt hậu trong cuộc đua vũ trang về AI.

Nhóm nghiên cứu bao gồm các nhà nghiên cứu máy học của Apple là Jiatao Gu, Joshua M. Susskind và Shuangfei Zhai, cùng với các cộng tác viên học thuật từ các tổ chức bao gồm Đại học California, Berkeley và Georgia Tech, đã viết: “Theo hiểu biết của chúng tôi, công trình này là minh chứng thành công đầu tiên về việc chuẩn hóa luồng hoạt động hiệu quả ở quy mô và độ phân giải này” .

Apple đang phản công OpenAI và Google như thế nào trong cuộc chiến AI

Nghiên cứu STARFlow đại diện cho nỗ lực rộng lớn hơn của Apple nhằm phát triển các khả năng AI đặc biệt có thể giúp sản phẩm của họ khác biệt so với các đối thủ cạnh tranh. Trong khi các công ty như Google và OpenAI đã thống trị các tiêu đề với những tiến bộ AI tạo ra của họ, Apple đã và đang nghiên cứu các phương pháp tiếp cận thay thế có thể mang lại những lợi thế độc đáo.

Nhóm nghiên cứu đã giải quyết một thách thức cơ bản trong việc tạo hình ảnh AI: mở rộng quy mô chuẩn hóa luồng để hoạt động hiệu quả với hình ảnh có độ phân giải cao. Chuẩn hóa luồng, một loại mô hình sinh học cách chuyển đổi các phân phối đơn giản thành các phân phối phức tạp, theo truyền thống bị lu mờ bởi các mô hình khuếch tán và mạng đối nghịch sinh trong các ứng dụng tổng hợp hình ảnh.

Các nhà nghiên cứu đã viết rằng: “STARFlow đạt được hiệu suất cạnh tranh trong cả nhiệm vụ tạo hình ảnh có điều kiện lớp và có điều kiện văn bản, tiếp cận các mô hình khuếch tán tiên tiến về chất lượng mẫu”, chứng minh tính linh hoạt của hệ thống trên các loại thách thức tổng hợp hình ảnh khác nhau.

Bên trong bước đột phá toán học thúc đẩy hệ thống AI mới của Apple

Nhóm nghiên cứu của Apple đã giới thiệu một số cải tiến quan trọng để khắc phục những hạn chế của các phương pháp tiếp cận luồng chuẩn hóa hiện có. Hệ thống sử dụng cái mà các nhà nghiên cứu gọi là “thiết kế sâu-nông”, sử dụng “một khối Transformer sâu [để] nắm bắt hầu hết khả năng biểu diễn mô hình, được bổ sung bởi một vài khối Transformer nông có hiệu quả tính toán nhưng vẫn mang lại lợi ích đáng kể”.

Theo bài báo, bước đột phá này cũng liên quan đến hoạt động trong “không gian tiềm ẩn của bộ mã hóa tự động được đào tạo trước, chứng tỏ hiệu quả hơn so với mô hình hóa cấp độ pixel trực tiếp”. Cách tiếp cận này cho phép mô hình hoạt động với các biểu diễn hình ảnh được nén thay vì dữ liệu pixel thô, cải thiện đáng kể hiệu quả.

Không giống như các mô hình khuếch tán dựa trên các quy trình khử nhiễu lặp đi lặp lại, STARFlow duy trì các đặc tính toán học của luồng chuẩn hóa, cho phép “huấn luyện độ chính xác tối đa trong không gian liên tục mà không cần rời rạc”.

STARFlow có ý nghĩa gì đối với các sản phẩm iPhone và Mac trong tương lai của Apple

Nghiên cứu này xuất hiện khi Apple phải đối mặt với áp lực ngày càng tăng trong việc chứng minh sự tiến bộ có ý nghĩa trong trí tuệ nhân tạo. Một phân tích gần đây của Bloomberg đã nêu bật cách Apple Intelligence và Siri đã phải vật lộn để cạnh tranh với các đối thủ. Những thông báo khiêm tốn của Apple tại WWDC tuần này đã nhấn mạnh những thách thức của công ty trong lĩnh vực AI.

Đối với Apple, việc đào tạo khả năng chính xác của STARFlow có thể mang lại lợi thế trong các ứng dụng yêu cầu kiểm soát chính xác nội dung được tạo hoặc trong các tình huống mà việc hiểu được sự không chắc chắn của mô hình là rất quan trọng để ra quyết định — có khả năng có giá trị đối với các ứng dụng doanh nghiệp và khả năng AI trên thiết bị mà Apple đã nhấn mạnh.

Nghiên cứu chứng minh rằng các phương pháp tiếp cận thay thế cho mô hình khuếch tán có thể đạt được kết quả tương đương, có khả năng mở ra hướng đổi mới mới có thể phát huy thế mạnh của Apple trong tích hợp phần cứng-phần mềm và xử lý trên thiết bị.

Tại sao Apple đang đặt cược vào quan hệ đối tác với các trường đại học để giải quyết vấn đề AI của mình

Nghiên cứu này minh họa cho chiến lược hợp tác của Apple với các tổ chức học thuật hàng đầu để nâng cao năng lực AI của mình. Đồng tác giả Tianrong Chen , một nghiên cứu sinh tiến sĩ tại Georgia Tech, người đã thực tập với nhóm nghiên cứu máy học của Apple, mang đến chuyên môn về điều khiển tối ưu ngẫu nhiên và mô hình sinh sản.

Sự hợp tác này còn có sự tham gia của Ruixiang Zhang từ khoa toán của UC Berkeley và Laurent Dinh, một nhà nghiên cứu về máy học được biết đến với công trình tiên phong về các mô hình dựa trên luồng tại Google Brain và DeepMind .

“Điều quan trọng là mô hình của chúng tôi vẫn là luồng chuẩn hóa đầu cuối”, các nhà nghiên cứu nhấn mạnh, phân biệt cách tiếp cận của họ với các phương pháp kết hợp hy sinh tính dễ xử lý toán học để cải thiện hiệu suất.

Bài báo nghiên cứu đầy đủ có sẵn trên arXiv , cung cấp thông tin chi tiết kỹ thuật cho các nhà nghiên cứu và kỹ sư muốn xây dựng dựa trên công trình này trong lĩnh vực AI tạo ra cạnh tranh. Trong khi STARFlow đại diện cho một thành tựu kỹ thuật đáng kể, thì thử thách thực sự sẽ là liệu Apple có thể chuyển những đột phá nghiên cứu như vậy thành loại tính năng AI hướng đến người tiêu dùng đã khiến các đối thủ cạnh tranh như ChatGPT trở thành cái tên quen thuộc hay không. Đối với một công ty từng cách mạng hóa toàn bộ các ngành công nghiệp bằng các sản phẩm như iPhone, câu hỏi không phải là liệu Apple có thể đổi mới trong AI hay không — mà là liệu họ có thể làm đủ nhanh hay không.

BÌNH LUẬN

Vui lòng nhập bình luận của bạn
Vui lòng nhập tên của bạn ở đây

Tin nóng tuần này

Databricks mở mã nguồn công cụ ETL khai báo, tăng tốc xây dựng pipeline tới 90%

Databricks công bố mở mã nguồn công cụ Spark...

Google DeepMind ra mắt mô hình AI thay đổi vĩnh viễn dự báo bão

DeepMind hợp tác với Trung tâm Bão Quốc gia...

Microsoft và OpenAI “chia tay”: Ai sẽ nắm giữ quyền lực AI toàn cầu?

Mối quan hệ từng được ví như “bromance” công...

OpenAI tung o3-pro, giảm giá o3 đến 80%

Model mới cùng chiến lược giá mạnh tay của...

Meta đầu tư 15 tỷ USD vào Scale AI, theo đuổi tham vọng siêu trí tuệ

Meta đang tái định hướng chiến lược AI bằng...

Chủ đề

Bài viết liên quan

Danh mục phổ biến

Language »