Mọi người hiện có thể kết hợp các hình ảnh lấy cảm hứng từ Studio Ghibli do ChatGPT tạo ra vào doanh nghiệp của họ. OpenAI đã thêm mô hình đằng sau công cụ tạo hình ảnh cực kỳ phổ biến của mình, được sử dụng trong ChatGPT, vào API của mình.
OpenAI cho biết trong một bài đăng trên blog rằng: “Tính linh hoạt của mô hình cho phép nó tạo ra hình ảnh theo nhiều phong cách khác nhau, tuân thủ trung thực các hướng dẫn tùy chỉnh, tận dụng kiến thức thế giới và hiển thị văn bản chính xác – mở ra vô số ứng dụng thực tế trên nhiều lĩnh vực” .
Giá cho API tách riêng các token cho văn bản và hình ảnh. Token nhập văn bản hoặc văn bản nhắc sẽ có giá 5 đô la cho 1 triệu token. Token nhập hình ảnh sẽ có giá 10 đô la cho 1 triệu token, trong khi token đầu ra hình ảnh hoặc hình ảnh được tạo sẽ có giá lên tới 40 đô la cho 1 triệu token.
Các đối thủ cạnh tranh như Stability AI cung cấp hệ thống dựa trên tín dụng cho API của mình, trong đó một tín dụng bằng 0,01 đô la. Sử dụng Stable Image Ultra hàng đầu của mình có giá tám tín dụng cho mỗi thế hệ. Mô hình tạo hình ảnh của Google, Imagen, tính phí người dùng trả phí 0,03 đô la cho mỗi hình ảnh được tạo bằng API Gemini.
Tạo hình ảnh ở một nơi
OpenAI đã cho phép người dùng ChatGPT tạo và chỉnh sửa hình ảnh trực tiếp trên giao diện trò chuyện vào tháng 4, vài tháng sau khi thêm tính năng tạo hình ảnh vào ChatGPT thông qua mô hình GPT-4o.
Công ty cho biết tính năng tạo hình ảnh trên nền tảng trò chuyện “nhanh chóng trở thành một trong những tính năng phổ biến nhất của chúng tôi”. OpenAI cho biết hơn 130 triệu người dùng đã truy cập tính năng này và tạo ra 700 triệu bức ảnh chỉ trong tuần đầu tiên.
Tuy nhiên, sự phổ biến này cũng đặt ra một số thách thức cho OpenAI. Người dùng mạng xã hội nhanh chóng phát hiện ra rằng họ có thể nhắc ChatGPT tạo ra những hình ảnh lấy cảm hứng từ hãng phim hoạt hình Nhật Bản Studio Ghibli, và kết quả là, các nguồn cấp dữ liệu mạng xã hội của tôi tràn ngập những bức ảnh giống nhau trong suốt cả tuần. Xu hướng này khiến CEO của OpenAI Sam Altman tuyên bố rằng GPU của công ty “đang tan chảy”.
OpenAI trước đây đã thêm mô hình hình ảnh DALL-E 3 của mình vào ChatGPT . Mô hình đó là mô hình biến áp khuếch tán chứ không phải là hiểu biết đa phương thức gốc mà GPT-4o có.
Các trường hợp sử dụng doanh nghiệp
Các doanh nghiệp muốn có khả năng tạo hình ảnh cho các dự án của họ và nhiều doanh nghiệp không muốn mở một ứng dụng riêng để thực hiện việc này. Bằng cách thêm mô hình hình ảnh vào API của mình, OpenAI cho phép các doanh nghiệp kết nối gpt-image-1 với hệ sinh thái của riêng họ.
OpenAI cho biết họ đã chứng kiến một số doanh nghiệp và công ty khởi nghiệp sử dụng mô hình này cho các dự án, sản phẩm và trải nghiệm sáng tạo, đồng thời nêu tên một số thương hiệu nổi tiếng trong bài đăng trên blog của mình.
Canva được cho là đang khám phá các cách tích hợp gpt-image-1 cho Canva AI và Magic Studio Tools. GoDaddy đã bắt đầu thử nghiệm tạo hình ảnh cho khách hàng để tạo logo của họ và Airtable hiện cho phép các nhóm tiếp thị và sáng tạo doanh nghiệp dễ dàng quản lý quy trình công việc tài sản ở quy mô lớn.
OpenAI cho biết gpt-image-1 sẽ có cùng các biện pháp bảo vệ an toàn trên API như trong ChatGPT. Công ty cho biết hình ảnh được tạo bằng mô hình này bao gồm siêu dữ liệu từ Liên minh về Nguồn gốc và Tính xác thực Nội dung (C2PA) gắn nhãn nội dung là do AI tạo ra và theo dõi quyền sở hữu. OpenAI là một phần của ủy ban chỉ đạo C2PA .
Người dùng cũng có thể kiểm soát việc kiểm duyệt nội dung để tạo ra hình ảnh phù hợp nhất với thương hiệu của họ.
OpenAI đã hứa rằng họ sẽ không sử dụng dữ liệu API của khách hàng, bao gồm bất kỳ hình ảnh nào được tải lên hoặc tạo ra bởi gpt-image-1 để đào tạo các mô hình của mình.