GPT-4o: OpenAI tung ra khả năng tạo hình ảnh siêu mạnh mẽ chống lại Gemini

theanh · 8 Tháng tư 2025

OpenAI sẽ không núp sau cái bóng của Google, công ty đã tạo ra tính năng tạo hình ảnh “Flash” cho tất cả người dùng Gemini 2.0. Vào thứ Ba, ngày 25 tháng 3, Sam Altman, CEO của OpenAI, đã công bố bản cập nhật lớn nhất trong hơn một năm cho GPT-4o để tạo hình ảnh.

GPT-4o sẽ thay thế DALL-E 3 và cho phép ChatGPT và Sora, AI chuyển văn bản thành video của OpenAI, tạo và chỉnh sửa hình ảnh và ảnh với kết xuất chân thực hơn. Khả năng tạo văn bản cũng đã được cải thiện. Tính năng tạo hình ảnh có sẵn cho người dùng Plus, Pro, Team và Free. Tính năng này mặc định có sẵn trong ChatGPT và sẽ sớm có sẵn cho người dùng Enterprise và Edu. Tính năng này cũng có sẵn trong Sora.

Việc tạo hình ảnh và văn bản đã được cải thiện nhờ sự giám sát đào tạo của AI bởi con người thực. Họ đã xác định và chỉ ra những bàn tay và khuôn mặt được vẽ kém, lỗi đánh máy, v.v. Công việc này được thực hiện trên dữ liệu công khai, nhưng cũng trên dữ liệu từ các quan hệ đối tác mà OpenAI đã thiết lập với nhiều nhà xuất bản nội dung khác nhau, chẳng hạn như Shutterstock và News Corp (Wall Street Journal, The Times).

Trên X, chúng ta có thể thấy rằng những người dùng đầu tiên rất ngạc nhiên về chất lượng hình ảnh:

TIN MỚI NHẤT: OpenAI vừa ra mắt một mô hình tạo hình ảnh mới, được tích hợp đầy đủ vào GPT-4o và Sora. Và đây là bản tốt nhất tôi từng thấy.

Tôi đã được quyền truy cập sớm. Tôi sẽ cho bạn biết những gì bạn cần kiểm tra ngay lập tức.

1) yêu cầu đồ họa hoặc sơ đồ
2) chỉnh sửa cho đến khi bạn thích
3) yêu cầu… pic.twitter.com/MbjG9I6LQV

— Allie K. Miller (@alliekmiller) 25 tháng 3 năm 2025

GPT-4o hiện có thể tạo hình ảnh một cách liền mạch!

theo tôi thì có thể một bước tiến lớn hướng tới tương tác AI trực quan

(Trong ảnh: thơ trực quan + kết xuất văn bản + chủ nghĩa hiện thực) @OpenAI pic.twitter.com/8YHiWxXVdl

— Dian Ang Yap (@yapdianang) 25 tháng 3 năm 2025

Tạo văn bản và hình ảnh trong khi tôn trọng người sản xuất nội dung, một canh bạc không thể&nbsp?

Trong bối cảnh khi việc sử dụng dữ liệu để đào tạo AI ngày càng bị giám sát chặt chẽ, với nguy cơ bị kiện liên quan đến bảo vệ bản quyền và sở hữu trí tuệ, sự hợp tác này giữa thế giới AI và các nhà sản xuất nội dung trở nên cần thiết.

“Chúng tôi tôn trọng quyền của nghệ sĩ trong cách chúng tôi quản lý dữ liệu đầu ra của mình. Chúng tôi đã triển khai các chính sách để ngăn chặn việc tạo ra những hình ảnh sao chép trực tiếp tác phẩm của các nghệ sĩ còn sống,” Brad Lightcap, Giám đốc điều hành của OpenAI, chia sẻ với Tạp chí Phố Wallhttps://www.wsj.com/articles/openai...atgpt-62ed0318?utm_source=diendancongnghe.com. Vâng, người chết không còn ở đây để chứng kiến nữa.

Chính sách này được hiểu rõ là cho phép người sáng tạo yêu cầu xóa tác phẩm của họ khỏi cơ sở dữ liệu của OpenAI, cũng như khả năng yêu cầu loại trừ các bot thu thập dữ liệu web khỏi một trang web.

Những câu hỏi về khả năng truy cập dữ liệu và thù lao của những người sản xuất nội dung trong đào tạo AI không phải là mới. Chúng đã dẫn đến sự xuất hiện của những người chơi chuyên biệt như Linkup, một công ty khởi nghiệp của Pháp tự định vị mình là trung gian giữa các nhà phát triển AI và nhà sản xuất nội dung. Nó cung cấp một công cụ tìm kiếm dành riêng cho các mô hình ngôn ngữ chính, được hỗ trợ bởi các nguồn đã được xác minh và trả phí.

GPT-4o: OpenAI tung ra khả năng tạo hình ảnh siêu mạnh mẽ chống lại Gemini

theanh

Administrator

Tạo văn bản và hình ảnh trong khi tôn trọng người sản xuất nội dung, một canh bạc không thể&nbsp?

Chủ đề tương tự

GPT-4o: OpenAI tung ra khả năng tạo hình ảnh siêu mạnh mẽ chống lại Gemini

theanh

Administrator

Tạo văn bản và hình ảnh trong khi tôn trọng người sản xuất nội dung, một canh bạc không thể&nbsp?​

Chủ đề tương tự

Tạo văn bản và hình ảnh trong khi tôn trọng người sản xuất nội dung, một canh bạc không thể&nbsp?