Tạm biệt Photoshop? AI này cho phép bạn chỉnh sửa ảnh của mình từ lời nhắc

theanh

Administrator
Nhân viên
Tạm biệt Photoshop? Google vừa ra mắt một AI mới có khả năng chỉnh sửa hình ảnh của bạn chỉ bằng một lệnh thoại đơn giản. Không còn phải mất nhiều giờ để thành thạo phần mềm phức tạp nữa, giờ đây chỉ cần yêu cầu AI thêm mũ cho bà của bạn hoặc biến phòng khách của bạn thành một khu rừng nhiệt đới.

Gemini.jpg


Google vừa cải tiến Gemini 2.0 Flash, một mẫu có khả năng tạo và chỉnh sửa hình ảnh dễ dàng như tạo văn bản. Một tính năng mới trên AI của Google, được tích hợp trực tiếp vào giao diện chatbot, hứa hẹn sẽ dân chủ hóa việc chỉnh sửa hình ảnh và cách mạng hóa mối quan hệ của chúng ta với việc chỉnh sửa ảnh.

Ra mắt vào tuần trước và hiện có thể truy cập thông qua Google AI Studio, Gemini 2.0 Flash nổi bật với khả năng xử lý cả văn bản và hình ảnh trong cùng một mô hình AI. Phương pháp tiếp cận đa phương thức này đánh dấu sự thay đổi so với các giải pháp hiện có, vốn thường dựa vào các mẫu riêng biệt để tạo văn bản và hình ảnh.

Đọc thêm – Gemini hiện có thể phát video YouTube tại chỗ của bạn, đây là cách thức hoạt động

Gemini 2.0 Flash hướng đến mục tiêu trở nên linh hoạt hơn bao giờ hết​

Khả năng chỉnh sửa ảnh của Gemini 2.0 Flash rất rộng lớn và đa dạng:
  • Thêm hoặc xóa đối tượng trong ảnh
  • Thay đổi nền và ánh sáng
  • Thay đổi góc xem
  • Phóng to hoặc thu nhỏ
  • Xóa hình mờ (mặc dù điều này có thể ảnh hưởng đến chất lượng hình ảnh)
Theo Google, tính linh hoạt này có thể thực hiện được nhờ việc đào tạo trên một tập dữ liệu lớn kết hợp hình ảnh và văn bản. Do đó, mô hình tích hợp hiểu biết sâu sắc về các khái niệm trực quan và văn bản, cho phép mô hình trực tiếp tạo ra hình ảnh để đáp ứng các truy vấn của người dùng.

Cách tiếp cận của Google nổi bật so với các gã khổng lồ công nghệ khác như OpenAI, nơi sử dụng các mô hình riêng biệt cho văn bản (ChatGPT) và hình ảnh (DALL-E). Về mặt kỹ thuật, như bạn có thể hình dung, việc xử lý đồng thời văn bản và hình ảnh đòi hỏi rất nhiều tính toán. Điều này giải thích một phần lý do tại sao chất lượng hình ảnh do Gemini 2.0 Flash tạo ra vẫn chưa đạt đến mức của các mô hình chuyên dụng như DALL-E.

Tin xấu là về mặt đạo đức, mức độ dễ dàng mà các mô hình đa phương thức này có thể thao túng hình ảnh làm dấy lên những lo ngại chính đáng. Việc tạo ra các video deepfake có sức thuyết phục hoặc chỉnh sửa ảnh cho mục đích xấu có thể trở nên đơn giản hơn, đặt ra những thách thức mới đối với thông tin sai lệch và bảo vệ quyền riêng tư.
 
Back
Bên trên