Tạm biệt Photoshop? Google vừa ra mắt một AI mới có khả năng chỉnh sửa hình ảnh của bạn chỉ bằng một lệnh thoại đơn giản. Không còn phải mất nhiều giờ để thành thạo phần mềm phức tạp nữa, giờ đây chỉ cần yêu cầu AI thêm mũ cho bà của bạn hoặc biến phòng khách của bạn thành một khu rừng nhiệt đới.
Google vừa cải tiến Gemini 2.0 Flash, một mẫu có khả năng tạo và chỉnh sửa hình ảnh dễ dàng như tạo văn bản. Một tính năng mới trên AI của Google, được tích hợp trực tiếp vào giao diện chatbot, hứa hẹn sẽ dân chủ hóa việc chỉnh sửa hình ảnh và cách mạng hóa mối quan hệ của chúng ta với việc chỉnh sửa ảnh.
Ra mắt vào tuần trước và hiện có thể truy cập thông qua Google AI Studio, Gemini 2.0 Flash nổi bật với khả năng xử lý cả văn bản và hình ảnh trong cùng một mô hình AI. Phương pháp tiếp cận đa phương thức này đánh dấu sự thay đổi so với các giải pháp hiện có, vốn thường dựa vào các mẫu riêng biệt để tạo văn bản và hình ảnh.
Đọc thêm – Gemini hiện có thể phát video YouTube tại chỗ của bạn, đây là cách thức hoạt động
Cách tiếp cận của Google nổi bật so với các gã khổng lồ công nghệ khác như OpenAI, nơi sử dụng các mô hình riêng biệt cho văn bản (ChatGPT) và hình ảnh (DALL-E). Về mặt kỹ thuật, như bạn có thể hình dung, việc xử lý đồng thời văn bản và hình ảnh đòi hỏi rất nhiều tính toán. Điều này giải thích một phần lý do tại sao chất lượng hình ảnh do Gemini 2.0 Flash tạo ra vẫn chưa đạt đến mức của các mô hình chuyên dụng như DALL-E.
Tin xấu là về mặt đạo đức, mức độ dễ dàng mà các mô hình đa phương thức này có thể thao túng hình ảnh làm dấy lên những lo ngại chính đáng. Việc tạo ra các video deepfake có sức thuyết phục hoặc chỉnh sửa ảnh cho mục đích xấu có thể trở nên đơn giản hơn, đặt ra những thách thức mới đối với thông tin sai lệch và bảo vệ quyền riêng tư.

Google vừa cải tiến Gemini 2.0 Flash, một mẫu có khả năng tạo và chỉnh sửa hình ảnh dễ dàng như tạo văn bản. Một tính năng mới trên AI của Google, được tích hợp trực tiếp vào giao diện chatbot, hứa hẹn sẽ dân chủ hóa việc chỉnh sửa hình ảnh và cách mạng hóa mối quan hệ của chúng ta với việc chỉnh sửa ảnh.
Ra mắt vào tuần trước và hiện có thể truy cập thông qua Google AI Studio, Gemini 2.0 Flash nổi bật với khả năng xử lý cả văn bản và hình ảnh trong cùng một mô hình AI. Phương pháp tiếp cận đa phương thức này đánh dấu sự thay đổi so với các giải pháp hiện có, vốn thường dựa vào các mẫu riêng biệt để tạo văn bản và hình ảnh.
Đọc thêm – Gemini hiện có thể phát video YouTube tại chỗ của bạn, đây là cách thức hoạt động
Gemini 2.0 Flash hướng đến mục tiêu trở nên linh hoạt hơn bao giờ hết
Khả năng chỉnh sửa ảnh của Gemini 2.0 Flash rất rộng lớn và đa dạng:- Thêm hoặc xóa đối tượng trong ảnh
- Thay đổi nền và ánh sáng
- Thay đổi góc xem
- Phóng to hoặc thu nhỏ
- Xóa hình mờ (mặc dù điều này có thể ảnh hưởng đến chất lượng hình ảnh)
Cách tiếp cận của Google nổi bật so với các gã khổng lồ công nghệ khác như OpenAI, nơi sử dụng các mô hình riêng biệt cho văn bản (ChatGPT) và hình ảnh (DALL-E). Về mặt kỹ thuật, như bạn có thể hình dung, việc xử lý đồng thời văn bản và hình ảnh đòi hỏi rất nhiều tính toán. Điều này giải thích một phần lý do tại sao chất lượng hình ảnh do Gemini 2.0 Flash tạo ra vẫn chưa đạt đến mức của các mô hình chuyên dụng như DALL-E.
Tin xấu là về mặt đạo đức, mức độ dễ dàng mà các mô hình đa phương thức này có thể thao túng hình ảnh làm dấy lên những lo ngại chính đáng. Việc tạo ra các video deepfake có sức thuyết phục hoặc chỉnh sửa ảnh cho mục đích xấu có thể trở nên đơn giản hơn, đặt ra những thách thức mới đối với thông tin sai lệch và bảo vệ quyền riêng tư.