Khả năng mới của Song Tử có thể không còn xa nữa. Một phân tích về phiên bản ứng dụng Google 16.6.23 đã tiết lộ những tham chiếu thú vị đến một thuật ngữ “videogen” bí ẩn, một thuật ngữ trước đây chưa từng được biết đến được đề cập cùng với “robin”, tên mã nội bộ của Gemini. Những thông báo như “Đang tiến hành…” và “Chúng tôi sẽ thông báo cho bạn khi tính năng này sẵn sàng” cho thấy tính năng tạo video đang được phát triển.
Những vụ rò rỉ mã nguồn như vậy đã giúp báo trước những thông báo công nghệ lớn trong quá khứ. Mặc dù không phải là xác nhận chính thức, nhưng những manh mối này cho thấy rõ ràng rằng Google đang thử nghiệm công nghệ tạo video được tích hợp vào Gemini.
Với Gemini, Google có thể tiến một bước dài bằng cách tích hợp các công nghệ tương tự như trong Imagen 3, mô hình tạo hình ảnh của công ty, để tạo ra các chuỗi hoạt hình chân thực từ các hướng dẫn văn bản đơn giản. Nếu lý thuyết này được xác nhận, Gemini có thể trở thành một trong những trợ lý kỹ thuật số tiên tiến nhất trên thị trường, kết hợp văn bản, hình ảnh và giờ đây là tạo video trong một công cụ duy nhất.
Sự phát triển này có thể có những tác động lớn đến một số lĩnh vực:
Thách thức sẽ là gấp đôi:
Bây giờ chúng ta sẽ phải chờ thông báo chính thức để biết Google đã sẵn sàng tiến xa đến đâu với công nghệ này và ứng dụng cụ thể của nó đối với công chúng nói chung là gì.
Những vụ rò rỉ mã nguồn như vậy đã giúp báo trước những thông báo công nghệ lớn trong quá khứ. Mặc dù không phải là xác nhận chính thức, nhưng những manh mối này cho thấy rõ ràng rằng Google đang thử nghiệm công nghệ tạo video được tích hợp vào Gemini.
Gemini và sự trỗi dậy của AI sáng tạo
Việc Google tham gia vào lĩnh vực tạo video sẽ không có gì đáng ngạc nhiên. Công ty đã có các công cụ như Google Vids, một nền tảng giúp người dùng chỉnh sửa và tường thuật mà không cần tạo video độc lập.Với Gemini, Google có thể tiến một bước dài bằng cách tích hợp các công nghệ tương tự như trong Imagen 3, mô hình tạo hình ảnh của công ty, để tạo ra các chuỗi hoạt hình chân thực từ các hướng dẫn văn bản đơn giản. Nếu lý thuyết này được xác nhận, Gemini có thể trở thành một trong những trợ lý kỹ thuật số tiên tiến nhất trên thị trường, kết hợp văn bản, hình ảnh và giờ đây là tạo video trong một công cụ duy nhất.
Một trợ lý kỹ thuật số tất cả trong một?
Gemini được thiết kế để hiểu ngữ cảnh và tương tác thông minh với môi trường kỹ thuật số của nó. Việc bổ sung tính năng tạo video sẽ củng cố tham vọng này bằng cách cho phép người dùng tạo nội dung đa phương tiện mà không cần phải thành thạo phần mềm phức tạp.Sự phát triển này có thể có những tác động lớn đến một số lĩnh vực:
- Tiếp thị và quảng cáo: tạo nhanh nội dung quảng cáo hoạt hình.
- Giáo dục: tạo hình ảnh tương tác trong vài giây.
- Mạng xã hội: sản xuất video được cá nhân hóa trực tiếp từ trợ lý AI.
Một bản phát hành sắp tới hay một dự án đang được thực hiện?
Nếu Google thực sự đang nỗ lực tích hợp video vào Gemini, vẫn chưa có ngày ra mắt nào được tiết lộ. Có khả năng công nghệ này vẫn đang trong giai đoạn thử nghiệm nội bộ và sẽ chỉ được công bố khi nó đã đủ hoàn thiện.Thách thức sẽ là gấp đôi:
- Cung cấp chất lượng video đáng tin cậy và hữu ích ngay từ những phiên bản đầu tiên.
- Đảm bảo rằng công cụ đáp ứng các tiêu chí nghiêm ngặt về bảo mật và đạo đức để ngăn chặn việc lạm dụng và sử dụng có mục đích xấu.
Google đang đạt được tiến bộ trong AI đa phương thức
Sự xuất hiện tiềm năng của thế hệ video trong Gemini xác nhận rằng Google đang thúc đẩy trợ lý AI của mình theo hướng tiếp cận đa phương thức có khả năng tích hợp văn bản, hình ảnh và video trong cùng một môi trường. Một sự phát triển hợp lý khi đối thủ cạnh tranh – OpenAI đang dẫn đầu – cũng đang tăng tốc trong lĩnh vực này.Bây giờ chúng ta sẽ phải chờ thông báo chính thức để biết Google đã sẵn sàng tiến xa đến đâu với công nghệ này và ứng dụng cụ thể của nó đối với công chúng nói chung là gì.