Google đã tận dụng Google I/O 2025 để công bố sự ra mắt của một tính năng mới trong Google Meet. Từ bây giờ, dịch vụ hội nghị truyền hình sẽ có thể dịch các cuộc trò chuyện của người dùng theo thời gian thực, với "độ trễ thấp". Để đạt được kỳ tích này, Google Meet rõ ràng phải dựa vào trí tuệ nhân tạo của Google.
Gã khổng lồ Mountain View cho biết mô hình AI đằng sau chức năng này không gì khác chính là AudioLM, mộttrí tuệ nhân tạocó khả năngtạo ra âm thanh, chẳng hạn như giọng nói của con người hoặc âm nhạc,từ một đoạn trích âm thanh nhỏ. Mô hình này được phát triển bởi Deepmind, công ty con về AI của Google.
Như Google giải thích, trước tiên bạn sẽ nghe giọng nói gốc, bị tắt tiếng, sau đó bản dịch sẽ xuất hiện ngay sau đó, "sẽ gây ra sự chậm trễ trong cuộc trò chuyện". Google chỉ rõ rằng Google Meet được lập trình để duy trì các đặc điểm của giọng nói người dùng, chẳng hạn như giọng điệu, ngữ điệu và cảm xúc. Nhờ AI tạo sinh, Meet có thể hiểu và nhận biết được sắc thái trong lời nói của mọi người.
Chỉ hỗ trợ hai ngôn ngữ: tiếng Anh và tiếng Tây Ban Nha. Tiếng Ý, tiếng Đức và tiếng Bồ Đào Nha sẽ được triển khai trong "những tuần tới". Google có kế hoạch cung cấp tính năng dịch thuật thời gian thực cho tất cả các doanh nghiệp sử dụng Workspace. Google hứa sẽ "thử nghiệm sớm" vào cuối năm nay.
Nguồn: Google
Gã khổng lồ Mountain View cho biết mô hình AI đằng sau chức năng này không gì khác chính là AudioLM, mộttrí tuệ nhân tạocó khả năngtạo ra âm thanh, chẳng hạn như giọng nói của con người hoặc âm nhạc,từ một đoạn trích âm thanh nhỏ. Mô hình này được phát triển bởi Deepmind, công ty con về AI của Google.
Tính năng dịch thời gian thực của Google Meet hoạt động như thế nào?
Cụ thể, AI sẽ nhân đôi số từ mà người đối thoại của bạn nói. Không đề cập đến phụ đề, một tính năng đã có sẵn trên dịch vụ này. Thay vì nghe giọng nói của đồng nghiệp bằng ngôn ngữ mẹ đẻ của họ, bạn sẽ nghe giọng nói của AI bằng ngôn ngữ bạn chọn. Trên thực tế, AI sẽ thay thế lời nói của người đối thoại với bạn. Ứng dụng này cũng có chức năng dịch phản hồi theo thời gian thực, cho phép bạn giao tiếp mà không cần phải học ngôn ngữ mới.Như Google giải thích, trước tiên bạn sẽ nghe giọng nói gốc, bị tắt tiếng, sau đó bản dịch sẽ xuất hiện ngay sau đó, "sẽ gây ra sự chậm trễ trong cuộc trò chuyện". Google chỉ rõ rằng Google Meet được lập trình để duy trì các đặc điểm của giọng nói người dùng, chẳng hạn như giọng điệu, ngữ điệu và cảm xúc. Nhờ AI tạo sinh, Meet có thể hiểu và nhận biết được sắc thái trong lời nói của mọi người.
Một tính năng dành riêng cho một số người đăng ký nhất định
Ban đầu, dịch vụ dịch thời gian thực của Google Meet được dành riêng cho những người đăng ký Google AI Pro và Ultra, gói đăng ký mới có giá hơn 250 đô la mỗi tháng và mới ra mắt tại Hoa Kỳ.Chỉ hỗ trợ hai ngôn ngữ: tiếng Anh và tiếng Tây Ban Nha. Tiếng Ý, tiếng Đức và tiếng Bồ Đào Nha sẽ được triển khai trong "những tuần tới". Google có kế hoạch cung cấp tính năng dịch thuật thời gian thực cho tất cả các doanh nghiệp sử dụng Workspace. Google hứa sẽ "thử nghiệm sớm" vào cuối năm nay.
Nguồn: Google