Sẽ thế nào nếu cá heo có phiên bản WhatsApp riêng? Google đang nghiêm túc thực hiện điều này: với điện thoại thông minh Pixel và AI có tên DolphinGemma, công ty đang cố gắng giải mã ngôn ngữ của các loài động vật có vú sống dưới nước.
Trong 40 năm, các nhà nghiên cứu tại Dự án Cá heo hoang dã đã ghi lại tiếng huýt sáo và tiếng lách cách của cá heo, với một ước mơ trong đầu: hiểu được ngôn ngữ của chúng. Ngày nay, Google đang cung cấp cho họ sự hỗ trợ công nghệ cao. Nhờ có điện thoại thông minh AI DolphinGemma và Pixel, công ty hy vọng cuối cùng có thể thiết lập được cuộc đối thoại với những loài động vật có vú biển này. Một bước đột phá nghiêm túc nhưng cũng thú vị, và có thể làm thay đổi mối quan hệ của chúng ta với động vật.
Cá heo, những chuyên gia giao tiếp dưới nước, sử dụng nhiều loại âm thanh khác nhau: tiếng kêu khi săn mồi, tiếng huýt sáo nhận dạng hoặc tiếng gầm gừ trong các cuộc xung đột. Vấn đề ở đây là gì? Việc phân tích những cuộc trao đổi này đòi hỏi nhiều năm làm việc... trừ khi có sự tham gia của AI. Đây chính là lúc DolphinGemma, một mô hình ngôn ngữ nguồn mở được Google thiết kế, xuất hiện. Vai trò của anh ấy là gì? Dự đoán âm thanh tiếp theo mà cá heo sẽ tạo ra, giống như ChatGPT đoán phần còn lại của câu.
Đọc thêm – Bạn muốn tạo video tuyệt vời bằng AI không? Giờ đây, việc này dễ dàng hơn bao giờ hết với Gemini của Google, đây là cách
Bí quyết nằm ở việc tối ưu hóa mô hình cho điện thoại thông minh Pixel. Với chỉ 400 triệu tham số (so với hàng tỷ tham số của Gemini), DolphinGemma vẫn hoạt động ngay cả khi không có kết nối internet. Một điểm quan trọng trên biển khơi. Mùa hè này, CHAT sẽ chuyển sang Pixel 9, có khả năng chạy nhiều thuật toán cùng lúc. Mục tiêu: tinh chỉnh các dự đoán và thử nghiệm âm thanh tổng hợp để tương tác với cá heo.
Google đang dựa vào nguồn mở: từ mùa hè này, DolphinGemma sẽ có thể truy cập được cho tất cả các nhà nghiên cứu. Mặc dù được đào tạo trên cá heo đốm Đại Tây Dương, mô hình này có thể phù hợp với các loài khác. Công ty hiện đang hình dung ra các ứng dụng để bảo vệ động vật biển có vú, ví dụ như bằng cách xác định các tín hiệu cấp cứu.
Vẫn chưa biết liệu Dolphins có tham gia trò chơi hay không. Hiện tại, các cuộc trao đổi chỉ giới hạn ở các bài tập đơn giản ("chạm vào quả bóng này"), nhưng các video đầu tiên cho thấy những phản ứng thích thú... và khá nhiệt tình.

Trong 40 năm, các nhà nghiên cứu tại Dự án Cá heo hoang dã đã ghi lại tiếng huýt sáo và tiếng lách cách của cá heo, với một ước mơ trong đầu: hiểu được ngôn ngữ của chúng. Ngày nay, Google đang cung cấp cho họ sự hỗ trợ công nghệ cao. Nhờ có điện thoại thông minh AI DolphinGemma và Pixel, công ty hy vọng cuối cùng có thể thiết lập được cuộc đối thoại với những loài động vật có vú biển này. Một bước đột phá nghiêm túc nhưng cũng thú vị, và có thể làm thay đổi mối quan hệ của chúng ta với động vật.
Cá heo, những chuyên gia giao tiếp dưới nước, sử dụng nhiều loại âm thanh khác nhau: tiếng kêu khi săn mồi, tiếng huýt sáo nhận dạng hoặc tiếng gầm gừ trong các cuộc xung đột. Vấn đề ở đây là gì? Việc phân tích những cuộc trao đổi này đòi hỏi nhiều năm làm việc... trừ khi có sự tham gia của AI. Đây chính là lúc DolphinGemma, một mô hình ngôn ngữ nguồn mở được Google thiết kế, xuất hiện. Vai trò của anh ấy là gì? Dự đoán âm thanh tiếp theo mà cá heo sẽ tạo ra, giống như ChatGPT đoán phần còn lại của câu.
Đọc thêm – Bạn muốn tạo video tuyệt vời bằng AI không? Giờ đây, việc này dễ dàng hơn bao giờ hết với Gemini của Google, đây là cách
Pixel biến thành máy phiên dịch dưới nước
Để ghi lại những cuộc trao đổi này, các nhà khoa học sử dụng một công cụ có tên là CHAT, dựa trên Pixel 6. Vỏ chống thấm nước này ghi lại giọng nói, trong khi DolphinGemma phân tích chúng theo thời gian thực. Làm sao ? Bằng cách cắt âm thanh thành « token » âm học, nhờ vào công nghệ SoundStream của Google. Sau đó, AI sẽ phát hiện các mẫu lặp lại, chẳng hạn như "từ ngữ" liên quan đến các đối tượng hoặc hành động.Bí quyết nằm ở việc tối ưu hóa mô hình cho điện thoại thông minh Pixel. Với chỉ 400 triệu tham số (so với hàng tỷ tham số của Gemini), DolphinGemma vẫn hoạt động ngay cả khi không có kết nối internet. Một điểm quan trọng trên biển khơi. Mùa hè này, CHAT sẽ chuyển sang Pixel 9, có khả năng chạy nhiều thuật toán cùng lúc. Mục tiêu: tinh chỉnh các dự đoán và thử nghiệm âm thanh tổng hợp để tương tác với cá heo.
Google đang dựa vào nguồn mở: từ mùa hè này, DolphinGemma sẽ có thể truy cập được cho tất cả các nhà nghiên cứu. Mặc dù được đào tạo trên cá heo đốm Đại Tây Dương, mô hình này có thể phù hợp với các loài khác. Công ty hiện đang hình dung ra các ứng dụng để bảo vệ động vật biển có vú, ví dụ như bằng cách xác định các tín hiệu cấp cứu.
Vẫn chưa biết liệu Dolphins có tham gia trò chơi hay không. Hiện tại, các cuộc trao đổi chỉ giới hạn ở các bài tập đơn giản ("chạm vào quả bóng này"), nhưng các video đầu tiên cho thấy những phản ứng thích thú... và khá nhiệt tình.