Google ra mắt công cụ AI bí mật tại Pháp giúp chuyển đổi tài liệu của bạn thành podcast

theanh

Administrator
Nhân viên
Google tiếp tục làm phong phú thêm hệ sinh thái trí tuệ nhân tạo của mình bằng cách công bố một tính năng mới quan trọng cho công cụ NotebookLM. Tính năng Tổng quan bằng âm thanh hiện có sẵn bằng tiếng Pháp và hơn 50 ngôn ngữ khác. Dịch vụ này cho phép bạn chuyển đổi bất kỳ nguồn tài liệu nào, dù là video, PDF, văn bản hay các nguồn khác, thành cuộc trò chuyện âm thanh theo phong cách podcast.

Tóm tắt âm thanh: Công cụ tuyệt vời của Google có sẵn bằng tiếng Pháp​

Đã được áp dụng tại các quốc gia nói tiếng Anh, chức năng Tóm tắt âm thanh nổi bật trong NotebookLM nhờ khả năng tạo bản tóm tắt âm thanh từ tài liệu. Nhờ tích hợp âm thanh gốc của Gemini, công cụ này có thể mô phỏng cuộc trò chuyện giữa hai trí tuệ nhân tạo đang thảo luận về chủ đề tài liệu của bạn. Việc tạo tóm tắt chỉ mất vài phút và kết quả thật ấn tượng.

Để tạo podcast bằng hai AI, người dùng chỉ cần truy cập notebooklm.google, thêm nguồn (PDF, ghi chú, video YouTube, v.v.) rồi chọn Tóm tắt âm thanh. Tóm tắt âm thanh được tạo theo mặc định bằng ngôn ngữ ưa thích của tài khoản Google của bạn, nhưng bạn có thể chọn ngôn ngữ đầu ra mong muốn trong tùy chọn chuyên dụng mới (Cài đặt > Ngôn ngữ đầu ra).

Tham vọng của Google? sự kết thúc của rào cản ngôn ngữ​

Thông báo ngày 29 tháng 4 đánh dấu một cột mốc quan trọng với việc mở rộng sang hơn 50 ngôn ngữ, bao gồm cả tiếng Pháp. Công ty Mountain View giải thích rằng họ muốn loại bỏ rào cản ngôn ngữ và giúp thông tin dễ tiếp cận hơn. Năm ngoái, Google đã mở rộng quyền truy cập vào NotebookLM tới hơn 200 quốc gia và cung cấp các ví dụ về cách sử dụng của dịch vụ này: ví dụ, giáo viên có thể chia sẻ tài liệu bằng nhiều ngôn ngữ khác nhau và học sinh có thể tạo bản tóm tắt bằng âm thanh bằng ngôn ngữ của riêng mình.

Nhưng NotebookLM là gì?​

Ra mắt gần một năm trước, NotebookLM là dịch vụ AI do Google phát triển để hỗ trợ biên soạn tài liệu và dữ liệu. Ít được biết đến hơn các dịch vụ khác, dịch vụ này đặc biệt hữu ích cho các nhà nghiên cứu, nhà báo, nhà văn, sinh viên hoặc học giả. Công cụ này được thiết kế để hiểu các tài liệu mà người dùng đang làm việc, chẳng hạn như dự án nghiên cứu của họ, nhằm tương tác theo cách phù hợp. Công cụ này giúp bạn tìm ý tưởng, hiểu và có được cái nhìn tổng quan từ tài liệu của riêng bạn, đồng thời có khả năng tổng hợp nghiên cứu, hỗ trợ phân tích, tham chiếu chéo các yếu tố và trả lời câu hỏi, bất kể định dạng nguồn nào.

NotebookLM cũng gây ngạc nhiên vì người tạo ra nó, Steven Johnson, không thực sự có hồ sơ thông thường. Ông là tác giả của mười bốn cuốn sách, đam mê công nghệ, được Google thuê để phát triển dịch vụ này.

Công nghệ này, tạo ra cuộc trò chuyện giữa giọng nam và giọng nữ mô phỏng ngữ điệu của con người, là một thách thức to lớn đối với Google trong tham vọng xóa bỏ rào cản ngôn ngữ. Nó mở ra góc nhìn mới cho việc học đa ngôn ngữ và có khả năng thay đổi cách chúng ta tiếp cận các môn học phức tạp. Hiện tại, Google đang mời người dùng dùng thử tính năng này và chia sẻ phản hồi của họ, đặc biệt là qua Discord.

Mặc dù tóm tắt bằng âm thanh vẫn là tính năng độc quyền của NotebookLM nhưng tiềm năng của tính năng này là vô cùng lớn. Chúng có thể đặc biệt hấp dẫn những người hâm mộ podcast đang tìm kiếm một cách mới để tiếp thu thông tin, biến bất kỳ câu hỏi hoặc tài liệu nào thành một cuộc trò chuyện ảo có thể nghe ở bất cứ đâu.

Tại sao Google mất nhiều thời gian như vậy để cung cấp tính năng này bằng tiếng Pháp?​

Sự xuất hiện của tiếng Pháp đòi hỏi phải có công việc cụ thể, như Steven Johnson đã giải thích với các đồng nghiệp của chúng tôi tại Numerama và href="https://www.bfmtv.com/tech/google/n...isme-a-partir-d-un-texte_AN-202504290634.html">Tech&Co. Ngôn ngữ của chúng tôi phức tạp để hiểu đối với chức năng này và mong muốn của công ty là có được bản kết xuất âm thanh đáng tin cậy. Mô hình AI đã được đào tạo trên hơn 200 giờ ghi âm trong phòng thu với hai người trò chuyện để nắm bắt ngữ điệu, phản ứng và sự ngắt quãng đặc trưng của một cuộc trò chuyện tự nhiên.

notebook-lm-langue-francais.jpg


“Mỗi ngôn ngữ đều ngắt quãng theo cách khác nhau,” Steven Johnson giải thích, nhấn mạnh tầm quan trọng của việc điều chỉnh mô hình cho từng ngôn ngữ để đạt được “phép thuật của một cuộc trò chuyện”. Hiện tại, phiên bản tiếng Pháp có một điểm khác biệt chính so với phiên bản tiếng Anh: vẫn chưa thể ngắt podcast để đặt câu hỏi cho AI và đưa cuộc thảo luận tiếp tục. Tuy nhiên, khả năng tương tác theo thời gian thực này lại là một tính năng phổ biến của phiên bản tiếng Anh.
 
Back
Bên trên