Chỉ trong vài năm, ElevenLabs đã khẳng định vị thế là một công ty chủ chốt trong lĩnh vực công nghệ giọng nói tổng hợp. Chuyên về các công cụ lồng tiếng và nhân bản giọng nói, công ty khởi nghiệp có trụ sở tại New York này gần đây đã huy động được 250 triệu đô la trong vòng gọi vốn Series C, đưa định giá của công ty lên mức từ 3 đến 3,3 tỷ đô la.
Những người sáng lập ElevenLabs, ban đầu đến từ Ba Lan, đã lấy cảm hứng từ chất lượng lồng tiếng kém trong các video của Mỹ mà họ xem khi còn nhỏ. Trải nghiệm cá nhân này đã truyền cảm hứng cho họ khám phá khả năng của trí tuệ nhân tạo để tạo ra công nghệ giọng nói tổng hợp vượt trội. Tham vọng của họ rất rõ ràng: sử dụng công nghệ để mang lại chất lượng âm thanh tốt hơn trong các ứng dụng đa phương tiện.
Tầm nhìn táo bạo này đã được đền đáp. Ngày nay, ElevenLabs cung cấp nhiều dịch vụ khác nhau, từ dịch văn bản thành giọng nói đến sao chép giọng nói và thậm chí tạo ra giọng nói hoàn toàn mới. Tất cả các dịch vụ này đều có thể truy cập thông qua API thân thiện với người dùng, giúp dễ dàng tích hợp vào nhiều loại sản phẩm và nền tảng khác nhau.
ElevenLabs không chỉ cung cấp giải pháp nhân bản giọng nói đơn giản. Công ty đã mở rộng dịch vụ của mình với nhiều công cụ đáp ứng nhu cầu đa dạng của ngành công nghiệp sáng tạo. Các trường hợp sử dụng bao gồm lồng tiếng cho phim và loạt phim, tạo sách nói và tạo lời tường thuật cho nhiều sản phẩm truyền thông khác nhau.
Khả năng dịch giọng nói được sao chép sang hơn hai chục ngôn ngữ và giữ nguyên ngữ điệu, cảm xúc và phong cách nói của công ty mang lại cho khách hàng một lợi thế đáng kể. Một ví dụ nổi bật là bản dịch đa ngôn ngữ gần đây của cuộc phỏng vấn giữa blogger người Mỹ Lex Fridman và Tổng thống Ukraine Volodymyr Zelenskyy, trong đó mỗi ngôn ngữ đều giữ nguyên chất lượng giọng nói như bản gốc.
Sự mở rộng nhanh chóng và ấn tượng của công ty sẽ không thể thực hiện được nếu không có sự hỗ trợ của nhiều nhà đầu tư có ảnh hưởng. Vòng gây quỹ mới nhất được dẫn đầu bởi ICONIQ Growth, với sự tham gia đáng chú ý từ Andreessen Horowitz. Trước đây, ElevenLabs đã được hưởng lợi từ sự hỗ trợ tài chính từ những gã khổng lồ như Sequoia, Credo Ventures, Concept Ventures, Salesforce Ventures và thậm chí cả Disney. Những khoản đầu tư lớn này chứng tỏ sự tin tưởng ngày càng tăng vào năng lực và tiềm năng của công ty khởi nghiệp.
Mặc dù mục tiêu tài trợ ban đầu là định giá 4 tỷ đô la, nhưng cuối cùng đã được điều chỉnh giảm nhẹ xuống, hợp nhất mức định giá ở mức từ 3 đến 3,3 tỷ đô la. Tuy nhiên, sự tái cơ cấu này vẫn mang tính cạnh tranh, đặc biệt là khi bạn cân nhắc rằng một số nhà đầu tư sẵn sàng trả tới 50 lần doanh thu định kỳ hàng năm (ARR) cho các công ty AI năng động nhất.
Sự trỗi dậy nhanh chóng của ElevenLabs không phải là không gây tranh cãi. Việc sử dụng công nghệ nhân bản giọng nói đã đặt ra nhiều câu hỏi về đạo đức, đặc biệt là khi tái tạo giọng nói của người đã khuất. Một sự cố đáng chú ý liên quan đến Aurore Bergé, bộ trưởng phụ trách bình đẳng giới và chống phân biệt đối xử, người đã cáo buộc ElevenLabs sử dụng trái phép giọng nói nhân bản của người cha quá cố của bà, Alain Dorval, người nổi tiếng là giọng nói tiếng Pháp của Sylvester Stallone.
Bergé cho biết thỏa thuận ban đầu quy định rằng gia đình sẽ có quyền xác nhận cuối cùng trước khi sử dụng giọng nói của Dorval trước công chúng. Đáp lại, ElevenLabs đã làm rõ rằng dự án vẫn đang tiếp tục và quyết định cuối cùng về việc sử dụng giọng nói được sao chép vẫn nằm trong tay gia đình. Một tình huống nhấn mạnh tầm quan trọng của tính minh bạch và sự đồng ý trong việc sử dụng công nghệ nhân bản giọng nói.
Bất chấp những thách thức này, tương lai của ElevenLabs có vẻ đầy hứa hẹn. Sự đa dạng của các ứng dụng tiếp tục thu hút một lượng khách hàng uy tín, bao gồm các nhà xuất bản như Washington Post, HarperCollins và Bertelsmann, cũng như các nhà phát triển trò chơi điện tử.
Tầm nhìn nảy sinh từ thời thơ ấu ở Ba Lan
Những người sáng lập ElevenLabs, ban đầu đến từ Ba Lan, đã lấy cảm hứng từ chất lượng lồng tiếng kém trong các video của Mỹ mà họ xem khi còn nhỏ. Trải nghiệm cá nhân này đã truyền cảm hứng cho họ khám phá khả năng của trí tuệ nhân tạo để tạo ra công nghệ giọng nói tổng hợp vượt trội. Tham vọng của họ rất rõ ràng: sử dụng công nghệ để mang lại chất lượng âm thanh tốt hơn trong các ứng dụng đa phương tiện.
Tầm nhìn táo bạo này đã được đền đáp. Ngày nay, ElevenLabs cung cấp nhiều dịch vụ khác nhau, từ dịch văn bản thành giọng nói đến sao chép giọng nói và thậm chí tạo ra giọng nói hoàn toàn mới. Tất cả các dịch vụ này đều có thể truy cập thông qua API thân thiện với người dùng, giúp dễ dàng tích hợp vào nhiều loại sản phẩm và nền tảng khác nhau.
Ứng dụng đa dạng và phong phú
ElevenLabs không chỉ cung cấp giải pháp nhân bản giọng nói đơn giản. Công ty đã mở rộng dịch vụ của mình với nhiều công cụ đáp ứng nhu cầu đa dạng của ngành công nghiệp sáng tạo. Các trường hợp sử dụng bao gồm lồng tiếng cho phim và loạt phim, tạo sách nói và tạo lời tường thuật cho nhiều sản phẩm truyền thông khác nhau.
Khả năng dịch giọng nói được sao chép sang hơn hai chục ngôn ngữ và giữ nguyên ngữ điệu, cảm xúc và phong cách nói của công ty mang lại cho khách hàng một lợi thế đáng kể. Một ví dụ nổi bật là bản dịch đa ngôn ngữ gần đây của cuộc phỏng vấn giữa blogger người Mỹ Lex Fridman và Tổng thống Ukraine Volodymyr Zelenskyy, trong đó mỗi ngôn ngữ đều giữ nguyên chất lượng giọng nói như bản gốc.
Sự hỗ trợ mạnh mẽ từ các nhà đầu tư
Sự mở rộng nhanh chóng và ấn tượng của công ty sẽ không thể thực hiện được nếu không có sự hỗ trợ của nhiều nhà đầu tư có ảnh hưởng. Vòng gây quỹ mới nhất được dẫn đầu bởi ICONIQ Growth, với sự tham gia đáng chú ý từ Andreessen Horowitz. Trước đây, ElevenLabs đã được hưởng lợi từ sự hỗ trợ tài chính từ những gã khổng lồ như Sequoia, Credo Ventures, Concept Ventures, Salesforce Ventures và thậm chí cả Disney. Những khoản đầu tư lớn này chứng tỏ sự tin tưởng ngày càng tăng vào năng lực và tiềm năng của công ty khởi nghiệp.
Mặc dù mục tiêu tài trợ ban đầu là định giá 4 tỷ đô la, nhưng cuối cùng đã được điều chỉnh giảm nhẹ xuống, hợp nhất mức định giá ở mức từ 3 đến 3,3 tỷ đô la. Tuy nhiên, sự tái cơ cấu này vẫn mang tính cạnh tranh, đặc biệt là khi bạn cân nhắc rằng một số nhà đầu tư sẵn sàng trả tới 50 lần doanh thu định kỳ hàng năm (ARR) cho các công ty AI năng động nhất.
Những thách thức về mặt đạo đức và pháp lý xung quanh việc sao chép giọng nói
Sự trỗi dậy nhanh chóng của ElevenLabs không phải là không gây tranh cãi. Việc sử dụng công nghệ nhân bản giọng nói đã đặt ra nhiều câu hỏi về đạo đức, đặc biệt là khi tái tạo giọng nói của người đã khuất. Một sự cố đáng chú ý liên quan đến Aurore Bergé, bộ trưởng phụ trách bình đẳng giới và chống phân biệt đối xử, người đã cáo buộc ElevenLabs sử dụng trái phép giọng nói nhân bản của người cha quá cố của bà, Alain Dorval, người nổi tiếng là giọng nói tiếng Pháp của Sylvester Stallone.
Bergé cho biết thỏa thuận ban đầu quy định rằng gia đình sẽ có quyền xác nhận cuối cùng trước khi sử dụng giọng nói của Dorval trước công chúng. Đáp lại, ElevenLabs đã làm rõ rằng dự án vẫn đang tiếp tục và quyết định cuối cùng về việc sử dụng giọng nói được sao chép vẫn nằm trong tay gia đình. Một tình huống nhấn mạnh tầm quan trọng của tính minh bạch và sự đồng ý trong việc sử dụng công nghệ nhân bản giọng nói.
Bất chấp những thách thức này, tương lai của ElevenLabs có vẻ đầy hứa hẹn. Sự đa dạng của các ứng dụng tiếp tục thu hút một lượng khách hàng uy tín, bao gồm các nhà xuất bản như Washington Post, HarperCollins và Bertelsmann, cũng như các nhà phát triển trò chơi điện tử.