DeepSeek đã gây tổn hại cho các gã khổng lồ công nghệ Mỹ. Trong những tuần gần đây, gã khổng lồ AI của Trung Quốc đã tung ra các mô hình có khả năng tương đương với các công ty Hoa Kỳ: R1 tương tự như o1, mô hình lý luận tiên tiến nhất từ OpenAI. Mô hình DeepSeek V3, kém tiên tiến hơn, tuy nhiên vẫn có thể sánh ngang với Sonnet-3.5 của Anthropic hoặc GPT-4o của OpenAI.
Trên hết, cách DeepSeek đào tạo các mô hình này đã gây chấn động ở Hoa Kỳ: công ty sử dụng GPU Nvidia (2048 card H800 cho V3) kém mạnh hơn nhiều so với các GPU tương tự của Mỹ do những hạn chế của Mỹ. DeepSeek cũng đã và trên hết đã phát triển các phương pháp tối ưu hóa khéo léo giúp giảm đáng kể chi phí đào tạo các mô hình của mình.
Chúng ta đang nói đến chi phí dưới 6 triệu đô la cho mô hình V3, nhưng con số này chưa tính đến chi phí phát sinh cho nghiên cứu, phát triển thuật toán, thu thập dữ liệu và thử nghiệm kiến trúc. Do đó, V3 hẳn phải tốn kém hơn nhiều, nhưng có lẽ không đến hàng trăm tỷ đô la mà những gã khổng lồ của Hoa Kỳ đang khoa trương tuyên bố.
Trong mọi trường hợp, sự gia tăng ngoạn mục của DeepSeek trong những ngày gần đây và thực tế là các mô hình AI của công ty này là mã nguồn mở đã gây ra những hậu quả tài chính rất thực tế, đặc biệt là đối với Nvidia, vốn hóa thị trường chứng khoán của công ty đã giảm 589 tỷ đô la (!) vào thứ Hai, trước khi phục hồi một chút vào ngày hôm sau. Các công ty AI khác cũng chẳng khá khẩm hơn là bao.
Trên hết, sự xuất hiện của DeepSeek trong trò chơi đặt ra nghi ngờ nghiêm trọng về tính nghiêm túc của lộ trình cực kỳ tốn kém của những công ty Mỹ, như dự án Stargate đầy tham vọng của OpenAI.
Thật tuyệt, Nvidia, Microsoft, Meta và OpenAI đã ca ngợi năng lực của DeepSeek, nhưng cũng nhanh chóng có những nghi ngờ về các phương pháp mà công ty Trung Quốc này sử dụng. Do đó, OpenAI sẽ có bằng chứng chứng minh việc DeepSeek sử dụng các mô hình độc quyền để đào tạo các mô hình cạnh tranh của riêng mình. Cụ thể hơn, người tạo ra ChatGPT đã lưu ý đến việc sử dụng phương pháp được gọi là "chưng cất".
Kỹ thuật này được các nhà phát triển sử dụng để đạt hiệu suất tốt hơn trên các mô hình nhỏ bằng cách khai thác kết quả của các mô hình lớn hơn và mạnh hơn. Điều này cho phép họ đạt được kết quả tương tự đối với các nhiệm vụ cụ thể, với chi phí thấp hơn nhiều. Chưng cất là một hoạt động phổ biến và được phép trong ngành, nhưng mối lo ngại ở đây là DeepSeek có thể đã tận dụng nó để phát triển các mô hình cạnh tranh của riêng mình, vi phạm các điều khoản dịch vụ của OpenAI.
“Vấn đề phát sinh khi bạn [tận dụng kỹ thuật này bên ngoài nền tảng] để tạo mô hình của riêng mình cho mục đích của riêng bạn,” một nguồn tin của OpenAI chia sẻ với Financial Times. Điều khoản dịch vụ của công ty nêu rõ rằng người dùng không được sao chép bất kỳ dịch vụ OpenAI nào hoặc "khai thác kết quả để phát triển các mô hình cạnh tranh với OpenAI".
Năm ngoái, OpenAI và Microsoft đã tiến hành điều tra các tài khoản mà họ nghi ngờ thuộc về DeepSeek đang sử dụng API của OpenAI. Lối vào bị chặn vì nghi ngờ có hoạt động chưng cất. Câu chuyện đã rẽ sang hướng chính trị: David Sacks, "ông trùm AI" của Donald Trump, đã tuyên bố rằng có "bằng chứng đáng kể" cho thấy DeepSeek đã chắt lọc các mô hình của OpenAI.
Có điều gì đó trớ trêu về việc DeepSeek "đánh cắp" tài sản trí tuệ của OpenAI. Quá trình đào tạo mô hình của OpenAI dựa trên khối lượng dữ liệu lớn, một số trong đó đến từ nội dung có trên "web mở" nhưng không được phép khai thác thương mại nếu không được phép. OpenAI cũng được cho là đã đào sâu vào nội dung có bản quyền, gây ra một số khiếu nại từ các tác giả và nhà xuất bản báo chí.
Nguồn: Financial Times
OpenAI, thế trận đảo ngược
Trên hết, cách DeepSeek đào tạo các mô hình này đã gây chấn động ở Hoa Kỳ: công ty sử dụng GPU Nvidia (2048 card H800 cho V3) kém mạnh hơn nhiều so với các GPU tương tự của Mỹ do những hạn chế của Mỹ. DeepSeek cũng đã và trên hết đã phát triển các phương pháp tối ưu hóa khéo léo giúp giảm đáng kể chi phí đào tạo các mô hình của mình.
Chúng ta đang nói đến chi phí dưới 6 triệu đô la cho mô hình V3, nhưng con số này chưa tính đến chi phí phát sinh cho nghiên cứu, phát triển thuật toán, thu thập dữ liệu và thử nghiệm kiến trúc. Do đó, V3 hẳn phải tốn kém hơn nhiều, nhưng có lẽ không đến hàng trăm tỷ đô la mà những gã khổng lồ của Hoa Kỳ đang khoa trương tuyên bố.
Trong mọi trường hợp, sự gia tăng ngoạn mục của DeepSeek trong những ngày gần đây và thực tế là các mô hình AI của công ty này là mã nguồn mở đã gây ra những hậu quả tài chính rất thực tế, đặc biệt là đối với Nvidia, vốn hóa thị trường chứng khoán của công ty đã giảm 589 tỷ đô la (!) vào thứ Hai, trước khi phục hồi một chút vào ngày hôm sau. Các công ty AI khác cũng chẳng khá khẩm hơn là bao.
Trên hết, sự xuất hiện của DeepSeek trong trò chơi đặt ra nghi ngờ nghiêm trọng về tính nghiêm túc của lộ trình cực kỳ tốn kém của những công ty Mỹ, như dự án Stargate đầy tham vọng của OpenAI.
Thật tuyệt, Nvidia, Microsoft, Meta và OpenAI đã ca ngợi năng lực của DeepSeek, nhưng cũng nhanh chóng có những nghi ngờ về các phương pháp mà công ty Trung Quốc này sử dụng. Do đó, OpenAI sẽ có bằng chứng chứng minh việc DeepSeek sử dụng các mô hình độc quyền để đào tạo các mô hình cạnh tranh của riêng mình. Cụ thể hơn, người tạo ra ChatGPT đã lưu ý đến việc sử dụng phương pháp được gọi là "chưng cất".
Kỹ thuật này được các nhà phát triển sử dụng để đạt hiệu suất tốt hơn trên các mô hình nhỏ bằng cách khai thác kết quả của các mô hình lớn hơn và mạnh hơn. Điều này cho phép họ đạt được kết quả tương tự đối với các nhiệm vụ cụ thể, với chi phí thấp hơn nhiều. Chưng cất là một hoạt động phổ biến và được phép trong ngành, nhưng mối lo ngại ở đây là DeepSeek có thể đã tận dụng nó để phát triển các mô hình cạnh tranh của riêng mình, vi phạm các điều khoản dịch vụ của OpenAI.
“Vấn đề phát sinh khi bạn [tận dụng kỹ thuật này bên ngoài nền tảng] để tạo mô hình của riêng mình cho mục đích của riêng bạn,” một nguồn tin của OpenAI chia sẻ với Financial Times. Điều khoản dịch vụ của công ty nêu rõ rằng người dùng không được sao chép bất kỳ dịch vụ OpenAI nào hoặc "khai thác kết quả để phát triển các mô hình cạnh tranh với OpenAI".
Năm ngoái, OpenAI và Microsoft đã tiến hành điều tra các tài khoản mà họ nghi ngờ thuộc về DeepSeek đang sử dụng API của OpenAI. Lối vào bị chặn vì nghi ngờ có hoạt động chưng cất. Câu chuyện đã rẽ sang hướng chính trị: David Sacks, "ông trùm AI" của Donald Trump, đã tuyên bố rằng có "bằng chứng đáng kể" cho thấy DeepSeek đã chắt lọc các mô hình của OpenAI.
Có điều gì đó trớ trêu về việc DeepSeek "đánh cắp" tài sản trí tuệ của OpenAI. Quá trình đào tạo mô hình của OpenAI dựa trên khối lượng dữ liệu lớn, một số trong đó đến từ nội dung có trên "web mở" nhưng không được phép khai thác thương mại nếu không được phép. OpenAI cũng được cho là đã đào sâu vào nội dung có bản quyền, gây ra một số khiếu nại từ các tác giả và nhà xuất bản báo chí.
Nguồn: Financial Times