Deepseek: AI Trung Quốc sợ người khổng lồ Mỹ

theanh

Administrator
Nhân viên
Cộng đồng AI của Mỹ đang hoảng loạn, một "khoảnh khắc Sputnik", khiến Marc Andreessen, nhà đầu tư và cố vấn thân cận của Donald Trump, lo lắng khi nhắc đến vệ tinh đầu tiên do Liên Xô phóng vào năm 1957 khiến Hoa Kỳ trở tay không kịp. Một chatbot của Trung Quốc, DeepSeek, đã đứng đầu bảng xếp hạng các ứng dụng miễn phí phổ biến nhất trên toàn thế giới trong vài ngày qua.

David đấu với Goliath​


Mô hình ngôn ngữ tiên tiến nhất (LLM) do bot cung cấp, DeepSeek-R1, sẽ hoạt động tốt hơn mô hình o1, mô hình tiên tiến nhất của OpenAI, về các vấn đề toán học và lập luận, theo các điểm chuẩn do DeepSeek thực hiện. Theo mặc định, chatbot chạy trên DeepSeek-V3, được cho là có chi phí phát triển dưới 6 triệu đô la. Những gã khổng lồ của Mỹ trong lĩnh vực này không bao giờ ngừng nhắc nhở chúng ta rằng số tiền cần thiết để thiết kế các chương trình LLM hiệu suất cao chỉ là một giọt nước giữa đại dương - chẳng hạn như thông qua dự án Stargate.
DeepSeek có hình ảnh David nhỏ bé đánh bại Goliath có thể làm lung lay sự chắc chắn của ngành công nghiệp Hoa Kỳ (và Châu Âu): với các mô hình nguồn mở được tính toán bằng các con chip kém hiệu quả hơn so với các nhà vô địch phương Tây, do đó, bot của Trung Quốc sẽ hoạt động tốt hơn... và thậm chí còn rẻ hơn. Theo Epoch AI, mô hình của DeepSeek hiệu quả đến mức chỉ cần một phần mười sức mạnh tính toán của mô hình Llama 3.1 của Meta để đào tạo.
Một bot Trung Quốc cũng có nghĩa là hạn chế một số truy vấn "nhạy cảm". Ví dụ, không thể hỏi DeepSeek những câu hỏi liên quan đến cuộc nổi loạn Thiên An Môn hay Tập Cận Bình.
Kể từ năm 2021, rất khó để có được silicon tiên tiến nhất của Mỹ tại Trung Quốc do những hạn chế do Nhà Trắng áp đặt. Để tiếp tục hoạt động, các nhà phát triển AI Trung Quốc đang chia sẻ công việc của mình với nhau và thử nghiệm những cách tiếp cận mới. “DeepSeek tập trung vào việc tối ưu hóa tài nguyên thông qua các giải pháp phần mềm”, Marina Zhang, phó giáo sư tại Đại học Công nghệ Sydney, chia sẻ với Wired.
Chuyên gia công nghệ Trung Quốc tiếp tục: “DeepSeek đã áp dụng các phương pháp nguồn mở, tập hợp chuyên môn tập thể và thúc đẩy đổi mới hợp tác. Cách tiếp cận này không chỉ khắc phục được những hạn chế về nguồn lực mà còn đẩy nhanh quá trình phát triển các công nghệ tiên tiến, giúp DeepSeek khác biệt so với các đối thủ cạnh tranh khép kín hơn.
DeepSeek được Liang Wenfeng thành lập vào năm 2023 tại Hàng Châu. Kỹ sư điện tử này đã lắp ráp một pin gồm 10.000 chip Nvidia H100 hiện bị cấm nhập khẩu vào Trung Quốc. Thêm vào cơ sở hạ tầng này sẽ là những con chip ít mạnh hơn vẫn có thể nhập khẩu và các biện pháp tối ưu hóa để hạn chế chi phí và giảm sức mạnh tính toán cần thiết để đào tạo LLM.
Thành công của DeepSeek thực sự là một cú sốc điện đối với ngành công nghiệp AI phương Tây. Ví dụ của Trung Quốc có lẽ sẽ thúc đẩy họ làm việc cùng nhau nhiều hơn và tìm kiếm hiệu quả cao hơn với cơ sở hạ tầng hiện có.
Nguồn: Wired
 
Back
Bên trên