Không còn nghi ngờ gì nữa, DeepSeek R1 là một Vấn đề Rất. Lớn. Có rất nhiều sự cường điệu trong lĩnh vực AI, cũng giống như hầu hết các công nghệ mới khác. Nhưng thỉnh thoảng cũng có một người mới xuất hiện và thực sự có tuyên bố là một lực lượng phá vỡ lớn. DeepSeek R1 là một sinh vật như vậy (bạn có thể tự mình truy cập mô hình tại đây).
Theo báo cáo của CNBC, ứng dụng DeepSeek đã vượt qua ChatGPT là ứng dụng miễn phí hàng đầu trong App Store của Apple. Và một số gã khổng lồ công nghệ đã chứng kiến cổ phiếu của họ bị ảnh hưởng nặng nề. Trong đó có Nvidia, giảm 13% vào sáng nay.
Nhìn bề ngoài, đây chỉ là một mô hình AI mới của Trung Quốc và không thiếu những mô hình như vậy được ra mắt hàng tuần. Nhưng có hai điều chính khiến DeepSeek R1 trở nên khác biệt.
YouTube
Xem trên Đầu tiên, mọi người nói về nó như có hiệu suất tương đương với mô hình o1 của OpenAI. Tóm lại, o1 là công ty dẫn đầu thế giới hiện nay về các mô hình AI, vì khả năng suy luận trước khi đưa ra câu trả lời. Điều này khiến nó cực kỳ mạnh mẽ đối với các tác vụ phức tạp hơn, mà AI thường gặp khó khăn.
Thực tế là một công ty mới nổi đã nhảy vào cạnh tranh với công ty dẫn đầu thị trường chỉ trong một lần là điều đáng kinh ngạc.
Đó là một bước nhảy vọt về tốc độ phát triển tiềm năng mà chúng ta có thể thấy trong AI trong những tháng tới. Đây không còn là tình huống một hoặc hai công ty kiểm soát không gian AI nữa, giờ đây đã có một cộng đồng toàn cầu khổng lồ có thể đóng góp vào sự tiến bộ của những công cụ mới tuyệt vời này.
Để làm cho tình hình tệ hơn, họ mô hình DeepSeek đã được đào tạo và phát triển chỉ trong hai tháng với số tiền ít ỏi là 5,6 triệu đô la. Con số này so với chi phí phát triển hàng tỷ đô la của những công ty lớn như OpenAI và Anthropic.
Nói rằng đây là một cú tát vào mặt những gã khổng lồ công nghệ này là còn nói giảm nói tránh. Các chủ sở hữu quỹ đầu cơ Trung Quốc của DeepSeek, High-Flyer, có thành tích trong phát triển AI, vì vậy đây không phải là điều hoàn toàn bất ngờ. Điều bất ngờ là họ đã tạo ra thứ gì đó từ đầu một cách nhanh chóng và rẻ như vậy, và không có lợi thế là được tiếp cận với công nghệ điện toán tiên tiến của phương Tây.
Tất nhiên, xếp hạng tốt trên một chuẩn mực là một chuyện, nhưng hầu hết mọi người hiện nay đều tìm kiếm bằng chứng thực tế về cách các mô hình hoạt động hàng ngày. Các báo cáo ban đầu cho thấy các tiêu chuẩn DeepSeek không hề nói dối, với một số lượng lớn người dùng áp dụng nó cho lập trình AI thay vì Claude Sonnet 3.5 của Anthropic.
Điều đáng ngạc nhiên là mô hình R1 thậm chí còn có vẻ di chuyển các cột mốc mục tiêu theo đuổi nhiều hoạt động sáng tạo hơn. Một người dùng Reddit đã đăng một mẫu bài viết sáng tạo do mô hình tạo ra, bài viết này thực sự rất hay.
Kiểm tra của riêng tôi cho thấy DeepSeek cũng sẽ phổ biến đối với những người muốn sử dụng cục bộ trên máy tính của họ. Trong ba thử nghiệm nhỏ, thừa nhận là không khoa học, mà tôi đã thực hiện với mô hình, tôi đã bị choáng ngợp bởi hiệu suất của nó.
Trong một thử nghiệm, tôi đã yêu cầu mô hình giúp tôi theo dõi tên nền tảng gây quỹ phi lợi nhuận mà tôi đang tìm kiếm. Một tìm kiếm tiêu chuẩn trên Google, OpenAI và Gemini đều không cung cấp cho tôi bất kỳ câu trả lời nào gần đúng. DeepSeek đã đánh trúng mục tiêu chỉ trong một lần, điều này thật đáng kinh ngạc.
Nếu không có lời nhắc tốt, kết quả chắc chắn sẽ tầm thường hoặc ít nhất là không có tiến bộ thực sự nào so với các mô hình cục bộ hiện có. Nhưng khi nó hoạt động tốt, trời ơi, tia lửa chắc chắn sẽ bùng cháy.
Theo báo cáo của CNBC, ứng dụng DeepSeek đã vượt qua ChatGPT là ứng dụng miễn phí hàng đầu trong App Store của Apple. Và một số gã khổng lồ công nghệ đã chứng kiến cổ phiếu của họ bị ảnh hưởng nặng nề. Trong đó có Nvidia, giảm 13% vào sáng nay.
Nhìn bề ngoài, đây chỉ là một mô hình AI mới của Trung Quốc và không thiếu những mô hình như vậy được ra mắt hàng tuần. Nhưng có hai điều chính khiến DeepSeek R1 trở nên khác biệt.
YouTube

Xem trên Đầu tiên, mọi người nói về nó như có hiệu suất tương đương với mô hình o1 của OpenAI. Tóm lại, o1 là công ty dẫn đầu thế giới hiện nay về các mô hình AI, vì khả năng suy luận trước khi đưa ra câu trả lời. Điều này khiến nó cực kỳ mạnh mẽ đối với các tác vụ phức tạp hơn, mà AI thường gặp khó khăn.
Thực tế là một công ty mới nổi đã nhảy vào cạnh tranh với công ty dẫn đầu thị trường chỉ trong một lần là điều đáng kinh ngạc.
Thứ hai, mô hình mới này không chỉ mang lại hiệu suất gần như tương đương với mô hình o1 mà còn là mã nguồn mở. Điều này có nghĩa là bất kỳ nhà nghiên cứu hoặc kỹ sư AI nào trên toàn thế giới đều có thể làm việc để cải thiện và tinh chỉnh nó cho các ứng dụng khác nhau.Thực tế là một công ty mới nổi đã nhảy vào cạnh tranh với công ty dẫn đầu thị trường chỉ trong một lần là điều đáng kinh ngạc.
Đó là một bước nhảy vọt về tốc độ phát triển tiềm năng mà chúng ta có thể thấy trong AI trong những tháng tới. Đây không còn là tình huống một hoặc hai công ty kiểm soát không gian AI nữa, giờ đây đã có một cộng đồng toàn cầu khổng lồ có thể đóng góp vào sự tiến bộ của những công cụ mới tuyệt vời này.
Để làm cho tình hình tệ hơn, họ mô hình DeepSeek đã được đào tạo và phát triển chỉ trong hai tháng với số tiền ít ỏi là 5,6 triệu đô la. Con số này so với chi phí phát triển hàng tỷ đô la của những công ty lớn như OpenAI và Anthropic.
Nói rằng đây là một cú tát vào mặt những gã khổng lồ công nghệ này là còn nói giảm nói tránh. Các chủ sở hữu quỹ đầu cơ Trung Quốc của DeepSeek, High-Flyer, có thành tích trong phát triển AI, vì vậy đây không phải là điều hoàn toàn bất ngờ. Điều bất ngờ là họ đã tạo ra thứ gì đó từ đầu một cách nhanh chóng và rẻ như vậy, và không có lợi thế là được tiếp cận với công nghệ điện toán tiên tiến của phương Tây.
Tất nhiên, xếp hạng tốt trên một chuẩn mực là một chuyện, nhưng hầu hết mọi người hiện nay đều tìm kiếm bằng chứng thực tế về cách các mô hình hoạt động hàng ngày. Các báo cáo ban đầu cho thấy các tiêu chuẩn DeepSeek không hề nói dối, với một số lượng lớn người dùng áp dụng nó cho lập trình AI thay vì Claude Sonnet 3.5 của Anthropic.
Điều đáng ngạc nhiên là mô hình R1 thậm chí còn có vẻ di chuyển các cột mốc mục tiêu theo đuổi nhiều hoạt động sáng tạo hơn. Một người dùng Reddit đã đăng một mẫu bài viết sáng tạo do mô hình tạo ra, bài viết này thực sự rất hay.
Những ngày đầu của DeepSeek

Kiểm tra của riêng tôi cho thấy DeepSeek cũng sẽ phổ biến đối với những người muốn sử dụng cục bộ trên máy tính của họ. Trong ba thử nghiệm nhỏ, thừa nhận là không khoa học, mà tôi đã thực hiện với mô hình, tôi đã bị choáng ngợp bởi hiệu suất của nó.
Trong một thử nghiệm, tôi đã yêu cầu mô hình giúp tôi theo dõi tên nền tảng gây quỹ phi lợi nhuận mà tôi đang tìm kiếm. Một tìm kiếm tiêu chuẩn trên Google, OpenAI và Gemini đều không cung cấp cho tôi bất kỳ câu trả lời nào gần đúng. DeepSeek đã đánh trúng mục tiêu chỉ trong một lần, điều này thật đáng kinh ngạc.
Vẫn còn quá sớm để đưa ra phán quyết cuối cùng về mô hình AI mới này, nhưng cho đến nay, kết quả có vẻ rất hứa hẹn. Một điều tôi nhận thấy là thực tế là lời nhắc và lời nhắc của hệ thống cực kỳ quan trọng khi chạy mô hình cục bộ.Chúng ta đang sống trong một dòng thời gian mà một công ty không phải của Hoa Kỳ đang duy trì sứ mệnh ban đầu của OpenAI - nghiên cứu thực sự mở, tiên phong trao quyền cho tất cả mọi người. Điều đó thật vô lý. Kết quả thú vị nhất có khả năng xảy ra nhất. DeepSeek-R1 không chỉ mã nguồn mở một loạt các mô hình mà còn… pic.twitter.com/M7eZnEmCOY20 tháng 1 năm 2025
Nếu không có lời nhắc tốt, kết quả chắc chắn sẽ tầm thường hoặc ít nhất là không có tiến bộ thực sự nào so với các mô hình cục bộ hiện có. Nhưng khi nó hoạt động tốt, trời ơi, tia lửa chắc chắn sẽ bùng cháy.
- Tôi đã thử nghiệm Meta AI so với Perplexity AI với 7 lời nhắc — đây là người chiến thắng
- Tôi viết để kiếm sống — và phần mềm phiên âm AI này thực sự là một công cụ thay đổi cuộc chơi
- Bản ghi nhớ bị rò rỉ tiết lộ kế hoạch AI của Apple cho năm 2025 — đây là những gì công ty đang tập trung vào