Microsoft vừa công bố mô hình AI suy luận Phi-4 mới — đây là lý do tại sao chúng lại là một vấn đề lớn

theanh

Administrator
Nhân viên
Một tuần mới, một mô hình AI mới. Tham gia vào cuộc đua này là Microsoft, ra mắt 3 mô hình mới trong phạm vi “Phi-4”. Chúng bao gồm lý luận Phi-4, lý luận Phi-4 cộng và lý luận Phi-4 mini.

Ngoài việc thể hiện cam kết của họ đối với các lược đồ đặt tên kỳ lạ được tìm thấy trong thế giới AI, những cái tên này còn tiết lộ loại mô hình AI mà chúng là.

Các mô hình lý luận đã trở nên thịnh hành gần đây. Chúng được đào tạo cụ thể để vượt ra ngoài câu trả lời đơn giản hoặc tạo hình ảnh, tham gia vào một cách tiếp cận hợp lý hơn đối với các lời nhắc. Chúng thường được trang bị tốt hơn để kiểm tra thực tế và các vấn đề phức tạp.

Phạm vi lý luận của Phi-4 được xây dựng dựa trên họ “mô hình nhỏ” của Microsoft – một dự án do Microsoft khởi xướng cách đây khoảng một năm.
Microsoft tuyên bố rằng Phi-4-reasoning-plus tiếp cận hiệu suất của Deepseek R1

Mục đích ở đây là xây dựng các mô hình ngôn ngữ nhỏ, ưu tiên hiệu quả và chi phí thấp. Những mô hình này khác với các mô hình ngôn ngữ lớn, trong đó chúng được cung cấp một lượng dữ liệu khổng lồ, cho phép chúng hoàn thành hầu hết các tác vụ với độ chi tiết cực cao, nhưng phải trả chi phí cao.

Điều này hoàn toàn tách biệt với Microsoft Copilot và Copilot 365 — các mô hình AI nổi tiếng hơn của thương hiệu phục vụ cho cả nhiệm vụ của người tiêu dùng và công việc.


wZGmfPwAivKWvikiWeJGM8-1200-80.png



Thay vào đó, các mô hình mới của Microsoft tập trung vào các nhiệm vụ cụ thể hơn, ưu tiên các tập dữ liệu chất lượng cao và lịch trình đào tạo cụ thể hơn để đạt được hiệu suất cao ở quy mô nhỏ hơn.

Lý luận Phi-4 là mô hình tham số 14 tỷ (tham số đề cập đến mức độ hiểu biết của mô hình; số càng cao, thường là càng biết nhiều). Nó được đào tạo bằng dữ liệu web chất lượng cao và được sử dụng tốt nhất cho các ứng dụng toán học, khoa học và mã hóa.

Phi 4-reasoning-plus được đào tạo trên một tập dữ liệu tương tự, nhưng nó được đào tạo để nỗ lực hơn nữa nhằm đạt được độ chính xác cao hơn cho các nhiệm vụ cụ thể. Microsoft tuyên bố rằng Phi-4-reasoning-plus có hiệu suất gần bằng Deepseek R1, mặc dù nó có tham số lớn hơn nhiều là 671 tỷ.

Tôi có thể làm gì với các mô hình suy luận của Phi-4?​


eyjvwzNaBEMjPv85uF9Yk5-1200-80.jpg



Tất cả các mô hình này, cùng với báo cáo kỹ thuật có sẵn trên trang web phát triển AI Hugging Face.

Tuy nhiên, đối với hầu hết mọi người, Phi-4 sẽ không phải là mô hình mà bạn sẽ sử dụng. Các loại mô hình này được thiết kế cho các mục đích nâng cao hơn, chẳng hạn như nghiên cứu, mã hóa và nghiên cứu khoa học.

Bằng cách xây dựng một mô hình nhỏ hơn và giá cả phải chăng hơn để chạy, Microsoft đang tham gia cùng Deepseek và Alibaba, tập trung vào việc làm cho loại công nghệ này có giá cả phải chăng hơn so với các tùy chọn như mô hình O3 của OpenAI.

Lĩnh vực AI này đang phát triển nhanh chóng, chứng kiến các mô hình đảm nhận các nhiệm vụ phức tạp hơn với ít năng lượng hơn, thời gian đào tạo ngắn hơn và giao diện người dùng dễ tiếp cận hơn để nhiều người có thể tham gia.
  • Google Gemini bổ sung các công cụ chỉnh sửa hình ảnh mới — đây là những gì chúng có thể làm
  • Tôi sử dụng ChatGPT để lập kế hoạch cho tất cả các kỳ nghỉ của mình — 5 lời nhắc thiết yếu cần thử
  • Bắt đầu với Hume AI — cách thiết lập giọng nói và nói chuyện tự nhiên
 
Back
Bên trên