Với Vera Rubin và Blackwell Ultra, Nvidia đang hướng tới tương lai xa hơn của AI

theanh

Administrator
Nhân viên
Nvidia tất nhiên có card đồ họa dành cho game thủ như GeForce RTX5070 mới ra mắt gần đây. Nhưng trong khi GPU chơi game vẫn quan trọng đối với doanh nghiệp - xét cho cùng, đây là hoạt động kinh doanh cốt lõi - thì hoạt động này phần lớn đã nhường chỗ cho AI. Và trong Hội nghị Công nghệ GPU (GTC) được tổ chức tại California cho đến ngày 21 tháng 3, Nvidia đã khai thác triệt để vấn đề này bằng cách giới thiệu nhiều tính năng mới.

Một GPU, nhiều chip, nhiều sức mạnh hơn​

À bắt đầu với thế hệ GPU mới mang tên Vera Rubin, nhằm tôn vinh nhà thiên văn học người Mỹ nổi tiếng với công trình nghiên cứu về vật chất moiré. Những GPU này sẽ xuất hiện vào nửa cuối năm 2026, trên thực tế bao gồm một CPU (Vera) và một thiết kế GPU mới (Rubin). Vera là bộ xử lý đầu tiên được Nvidia phát triển, dựa trên thiết kế có tên gọi là Olympus; Trước đây, công ty đã sử dụng các thành phần của Arm.

Thiết kế nội bộ này cho phép Vera nhanh gấp đôi CPU tại nơi làm việc trong chip Grace Blackwell, Nvidia đảm bảo điều này cũng làm thay đổi định nghĩa về GPU: một tập hợp các chip được nhóm lại giờ đây sẽ được coi như nhiều GPU riêng biệt.

Ví dụ, chip Blackwell trên thị trường bao gồm hai chip được lắp ráp để hoạt động như một khối duy nhất. Với Rubin thế hệ mới, Nvidia hiện cho rằng một GPU được tạo thành từ nhiều chip (đế) phải được tính là nhiều GPU riêng biệt. Rubin bao gồm hai đế, tức là hai GPU. Vào năm 2027, dòng Rubin Next sẽ kết hợp bốn đế chip trên một con chip duy nhất và sẽ được giới thiệu dưới dạng GPU. Nvidia đang hướng tới tương lai, vì thế hệ sau Rubin đã được biết đến: đó sẽ là Feynman, dự kiến ra mắt vào năm 2028.

Nhưng chúng ta hãy quay lại với; thế hệ đầu tiên của Rubin dự kiến ra đời vào năm sau. Khi kết hợp với Vera, GPU Rubin sẽ có khả năng thực hiện tới 50 petaflop trong quá trình suy luận, quá trình mà mô hình AI được đào tạo áp dụng kiến thức để phân tích dữ liệu mới và đưa ra kết quả theo thời gian thực. Con số này cao hơn gấp đôi so với 20 petaflop của thế hệ Blackwell hiện tại. Ngoài ra, Rubin sẽ có thể hỗ trợ bộ nhớ nhanh lên đến 288GB, một tiêu chí quan trọng đối với các nhà phát triển AI.

blackwell-ultra-nvdia.jpg


Nvidia cũng đã tiết lộ Blackwell Ultra, một phiên bản cải tiến của dòng sản phẩm hiện tại có khả năng tạo ra nhiều nội dung hơn trong thời gian ngắn hơn. Sản phẩm sẽ được cung cấp theo nhiều cấu hình khác nhau, bao gồm phiên bản có CPU Nvidia Arm (GB300) và phiên bản có tám GPU cho mỗi máy chủ. Nhà sản xuất tuyên bố rằng những con chip này sẽ cho phép các nhà cung cấp dịch vụ đám mây tăng băng thông lên đến 50 lần (!) so với thu nhập của họ so với thế hệ Hopper.

Blackwell Ultra đặc biệt phù hợp với các mô hình AI về "lý luận" cũng như các mô hình DeepSeek của Trung Quốc, thứ khiến các gã khổng lồ của Hoa Kỳ vô cùng sợ hãi. Nvidia, mục tiêu chính của cuộc tấn công này, ngược lại đã chọn áp dụng các mô hình này và có lý do chính đáng: Các "tác nhân" AI kêu gọi AI lý luận một cách ồ ạt… và do đó, các công nghệ có khả năng nghiền nát chúng.

Nguồn: Nvidia
 
Back
Bên trên