Google ra mắt máy tăng tốc AI Ironwood “thế hệ thứ 7”; Cụm chip được cho là nhanh hơn siêu máy tính mạnh nhất thế giới 24 lần

theanh

Administrator
Nhân viên
Google đã tiết lộ bộ tăng tốc AI tùy chỉnh "thế hệ thứ 7" của mình, Ironwood, là chip nội bộ đầu tiên được thiết kế riêng cho khối lượng công việc suy luận.

Chip AI Ironwood mới nhất của Google đã tạo ra một chuẩn mực hiệu suất mới, nhắm mục tiêu vào khối lượng công việc suy luận​

Được công bố tại Google Cloud Next 25, Ironwood là bộ tăng tốc mạnh mẽ và hiệu quả nhất của công ty cho đến nay. Nó đi kèm với một số cải tiến về khả năng thế hệ, khiến nó trở thành ứng cử viên lý tưởng cho khối lượng công việc suy luận, một lĩnh vực mà Google tin rằng sẽ là "giai đoạn tiếp theo của AI". Bộ tăng tốc này sẽ được cung cấp cho khách hàng của Google Cloud, theo báo cáo là có hai cấu hình khác nhau: cấu hình 256 chip và cấu hình 9.216 chip, được lựa chọn tùy thuộc vào khối lượng công việc và sức mạnh suy luận cần thiết.

Introducing-7th-Generation-TPUs_-Ironwood-0-39-screenshot.png


Phần tiếp theo là những gì khiến Ironwood của Google trở thành một cuộc cách mạng cho thị trường AI hiện đại. Người ta tuyên bố rằng với cấu hình 9.216 chip, công ty này đạt được sức mạnh tính toán gấp 24 lần so với siêu máy tính lớn nhất thế giới, El Capitan, đạt 42,5 Exaflop. Ngoài ra, Ironwood được cho là có hiệu suất/watt cao hơn gấp 2 lần so với Trillium TPU thế hệ trước, điều này cho thấy hiệu suất được cải thiện đáng kể qua từng thế hệ. Sau đây là một số thông tin thú vị khác về Ironwood:
  • Tăng đáng kể dung lượng Bộ nhớ băng thông cao (HBM).
  • Ironwood cung cấp 192 GB cho mỗi chip, gấp 6 lần so với Trillium, cho phép xử lý các mô hình và tập dữ liệu lớn hơn, giảm nhu cầu truyền dữ liệu thường xuyên và cải thiện hiệu suất.
  • Băng thông HBM được cải thiện đáng kể, đạt 7,2 TBps cho mỗi chip, gấp 4,5 lần Trillium’s.Băng thông cao này đảm bảo truy cập dữ liệu nhanh chóng, rất quan trọng đối với khối lượng công việc đòi hỏi nhiều bộ nhớ thường gặp trong AI hiện đại.
  • Băng thông Inter-Chip Interconnect (ICI) nâng cao. Băng thông này đã được tăng lên 1,2 Tbps hai chiều, gấp 1,5 lần Trillium’s, cho phép truyền thông giữa các chip nhanh hơn, tạo điều kiện thuận lợi cho đào tạo phân tán hiệu quả và suy luận ở quy mô lớn.
Những thành tựu của Ironwood và Google cho thấy các giải pháp AI tùy chỉnh nội bộ đã phát triển đến mức nào và có thể khẳng định rằng điều này thực sự thách thức thế độc quyền của NVIDIA trên thị trường, điều mà Jensen đã biết. Những con số hiệu suất như vậy cho thấy rõ ràng rằng luôn có chỗ để phát triển và với các giải pháp xuất hiện từ Microsoft với Maia 100 và Amazon với chip Graviton, rõ ràng là các công ty đã nhận ra những cơ hội do các giải pháp nội bộ mang lại.


 
Back
Bên trên