GPU AMD Radeon AI PRO R9700 cung cấp TOPS cao hơn 4 lần và hiệu suất AI cao hơn 2 lần so với Radeon PRO W7800

theanh

Administrator
Nhân viên
AMD đã chia sẻ thêm thông tin chi tiết về GPU Radeon AI PRO R9700 và cách so sánh trong các tác vụ AI với Radeon PRO W7800 hiện tại.

AMD cung cấp AI TOPS cao hơn 4x và hiệu suất AI tăng gấp 2x cho người tiêu dùng với GPU Radeon AI PRO R9700 dựa trên RDNA 4​

AMD gần đây đã mở rộng bộ phần mềm của mình với ROCm 7, với chiến lược tăng tốc AI hiện tại mở rộng trên ba danh mục chính: APU Ryzen AI MAX, nhắm đến LLM vừa và nhỏ, GPU Radeon AI PRO, nhắm đến suy luận Edge đa GPU và LLM vừa và nhỏ, và cuối cùng là bộ tăng tốc AI Instinct, nhắm đến LLM lớn cho suy luận quy mô giá đỡ và đào tạo. Trong khi AMD đã trình bày chi tiết về dòng MI350 của mình, công ty cũng tiết lộ thêm một số số liệu thống kê AI cho dòng sản phẩm Radeon AI PRO của mình.

AMD Radeon AI PRO R9700 sử dụng GPU Navi 48, đi kèm với 64 đơn vị tính toán hoặc 4096 bộ xử lý luồng. GPU được tải với 128 bộ tăng tốc AI và có TBP lên tới 300W. Về bộ nhớ, AMD Radeon AI PRO R9700 được trang bị bộ nhớ GDDR6 32 GB, chạy trên bus 256 bit và về cơ bản là gấp đôi VRAM có trên 9070 XT. Các khía cạnh hiệu suất khác được AMD chia sẻ bao gồm 96 TFLOP của phép tính FP16 và 1531 TOPS INT4 (Sparse).

2025-06-18_10-31-10-scaled.png


Mục tiêu của GPU AMD Radeon AI PRO R9700 là cho phép hoàn thành các mô hình AI chất lượng cao một cách hiệu quả. Đó là lý do tại sao nó được trang bị 32 GB VRAM, đây là dung lượng tối ưu cho hầu hết các khối lượng công việc AI cục bộ tiên tiến, chẳng hạn như DeepSeek R1 Distill Qwen 32B Q6, Mistral Small 3.1 24B Instruct 2503 Q8, Flux 1 Schnel và SD 3.5 Medium.

2025-05-21_3-25-18.jpg


Về hiệu suất, AMD tuyên bố rằng Radeon AI PRO R9700 nhanh gấp đôi GPU Radeon PRO W7800 32 GB trong DeepSeek R1, đồng thời công ty cũng đưa ra một vài phép đo so với RTX 5080, có bộ đệm VRAM 16 GB. 16 GB VRAM có thể không phù hợp với các mô hình AI yêu cầu nhiều bộ nhớ hơn và đó là lý do tại sao R9700 được chứng minh là nhanh hơn tới 5 lần.

2025-06-18_10-31-17-scaled.png


Đi sâu vào các số liệu tính toán, R9700 sẽ cung cấp 47,8 TFLOP FP32, 191,4 TFLOP FP16 / BF16, 382,7 TFLOP FP8, 382,7 TOP INT8 và 765,5 TOPS hiệu suất INT4. GPU cũng sẽ hỗ trợ các lệnh Wave Matrix Multiply Accumulate (WMMA) và Structured Sparsity. Với Sparsity, tổng số INT4 TOPS sẽ đạt 1531. Các số liệu FP16 tăng gấp 2 lần so với Radeon PRO W7800, trong khi các số liệu INT8/INT4 tăng gấp 4 lần.

2025-06-18_10-31-19-scaled.png


AMD cũng nhấn mạnh lý do tại sao việc hỗ trợ các mô hình lớn hơn là điều cần thiết để có được kết quả tốt hơn. Trong Text-To-Image, mô hình 8B chạy trên FP16 sẽ tạo ra kết quả tốt hơn nhiều so với mô hình 1B. Về mặt lý luận, mô hình 32B 6-bit sẽ tạo ra độ chính xác cao hơn mô hình 8B 6-bit.




2 trong số 9
AMD cũng giới thiệu hiệu suất AI của FP16 trong một phép so sánh GPU duy nhất giữa R9700 & W7800, với biến thể mới cung cấp hiệu suất tăng gấp 2 lần trong DeepSeek R1 Distill Llama (8B).

2025-05-21_3-25-19.jpg


Nhưng không dừng lại ở đó; AMD Radeon AI PRO R9700 cũng có thể được mở rộng trong cấu hình Multi-GPU 4 chiều bằng nền tảng PCIe 5.0 hiện đại. Điều này cho phép người dùng khai thác nhóm 128 GB khổng lồ, có thể xử lý các mô hình bộ đệm như Mistral 123B & DeepSeek R1 70 B. Các mô hình này có thể tiêu thụ tới 112-116 GB VRAM.






2 trong số 9
Cuối cùng, để đảm bảo tính khả dụng, GPU AMD Radeon AI PRO R9700 sẽ có mặt vào tháng 7 năm nay thông qua các đối tác hàng đầu như ASUS, ASRock, Gigabyte, PowerColor, Sapphire, XFX và Yeston. Card sẽ có thiết kế khe cắm kép với bộ làm mát dạng quạt.

2025-05-21_3-25-25.jpg


Bạn có thể xem mẫu ASRock bên dưới:












2 trong số 9

Dòng sản phẩm đồ họa AMD Radeon Pro Workstation:​

Tên card đồ họaRadeon AI PRO R9700Radeon Pro W7900Radeon Pro W7800Radeon Pro W6900XRadeon Pro W6800Radeon Pro VIIRadeon Pro W5700XRadeon Pro W5700Radeon Pro WX 9100Radeon Pro WX 8200Radeon Pro WX 7100
GPUNavi 48Navi 31Navi 31Navi 21Navi 21Vega 20Navi 10Navi 10Vega 10Vega 10Polaris 10
Nút xử lý4nm5nm+6nm5nm+6nm7nm7nm7nm7nm7nm14nm14nm14nm
Đơn vị tính toán64 CU96 CU70 CU8060604036645636
Bộ xử lý luồng40966144448051203840384025602304409635842304
Tốc độ xung nhịp (Đỉnh)TBD~2,5 GHz~2,5 GHz2171 MHz2320 MHz1700 MHz2040 MHz1930 MHz1500 MHz1500 MHz1243 MHz
VRAM32 GB GDDR648 GB GDDR632 GB GDDR632 GB GDDR632 GB GDDR616 GB HBM216 GB GDDR68 GB GDDR616 GB HBM28 GB HBM28 GB GDDR5
Băng thông bộ nhớ640 GB/giây864 GB/giây576 GB/giây512 GB/giây512 GB/giây1024 GB/giây448 GB/giây448 GB/giây512 GB/giây484 GB/giây224 GB/giây
Bus bộ nhớ256 bit384 bit256 bit256 bit256 bit4096 bit256 bit256 bit2048-bit2048-bit256-bit
Tốc độ tính toán (FP32)48 TFLOP61,3 TFLOP45,2 TFLOP22,23 TFLOP17,82 TFLOP13,1 TFLOP9,5 TFLOP8,89 TFLOP12,3 TFLOP10,8 TFLOP5,7 TFLOP
TDP300W295W260W300W250W250W240W205W250W230W150W
GiáTBD3999 đô la Mỹ2499 đô la Mỹ5999 đô la Mỹ2249 đô la Mỹ1899 đô la Mỹ999 đô la Mỹ799 đô la Mỹ2199 đô la Mỹ999 đô la Mỹ799 đô la Mỹ
Ra mắt20252023202320212021202020192019201720182016
 
Back
Bên trên