AMD đã chia sẻ thêm thông tin chi tiết về GPU Radeon AI PRO R9700 và cách so sánh trong các tác vụ AI với Radeon PRO W7800 hiện tại.
AMD Radeon AI PRO R9700 sử dụng GPU Navi 48, đi kèm với 64 đơn vị tính toán hoặc 4096 bộ xử lý luồng. GPU được tải với 128 bộ tăng tốc AI và có TBP lên tới 300W. Về bộ nhớ, AMD Radeon AI PRO R9700 được trang bị bộ nhớ GDDR6 32 GB, chạy trên bus 256 bit và về cơ bản là gấp đôi VRAM có trên 9070 XT. Các khía cạnh hiệu suất khác được AMD chia sẻ bao gồm 96 TFLOP của phép tính FP16 và 1531 TOPS INT4 (Sparse).
Mục tiêu của GPU AMD Radeon AI PRO R9700 là cho phép hoàn thành các mô hình AI chất lượng cao một cách hiệu quả. Đó là lý do tại sao nó được trang bị 32 GB VRAM, đây là dung lượng tối ưu cho hầu hết các khối lượng công việc AI cục bộ tiên tiến, chẳng hạn như DeepSeek R1 Distill Qwen 32B Q6, Mistral Small 3.1 24B Instruct 2503 Q8, Flux 1 Schnel và SD 3.5 Medium.
Về hiệu suất, AMD tuyên bố rằng Radeon AI PRO R9700 nhanh gấp đôi GPU Radeon PRO W7800 32 GB trong DeepSeek R1, đồng thời công ty cũng đưa ra một vài phép đo so với RTX 5080, có bộ đệm VRAM 16 GB. 16 GB VRAM có thể không phù hợp với các mô hình AI yêu cầu nhiều bộ nhớ hơn và đó là lý do tại sao R9700 được chứng minh là nhanh hơn tới 5 lần.
Đi sâu vào các số liệu tính toán, R9700 sẽ cung cấp 47,8 TFLOP FP32, 191,4 TFLOP FP16 / BF16, 382,7 TFLOP FP8, 382,7 TOP INT8 và 765,5 TOPS hiệu suất INT4. GPU cũng sẽ hỗ trợ các lệnh Wave Matrix Multiply Accumulate (WMMA) và Structured Sparsity. Với Sparsity, tổng số INT4 TOPS sẽ đạt 1531. Các số liệu FP16 tăng gấp 2 lần so với Radeon PRO W7800, trong khi các số liệu INT8/INT4 tăng gấp 4 lần.
AMD cũng nhấn mạnh lý do tại sao việc hỗ trợ các mô hình lớn hơn là điều cần thiết để có được kết quả tốt hơn. Trong Text-To-Image, mô hình 8B chạy trên FP16 sẽ tạo ra kết quả tốt hơn nhiều so với mô hình 1B. Về mặt lý luận, mô hình 32B 6-bit sẽ tạo ra độ chính xác cao hơn mô hình 8B 6-bit.


2 trong số 9
AMD cũng giới thiệu hiệu suất AI của FP16 trong một phép so sánh GPU duy nhất giữa R9700 & W7800, với biến thể mới cung cấp hiệu suất tăng gấp 2 lần trong DeepSeek R1 Distill Llama (8B).
Nhưng không dừng lại ở đó; AMD Radeon AI PRO R9700 cũng có thể được mở rộng trong cấu hình Multi-GPU 4 chiều bằng nền tảng PCIe 5.0 hiện đại. Điều này cho phép người dùng khai thác nhóm 128 GB khổng lồ, có thể xử lý các mô hình bộ đệm như Mistral 123B & DeepSeek R1 70 B. Các mô hình này có thể tiêu thụ tới 112-116 GB VRAM.



2 trong số 9
Cuối cùng, để đảm bảo tính khả dụng, GPU AMD Radeon AI PRO R9700 sẽ có mặt vào tháng 7 năm nay thông qua các đối tác hàng đầu như ASUS, ASRock, Gigabyte, PowerColor, Sapphire, XFX và Yeston. Card sẽ có thiết kế khe cắm kép với bộ làm mát dạng quạt.
Bạn có thể xem mẫu ASRock bên dưới:






2 trong số 9
AMD cung cấp AI TOPS cao hơn 4x và hiệu suất AI tăng gấp 2x cho người tiêu dùng với GPU Radeon AI PRO R9700 dựa trên RDNA 4
AMD gần đây đã mở rộng bộ phần mềm của mình với ROCm 7, với chiến lược tăng tốc AI hiện tại mở rộng trên ba danh mục chính: APU Ryzen AI MAX, nhắm đến LLM vừa và nhỏ, GPU Radeon AI PRO, nhắm đến suy luận Edge đa GPU và LLM vừa và nhỏ, và cuối cùng là bộ tăng tốc AI Instinct, nhắm đến LLM lớn cho suy luận quy mô giá đỡ và đào tạo. Trong khi AMD đã trình bày chi tiết về dòng MI350 của mình, công ty cũng tiết lộ thêm một số số liệu thống kê AI cho dòng sản phẩm Radeon AI PRO của mình.AMD Radeon AI PRO R9700 sử dụng GPU Navi 48, đi kèm với 64 đơn vị tính toán hoặc 4096 bộ xử lý luồng. GPU được tải với 128 bộ tăng tốc AI và có TBP lên tới 300W. Về bộ nhớ, AMD Radeon AI PRO R9700 được trang bị bộ nhớ GDDR6 32 GB, chạy trên bus 256 bit và về cơ bản là gấp đôi VRAM có trên 9070 XT. Các khía cạnh hiệu suất khác được AMD chia sẻ bao gồm 96 TFLOP của phép tính FP16 và 1531 TOPS INT4 (Sparse).

Mục tiêu của GPU AMD Radeon AI PRO R9700 là cho phép hoàn thành các mô hình AI chất lượng cao một cách hiệu quả. Đó là lý do tại sao nó được trang bị 32 GB VRAM, đây là dung lượng tối ưu cho hầu hết các khối lượng công việc AI cục bộ tiên tiến, chẳng hạn như DeepSeek R1 Distill Qwen 32B Q6, Mistral Small 3.1 24B Instruct 2503 Q8, Flux 1 Schnel và SD 3.5 Medium.

Về hiệu suất, AMD tuyên bố rằng Radeon AI PRO R9700 nhanh gấp đôi GPU Radeon PRO W7800 32 GB trong DeepSeek R1, đồng thời công ty cũng đưa ra một vài phép đo so với RTX 5080, có bộ đệm VRAM 16 GB. 16 GB VRAM có thể không phù hợp với các mô hình AI yêu cầu nhiều bộ nhớ hơn và đó là lý do tại sao R9700 được chứng minh là nhanh hơn tới 5 lần.

Đi sâu vào các số liệu tính toán, R9700 sẽ cung cấp 47,8 TFLOP FP32, 191,4 TFLOP FP16 / BF16, 382,7 TFLOP FP8, 382,7 TOP INT8 và 765,5 TOPS hiệu suất INT4. GPU cũng sẽ hỗ trợ các lệnh Wave Matrix Multiply Accumulate (WMMA) và Structured Sparsity. Với Sparsity, tổng số INT4 TOPS sẽ đạt 1531. Các số liệu FP16 tăng gấp 2 lần so với Radeon PRO W7800, trong khi các số liệu INT8/INT4 tăng gấp 4 lần.

AMD cũng nhấn mạnh lý do tại sao việc hỗ trợ các mô hình lớn hơn là điều cần thiết để có được kết quả tốt hơn. Trong Text-To-Image, mô hình 8B chạy trên FP16 sẽ tạo ra kết quả tốt hơn nhiều so với mô hình 1B. Về mặt lý luận, mô hình 32B 6-bit sẽ tạo ra độ chính xác cao hơn mô hình 8B 6-bit.


2 trong số 9
AMD cũng giới thiệu hiệu suất AI của FP16 trong một phép so sánh GPU duy nhất giữa R9700 & W7800, với biến thể mới cung cấp hiệu suất tăng gấp 2 lần trong DeepSeek R1 Distill Llama (8B).

Nhưng không dừng lại ở đó; AMD Radeon AI PRO R9700 cũng có thể được mở rộng trong cấu hình Multi-GPU 4 chiều bằng nền tảng PCIe 5.0 hiện đại. Điều này cho phép người dùng khai thác nhóm 128 GB khổng lồ, có thể xử lý các mô hình bộ đệm như Mistral 123B & DeepSeek R1 70 B. Các mô hình này có thể tiêu thụ tới 112-116 GB VRAM.



2 trong số 9
Cuối cùng, để đảm bảo tính khả dụng, GPU AMD Radeon AI PRO R9700 sẽ có mặt vào tháng 7 năm nay thông qua các đối tác hàng đầu như ASUS, ASRock, Gigabyte, PowerColor, Sapphire, XFX và Yeston. Card sẽ có thiết kế khe cắm kép với bộ làm mát dạng quạt.

Bạn có thể xem mẫu ASRock bên dưới:






2 trong số 9
Dòng sản phẩm đồ họa AMD Radeon Pro Workstation:
Tên card đồ họa | Radeon AI PRO R9700 | Radeon Pro W7900 | Radeon Pro W7800 | Radeon Pro W6900X | Radeon Pro W6800 | Radeon Pro VII | Radeon Pro W5700X | Radeon Pro W5700 | Radeon Pro WX 9100 | Radeon Pro WX 8200 | Radeon Pro WX 7100 |
---|---|---|---|---|---|---|---|---|---|---|---|
GPU | Navi 48 | Navi 31 | Navi 31 | Navi 21 | Navi 21 | Vega 20 | Navi 10 | Navi 10 | Vega 10 | Vega 10 | Polaris 10 |
Nút xử lý | 4nm | 5nm+6nm | 5nm+6nm | 7nm | 7nm | 7nm | 7nm | 7nm | 14nm | 14nm | 14nm |
Đơn vị tính toán | 64 CU | 96 CU | 70 CU | 80 | 60 | 60 | 40 | 36 | 64 | 56 | 36 |
Bộ xử lý luồng | 4096 | 6144 | 4480 | 5120 | 3840 | 3840 | 2560 | 2304 | 4096 | 3584 | 2304 |
Tốc độ xung nhịp (Đỉnh) | TBD | ~2,5 GHz | ~2,5 GHz | 2171 MHz | 2320 MHz | 1700 MHz | 2040 MHz | 1930 MHz | 1500 MHz | 1500 MHz | 1243 MHz |
VRAM | 32 GB GDDR6 | 48 GB GDDR6 | 32 GB GDDR6 | 32 GB GDDR6 | 32 GB GDDR6 | 16 GB HBM2 | 16 GB GDDR6 | 8 GB GDDR6 | 16 GB HBM2 | 8 GB HBM2 | 8 GB GDDR5 |
Băng thông bộ nhớ | 640 GB/giây | 864 GB/giây | 576 GB/giây | 512 GB/giây | 512 GB/giây | 1024 GB/giây | 448 GB/giây | 448 GB/giây | 512 GB/giây | 484 GB/giây | 224 GB/giây |
Bus bộ nhớ | 256 bit | 384 bit | 256 bit | 256 bit | 256 bit | 4096 bit | 256 bit | 256 bit | 2048-bit | 2048-bit | 256-bit |
Tốc độ tính toán (FP32) | 48 TFLOP | 61,3 TFLOP | 45,2 TFLOP | 22,23 TFLOP | 17,82 TFLOP | 13,1 TFLOP | 9,5 TFLOP | 8,89 TFLOP | 12,3 TFLOP | 10,8 TFLOP | 5,7 TFLOP |
TDP | 300W | 295W | 260W | 300W | 250W | 250W | 240W | 205W | 250W | 230W | 150W |
Giá | TBD | 3999 đô la Mỹ | 2499 đô la Mỹ | 5999 đô la Mỹ | 2249 đô la Mỹ | 1899 đô la Mỹ | 999 đô la Mỹ | 799 đô la Mỹ | 2199 đô la Mỹ | 999 đô la Mỹ | 799 đô la Mỹ |
Ra mắt | 2025 | 2023 | 2023 | 2021 | 2021 | 2020 | 2019 | 2019 | 2017 | 2018 | 2016 |