GPU AMD Radeon AI PRO R9700 cung cấp TOPS cao hơn 4 lần và hiệu suất AI cao hơn 2 lần so với Radeon PRO W7800

theanh · Hôm nay lúc 3:31 PM

AMD đã chia sẻ thêm thông tin chi tiết về GPU Radeon AI PRO R9700 và cách so sánh trong các tác vụ AI với Radeon PRO W7800 hiện tại.

AMD cung cấp AI TOPS cao hơn 4x và hiệu suất AI tăng gấp 2x cho người tiêu dùng với GPU Radeon AI PRO R9700 dựa trên RDNA 4

AMD gần đây đã mở rộng bộ phần mềm của mình với ROCm 7, với chiến lược tăng tốc AI hiện tại mở rộng trên ba danh mục chính: APU Ryzen AI MAX, nhắm đến LLM vừa và nhỏ, GPU Radeon AI PRO, nhắm đến suy luận Edge đa GPU và LLM vừa và nhỏ, và cuối cùng là bộ tăng tốc AI Instinct, nhắm đến LLM lớn cho suy luận quy mô giá đỡ và đào tạo. Trong khi AMD đã trình bày chi tiết về dòng MI350 của mình, công ty cũng tiết lộ thêm một số số liệu thống kê AI cho dòng sản phẩm Radeon AI PRO của mình.

AMD Radeon AI PRO R9700 sử dụng GPU Navi 48, đi kèm với 64 đơn vị tính toán hoặc 4096 bộ xử lý luồng. GPU được tải với 128 bộ tăng tốc AI và có TBP lên tới 300W. Về bộ nhớ, AMD Radeon AI PRO R9700 được trang bị bộ nhớ GDDR6 32 GB, chạy trên bus 256 bit và về cơ bản là gấp đôi VRAM có trên 9070 XT. Các khía cạnh hiệu suất khác được AMD chia sẻ bao gồm 96 TFLOP của phép tính FP16 và 1531 TOPS INT4 (Sparse).

Mục tiêu của GPU AMD Radeon AI PRO R9700 là cho phép hoàn thành các mô hình AI chất lượng cao một cách hiệu quả. Đó là lý do tại sao nó được trang bị 32 GB VRAM, đây là dung lượng tối ưu cho hầu hết các khối lượng công việc AI cục bộ tiên tiến, chẳng hạn như DeepSeek R1 Distill Qwen 32B Q6, Mistral Small 3.1 24B Instruct 2503 Q8, Flux 1 Schnel và SD 3.5 Medium.

Về hiệu suất, AMD tuyên bố rằng Radeon AI PRO R9700 nhanh gấp đôi GPU Radeon PRO W7800 32 GB trong DeepSeek R1, đồng thời công ty cũng đưa ra một vài phép đo so với RTX 5080, có bộ đệm VRAM 16 GB. 16 GB VRAM có thể không phù hợp với các mô hình AI yêu cầu nhiều bộ nhớ hơn và đó là lý do tại sao R9700 được chứng minh là nhanh hơn tới 5 lần.

Đi sâu vào các số liệu tính toán, R9700 sẽ cung cấp 47,8 TFLOP FP32, 191,4 TFLOP FP16 / BF16, 382,7 TFLOP FP8, 382,7 TOP INT8 và 765,5 TOPS hiệu suất INT4. GPU cũng sẽ hỗ trợ các lệnh Wave Matrix Multiply Accumulate (WMMA) và Structured Sparsity. Với Sparsity, tổng số INT4 TOPS sẽ đạt 1531. Các số liệu FP16 tăng gấp 2 lần so với Radeon PRO W7800, trong khi các số liệu INT8/INT4 tăng gấp 4 lần.

AMD cũng nhấn mạnh lý do tại sao việc hỗ trợ các mô hình lớn hơn là điều cần thiết để có được kết quả tốt hơn. Trong Text-To-Image, mô hình 8B chạy trên FP16 sẽ tạo ra kết quả tốt hơn nhiều so với mô hình 1B. Về mặt lý luận, mô hình 32B 6-bit sẽ tạo ra độ chính xác cao hơn mô hình 8B 6-bit.

2 trong số 9
AMD cũng giới thiệu hiệu suất AI của FP16 trong một phép so sánh GPU duy nhất giữa R9700 & W7800, với biến thể mới cung cấp hiệu suất tăng gấp 2 lần trong DeepSeek R1 Distill Llama (8B).

Nhưng không dừng lại ở đó; AMD Radeon AI PRO R9700 cũng có thể được mở rộng trong cấu hình Multi-GPU 4 chiều bằng nền tảng PCIe 5.0 hiện đại. Điều này cho phép người dùng khai thác nhóm 128 GB khổng lồ, có thể xử lý các mô hình bộ đệm như Mistral 123B & DeepSeek R1 70 B. Các mô hình này có thể tiêu thụ tới 112-116 GB VRAM.

2 trong số 9
Cuối cùng, để đảm bảo tính khả dụng, GPU AMD Radeon AI PRO R9700 sẽ có mặt vào tháng 7 năm nay thông qua các đối tác hàng đầu như ASUS, ASRock, Gigabyte, PowerColor, Sapphire, XFX và Yeston. Card sẽ có thiết kế khe cắm kép với bộ làm mát dạng quạt.

Bạn có thể xem mẫu ASRock bên dưới:

2 trong số 9

Dòng sản phẩm đồ họa AMD Radeon Pro Workstation:

Tên card đồ họa	Radeon AI PRO R9700	Radeon Pro W7900	Radeon Pro W7800	Radeon Pro W6900X	Radeon Pro W6800	Radeon Pro VII	Radeon Pro W5700X	Radeon Pro W5700	Radeon Pro WX 9100	Radeon Pro WX 8200	Radeon Pro WX 7100
GPU	Navi 48	Navi 31	Navi 31	Navi 21	Navi 21	Vega 20	Navi 10	Navi 10	Vega 10	Vega 10	Polaris 10
Nút xử lý	4nm	5nm+6nm	5nm+6nm	7nm	7nm	7nm	7nm	7nm	14nm	14nm	14nm
Đơn vị tính toán	64 CU	96 CU	70 CU	80	60	60	40	36	64	56	36
Bộ xử lý luồng	4096	6144	4480	5120	3840	3840	2560	2304	4096	3584	2304
Tốc độ xung nhịp (Đỉnh)	TBD	~2,5 GHz	~2,5 GHz	2171 MHz	2320 MHz	1700 MHz	2040 MHz	1930 MHz	1500 MHz	1500 MHz	1243 MHz
VRAM	32 GB GDDR6	48 GB GDDR6	32 GB GDDR6	32 GB GDDR6	32 GB GDDR6	16 GB HBM2	16 GB GDDR6	8 GB GDDR6	16 GB HBM2	8 GB HBM2	8 GB GDDR5
Băng thông bộ nhớ	640 GB/giây	864 GB/giây	576 GB/giây	512 GB/giây	512 GB/giây	1024 GB/giây	448 GB/giây	448 GB/giây	512 GB/giây	484 GB/giây	224 GB/giây
Bus bộ nhớ	256 bit	384 bit	256 bit	256 bit	256 bit	4096 bit	256 bit	256 bit	2048-bit	2048-bit	256-bit
Tốc độ tính toán (FP32)	48 TFLOP	61,3 TFLOP	45,2 TFLOP	22,23 TFLOP	17,82 TFLOP	13,1 TFLOP	9,5 TFLOP	8,89 TFLOP	12,3 TFLOP	10,8 TFLOP	5,7 TFLOP
TDP	300W	295W	260W	300W	250W	250W	240W	205W	250W	230W	150W
Giá	TBD	3999 đô la Mỹ	2499 đô la Mỹ	5999 đô la Mỹ	2249 đô la Mỹ	1899 đô la Mỹ	999 đô la Mỹ	799 đô la Mỹ	2199 đô la Mỹ	999 đô la Mỹ	799 đô la Mỹ
Ra mắt	2025	2023	2023	2021	2021	2020	2019	2019	2017	2018	2016

GPU AMD Radeon AI PRO R9700 cung cấp TOPS cao hơn 4 lần và hiệu suất AI cao hơn 2 lần so với Radeon PRO W7800

theanh

Administrator

AMD cung cấp AI TOPS cao hơn 4x và hiệu suất AI tăng gấp 2x cho người tiêu dùng với GPU Radeon AI PRO R9700 dựa trên RDNA 4

Dòng sản phẩm đồ họa AMD Radeon Pro Workstation:

Chủ đề tương tự

GPU AMD Radeon AI PRO R9700 cung cấp TOPS cao hơn 4 lần và hiệu suất AI cao hơn 2 lần so với Radeon PRO W7800

theanh

Administrator

AMD cung cấp AI TOPS cao hơn 4x và hiệu suất AI tăng gấp 2x cho người tiêu dùng với GPU Radeon AI PRO R9700 dựa trên RDNA 4​

Dòng sản phẩm đồ họa AMD Radeon Pro Workstation:​

Chủ đề tương tự

AMD cung cấp AI TOPS cao hơn 4x và hiệu suất AI tăng gấp 2x cho người tiêu dùng với GPU Radeon AI PRO R9700 dựa trên RDNA 4

Dòng sản phẩm đồ họa AMD Radeon Pro Workstation: