Cuối cùng. Đây là từ đầu tiên xuất hiện trong đầu khi AMD chính thức công bố kiến trúc RDNA 4 của mình, sau nhiều tháng chờ đợi và một số lần trì hoãn vào phút chót. Nhà sản xuất đã phát hành video giới thiệu về kiến trúc đồ họa mới này, tiết lộ sâu hơn các đặc điểm của nó về khả năng dựng hình 3D, dò tia và thậm chí cả khả năng trí tuệ nhân tạo. Đây cũng là cơ hội để AMD tiết lộ toàn bộ thông tin chi tiết về hai card đồ họa đầu tiên sử dụng kiến trúc RDNA 4 này, cụ thể là Radeon RX 9070 và RX 9070 XT.
Kiến trúc RDNA4 mang đến những cải tiến cho quy trình kết xuất. Hiệu quả của các đơn vị tính toán đã được cải thiện, ví dụ, bằng cách tăng số lượng tác vụ đang hoạt động trên mỗi chu kỳ xung nhịp và các đơn vị thực thi hiện được hưởng lợi từ khả năng kiểm soát chính xác hơn để các phép tính ở các độ chính xác khác nhau có thể (INT4, INT8, FP16 hoặc FP32) có thể được xử lý hiệu quả hơn.
Sự xuất hiện của các thanh ghi động trong RDNA 4 là một trong những tính năng mới thú vị nhất của kiến trúc. Cho đến nay, số lượng thanh ghi - những vùng bộ nhớ nhỏ gần các đơn vị thực thi và có thể truy cập nhanh hơn nhiều so với bộ nhớ video hoặc thậm chí các cấp bộ nhớ đệm khác nhau - có sẵn trong GPU được phân bổ tĩnh, không thực sự tương ứng với nhu cầu của từng tác vụ được thực thi. Bây giờ, việc phân bổ động các thanh ghi cho các tác vụ tính toán khác nhau, phức tạp hơn hoặc ít phức tạp hơn sẽ tối ưu hóa việc sử dụng ngân hàng thanh ghi có sẵn trong chipset đồ họa và do đó tối ưu hóa hiệu suất và hiệu quả tổng thể.
© AMD
© AMD
© AMD
Những cải tiến này, kết hợp với hệ thống bộ nhớ được cải tiến (Infinity Cache thế hệ thứ ba) và tần số hoạt động cao hơn, đảm bảo hiệu suất tăng lên trong quá trình kết xuất Classic 3D: AMD đang nói về mức tăng khoảng 40% so với kiến trúc RDNA 3 của Radeon trước đó.
Dựa trên thiết kế SIMD (Một lệnh, Nhiều dữ liệu) được phát triển hơn trước đây, RDNA 4 cũng đảm bảo sử dụng tốt hơn các tài nguyên điện toán có sẵn về mặt dò tia. Kiểu kết xuất này đòi hỏi nhiều phép tính song song, đặc biệt là đối với mô phỏng ánh sáng và hiệu ứng chiếu sáng toàn cục. Do đó, AMD đã tối ưu hóa kiến trúc của mình để các phép tính hiệu quả hơn bằng cách cho phép xử lý nhiều luồng hơn trên mỗi chu kỳ. Các đơn vị tính toán được sử dụng tốt hơn, đặc biệt là trong các tình huống kết xuất kết hợp khi rasterization và raytracing được kết hợp.
Một số thay đổi và tính năng mới trong quy trình kết xuất raytracing, chẳng hạn như tối ưu hóa đối với biến đổi thể hiện vật liệu hoặc hộp giới hạn định hướng (OBB), giúp tăng tốc độ phân tích cảnh đồng thời cải thiện độ chính xác của nó. Ít tia hơn được sử dụng trong các phép tính không cần thiết, giúp giảm thời gian kết xuất tổng thể: AMD đang nói về việc tăng gấp đôi hiệu suất dò tia so với RDNA 3.
Kiến trúc RDNA 4 cũng hỗ trợ các hoạt động FP8, INT8, BF8 và INT4, với các phép tính 8 bit nhanh gấp đôi so với 16 bit và số nguyên 4 bit tăng gấp đôi hình này nữa. Nói cách khác, các phép tính FP8 nhanh hơn tới 8 lần với kiến trúc RDNA 4 so với các phép tính có độ chính xác FP16 trên kiến trúc RDNA 3.
Không giống như FSR 3.1, phiên bản mới này chỉ dành riêng cho kiến trúc RDNA 4 và do đó sẽ chỉ hoạt động trên các card Radeon mới. Ngoài ra, AMD vẫn chưa xác nhận liệu mô hình nâng cấp nơ-ron có khả dụng khi ra mắt dòng Radeon thế hệ tiếp theo hay không. Nhà sản xuất cho biết chế độ "Hiệu suất" mới của FSR 4 sẽ cung cấp chất lượng hình ảnh 4K "tốt hơn chất lượng gốc".
Với chipset Navi 48 XTX có tốc độ lên tới 2,97 GHz, Radeon RX 9070 XT có 4096 lõi thực thi, 64 bộ tăng tốc RT và 128 bộ tăng tốc AI. Sản phẩm có bộ nhớ GDDR6 16GB và được hưởng lợi từ giao diện bộ nhớ 256-bit, cung cấp băng thông 640GB/giây. Mức tiêu thụ đạt 304 watt; Do đó, AMD khuyến nghị sử dụng nguồn điện 750 watt.
Về phần mình, Radeon RX 9070 có chipset Navi 48 bao gồm 3584 lõi thực thi, 56 bộ tăng tốc RT và 112 bộ tăng tốc AI. Nó cũng có 16GB bộ nhớ GDDR6 với giao diện bộ nhớ 256-bit, nhưng TDP của nó giảm xuống "chỉ" 220 watt.
Những cải tiến đối với kiến trúc RDNA 4 và tần số hoạt động cao hơn cho phép hai mẫu Radeon mới này đạt được – theo nhà sản xuất – mức hiệu suất tương tự như RX 7900 XT và RX 7900 XTX của thế hệ trước, mặc dù số lượng đơn vị tính toán ít hơn. AMD cũng tuyên bố rằng Radeon RX 9070 sẽ có thể cung cấp hiệu suất trung bình cao hơn 20% so với RX 7900 GRE thế hệ trước ở mức 1440p, trong khi Radeon RX 9070 XT sẽ mở rộng lợi thế này lên hơn 40% trung bình.
RX 9070 XT cũng dự kiến sẽ có giá cao hơn RTX 4070 Ti Super, trong khi RX 9070 có thể cung cấp hiệu suất tương đương với RTX 4070 Super nhưng với mức giá hấp dẫn hơn. RX 9070 XT và RX 9070 cuối cùng được cho là nhanh hơn 26% so với RTX 3090 và RTX 3080.
Với giá bán lẻ đề xuất lần lượt là 549 đô la và 599 đô la, Radeon RX 9070 và RX 9070 Do đó, XT hướng đến nhiều hơn đến các game thủ có nhu cầu chính về hiệu suất cao ở độ phân giải 1440p và chấp nhận được ở độ phân giải 4K. Chúng sẽ có sẵn từ ngày 6 tháng 3; Chúng tôi chỉ đang chờ các bài kiểm tra độc lập để thực sự biết những chiếc Radeon mới này có gì.
RDNA 4: kiến trúc được tối ưu hóa để tăng hiệu quả
Được sản xuất bởi TSMC với quy trình khắc N4P (hay nói cách khác là cải tiến 5 nm), hai chipset đồ họa đầu tiên của thế hệ này ra mắt là Navi 48 XTX và XT. Với kiến trúc RDNA 4, AMD đã lựa chọn quay lại thiết kế nguyên khối, từ bỏ phương pháp chiplet được sử dụng trong RDNA 3. Chipset Navi 48 do đó kết hợp tới 53,9 tỷ bóng bán dẫn vào một khuôn 356,5 mm² duy nhất.
Kiến trúc RDNA4 mang đến những cải tiến cho quy trình kết xuất. Hiệu quả của các đơn vị tính toán đã được cải thiện, ví dụ, bằng cách tăng số lượng tác vụ đang hoạt động trên mỗi chu kỳ xung nhịp và các đơn vị thực thi hiện được hưởng lợi từ khả năng kiểm soát chính xác hơn để các phép tính ở các độ chính xác khác nhau có thể (INT4, INT8, FP16 hoặc FP32) có thể được xử lý hiệu quả hơn.

Sự xuất hiện của các thanh ghi động trong RDNA 4 là một trong những tính năng mới thú vị nhất của kiến trúc. Cho đến nay, số lượng thanh ghi - những vùng bộ nhớ nhỏ gần các đơn vị thực thi và có thể truy cập nhanh hơn nhiều so với bộ nhớ video hoặc thậm chí các cấp bộ nhớ đệm khác nhau - có sẵn trong GPU được phân bổ tĩnh, không thực sự tương ứng với nhu cầu của từng tác vụ được thực thi. Bây giờ, việc phân bổ động các thanh ghi cho các tác vụ tính toán khác nhau, phức tạp hơn hoặc ít phức tạp hơn sẽ tối ưu hóa việc sử dụng ngân hàng thanh ghi có sẵn trong chipset đồ họa và do đó tối ưu hóa hiệu suất và hiệu quả tổng thể.



Những cải tiến này, kết hợp với hệ thống bộ nhớ được cải tiến (Infinity Cache thế hệ thứ ba) và tần số hoạt động cao hơn, đảm bảo hiệu suất tăng lên trong quá trình kết xuất Classic 3D: AMD đang nói về mức tăng khoảng 40% so với kiến trúc RDNA 3 của Radeon trước đó.
Cải tiến cụ thể cho raytracing

Dựa trên thiết kế SIMD (Một lệnh, Nhiều dữ liệu) được phát triển hơn trước đây, RDNA 4 cũng đảm bảo sử dụng tốt hơn các tài nguyên điện toán có sẵn về mặt dò tia. Kiểu kết xuất này đòi hỏi nhiều phép tính song song, đặc biệt là đối với mô phỏng ánh sáng và hiệu ứng chiếu sáng toàn cục. Do đó, AMD đã tối ưu hóa kiến trúc của mình để các phép tính hiệu quả hơn bằng cách cho phép xử lý nhiều luồng hơn trên mỗi chu kỳ. Các đơn vị tính toán được sử dụng tốt hơn, đặc biệt là trong các tình huống kết xuất kết hợp khi rasterization và raytracing được kết hợp.
Một số thay đổi và tính năng mới trong quy trình kết xuất raytracing, chẳng hạn như tối ưu hóa đối với biến đổi thể hiện vật liệu hoặc hộp giới hạn định hướng (OBB), giúp tăng tốc độ phân tích cảnh đồng thời cải thiện độ chính xác của nó. Ít tia hơn được sử dụng trong các phép tính không cần thiết, giúp giảm thời gian kết xuất tổng thể: AMD đang nói về việc tăng gấp đôi hiệu suất dò tia so với RDNA 3.

Đơn vị tính toán AI nhanh gấp đôi
Đơn vị tính toán chuyên dụng Trí tuệ nhân tạo và việc thực hiện các mô hình học sâu cũng được hưởng lợi từ những cải tiến cụ thể. Chúng có khả năng xử lý gấp đôi số thao tác trong mỗi chu kỳ với độ chính xác FP16 và hiện hỗ trợ các thao tác thưa thớt, bỏ qua tới một nửa các thao tác không cần thiết để có khả năng tăng gấp đôi hiệu suất. Tuy nhiên, AMD chỉ mới bắt kịp NVIDIA vì tính năng này đã có trên đối thủ cạnh tranh kể từ GeForce RTX 30 Series.
Kiến trúc RDNA 4 cũng hỗ trợ các hoạt động FP8, INT8, BF8 và INT4, với các phép tính 8 bit nhanh gấp đôi so với 16 bit và số nguyên 4 bit tăng gấp đôi hình này nữa. Nói cách khác, các phép tính FP8 nhanh hơn tới 8 lần với kiến trúc RDNA 4 so với các phép tính có độ chính xác FP16 trên kiến trúc RDNA 3.
FSR 4: nâng cấp cuối cùng cũng được hưởng lợi từ học máy
So với các phiên bản trước của FSR (FidelityFX Super Resolution), cấu trúc của thuật toán nâng cấp đã có những cải tiến đáng kể, đặc biệt là nhờ sử dụng các kỹ thuật tái tạo tiên tiến tạo ra kết quả cuối cùng rất chi tiết từ các hình ảnh có độ phân giải thấp hơn. Việc tích hợp mô hình lấy mẫu thần kinh (cuối cùng) khai thác học máy để tái tạo chi tiết hình ảnh và tránh làm mờ cạnh do đó tạo nên sự đổi mới thiết yếu của FSR 4.
Không giống như FSR 3.1, phiên bản mới này chỉ dành riêng cho kiến trúc RDNA 4 và do đó sẽ chỉ hoạt động trên các card Radeon mới. Ngoài ra, AMD vẫn chưa xác nhận liệu mô hình nâng cấp nơ-ron có khả dụng khi ra mắt dòng Radeon thế hệ tiếp theo hay không. Nhà sản xuất cho biết chế độ "Hiệu suất" mới của FSR 4 sẽ cung cấp chất lượng hình ảnh 4K "tốt hơn chất lượng gốc".
Radeon RX 9070 và 9070 XT: card đồ họa cạnh tranh với RTX 4070/5070
AMD đã chọn tập trung vào phân khúc tầm trung cao cấp với thế hệ card đồ họa mới này, hướng đến khối lượng lớn thay vì giới thiệu công nghệ cực kỳ cao cấp và đắt tiền.Radeon RX 9070 XT | RTX 5070 Ti | ||||
GPU | Navi 48 XTX | Navi 48 Trái tim | 4096 | 3584 | 8960 |
Tần số tăng cường | ~2,97 GHz | ~2,52 GHz | ~2,47 GHz | ||
Bộ nhớ | 16 GB GDDR6 | 16 GB GDDR6 | 16 GB GDDR7 | ||
Bus bộ nhớ | 256 bit | 256 bit | 256-bit | ||
Tốc độ bộ nhớ | 20 Gbps | 20 Gbps | 28 Gbps | ||
Băng thông bộ nhớ | 640 GB/giây | 640 GB/giây | 896 GB/giây | ||
Mức tiêu thụ tối đa | 304W | 220W | 300W | ||
Giao diện PCIe | PCIe 5.0×16 | PCIe 5.0×16 | PCIe 5.0×16 | ||
Giá giới thiệu (MSRP) | 599$ | 549$ | $749 | ||
Ngày phát hành | Ngày 6 tháng 3 | Ngày 6 tháng 3 | Ngày 20 tháng 2 |
Về phần mình, Radeon RX 9070 có chipset Navi 48 bao gồm 3584 lõi thực thi, 56 bộ tăng tốc RT và 112 bộ tăng tốc AI. Nó cũng có 16GB bộ nhớ GDDR6 với giao diện bộ nhớ 256-bit, nhưng TDP của nó giảm xuống "chỉ" 220 watt.

Những cải tiến đối với kiến trúc RDNA 4 và tần số hoạt động cao hơn cho phép hai mẫu Radeon mới này đạt được – theo nhà sản xuất – mức hiệu suất tương tự như RX 7900 XT và RX 7900 XTX của thế hệ trước, mặc dù số lượng đơn vị tính toán ít hơn. AMD cũng tuyên bố rằng Radeon RX 9070 sẽ có thể cung cấp hiệu suất trung bình cao hơn 20% so với RX 7900 GRE thế hệ trước ở mức 1440p, trong khi Radeon RX 9070 XT sẽ mở rộng lợi thế này lên hơn 40% trung bình.
RX 9070 XT cũng dự kiến sẽ có giá cao hơn RTX 4070 Ti Super, trong khi RX 9070 có thể cung cấp hiệu suất tương đương với RTX 4070 Super nhưng với mức giá hấp dẫn hơn. RX 9070 XT và RX 9070 cuối cùng được cho là nhanh hơn 26% so với RTX 3090 và RTX 3080.

Với giá bán lẻ đề xuất lần lượt là 549 đô la và 599 đô la, Radeon RX 9070 và RX 9070 Do đó, XT hướng đến nhiều hơn đến các game thủ có nhu cầu chính về hiệu suất cao ở độ phân giải 1440p và chấp nhận được ở độ phân giải 4K. Chúng sẽ có sẵn từ ngày 6 tháng 3; Chúng tôi chỉ đang chờ các bài kiểm tra độc lập để thực sự biết những chiếc Radeon mới này có gì.