Khi các trò chơi ngày càng đa luồng hơn, thiết kế CPU lai của Intel có thể bắt đầu tụt hậu so với kiến trúc đơn giản hơn nhưng hiệu quả hơn của AMD

theanh

Administrator
Nhân viên
AMD và Intel đã có những cách tiếp cận rất khác nhau để tăng số lượng lõi của bộ xử lý của họ. Trong trường hợp của Team Red và CPU Ryzen của họ, họ đã đi theo con đường chiplet, đưa một khối lõi và bộ nhớ đệm vào một con chip nhỏ, có thể dễ dàng nhân đôi hoặc nhiều hơn để có thêm lõi.

Mặt khác, Intel đã quyết định rằng họ sẽ nhồi nhét hai loại lõi khác nhau vào chip của mình và mặc dù hiện tại họ sử dụng phương pháp lát gạch/chiplet cho bộ xử lý mới nhất của mình, nhưng kiến trúc 'lai' không có dấu hiệu thay đổi. Trên thực tế, nó đã trở nên lai tạp hơn cả thiết kế ban đầu trong Alder Lake xuất hiện vào năm 2021.

Arrow Lake đã mở ra một số thay đổi triệt để so với bố cục và tính năng thông thường của Intel, với việc loại bỏ siêu phân luồng (hay còn gọi là đa luồng đồng thời) và các lõi P và E được trộn lẫn với nhau bên trong khuôn, thay vì là các khối lõi riêng biệt.


ufCg3SpmYNZvFFN7badJfD-1200-80.jpg



Từ Ngay từ khi bắt đầu phương pháp lai này, các trò chơi đã cần sự trợ giúp thêm, từ phần mềm Windows hoặc Intel (IAO, Intel Application Optimization), để đảm bảo rằng các luồng quan trọng chỉ được xử lý bởi lõi P. Tuy nhiên, trong vài năm qua, số lượng luồng mà trò chơi dựa vào đã tăng đáng kể và với việc mất đi siêu phân luồng trong Arrow Lake, lõi E hiện đang phát huy tác dụng nhiều hơn.

Để cho bạn thấy ý tôi là gì, tôi đã lấy mẫu mức sử dụng CPU của hai PC cao cấp trong năm trò chơi khác nhau. Một giàn máy là CyberPowerPC, với CPU Ryzen 7 9800X3D và card đồ họa RTX 5080. Phiên bản còn lại là thiết lập Core Ultra 7 265K, với RTX 4080 Super xử lý tất cả các điểm ảnh. Chắc chắn, chúng không phải là nền tảng tương đương nhau và thật không công bằng khi so sánh 9800X3D giá 477 đô la với 265K giá 323 đô la.

Tuy nhiên, tôi không xem xét hiệu suất ở đây; tôi chỉ xem xét cách các lõi CPU được sử dụng. Tất nhiên, biểu đồ sử dụng CPU trong Trình quản lý tác vụ không cho bạn biết bất cứ điều gì về mức độ "cứng" mà các lõi đó đang được sử dụng và nếu một lõi hiển thị mức sử dụng 100%, điều đó không có nghĩa là nó không thể được sử dụng thêm nữa.

Trong các video bên dưới, bạn sẽ thấy mức sử dụng lõi của Ryzen 7 9800X3D ở bên trái và mức sử dụng tương tự của Core Ultra 7 265K ở bên phải.

Chúng ta hãy bắt đầu với một trò chơi kinh điển, Cyberpunk 2077. Là một trò chơi thế giới mở rộng lớn, với hàng trăm vật thể và nhân vật liên tục di chuyển, bạn sẽ mong đợi nó sẽ rất nặng trên CPU. Ở một mức độ nào đó, thì đúng là như vậy, nhưng khi bạn tăng cài đặt đồ họa, bộ xử lý trung tâm đó sẽ chậm hơn GPU.

Tôi đã ghi lại mức sử dụng với CP2077 ở 4K và cài đặt đồ họa tối đa (tức là theo dõi đường dẫn), cùng với Chất lượng DLSS và tạo khung hình được bật. Bạn có thể thấy rõ ràng rằng không có lõi nào trong Ryzen 9800X3D được sử dụng đáng kể, ngoại trừ lõi thứ nhất và thứ ba.

Trình quản lý tác vụ hiển thị các bộ xử lý logic theo thứ tự từ lõi 1 (luồng 1, luồng 2), đến lõi 8 theo thứ tự từ trái sang phải, từ trên xuống dưới. Vì Core Ultra 7 265K không hỗ trợ đa luồng đồng thời, nên bộ xử lý logic chính là lõi thực tế.


UkvYGiHXvTxTNDC8uxo8z6-1200-80.jpg



Đối với tất cả các chip Arrow Lake, Trình quản lý tác vụ sẽ chạy P-core 1, P-core 2, sau đó là E-core 1 đến 4, tiếp theo là P-core 3 đến 6, sau đó là E-core 5 đến 12 và kết thúc bằng hai E-core cuối cùng P-core (7 và 8)

Cyberpunk 2077 được mã hóa để đẩy luồng vào P-core trong CPU lai và bạn có thể thấy điều này khá rõ ràng, với P-1 và P-5 được sử dụng nhiều nhất, tiếp theo là tất cả các P-core khác được xử lý gần như giống nhau. E-core đang làm một cái gì đó nhưng có vẻ như không quá nặng nề.

HWInfo64 hiển thị tốc độ xung nhịp cho nhiều lõi khác nhau (lưu ý rằng tốc độ này bắt đầu từ lõi 0, đây là cách đo lường về mặt kỹ thuật) và đối với Ryzen 7 9800X3D, tốc độ này cũng hiển thị lõi nào là 'ưa thích' - đây là lõi mà Windows sẽ hướng luồng tới theo sở thích. Như bạn có thể thấy, lõi 0 và 3 được sử dụng nhiều hơn một chút so với các lõi khác, nhưng lại hoàn toàn trái ngược với 265K.

Stalker 2 sử dụng Unreal Engine 5 cho mọi thứ và có thể xử lý khá nhiều luồng, chủ yếu là để xử lý việc phát hành song song các danh sách lệnh cho đồ họa. Giống như CP2077, Stalker 2 là một trò chơi thế giới mở rộng lớn và khối lượng công việc CPU của nó rõ ràng cao hơn Cyberpunk.

Cả 9800X3D và 265K đều được xử lý ở mức 4K, cài đặt tối đa, với Chất lượng DLSS và tạo khung hình, nhưng lõi P của chip Arrow Lake một lần nữa phải chịu phần lớn quá trình xử lý. Trong khi 9800X3D có đủ khả năng hấp thụ mức tăng sử dụng CPU, thì 265K lại có phần hạn chế vì nó chỉ có tám lõi P cho tám luồng.

Một trò chơi thế giới mở khác, một engine khác, nhưng câu chuyện lại tương tự như trong Assassin's Creed Shadows. Tuy nhiên, lưu ý rằng một số lõi E của 265K đang được sử dụng nhiều như lõi P, mặc dù một lần nữa chúng ta có thể thấy rằng P-1 và P-5 là những lõi được ưa chuộng cho các luồng chính của trò chơi.

Sau mốc 40 giây trong video, mức sử dụng CPU ổn định hơn và cả hai chip đều có dung lượng dự phòng; nhiều hơn về Ryzen so với Core Ultra, nhưng có vẻ như việc sử dụng E-core trong Shadows không gây ra bất kỳ vấn đề nào.

Mặc dù ba trò chơi mà chúng ta đã thấy cho đến nay không có nhiều luồng đa luồng, nhưng tất cả đã thay đổi với The Last of Us Part 2. Trò chơi có nhiều luồng để xử lý hệ thống phát trực tuyến tài sản, tận dụng DirectStorage để giảm chi phí CPU, cùng với nhiều luồng hơn để thực hiện biên dịch shader nền.

Ba trong số các lõi của Ryzen 7 9800X3D được tải đáng kể, với hai lõi khác không ít hơn nhiều. Ba lõi còn lại (đừng quên rằng hai biểu đồ trong Trình quản lý tác vụ ở đây biểu thị hai luồng trên một lõi) hoạt động ở mức sử dụng từ 40% đến 50%, cao hơn đáng kể so với những gì chúng ta đã thấy cho đến nay.

Các lõi E trong 265K cũng được giao nhiều nhiệm vụ hơn so với các trò chơi khác, mặc dù bốn lõi đầu tiên không hoạt động nhiều, nhưng một lần nữa, chính hai lõi P đó đang được tải ngay.

Tôi đã giữ lại điều tốt nhất để cuối cùng! Flight Simulator 2024 ném một bức tường luồng vào CPU và nó là một dòng chảy tuyệt đối trong 30 giây đầu tiên của chuyến bay. Phát trực tuyến tài sản, xử lý mã mạng để tải xuống thế giới và động lực bay phức tạp đều muốn có một phần đáng kể trong khả năng của bộ xử lý.

Cuối cùng, mọi thứ ổn định và cả hai chip đều có tất cả các lõi được sử dụng khoảng 40% trở lên và trong trường hợp lõi P của 265K, con số này còn cao hơn đáng kể. Đến mức nếu trò chơi yêu cầu chúng nhiều hơn, có khả năng chúng sẽ không có đủ khả năng và các lõi E chậm hơn sẽ cảm thấy bị ép.

Đúng vậy, đây chỉ là một số ít ví dụ và chắc chắn không phải là sự so sánh cân bằng về mặt khoa học, nhưng tôi đã xem xét các trò chơi khác và có một xu hướng rõ ràng hướng tới đa luồng nặng hơn. Tôi chắc rằng một số bạn sẽ nghĩ "Đã đến lúc rồi!" vì chúng ta đã có chip tám nhân, 16 luồng trong nhiều năm nay.

Tất cả những điều này khiến tôi tự hỏi về kiến trúc CPU lai của Intel, đặc biệt là bây giờ tất cả đều không có siêu phân luồng. Các E-core trong Arrow Lake chắc chắn rất có khả năng nhưng nó chỉ có một câu hỏi đơn giản: Có tốt hơn không khi để một nhân xử lý hai luồng trò chơi hay hai nhân khác nhau xử lý chúng?


MVBXPoPyUrxeBXBJ6qyi4Q-1200-80.jpg



Cách tiếp cận đầu tiên đơn giản hơn và là cách mà PC và máy chơi game Windows đã được thiết kế trong nhiều năm. Chúng ta còn lâu mới cần một CPU hỗ trợ hơn 16 luồng, nhưng trong trường hợp của AMD, các chip chơi game chính của hãng xử lý mọi luồng với mức khả năng gần như ngang nhau.

Không phải như vậy trong trường hợp của Intel, nơi lý tưởng nhất là bạn muốn các lõi P thực hiện mọi thứ. Tuy nhiên, bạn chỉ nhận được tám lõi, cho tám luồng và khi chúng được tải đến tận cùng, các lõi E chậm hơn phải được sử dụng. Trong trường hợp của The Last of Us Part 2 và Flight Simulator 2024, chúng được sử dụng bất kể sở thích lõi là gì.

Tôi nghĩ rằng có thể cho rằng Intel sẽ duy trì thiết kế lai của mình trong nhiều năm tới; tương tự như vậy, có thể cho rằng các lõi E sẽ luôn kém khả năng hơn các lõi P (nếu không, chúng sẽ chỉ được phân loại giống nhau). Điều đó có nghĩa là trong tương lai không xa, các trò chơi tạo ra hơn tám luồng nặng có khả năng chạy chậm hơn trên chip Intel so với chip AMD.
Bản nâng cấp tiếp theo của bạn

BX4FDWEFpGocKXBw8SLhsE-1200-80.jpg



CPU tốt nhất cho chơi game: Các chip hàng đầu từ Intel và AMD.
Bo mạch chủ chơi game tốt nhất: Các bo mạch phù hợp.
Card đồ họa tốt nhất: Bộ đẩy pixel hoàn hảo của bạn đang chờ.
Ổ SSD tốt nhất để chơi game: Hãy vào game trước những ổ còn lại.

Hay là không? Rốt cuộc, hai luồng trên một lõi phải chia sẻ tài nguyên (bộ nhớ đệm, đơn vị logic, v.v.), vì vậy chúng không nhất thiết phải được xử lý ở cùng một tốc độ. Có khả năng hai luồng trên lõi Ryzen được xử lý ở cùng tốc độ với hai luồng trên lõi P và E của Intel. Sẽ cần phải điều tra nhiều hơn nữa để biết chắc chắn điều này.

Nếu tôi là một nhà phát triển trò chơi, tôi nghi ngờ mình sẽ có thời gian để làm điều này đúng cách nên tôi phải dựa vào các kỹ sư của AMD và Intel để đảm bảo rằng tất cả các bộ xử lý của họ đều hoạt động như mong đợi. Khả năng dự đoán giúp tiết kiệm thời gian trong việc tinh chỉnh hiệu suất và có lẽ đây là một khía cạnh lý do tại sao Microsoft và Sony sử dụng CPU AMD trong các máy chơi game của họ.

Với những tin đồn chỉ ra rằng AMD sẽ gắn 12 lõi vào mỗi CCD (Core Complex Die) cho Zen 6, thay vì tám lõi hiện tại, phương pháp lai của Intel có thể sẽ tụt hậu xa hơn so với thiết kế đơn giản nhưng rõ ràng là hiệu quả. Sẽ rất thú vị khi xem Team Blue phản ứng với điều này như thế nào, nếu nó trở thành sự thật.
 
Back
Bên trên