Hỏi / Đáp HWMon Bộ đếm phục hồi lỗi PCIe là gì?

Heat_Fan89

New member
Tôi thấy 11 khi khởi động. Tôi đã chơi MSFS 2024 và nhận thấy khoảng 25 sau 15 phút. Tôi đã chơi MSFS 2020 và sau 15 phút, tôi đã tăng từ 11 lên 130. Có vẻ như nó không tăng nếu tôi ở chế độ chờ. Không có gì được OC, chỉ là cài đặt mặc định.

Hệ thống cực kỳ ổn định. Không có màn hình đen, CTD, khởi động lại, không có gì cả.

Bo mạch chủ Gigabyte B650 Eagle AX
Ryzen 7 9800X3D
Teamgroup 6000Mhz CL 30-36-36-76 (4x16) 64GB
ASUS TUF OC RTX 5080 Trình điều khiển Nvidia 576.02

Bộ nguồn Corsair RMe 1000W
 
Đúng như tên gọi của nó. Bạn có đang chạy trình điều khiển chipset mới nhất không?

https://www.amd.com/en/support/downloads/drivers.html/chipsets/am5/b650.html

BIOS của bo mạch chủ bạn có phải là phiên bản mới nhất không?

https://www.gigabyte.com/Motherboard/B650-EAGLE-AX/support#support-dl-biosCả hai đều được.
BIOS F33
Chipset 7.01.08.129

Tôi tự hỏi liệu cáp 12 chân sang 12 chân do Corsair PSU cung cấp có phải là một yếu tố không? ASUS TUF đi kèm với cáp pigtail 12 chân sang ba chân 8 chân. Tôi đang sử dụng cáp đi kèm với PSU, rất tiện lợi và không cứng như cáp đi kèm với GPU.

Ngoài ra, không có vấn đề quá nhiệt nào với ASUS TUF. Nhiệt độ nhàn rỗi khoảng 29 độ C. Tối đa khi tải là 49 độ C. Bộ nhớ nhàn rỗi ở mức 40 độ C và tối đa là 56 độ C khi tải.
 
Cái đi kèm với PSU là đủ rồi.

Bạn đã cài đặt những thiết bị PCIe nào khác (ngoài GPU)?
Về cơ bản là vậy.

Tôi có một Thermalright Prism 360 AIO. Tôi có một quạt tản nhiệt phía sau vỏ máy, ba quạt phía trước đi kèm với vỏ máy NZXT H7 Flow 2024. Tôi vừa đặt thêm ba quạt Thermalright mà tôi dự định lắp ở dưới đáy thùng máy để thổi khí mát lên GPU.

Ồ, tôi quên không nhắc đến vì nó không được nhắc đến. 9800X3D có AGPU và tôi đã cắm cáp HDMI vào cổng của nó. Vì vậy, đầu ra HDMI video của tôi không phải từ RTX 5080 mà từ AGPU. Điều đó có nghĩa là RTX 5080 đang thực hiện công việc.
 
Tôi đã cắm cáp HDMI vào cổng của nó. Vì vậy, đầu ra HDMI video của tôi không phải từ chính RTX 5080 mà từ AGPU. Điều đó có nghĩa là RTX 5080 đang thực hiện công việc.
Tại sao? Bạn đang sử dụng bao nhiêu màn hình?

Đây rất có thể là gốc rễ của vấn đề được quan sát thấy vì hệ thống quản lý hai tài nguyên GPU. Tôi sẽ đơn giản hóa điều này và chạy tất cả các màn hình từ 5080.
 
Tại sao? Bạn đang sử dụng bao nhiêu màn hình?Tôi đã mua sản phẩm này từ Amazon vào năm 2022:

Màn hình chơi game lớn ASUS ROG Strix XG438Q 43” với độ phân giải 4K 120Hz FreeSync 2 HDR 600 90% DCI-P3 Aura Sync 10W Loa chống chói bảo vệ mắt với HDMI 2.0 DP 1.4 Điều khiển từ xa, màu đen​

?utm_source=diendancongnghe.com#-as...-với-hdmi-2-0-dp-1-4-điều-khiển-từ-xa-màu-đen​

 
Tôi đang chờ máy PowerColor 9070XT Red Devil của mình được Amazon chuyển đến. Tôi sẽ nhận được máy vào tuần đầu tiên hoặc tuần thứ hai của tháng 5. Sẽ rất thú vị khi xem những lỗi đó có biến mất không.
 
Tôi đã thêm vào bình luận trước đó. Nếu bạn kết nối với 5080, vấn đề có biến mất không?

Ngoài ra, hãy đảm bảo chương trình cơ sở cho SSD của bạn được cập nhật.
 
Tôi đã thêm vào bình luận trước đó. Nếu bạn kết nối với 5080, vấn đề có biến mất không?
Không, tôi nhận được 10 khi khởi động từ RTX 5080. GPU có hai cổng HDMI và tôi nhận được thêm một vài cổng nữa khi chuyển từ cổng thứ nhất sang cổng thứ hai của 5080.
 
Nếu là tôi, tôi sẽ tháo 5080 ra và thử nghiệm (thử nghiệm) với iGPU để xem nó hoạt động như thế nào với số lỗi này.
 
AER là "báo cáo lỗi nâng cao". Đây là tính năng của một số card PCI (PCIe chỉ là PHY, vẫn là PCI, chỉ được tuần tự hóa). Có một số lỗi mà card PCI có thể nhìn thấy và có thể bị lỗi hoặc được sửa. Tôi không cho rằng đây là lỗi cần bỏ qua, nó phụ thuộc vào lỗi. Bản thân AER là con trỏ đến một chuỗi lỗi; nếu NULL thì không có lỗi. Thông thường sẽ không có lỗi nào. Có khá nhiều nguyên nhân có thể xảy ra. Nếu bạn muốn có mô tả quá chi tiết (nhưng trong Linux), hãy xem:
AER trong Kernel

Nếu có vấn đề về chất lượng tín hiệu, thì thông thường card sẽ trở về chuẩn chậm hơn. Nếu có vấn đề gì khác, ví dụ như firmware không khớp với phiên bản trình điều khiển, thì bạn có thể thấy lỗi này. Nếu có xung đột trình điều khiển, thì lỗi này cũng có thể dẫn đến AER. Có thể có một chút đảo ngược. Danh sách các nguyên nhân có thể xảy ra rất nhiều và bạn thực sự sẽ không biết nếu không xem danh sách lỗi. Tìm kiếm trên Google về chủ đề này để tìm ra lỗi là gì:
cách kiểm tra lỗi pcie advanced trong windows

Cũng có thể do nguồn điện không ổn định. Hoặc nhiệt độ cao. Hoặc do card lắp không đúng cách. Nếu là tôi, tôi thực sự muốn tìm hiểu lỗi nào được báo cáo và trên khe cắm nào. Có thể nó thậm chí không phải là card mà bạn nghĩ vì thường có các thiết bị PCIe nhúng.
 
Tôi muốn nói thêm rằng bạn có thể bỏ qua phần lớn số đếm này miễn là hệ thống hoạt động bình thường nếu không thì.
Có lẽ đó sẽ là kết quả. Tôi vẫn gặp những lỗi đó với 5080 khi lấy ra khỏi bo mạch chủ. Tôi thậm chí đã vào BIOS và thay đổi cài đặt cổng IO từ iGPU "Tự động" thành "Bắt buộc" thành "Tắt". Có vẻ như không có gì tạo ra sự khác biệt.

Sẽ rất thú vị khi xem liệu những lỗi này có biến mất khi thiết lập toàn bộ AMD hay không khi tôi có được 9070XT Red Devil. 🤔
 
AER là "báo cáo lỗi nâng cao". Đây là tính năng của một số card PCI (PCIe chỉ là PHY, vẫn là PCI, chỉ được tuần tự hóa). Có một số lỗi mà card PCI có thể nhìn thấy và có thể báo lỗi hoặc sửa lỗi. Tôi không cho rằng đây là lỗi cần bỏ qua, nó phụ thuộc vào lỗi. Bản thân AER là con trỏ đến một chuỗi lỗi; nếu NULL thì không có lỗi. Thông thường sẽ không có lỗi nào. Có khá nhiều nguyên nhân có thể xảy ra. Nếu bạn muốn có mô tả quá chi tiết (nhưng trong Linux), hãy xem:
AER trong Kernel

Nếu có vấn đề về chất lượng tín hiệu, thì thông thường card sẽ trở về chuẩn chậm hơn. Nếu có vấn đề gì khác, ví dụ như firmware không khớp với phiên bản trình điều khiển, thì bạn có thể thấy lỗi này. Nếu có xung đột trình điều khiển, thì lỗi này cũng có thể dẫn đến AER. Có thể có một chút đảo ngược. Danh sách các nguyên nhân có thể xảy ra rất nhiều và bạn thực sự sẽ không biết nếu không xem danh sách lỗi. Tìm kiếm trên Google về chủ đề này để tìm ra lỗi là gì:
cách kiểm tra lỗi pcie advanced trong windows

Cũng có thể do nguồn điện không ổn định. Hoặc nhiệt độ cao. Hoặc do card lắp không đúng cách. Nếu là tôi, tôi thực sự muốn tìm hiểu xem lỗi nào được báo cáo và ở khe cắm nào. Có thể nó thậm chí không phải là card mà bạn nghĩ vì thường có các thiết bị PCIe nhúng.
Chỉ có một khe cắm PCIe đang được sử dụng. Corsair RMe 1000W là PSU Tier A và định mức PSU được khuyến nghị là 850W theo ASUS. Nhiệt độ cũng không phải là yếu tố vì card chạy không tải ở mức khoảng 30c và bộ nhớ GPU cũng thấp ở mức 40c, với nhiệt độ môi trường Florida là 78F. Các lỗi xuất hiện khi khởi động nguội với PC đã tắt qua đêm.

Tuy nhiên, hệ thống cực kỳ ổn định.
 
Có lẽ đó sẽ là kết quả. Tôi vẫn gặp những lỗi đó khi 5080 rời khỏi bo mạch chủ. Tôi thậm chí đã vào BIOS và thay đổi cài đặt cổng IO từ "Tự động" của iGPU thành "Bắt buộc" thành "Tắt". Có vẻ như không có gì thay đổi.

Sẽ rất thú vị khi xem liệu những lỗi này có biến mất khi thiết lập toàn bộ AMD hay không khi tôi có được 9070XT Red Devil. 🤔
Có vẻ như là một "cấp độ phụ" kỳ lạ khi chuyển từ 5080 sang 9070 XT, đặc biệt là khi xét đến chi phí GPU hiện nay.

Tôi có Rzyen 9950X và 7900 XTX và HWMONITOR không chỉ ra bất kỳ lỗi tương tự nào. Điều này có thể không liên quan gì đến tình huống của bạn. Chỉ là một điểm so sánh.
 
Có vẻ như là một "side-grade" kỳ lạ khi chuyển từ 5080 sang 9070 XT, đặc biệt là khi xét đến chi phí của GPU hiện nay.

Tôi có Rzyen 9950X và 7900 XTX và HWMONITOR không chỉ ra bất kỳ lỗi tương tự nào. Điều này có thể không liên quan gì đến tình huống của bạn. Chỉ là một điểm so sánh.Tôi muốn xem Red Devil 9070XT so sánh với 5080 như thế nào, đặc biệt là trong Microsoft Flight Sim 2024. Tôi cũng đã mua được một chiếc Red Devil với giá 849 đô la từ Amazon, trong khi tôi đã trả giá bán lẻ đề xuất là 1484,99 đô la và ASUS vừa tăng giá thêm hơn 100 đô la một chút, lên 1599,99 đô la nên bây giờ Amazon đang tính mức giá đó. Nếu có thể, tôi cũng có thể trả lại cả hai loại thẻ.
 
Khi bạn tháo 5080 ra để thử nghiệm/thử nghiệm, bạn có gỡ cài đặt trình điều khiển Nvidia như một phần của thử nghiệm không?

Dù sao đi nữa, tôi nghĩ bạn hoàn toàn có thể bỏ qua điều này và chỉ chơi game!
 
Khi bạn gỡ bỏ 5080 để thử nghiệm/thử nghiệm, bạn có gỡ cài đặt trình điều khiển Nvidia như một phần của thử nghiệm không?

Dù sao đi nữa, tôi nghĩ bạn hoàn toàn có thể bỏ qua điều này và chỉ chơi game!Không, vì sau khi 5080 thực sự bị loại khỏi hệ thống, không có bất kỳ thông tin nào liên quan đến 5080 hiển thị trong HWMon.
 
Back
Bên trên