Hỏi / Đáp Máy tính đột nhiên bị treo và khởi động lại?

gavin786

New member
Ôi các vị thần và bậc thầy của Tom's Hardware. Tôi khiêm nhường cầu xin sự giúp đỡ của các bạn với các vấn đề phần cứng hiện tại của tôi:
Máy tính này hiện đang bị treo. Đôi khi (rất hiếm khi) xảy ra BSOD. Tôi đã cố gắng tải bản minidump cho 3 sự kiện này (win10) và đã bao gồm các liên kết.

Thông số kỹ thuật
MBD: MSI Godlike X570
CPU: AMD Ryzen 5950X
GPU: ASUS TUF 4090
RAM: 64MB (G.Skill F4-4000C 18-32GTZR x 2)
PSU: Superflower 1600w 80+ Titanium Leadex
HĐH: Win 10/Win 11 Dual Boot

CPU được làm mát bằng bộ tản nhiệt Arctic Freezer 2 480mm và 2 quạt. Tôi đã không thay keo tản nhiệt trong 4 năm nhưng có vẻ như không có vấn đề gì về nhiệt với CPU theo như tôi thấy.
Hiện tại tôi đang chạy với một vỏ máy mở. Có rất nhiều quạt và luồng không khí. Vỏ máy là Fractal Design Meshify 2(?). Một trong những Meshify.
Windows 10 (tôi nghĩ là 20H2 cũ?) + Windows 11 (bản cập nhật/bản vá mới nhất tính đến ngày 02/09/2024 và trình điều khiển)
Tôi không biết phiên bản BIOS nhưng tôi không cần cập nhật BIOS trong nhiều năm nay. Vì vậy, hãy mong đợi một phiên bản rất cũ, chắc chắn là từ năm 2021. Với những gì đang xảy ra, tôi không muốn thử nâng cấp BIOS trong trường hợp lỗi xảy ra giữa chừng và làm hỏng bo mạch chủ.

Tôi đã chạy memtest86 hai lần và nó không hiển thị bất kỳ lỗi nào sau 4 lần kiểm tra (mất khoảng 8 giờ).

Tôi có Windows 11
mới nhất được cập nhật đầy đủ với tất cả các bản vá lỗi cập nhật và phiên bản trình điều khiển mới nhất cho tất cả phần cứng. Tôi cũng có một phiên bản cũ của Windows 10 khi khởi động kép. Chúng nằm trên các đĩa riêng biệt và lỗi xảy ra trên cả hai.

Trong một thời gian dài, bo mạch chủ đã phàn nàn "Đã phát hiện quá dòng trên thiết bị USB, hãy khởi động lại sau 15 giây để bảo vệ bo mạch chủ của bạn". Thông thường, tôi giữ máy tính được cấp nguồn trong nhiều ngày (nhiều tuần, nhiều tháng?) liên tục vì tôi lưu trữ một trang web và nhiều lý do khác. Sau một vài lần thử, lỗi biến mất và máy tính khởi động, hoạt động bình thường cho đến bây giờ. Tình trạng này đã xảy ra trong khoảng 18 tháng trở lại đây. Tôi không biết lỗi này có liên quan đến sự cố này hay sự cố song song. Đây là một rắc rối nhưng không phải là vấn đề lớn và không đáng để chi hàng trăm đô la mua một bo mạch mới để sửa nếu tôi có thể tránh được (trừ khi đó là nguyên nhân gây ra sự cố này).

Sự cố này dường như bắt đầu sau khi tôi cài đặt Windows 11 ở chế độ khởi động kép, mặc dù tôi nghi ngờ đây là sự trùng hợp ngẫu nhiên chứ không phải nguyên nhân, hoặc nhiều lần khởi động lại đã làm trầm trọng thêm sự cố hiện có thành một cuộc khủng hoảng.

Hầu hết thời gian không có nhật ký BSOD nhưng tôi đã cố gắng chụp minidump trong 3 lần:
https://www.dropbox.com/scl/fi/svnl...6-01.dmp?rlkey=5latzaqpx7mes43hvn26gyhh9&dl=1
https://www.dropbox.com/scl/fi/y0a1...3-01.dmp?rlkey=u9atnwvqfh79zy1lvgdpwb8cv&dl=1
https://www.dropbox.com/scl/fi/a94n...5-01.dmp?rlkey=9y27zxyjal47u7nhe1ipfenlw&dl=1

Tôi đã chạy HwInfo64, đây là các số liệu cảm biến từ khi tôi bắt đầu đăng nhập vào phần crash/freeze thì ở đây (tệp csv): https://www.dropbox.com/scl/fi/ocqz..._log.CSV?rlkey=f3zuv610vngflfgk1zsf5scmo&dl=1

Tôi cũng đã chạy chương trình HwInfo khác tạo ra các biểu đồ và thực sự đã bắt được sự kiện đóng băng ở giữa, bạn có thể thấy một số bitmap đều là số không. Tôi bao gồm 2 lần chụp, một lần chụp 2 phút trước khi đóng băng và lần tiếp theo chụp 2 phút đóng băng :
https://www.dropbox.com/scl/fi/7387...3h46.zip?rlkey=5gtevy6uiv1zyorub9sv4npan&dl=1

Trong mọi trường hợp, nhật ký đều có vẻ ổn khi không có mức sử dụng hoặc nhiệt độ tăng đột biến, tuy nhiên tôi không phải là chuyên gia về phần cứng chuyên gia, chỉ là một người làm phần mềm nhàm chán, và không thể biết liệu có điện áp bất thường hay không vì tôi không biết đường cơ sở chính xác là gì.

Tôi KHÔNG muốn phải mua bo mạch/CPU mới và nâng cấp ngay bây giờ, tôi hoàn toàn không thích 9950x, tôi thực sự muốn nó tồn tại thêm một năm nữa cho đến khi AMD có thể đưa ra thứ gì đó hấp dẫn hơn một chút, vì vậy giải pháp thay thế phần cứng rẻ nhất có thể để sửa chữa và hoạt động sẽ là lý tưởng. Tôi dành toàn bộ thời gian của mình cho việc này và nó đã không tắt kể từ cuối năm 2020. Tôi đã rất may mắn khi là một trong những người đầu tiên có được 5950x nên đó là khung thời gian. Vì vậy, việc nó không hoạt động là một sự gián đoạn lớn đối với tôi + những người khác dựa vào trang web của tôi (tôi đã bất hòa với ISP của mình, đó là lý do tại sao tôi tự lưu trữ và KHÔNG quay lại!).

Bất kỳ sự trợ giúp hoặc ý tưởng hay nào cũng sẽ được đánh giá cao. Bây giờ nó chỉ kéo dài vài phút nếu tôi có thể khởi động nhưng nếu có điều gì đó tôi có thể làm để có thêm thông tin chẩn đoán hoặc điều gì đó khác có thể giúp ích, tôi sẽ thực hiện nếu có thể.

Cảm ơn bạn rất nhiều vì bất kỳ sự giúp đỡ hoặc hiểu biết sâu sắc nào bạn có thể đưa ra cho vấn đề này.
 
Windows 10 (tôi nghĩ là 20H2 cũ?)
Windows 10 đang ở phiên bản 22H2 nên bạn có thể cập nhật nếu đang ở phiên bản 20H2.

Tôi không biết phiên bản BIOS nhưng tôi không cần cập nhật BIOS trong nhiều năm nay.
Đây là nơi bạn phản hồi cho chúng tôi về phiên bản BIOS hiện tại của bạn.

Với những gì đang xảy ra, tôi không muốn thử nâng cấp BIOS trong trường hợp xảy ra lỗi giữa chừng và làm hỏng bo mạch chủ.

Bo mạch chủ của bạn có Nút BIOS Flash
, bạn không dễ dàng bị mắc cạn với một BIOS bị hỏng như vậy.

Trong một thời gian dài, bo mạch chủ đã báo lỗi "Đã phát hiện quá dòng trên thiết bị USB, hãy khởi động lại sau 15 giây để bảo vệ bo mạch chủ của bạn."
Bạn có thể muốn chuyển sang ổ cắm trên tường khác và xem sự cố có còn tiếp diễn không. Lưu ý, PSU trong bản dựng của bạn bao nhiêu tuổi?
 
Windows 10 (tôi nghĩ là 20H2 cũ?)
Windows 10 đang ở phiên bản 22H2 nên bạn có các bản cập nhật đang chờ xử lý nếu bạn đang ở phiên bản 20H2.

Tôi không biết phiên bản BIOS nhưng tôi đã không cần cập nhật BIOS trong nhiều năm nay.
Đây là nơi bạn phản hồi cho chúng tôi về phiên bản BIOS hiện tại của bạn.

Với những gì đang xảy ra, tôi không muốn thử nâng cấp BIOS trong trường hợp xảy ra lỗi giữa chừng khi cập nhật và làm hỏng bảng.

Bo mạch chủ của bạn có Nút Flash BIOS
, bạn không dễ dàng bị mắc cạn với một BIOS bị hỏng như vậy.

Trong một thời gian dài, bo mạch chủ đã báo lỗi "Đã phát hiện quá dòng trên thiết bị USB, hãy khởi động lại sau 15 giây để bảo vệ bo mạch chủ của bạn."
Bạn có thể muốn di chuyển sang ổ cắm trên tường khác và xem sự cố có còn tiếp diễn không. Lưu ý, PSU trong bản dựng của bạn bao nhiêu tuổi?
Phiên bản BIOS là: E7C34AMS.1D1. Ngày xây dựng BIOS: 24 tháng 2 năm 2021.

PSU cũ như PC, tức là khoảng 4 năm rồi.

Nó đã được cắm vào các ổ cắm trên tường khác nhau, mặc dù tôi luôn sử dụng một trong những bộ chuyển đổi nhiều phích cắm này và nó có chức năng chống sét lan truyền riêng, chỉ để bảo vệ nó trong trường hợp bị sét đánh. Tôi sẽ thử cắm trực tiếp vào ổ cắm trên tường khác mà không cần bộ chuyển đổi và xem liệu có tạo ra sự khác biệt không và báo cáo lại.

Tôi có tất cả các điện áp và các biến thể trong các tệp nhật ký mà tôi đã cung cấp, đặc biệt là tệp CSV từ HWMonitor64, có vẻ như rất toàn diện. Bây giờ tôi đang ở trong bios, tôi thấy điện áp VCore và DDR dao động nhẹ. Điện áp DDR dao động từ 1,412 đến 1,418. VCore dao động quanh mốc 1,47 với khoảng 0,002v.
 
Máy tính vừa bị hỏng lần nữa. Tôi có thể xác nhận việc chuyển máy sang ổ cắm điện khác và không có bộ chuyển đổi phích cắm đa năng không giải quyết được vấn đề.
 
Tôi nghĩ rằng lỗi quá dòng mà bạn thấy là do một thiết bị được cắm vào cổng USB đang cố gắng rút nhiều dòng điện hơn mức cổng có thể cung cấp. Đối với cổng USB2, giới hạn là 500mA, đối với cổng USB3 là 900mA. Bạn nên đầu tư vào một hub USB được cấp nguồn điện lưới và di chuyển thiết bị rút dòng điện cao đến hub.

Tất cả các dump đều là lỗi kiểm tra lỗi DPC_WATCHDOG_TIMEOUT xảy ra do một nhóm DPC/ISR chạy quá lâu. Điều này có thể liên quan đến lỗi quá dòng. Nếu thiết bị USB không thể rút đủ dòng điện từ cổng để hoạt động bình thường thì chúng ta có thể mong đợi lỗi ISR và DPC cho thiết bị đó.
 
Tôi nghĩ rằng lỗi quá dòng mà bạn thấy là do một thiết bị được cắm vào cổng USB đang cố gắng rút nhiều dòng điện hơn mức cổng có thể cung cấp. Đối với cổng USB2, giới hạn là 500mA, đối với cổng USB3 là 900mA. Bạn nên đầu tư vào một hub USB cấp nguồn điện lưới và di chuyển thiết bị rút dòng điện cao đến hub.

Tất cả các dump đều là lỗi kiểm tra lỗi DPC_WATCHDOG_TIMEOUT xảy ra do một nhóm DPC/ISR chạy quá lâu. Điều này có thể liên quan đến lỗi quá dòng. Nếu thiết bị USB không thể lấy đủ dòng điện từ cổng để hoạt động bình thường thì chúng ta có thể mong đợi lỗi ISR và DPC cho thiết bị đó.
Một trong những điều đầu tiên tôi thử khi lỗi này bắt đầu là lấy một hub USB được cấp nguồn bên ngoài. Nó không giúp ích gì. Rút phích cắm tất cả các thiết bị USB cũng không giúp ích gì. Có vẻ như cần một chút thời gian để làm mát khi lỗi quá dòng xảy ra liên tục, sau đó nó khởi động bình thường, bình thường nếu tôi để trong 20 phút. Nếu nó liên tục không khởi động thì để nguyên như vậy là được.
 
Tôi sẽ cập nhật BIOS đó. Đã có nhiều bản cập nhật kể từ phiên bản bạn có, một số bản cập nhật có AGESA và thường thì bạn phải cài đặt những bản cập nhật đó. BIOS mới nhất là 7C34v1O, ngày 9 tháng 8 năm 2024.

Những liên kết này đã có từ vài năm trước nhưng chúng có thể có liên quan. Có vẻ như bạn không đơn độc...
https://forum-en.msi.com/index.php?...ce-msi-prestige-x570-creation-bricked.372615/
https://forum-en.msi.com/index.php?threads/godlike-x570-usb-over-current-on-two-systems.345980/
https://forum-en.msi.com/index.php?threads/usb-overcurrent-issue-with-mpg-x570-gaming-plus.361779/

Bạn cũng có thể tải lên bản dump kernel được không, đó là tệp C:\Windows\Memory.dmp.
 
Xin chào, cuối cùng tôi cũng đã tải được tệp MEMORY.DMP lên: https://www.transfernow.net/dl/20240906SojGbQpNTôi đã thử cập nhật BIOS lên phiên bản mới nhất bằng tệp MSI.ROM trên ổ USB được định dạng FAT32 nhưng tôi vẫn nhận được thông báo Lỗi cập nhật trên bo mạch chủ màn hình.

Vào thời điểm này, tôi đang mất rất nhiều thứ vì hệ thống của tôi không chạy nên tôi cần phải đưa ra quyết định nhanh chóng về việc mình sẽ làm gì.

Nếu bo mạch chủ bị lỗi thì tốt hơn hết là tôi nên mua một Bo mạch chủ B550 giá rẻ mới.


CPU/Bo mạch chủ/Bộ làm mát/RAM/SSD, nhưng tôi thực sự không muốn tốn tiền mua tất cả những thứ đó chỉ để phát hiện ra rằng PSU bị lỗi và tôi đã mua một loạt các thành phần cập nhật mà tôi không cần. Tôi đang nghĩ nếu tôi định làm vậy thì tôi cũng có thể nâng cấp và tôi đang nghĩ đến việc mua:

Bộ xử lý Intel Core i9-14900KS 3,2 GHz 24 lõi
Bộ làm mát CPU dạng lỏng ARCTIC Liquid Freezer III 72,8 CFM
Bo mạch chủ ASRock Z790 Taichi Carrara EATX LGA1700
Bộ nhớ Corsair Vengeance 64 GB (2 x 32 GB) DDR5-6600 CL32
Ổ cứng thể rắn Sabrent Rocket 5 2 TB M.2-2280 PCIe 5.0 X4 NVME

Tôi cần phải hành động nhanh chóng vì chiếc PC này càng hỏng lâu thì tôi càng mất nhiều tiền và lúc này tôi đã sẵn sàng chi tiền để giải quyết vấn đề. Tôi có thể mua một vỏ máy mới nhưng muốn sử dụng card đồ họa, bộ lưu trữ và PSU từ bản dựng hiện tại mà tôi sẽ loại bỏ.

Nỗi sợ chính của tôi là những CPU Intel này dường như được thiết kế để hỏng ngay sau khi hết hạn bảo hành và tôi thực sự muốn nó chạy trong ít nhất 4-5 năm. Tôi không muốn làm như vậy trong một năm nữa nhưng có vẻ như vũ trụ đã có những kế hoạch khác.


Có vẻ như việc nâng cấp vào lúc này là không hợp lý vì chip Intel mới có khả năng sẽ ra mắt vào tháng tới và AMD 9950x3d vào cuối năm, vì vậy tôi sẽ thực hiện theo kế hoạch ban đầu và hạ cấp hệ thống của mình cho đến khi có phần cứng mới.

Và nó sẽ cho tôi biết liệu đó thực sự là bo mạch chủ hay PSU hay không. Tôi sẽ cập nhật diễn đàn. Tôi vẫn sẽ đánh giá cao bất kỳ lời khuyên nào mặc dù tôi đã đọc tất cả.

Sự trợ giúp hoặc lời khuyên tốt nhất sẽ rất tuyệt.
 
Được rồi, tôi đã thay thế bo mạch chủ bằng bo mạch B550 và lỗi Over Current Have Been Detected đã biến mất, nhưng vấn đề đóng băng và khởi động lại là vấn đề thực sự vẫn còn tồn tại. Tôi đã hoán đổi cả hai mô-đun RAM, vẫn xảy ra nên không phải do RAM.

Điều đó khiến tôi nghĩ rằng CPU hoặc PSU có thể là thủ phạm tiềm ẩn.

Và tôi không biết là cái nào. Tôi đoán nhiều hơn về PSU tại thời điểm này nhưng đó hoàn toàn chỉ là phỏng đoán.

Có cách nào để biết hoặc kiểm tra xem CPU hay PSU có vấn đề không?
 
Được rồi, tôi đã thay thế bo mạch chủ bằng bo mạch B550 và lỗi Over Current Have Been Detected đã biến mất, nhưng vấn đề đóng băng và khởi động lại là vấn đề thực sự vẫn còn tồn tại. Tôi đã hoán đổi cả hai mô-đun RAM, vẫn xảy ra như vậy nên không phải do RAM.

Điều đó khiến tôi nghĩ rằng CPU hoặc PSU có thể là thủ phạm tiềm ẩn.

Và tôi không biết là cái nào. Tôi đoán nhiều hơn về PSU tại thời điểm này nhưng đó hoàn toàn chỉ là phỏng đoán.

Có cách nào để biết hoặc kiểm tra xem CPU hay PSU gặp sự cố không?
Cách dễ nhất và tốt nhất là đổi PSU bằng một PSU tốt.
 
Cách dễ nhất và tốt nhất là thay PSU bằng một PSU tốt đã biết.
Tôi đồng ý nhưng PSU duy nhất khác mà tôi có đã 20 năm tuổi rồi. Tôi nghi ngờ nó thậm chí còn không có đầu nối VGA 8 chân hiện đại. Tôi cần mua một PSU mới và tôi không muốn làm vậy trừ khi tôi biết chắc chắn nó là thủ phạm.

Có cách nào để vô hiệu hóa lõi trên AMD Ryzen 5950x từ BIOS hoặc tương tự để có thể loại trừ CPU bị lỗi là nguyên nhân tiềm ẩn không?

Một lựa chọn khác là mở PSU và xem có bất kỳ sự xuống cấp vật lý rõ ràng nào như tụ điện bị nấm hay tương tự không.

Trên thực tế, nó vẫn còn trong thời gian bảo hành và là một PSU rất tốn kém để thay thế nên tôi muốn làm đúng.
 
Back
Bên trên