Hỏi / Đáp Windows bị sập và nhiệt độ GPU tăng cao đột biến?

BurntToasters

New member
Xin chào. Xin lỗi vì bài viết dài, tôi chỉ muốn đưa vào tất cả thông tin từ vấn đề kỳ lạ này với hy vọng tìm ra vấn đề.
TLDR ở cuối.

THÔNG SỐ KỸ THUẬT:

  • Loại máy tính:
  • Máy tính để bàn
  • GPU: RTX 4080 Super Founders
  • CPU: RYZEN 9 7900x
  • Bo mạch chủ: ASUS ProArt X670E-CREATOR WiFi
  • Phiên bản BIOS: 2704
  • RAM: CORSAIR Dominator Titanium 64GB DDR5 6000MHz C30
  • PSU: Seasonic Prime TX 1000W
  • Vỏ máy: Antec Flux Pro
  • Hệ điều hành & Phiên bản: WINDOWS 11 PRO 24H2 (Bản cập nhật hiện tại: KB5048667 vì các bản cập nhật mới hơn có các sự cố hiện chưa được giải quyết)
  • Trình điều khiển GPU: TRÌNH ĐIỀU KHIỂN GEFORCE GAME READY - Trình điều khiển WHQL Phiên bản: (Trước đó: 566.36/Hiện tại: 566.14)
  • Trình điều khiển Chipset: TRÌNH ĐIỀU KHIỂN CHIPSET AMD X670E PHIÊN BẢN 6.10.17.152
Giải thích:
Vào đầu tháng trước, tôi đang chơi Marvel Rivals và khi thoát khỏi trò chơi, tôi nhận được BSOD. Tôi nghĩ rằng điều đó thật lạ nhưng sau đó không còn sự cố hoặc hiện tượng kỳ lạ nào xảy ra nữa... cho đến ngày hôm qua. Hôm qua, tôi đang chơi Balatro và xem một video trên YouTube, thì đột nhiên máy tính của tôi khởi động lại.

Lần đầu tiên không phải là BSOD nên tôi không nhận được tệp dump nên tôi không thể thấy bất kỳ lỗi tiềm ẩn nào. Sau đó, tôi cài đặt lại trình điều khiển GPU của mình bằng DDU (Ở chế độ an toàn) và chạy furmark và CPU burner đi kèm để nhanh chóng xem đó có phải là sự cố của PSU không.

Tôi chạy furmark và cpu burner trong 30 phút và mọi thứ có vẻ ổn, cho đến khi tôi dừng furmark và cpu burner và sau đó windows ngay lập tức BSOD lần này với lỗi sau: Kernel Security Check Failure. Tôi đã cài đặt và sử dụng chế độ xem màn hình xanh để kiểm tra tệp dump và mục bị lỗi là noskrnl.exe
. Tôi đã nghiên cứu điều này và thấy rằng sự cố kernel bị sập thường liên quan đến các sự cố về bộ nhớ. Tôi đã chạy memtest86 và hoàn thành với 0 lỗi và vượt qua.
Công việc tiếp theo của tôi là cập nhật BIOS lên phiên bản mới nhất có sẵn. Sau đó, tôi bật lại EXPO và mọi thứ có vẻ hoạt động trở lại trong thời gian này. Sau đó, tôi lắp lại ram để phòng ngừa và sử dụng lại DDU để gỡ cài đặt trình điều khiển hiện tại và sử dụng phiên bản trước đó để khắc phục sự cố.

Hôm nay, tôi đã thử lại kết hợp kiểm tra furmark + cpu burner để xem chúng có hoạt động không và thật không may, hệ thống lại khởi động lại cứng mà không có BSOD ngay khi tôi nhấn "dừng" trên cpu burner.

Tôi đã khởi động lại furmark khi hệ thống khởi động lại nhưng lần này đã sử dụng chuẩn cinebench 30 phút để gây áp lực cho cpu và nhận thấy có điều gì đó có thể đáng lo ngại liên quan đến nhiệt độ của tôi.

Tôi biết nhiệt độ tối đa của 7900x là 95 độ C, đó là lý do tại sao tôi lo lắng khi thấy trên HWInfo64 rằng trong quá trình kiểm tra áp lực, CCD2 Tdie đã ở mức 100,6 độ C trong thời gian ngắn! và sau đó giảm xuống khoảng 88-95C (đôi khi là 96C).

Điều kỳ lạ là HWInfo64 không báo cáo bất kỳ hiện tượng giảm nhiệt nào do nhiệt độ. Sau khi thực hiện xong chuẩn cinebench, hệ thống lại bị khởi động lại.

Tôi linh cảm rằng sự cố này là do nhiệt, nhưng nó chỉ xảy ra khi các bài kiểm tra ứng suất DỪNG LẠI. Hơn nữa, lần thứ hai là khi máy tính không chịu bất kỳ tải nặng nào (chơi balatro và xem youtube). Ngoài ra, HWInfo64 không báo cáo hiện tượng điều chỉnh nhiệt.

Tôi cũng đã thực hiện lệnh dism /online /cleanup-image /restorehealth
sfc /scannow cổ điển nhưng không có kết quả.
TLDR:
  • BSOD sau khi thoát khỏi marvel partners
  • BSOD khi chơi balatro và xem youtube
  • Buộc khởi động lại sau khi dừng CPU burner
  • BSOD sau khi dừng CPU burner
  • Buộc khởi động lại sau khi hoàn tất chuẩn cinebench 30 phút
  • Nhiệt độ đỉnh cao trên CCD2 là 100,6C; không có báo cáo điều chỉnh nhiệt
  • Hệ thống LUÔN sập SAU KHI hoàn tất/dừng kiểm tra chuẩn CPU/kiểm tra ứng suất, không phải trong quá trình.
Các bước khắc phục sự cố tôi đã thực hiện:

  • DDU (hai lần, hai phiên bản trình điều khiển khác nhau)
  • Lệnh DISM và SFC
  • Gắn lại RAM
  • Cập nhật BIOS
  • Chạy Memtest86; không có lỗi
Chúng tôi rất trân trọng mọi ý tưởng hoặc hiểu biết sâu sắc!
 
Sau khi bạn cập nhật BIOS, SAU ĐÓ bạn có thực hiện khôi phục cài đặt gốc để đảm bảo rằng không có thông tin cài đặt trước đó nào được giữ lại (Vì đôi khi BIOS từ chối "quên" các cài đặt cũ mà không thực hiện như vậy) và buộc các bảng phần cứng phải được khôi phục cài đặt gốc không? Nếu không, hãy bắt đầu từ đó.


Quy trình khôi phục cài đặt gốc BIOS

Tắt nguồn thiết bị, tắt PSU và rút dây PSU ra khỏi ổ cắm trên tường hoặc nguồn điện.

Tháo pin CMOS trên bo mạch chủ trong khoảng ba đến năm phút. Trong một số trường hợp, có thể cần phải tháo card đồ họa để tiếp cận pin CMOS.

Trong năm phút khi pin CMOS không còn trong bo mạch chủ, hãy nhấn nút nguồn trên vỏ máy liên tục trong 15-30 giây để làm cạn kiệt bất kỳ lượng điện tích còn lại nào có thể có trong mạch CMOS. Sau năm phút, hãy lắp lại pin CMOS, đảm bảo lắp pin đúng chiều hướng lên trên ngay khi pin được tháo ra.

Nếu bạn phải tháo card đồ họa, giờ bạn có thể lắp lại, nhưng hãy nhớ kết nối lại cáp nguồn nếu có cũng như cáp màn hình.

Bây giờ, hãy cắm lại cáp nguồn, bật lại PSU và bật nguồn hệ thống. Màn hình POST sẽ hiển thị và các tùy chọn để vào thiết lập CMOS/BIOS. Vào chương trình thiết lập BIOS và cấu hình lại cài đặt khởi động cho trình quản lý khởi động Windows hoặc đối với các hệ thống cũ, ổ đĩa mà hệ điều hành của bạn được cài đặt nếu cần.

Lưu cài đặt và thoát. Nếu hệ thống sẽ POST và khởi động thì bạn có thể tiến hành từ đó bao gồm cả việc quay lại bios và cấu hình bất kỳ cài đặt tùy chỉnh nào khác mà bạn có thể cần cấu hình như cài đặt cấu hình Memory XMP, A-XMP hoặc DOCP, cài đặt cấu hình quạt tùy chỉnh hoặc các cài đặt cụ thể khác mà bạn có thể đã cấu hình trước đó nhưng đã bị xóa sạch khi đặt lại CMOS.

Trong một số trường hợp, khi bạn vào BIOS sau khi đặt lại, có thể cần phải tải các giá trị Mặc định hoặc Tối ưu rồi lưu cài đặt để thực sự đặt lại các bảng phần cứng trong trình quản lý khởi động.

Có lẽ cũng đáng đề cập rằng đối với bất kỳ thứ gì có thể yêu cầu thử đặt lại cứng ngay từ đầu, NẾU sự cố liên quan đến việc thiếu tín hiệu video, thì việc thử một loại màn hình khác là MỘT Ý TƯỞNG HAY vì nhiều hệ thống sẽ không hoạt động bình thường vì một số lý do với cấu hình displayport. Bạn nên thử HDMI nếu bạn không có màn hình hoặc không có khả năng trực quan để vào BIOS, hoặc không có thông báo tín hiệu.

Nếu có thể, hãy thử một màn hình khác cũng là một ý tưởng hay nếu màn hình không hiển thị. Điều này vẫn xảy ra.
 
Ngoài ra, bạn đang sử dụng bộ tản nhiệt CPU nào?

Mẫu vỏ máy của bạn là gì?

Có bao nhiêu quạt vỏ máy được lắp và CHÍNH XÁC từng quạt được định hướng/cấu hình như thế nào (Hút vào, xả ra)?

Nếu bạn có bộ tản nhiệt AIO, bộ tản nhiệt được lắp ở đâu và quạt được định hướng theo hướng nào, hút vào hay xả ra?

CHÍNH XÁC các mô-đun bộ nhớ của bạn được lắp vào khe cắm nào? Bắt đầu với 1 là khe cắm gần CPU nhất và 4 là khe cắm gần mép bo mạch chủ nhất, 1, 2, 3, 4? Khe cắm nào lắp bộ nhớ rất quan trọng do các vấn đề về kết thúc.

Tôi đã thấy khá nhiều hệ thống hoạt động chính xác như hệ thống của bạn khi mọi người lắp bộ nhớ vào khe cắm 1 và 3 hoặc 3 và 4, thay vì vào khe cắm 2 và 4 như thiết kế ban đầu. Tôi cũng đã thấy một số hệ thống bị sập sau khi dừng trò chơi hoặc kiểm tra ứng suất vì một số thành phần trên bo mạch hoặc bộ nhớ trong một số trường hợp có thể đột nhiên bị bão hòa nhiệt nếu quạt làm mát chậm lại nhanh chóng vì cảm biến nhiệt CPU nhanh chóng nguội đi nên quạt phản ứng tương tự nhưng các bộ phận khác của gói CPU HOẶC bo mạch chủ VRMS vẫn có thể hấp thụ nhiệt và bây giờ không có quạt hoạt động tốc độ cao và kích hoạt tắt máy.
 
Xin chào. Xin lỗi vì bài viết dài, tôi chỉ muốn đưa vào tất cả thông tin từ vấn đề kỳ lạ này với hy vọng tìm ra vấn đề.

TLDR ở cuối.

THÔNG SỐ KỸ THUẬT:
  • Loại máy tính:
  • Máy tính để bàn
  • GPU: RTX 4080 Super Founders
  • CPU: RYZEN 9 7900x
  • Bo mạch chủ: ASUS ProArt X670E-CREATOR WiFi
  • Phiên bản BIOS: 2704
  • RAM: CORSAIR Dominator Titanium 64GB DDR5 6000MHz C30
  • PSU: Seasonic Prime TX 1000W
  • Vỏ máy: Antec Flux Pro
  • Hệ điều hành & Phiên bản: WINDOWS 11 PRO 24H2 (Bản cập nhật hiện tại: KB5048667 vì các bản cập nhật mới hơn có các sự cố hiện tại chưa được giải quyết)
  • Trình điều khiển GPU: TRÌNH ĐIỀU KHIỂN GEFORCE GAME READY - Trình điều khiển WHQL Phiên bản: (Trước đó: 566.36/Hiện tại: 566.14)
  • Trình điều khiển Chipset: TRÌNH ĐIỀU KHIỂN CHIPSET AMD X670E PHIÊN BẢN 6.10.17.152
Giải thích:
Vào đầu tháng trước, tôi đang chơi marvel partners và khi thoát khỏi trò chơi, tôi nhận được BSOD. Tôi nghĩ rằng điều đó thật lạ nhưng sau đó không còn sự cố hoặc hiện tượng kỳ lạ nào xảy ra nữa... cho đến ngày hôm qua. Hôm qua, tôi đang chơi Balatro và xem một video trên YouTube, thì đột nhiên máy tính của tôi tự khởi động lại.

Lần đầu tiên không phải là BSOD, tôi không nhận được tệp dumb nên tôi không thể thấy bất kỳ lỗi tiềm ẩn nào. Sau đó, tôi cài đặt lại trình điều khiển GPU của mình bằng DDU (Ở chế độ an toàn) và chạy furmark và CPU burner đi kèm để nhanh chóng xem đó có phải là sự cố của PSU không.

Tôi chạy furmark và cpu burner trong 30 phút và mọi thứ có vẻ ổn, cho đến khi tôi dừng furmark và cpu burner, sau đó windows ngay lập tức BSOD lần này với lỗi sau: Kernel Security Check Failure. Tôi đã cài đặt và sử dụng chế độ xem màn hình xanh để kiểm tra tệp dump và mục bị lỗi là noskrnl.exe
. Tôi đã nghiên cứu điều này và thấy rằng sự cố kernel bị sập thường liên quan đến sự cố bộ nhớ. Tôi đã chạy memtest86 và hoàn thành với 0 lỗi và vượt qua.
Việc tiếp theo của tôi là cập nhật BIOS lên phiên bản mới nhất có sẵn. Sau đó, tôi bật lại EXPO và mọi thứ có vẻ hoạt động trở lại trong thời gian này. Sau đó, tôi lắp lại ram để phòng ngừa và sử dụng lại DDU để gỡ cài đặt trình điều khiển hiện tại và sử dụng phiên bản trước đó để khắc phục sự cố.

Hôm nay, tôi đã thử lại kết hợp kiểm tra furmark + cpu burner để xem chúng có hoạt động không và thật không may, hệ thống lại khởi động lại cứng mà không có BSOD ngay khi tôi nhấn "dừng" trên cpu burner.

Tôi đã khởi động lại furmark khi hệ thống khởi động lại nhưng lần này đã sử dụng chuẩn cinebench 30 phút để gây áp lực cho cpu và nhận thấy có điều gì đó có thể đáng lo ngại liên quan đến nhiệt độ của tôi.

Tôi biết nhiệt độ tối đa của 7900x là 95 độ C, đó là lý do tại sao tôi lo lắng khi thấy trên HWInfo64 rằng trong quá trình kiểm tra áp lực, CCD2 Tdie đã ở mức 100,6 độ C trong thời gian ngắn! và sau đó giảm xuống khoảng 88-95C (đôi khi là 96C).

Điều kỳ lạ là HWInfo64 không báo cáo bất kỳ hiện tượng giảm nhiệt nào do nhiệt độ. Sau khi thực hiện xong chuẩn cinebench, hệ thống lại bị khởi động lại.

Tôi linh cảm rằng sự cố này là do nhiệt, nhưng nó chỉ xảy ra khi các bài kiểm tra ứng suất DỪNG LẠI. Hơn nữa, lần thứ hai là khi máy tính không chịu bất kỳ tải nặng nào (chơi balatro và xem youtube). Ngoài ra, HWInfo64 không báo cáo hiện tượng điều chỉnh nhiệt.

Tôi cũng đã thực hiện lệnh dism /online /cleanup-image /restorehealth
sfc /scannow cổ điển nhưng không có kết quả.
TLDR:
  • BSOD sau khi thoát khỏi marvel partners
  • BSOD khi chơi balatro và xem youtube
  • Buộc khởi động lại sau khi dừng CPU burner
  • BSOD sau khi dừng CPU burner
  • Buộc khởi động lại sau khi hoàn tất chuẩn cinebench 30 phút
  • Nhiệt độ đỉnh cao trên CCD2 là 100,6C; không có báo cáo về việc điều chỉnh nhiệt
  • Hệ thống LUÔN sập SAU KHI hoàn tất/dừng kiểm tra điểm chuẩn CPU/kiểm tra ứng suất, không phải trong quá trình.
Các bước khắc phục sự cố mà tôi đã thực hiện:

  • DDU (hai lần, hai phiên bản trình điều khiển khác nhau)
  • Lệnh DISM và SFC
  • Gắn lại RAM
  • Cập nhật BIOS
  • Chạy Memtest86; không có lỗi
Chúng tôi rất trân trọng mọi ý tưởng hoặc hiểu biết sâu sắc!Bạn không nói bạn có bộ làm mát CPU và hệ thống làm mát chung nào. Cần khá nhiều bộ làm mát để chế ngự 7900x. Nếu làm mát bằng không khí, thông gió cho vỏ máy là rất quan trọng. nếu tốc độ bơm chất lỏng.
HWInfo64 có thể không nhận được các đỉnh nhiệt độ tạm thời nếu tần số thăm dò mặc định là 2000mS. hạ xuống 200 hoặc thấp hơn.
Nếu bạn thiếu khả năng làm mát, hãy sử dụng Curve Optimizer từ BIOS, phần PBO. để đặt một số độ lệch điện áp âm, thường là -20 đến -30. Để được trợ giúp đầu tiên, bạn cũng có thể đặt chế độ ECO trong BIOS, chế độ này sẽ làm giảm nhiệt độ đáng kể mà không làm giảm nhiều hoặc không làm giảm hiệu suất.
 
Back
Bên trên