Hỏi / Đáp Vấn đề về tính ổn định của hệ thống?

K77X

New member
Xin chào,
Tôi đã vật lộn với một vấn đề trong vài tháng qua khiến tôi bối rối. Máy tính chạy Windows 11 của tôi sẽ bị sập ngẫu nhiên mà không có BSOD vào những thời điểm có vẻ ngẫu nhiên. Tôi có thể đang chơi trò chơi hoặc chạy thử nghiệm ứng suất, để máy ở chế độ chờ mà không mở bất kỳ chương trình nào, xem video YouTube, kiểm tra email, v.v. và máy sẽ bị sập ngẫu nhiên. Tôi đã mang máy đến một cửa hàng sửa chữa để kiểm tra ứng suất trên tất cả các thành phần và thay thế bo mạch chủ và RAM, nhưng sự cố vẫn tiếp diễn (máy tính chạy tốt trong 2 tuần sau khi nhận lại). Tôi cũng vừa thay bo mạch chủ 2 ngày trước và máy chạy tốt, nhưng hôm nay tôi lại gặp sự cố tương tự. Tôi cũng đã thay PSU và có UPS nên tôi không nghĩ đó là sự cố về nguồn điện. Câu hỏi của tôi là liệu tôi chỉ gặp sự cố về CPU và tôi có thể thực hiện những loại thử nghiệm nào khác để xem thành phần nào bị lỗi?

Triệu chứng sập nguồn:
máy tính của tôi bị treo hoàn toàn và không phản hồi với mọi đầu vào trong 1-5 giây trước khi màn hình tắt (tất cả các thành phần như quạt và rgb vẫn sáng) trước khi cố gắng khởi động lại. Đôi khi, máy sẽ sập sau <10 phút khởi động và đăng nhập vào windows, những lần khác, tôi có thể sử dụng máy trong 2 giờ trước khi sập nguồn. May mắn nhất là máy chỉ khởi động lại hệ thống tự động, nhưng đôi khi tôi phải lắp lại CPU/RAM hoặc chạy lại BIOS để vào lại Windows. Những lần sập nguồn tệ nhất thậm chí không cho tôi vào BIOS ngay cả sau khi chạy lại BIOS.
Đối với một số lần sập nguồn, đèn DRAM trên bo mạch chủ sẽ sáng sau khi máy sập nhưng thường có thể khắc phục được nếu tôi giữ nút nguồn và khởi động lại. Trong trường hợp của hai bo mạch chủ đầu tiên, cuối cùng đèn DRAM và CPU cũng sáng nên phải thay thế chúng. Kiểm tra các chân cắm/kết nối, không có chân cắm nào bị cong trên ổ cắm hoặc bất kỳ vấn đề trực quan nào khác trên RAM hoặc CPU. EventViewer luôn hiển thị lỗi Kernel Power 41 nhưng không có nhật ký sự cố nào khác.

Thông số kỹ thuật:
CPU: Bộ xử lý AMD Ryzen 9 7900X 4,7 GHz 12 lõi
Bộ làm mát CPU: NZXT Kraken 360 78,02 CFM Liquid
GPU: Gigabyte GAMING OC Rev. 2.0 GeForce RTX 3060 12GB
Bo mạch chủ: MSI MAG B650 Tomahawk WIFI ATX --> Đã thay thế bằng MSI MAG B650 khác --> ASUS TUF GAMING B650-PLUS WIFI
RAM: G.SKILL Flare X5 DDR5 64GB 6000MT/giây CL30 --> Corsair Vengeance RGB 32GB DDR5-6000 CL36
Bộ nguồn: NZXT C850 Gold ATX3.1 --> CORSAIR RM1000x Fully Modular ATX 3.1
Lưu trữ: WD_BLACK SN7100 2 TB M.2-2280 PCIe 4.0 X4 NVME SSD

Những gì tôi đã thử cho đến nay:
CPU:

  • Đặt lại keo tản nhiệt mới (không khắc phục được sự cố nhưng có ích một chút khi tôi thậm chí không thể vào BIOS)
  • Theo dõi nhiệt độ khi không hoạt động (bị sập khi nhiệt độ <60°C, không bao giờ vượt quá 90°C)
  • Chạy thử nghiệm ứng suất với OCCT (không có lỗi hoặc sự cố)
GPU:
  • Theo dõi nhiệt độ khi không hoạt động (bị sập khi là <60°C, không vượt quá 83°C)
  • Cập nhật lên trình điều khiển mới nhất thông qua ứng dụng NVIDIA, nhưng cũng sử dụng DDU và cài đặt trình điều khiển mới nhất theo cách thủ công
  • Chạy thử nghiệm ứng suất với OCCT (không có lỗi hoặc sự cố)
Bo mạch chủ:
  • Cập nhật BIOS lên phiên bản mới nhất với cả 3 bo mạch chủ (không giải quyết được sự cố nhưng giúp tăng độ ổn định một chút)
  • Tắt PBO
  • Chạy thử nghiệm ứng suất với OCCT (không có lỗi hoặc sự cố)
  • Vô hiệu hóa khởi động nhanh
  • Bật/tắt bất kỳ ép xung nào cho CPU và RAM
RAM:
  • Gắn lại hoặc chạy bằng 1 thanh (không khắc phục được sự cố nhưng có ích một chút khi tôi thậm chí không thể vào BIOS)
  • Chạy memtest + chẩn đoán bộ nhớ Windows cho RAM (cả hai đều vượt qua, không tìm thấy bất kỳ sự cố nào)
Khác.

  • Kiểm tra tất cả các kết nối cáp PSU và đảm bảo tất cả các quạt đều quay
  • Cài đặt lại hoàn toàn Windows 11 với tất cả các ứng dụng mặc định (bị sập trong vòng một giờ khi chỉ cắm bàn phím + chuột)
  • Xóa tất cả phần mềm và thành phần để không có gì khác ngoài HĐH cơ bản đang chạy (vẫn bị sập ngẫu nhiên)
  • Chạy lệnh SFC và DISM (không vấn đề được tìm thấy), ngoài bản cập nhật windows và trình khắc phục sự cố windows
  • Kiểm tra trạng thái của SSD M.2 (khỏe mạnh 100%)
  • Chạy phần mềm diệt vi-rút trên MỌI THỨ (Malwarebytes), không tìm thấy gì
  • Đang thay đổi cài đặt nguồn điện thành hiệu suất cân bằng, cực cao
  • Đang chuyển đổi cổng màn hình, chỉ chạy trên 1 màn hình
 
Xin chào,

Tôi đã vật lộn với một vấn đề trong vài tháng qua khiến tôi bối rối. Máy tính chạy Windows 11 của tôi sẽ bị sập ngẫu nhiên mà không có BSOD vào những thời điểm có vẻ ngẫu nhiên. Tôi có thể đang chơi trò chơi hoặc chạy thử nghiệm ứng suất, để máy ở chế độ chờ mà không mở bất kỳ chương trình nào, xem video YouTube, kiểm tra email, v.v. và máy sẽ bị sập ngẫu nhiên. Tôi đã mang máy đến một cửa hàng sửa chữa để kiểm tra ứng suất trên tất cả các thành phần và thay thế bo mạch chủ và RAM, nhưng sự cố vẫn tiếp diễn (máy tính chạy tốt trong 2 tuần sau khi nhận lại). Tôi cũng vừa thay bo mạch chủ 2 ngày trước và nó chạy tốt, nhưng hôm nay tôi lại gặp vấn đề tương tự. Tôi cũng đã thay PSU và có UPS nên tôi không nghĩ đó là vấn đề về nguồn. Câu hỏi của tôi là tôi chỉ gặp vấn đề về CPU và tôi có thể thực hiện những loại kiểm tra nào khác để xem thành phần nào bị lỗi?

Triệu chứng sập:
máy tính của tôi bị treo hoàn toàn và không phản hồi với tất cả các đầu vào trong 1-5 giây trước khi màn hình tắt (tất cả các thành phần như quạt và rgb vẫn bật) trước khi cố gắng khởi động lại. Đôi khi nó sẽ sập sau khi khởi động và đăng nhập vào windows <10 phút, những lần khác tôi có thể sử dụng nó trong 2 giờ trước khi nó sập. May mắn nhất là nó chỉ khởi động lại hệ thống tự động, nhưng đôi khi tôi phải lắp lại CPU/RAM hoặc thực hiện flashback bios để vào lại windows. Những lần sập tệ nhất thậm chí không cho tôi vào BIOS ngay cả sau khi flashback.
Đối với một số sự cố sập, đèn DRAM trên bo mạch chủ sẽ sáng sau khi nó sập nhưng điều đó thường có thể khắc phục được nếu tôi giữ nút nguồn và khởi động lại. Trong trường hợp của hai bo mạch chủ đầu tiên, cuối cùng đèn DRAM và CPU sẽ sáng nên chúng phải được thay thế. Kiểm tra các chân cắm/kết nối, không có chân cắm nào bị cong trên ổ cắm hoặc bất kỳ sự cố hình ảnh nào khác trên RAM hoặc CPU. EventViewer luôn hiển thị lỗi Kernel Power 41 nhưng không có nhật ký sự cố nào khác.

Thông số kỹ thuật:
CPU: Bộ xử lý AMD Ryzen 9 7900X 4,7 GHz 12 lõi
Bộ làm mát CPU: NZXT Kraken 360 78,02 CFM Liquid
GPU: Gigabyte GAMING OC Rev. 2.0 GeForce RTX 3060 12GB
Bo mạch chủ: MSI MAG B650 Tomahawk WIFI ATX --> Đã thay thế bằng một MSI MAG B650 khác --> ASUS TUF GAMING B650-PLUS WIFI
RAM: G.SKILL Flare X5 DDR5 64GB 6000MT/giây CL30 --> Corsair Vengeance RGB 32GB DDR5-6000 CL36
PSU: NZXT C850 Gold ATX3.1 --> CORSAIR RM1000x Fully Modular ATX 3.1
Lưu trữ: WD_BLACK SN7100 2 TB M.2-2280 PCIe 4.0 X4 NVME SSD

Những gì tôi đã thử cho đến nay:
CPU:
  • Đặt lại nó bằng keo tản nhiệt mới (không khắc phục được sự cố nhưng có ích một chút khi tôi thậm chí không thể vào BIOS)
  • Theo dõi nhiệt độ khi không hoạt động (bị sập khi nhiệt độ <60°C, không bao giờ vượt quá 90°C)
  • Chạy thử nghiệm ứng suất với OCCT (không có lỗi hoặc sự cố)
GPU:
  • Theo dõi nhiệt độ khi không hoạt động (bị sập khi nhiệt độ <60°C, không vượt quá 83°C)
  • Cập nhật lên trình điều khiển mới nhất thông qua ứng dụng NVIDIA, nhưng cũng sử dụng DDU và cài đặt trình điều khiển mới nhất theo cách thủ công
  • Chạy thử nghiệm ứng suất với OCCT (không có lỗi hoặc sự cố)
Bo mạch chủ:
  • Cập nhật BIOS lên phiên bản mới nhất với cả 3 bo mạch chủ (không giải quyết được sự cố nhưng giúp tăng độ ổn định một chút)
  • Tắt PBO
  • Chạy thử nghiệm ứng suất với OCCT (không có lỗi hoặc sự cố)
  • Vô hiệu hóa khởi động nhanh
  • Bật/tắt bất kỳ ép xung nào cho CPU và RAM
RAM:
  • Gắn lại hoặc chạy bằng 1 thanh (không khắc phục được sự cố nhưng có ích một chút khi tôi thậm chí không thể vào BIOS)
  • Chạy memtest + chẩn đoán bộ nhớ Windows cho RAM (cả hai đều vượt qua, không tìm thấy bất kỳ sự cố nào)
Khác.

  • Kiểm tra tất cả các kết nối cáp PSU và đảm bảo tất cả các quạt đều quay
  • Cài đặt lại hoàn toàn Windows 11 với tất cả các ứng dụng mặc định (bị sập trong vòng một giờ khi chỉ cắm bàn phím + chuột)
  • Xóa tất cả phần mềm và thành phần để không có gì khác ngoài HĐH cơ bản đang chạy (vẫn bị sập ngẫu nhiên)
  • Chạy lệnh SFC và DISM (không vấn đề được tìm thấy), ngoài bản cập nhật windows và trình khắc phục sự cố windows
  • Kiểm tra trạng thái của SSD M.2 (khỏe mạnh 100%)
  • Chạy phần mềm diệt vi-rút trên MỌI THỨ (Malwarebytes), không tìm thấy gì
  • Đang thay đổi cài đặt nguồn điện thành hiệu suất cân bằng, cực cao
  • Đang chuyển đổi cổng màn hình, chỉ chạy trên 1 màn hình
Tôi cũng gặp vấn đề tương tự do điện áp CPU VDDCR_SOC (SVI3 TFN) quá thấp, việc đặt thủ công thành 1.250v đã khắc phục được vấn đề.
 
RAM: G.SKILL Flare X5 DDR5 64GB 6000MT/giây CL30 --> Corsair Vengeance RGB 32GB DDR5-6000 CL36
Nếu bạn đang chạy với XMP/EXPO/DOCP được bật ở tốc độ 6000MT/giây, hãy tắt chế độ ép xung bộ nhớ và trở về mặc định của JEDEC là 4800MT/giây. BIOS có thể đang đào tạo bộ nhớ tại POST và không tìm thấy một bộ thời gian tương thích ở 6000MT/giây.

Bạn đang chạy 2 DIMM hay 4 DIMM? 2 DIMM sẽ ổn định hơn. Khe cắm A2/B2 thường là tốt nhất cho thiết lập 2 DIMM.

Chạy một lượt đầy đủ (vài giờ) của MemTest86 trên mỗi cài đặt tốc độ RAM để kiểm tra tính ổn định. Bất kỳ lỗi nào cũng chỉ ra sự cố. RAM của bạn sẽ ổn khi được kiểm tra bằng MemTest86 ở tốc độ 4800MT/giây, nhưng có thể tạo ra lỗi ở tốc độ 6000MT/giây.
https://www.memtest86.com/

Nếu/khi bạn chạy hệ thống ở tốc độ 4800MT/giây, bạn có thể bắt đầu ép xung RAM bằng cách sử dụng thời gian thủ công nếu Tự động 6000MT/giây gây ra sự cố.
 
Back
Bên trên