Hỏi / Đáp Máy trạm của tôi bị sập GẦN NHƯ ngẫu nhiên.

nefertum

New member
Xin chào tất cả,
Máy tính của tôi bị hỏng và tôi không biết phải làm sao.

Đột nhiên, màn hình tối đen, quạt bắt đầu quay ở tốc độ mặc định. Máy tính không tắt hoàn toàn, nhưng không thể nhập dữ liệu, không thể nhìn thấy hoặc nghe thấy bất kỳ dữ liệu đầu ra nào (trừ quạt), ngay cả nút nguồn ở mặt trước của vỏ máy cũng không phản hồi. Tôi luôn phải nghiêng người về phía sau vỏ máy, tắt và bật lại công tắc nguồn ở đó rồi khởi động lại máy tính.
Điều này xảy ra cách ngày (trung bình, đôi khi 2 lần một ngày, đôi khi vài ngày là ổn) trong một thời gian. Nó xảy ra mà không có lý do rõ ràng nào. Nó có thể xảy ra khi tôi đang làm việc. Nó có thể xảy ra trong khi chơi game. Nhưng cũng có nhiều lần khi chỉ chạy trình duyệt web hoặc thậm chí khi tôi chưa bắt đầu làm bất cứ điều gì, chỉ nhìn vào màn hình nền ngay sau khi khởi động. Có vẻ như nó xảy ra nhiều hơn trong khi làm việc, nhưng đó có thể là một số loại thiên kiến quan sát, vì hầu hết thời gian máy tính này chạy, các phần mềm như 3dsMax, CAD, v.v. đều được mở.
Tôi đã dành thời gian với các công cụ mà một người không rành về máy tính như tôi có thể hiểu được:
- Tôi đã chạy thử nghiệm phần mềm diệt vi-rút và phần mềm chống phần mềm độc hại
- Tôi đã kiểm tra tình trạng ổ đĩa của mình thông qua các công cụ chẩn đoán
- Tôi đã chạy kiểm tra tệp hệ thống
- Tôi đã cập nhật trình điều khiển của mình. Như đã xảy ra trong nhiều tháng nay, một số người đã làm nhiều hơn một lần.
- Tôi đã cập nhật trình điều khiển UEFI. Có một điều tôi không biết là mình nên làm, cho đến lúc đó.
- Tôi đã dọn dẹp sổ đăng ký
- Tôi đã kiểm tra Trình xem sự kiện. Không có nhật ký nào ở đó, mà tôi có thể liên kết đến các lần sập (ngoại trừ nhật ký sau khi khởi động lại, chỉ ra rằng hệ thống đã tắt không đúng cách lần trước).
- Tôi đã chạy memtest từ đĩa flash USB
- Các công cụ kiểm tra nhiệt độ CPU không hiển thị bất kỳ đột biến nào, nhiệt độ tối đa là 69°C (156F), thường là 55-60°C (130-140F)
- Tôi không có nhật ký về nhiệt độ GPU, nhưng vì điều này thường xảy ra khi không có hiện tượng GPU bị cạn kiệt, nên trong những lần sập đó, tôi cho rằng nhiệt độ vẫn ở mức thông thường là 37°C (98F).
- Trong thời gian này, tôi đã từng dọn dẹp, cài đặt lại hệ thống (Win10) và sau đó một thời gian, cập nhật từ Win10 lên 11.
- Đến lúc này, tôi đã cân nhắc xem có vấn đề gì với nguồn điện không, nhưng đây chính là khởi đầu cho một vấn đề mà tôi không biết gì cả. Điện áp, watt, cách ghi lại chúng khi hệ thống đột ngột tắt,...
Từ giờ trở đi, tôi muốn nhờ mọi người giúp đỡ, những người biết các bước cần thực hiện để xác định thủ phạm.

Trong một thời gian dài, tôi không thể tái tạo sự cố này. Cho đến gần đây. Một tệp công việc cụ thể kích hoạt điều này mọi lúc, ngay sau khi tôi mở tệp. Đó là tệp Archicad (phần mềm CAD, dành cho kỹ thuật dân dụng, tài liệu kiến trúc), tệp nặng, do khách hàng cung cấp. Tệp này không kích hoạt điều này trên bất kỳ máy tính nào khác trong số 2 máy tính của bạn tôi mà tôi đã thử nghiệm. Ngay cả khi có tùy chọn này trong tay, các điểm nêu trên (về trình xem sự kiện, nhiệt độ,...) vẫn giữ nguyên.

Có cách nào để tôi xác định nguồn gốc của sự cố này không, trước khi tôi đi sâu vào việc thay thế từng bộ phận một bằng các bộ phận dự phòng (mà hiện tại tôi không có)? Một bước mà tôi hơi sợ, vì lần cuối cùng tôi phải tháo rời/lắp ráp PC là cách đây 20 năm và đó là thứ cũ kỹ rẻ tiền, không phải là nguồn sống của tôi. Và vì không có cửa hàng sửa chữa dịch vụ tốt nào ở gần đây...
Cảm ơn bạn.

CPU: Bộ xử lý AMD Ryzen 9 5950X 16 nhân
Bộ nhớ: 2x DIMM PATRIOT Viper 4 Blackout DDR4 64GB,(=128GB), 130981MB(3333)
Bo mạch chủ: ROG CROSSHAIR VIII DARK HERO
HĐH: Microsoft Windows 11 Pro
GPU: NVIDIA GeForce GTX 1650 SUPER
Ổ cứng: Samsung SSD 970 EVO Plus 1TB(931GB,SCSI), Samsung SSD 980 PRO 1TB(931GB,SCSI)
Nguồn điện: CORSAIR ATX 750W RM750x (2018)
Phiên bản BIOS: 4402
 
Bạn có thể tải xuống Cpuid Hwmonitor, https://www.cpuid.com/softwares/hwmonitor.html phần mềm này sẽ hiển thị điện áp của bạn bên cạnh điện áp dự kiến. Quá một chút thì ổn nhưng thấp hơn thì có lẽ là không ổn.
Tôi biết bạn đã nói rằng bạn đã chạy Memtest, nhưng bạn có thể thử rút từng thanh ram một và xem hành vi này có tiếp tục xảy ra không, sau đó thử thanh ram tiếp theo.
Bạn có thể thử chạy các cài đặt nguồn Windows khác nhau để xem điều này có ảnh hưởng đến hành vi hay không.
Bạn có cắm bất kỳ thiết bị ngoại vi nào vào cổng USB không? Bạn có thể thử rút từng cái một để kiểm tra xem có sự khác biệt nào không.
 
Ngoài ra, hãy xem trong Reliability History/Monitor để biết mã lỗi, cảnh báo và thậm chí cả các sự kiện thông tin được ghi lại ngay trước hoặc tại thời điểm xảy ra sự cố.

Reliability History/Monitor thân thiện hơn nhiều với người dùng cuối và định dạng dòng thời gian có thể tiết lộ các mẫu.

Thật tốt khi bạn xem Event Viewer. Tuy nhiên, Event Viewer thực sự cần nhiều thời gian và công sức hơn để điều hướng và hiểu.

Tuy nhiên, hãy xem lại ở đó.

Để trợ giúp:

Cách sử dụng - Cách sử dụng Windows 10 Event Viewer | Diễn+đàn+phần+mềm+Tom (tomshardware.com)
 
Bộ nhớ: 2x DIMM PATRIOT Viper 4 Blackout DDR4 64GB,(=128GB), 130981MB(3333)
Tôi đã cố gắng tìm bộ nhớ Patriot Viper 4 Blackout 128GB (2 x 64GB) trực tuyến và cho đến nay tôi vẫn chưa tìm thấy bất kỳ bảng dữ liệu nào. Tất cả chúng có vẻ là 2 x 16GB (32GB) hoặc 2 x 32GB (64GB).

Nếu có thể, bạn có thể rút một thanh RAM và đăng số bộ phận chính xác lên diễn đàn này không.

Có thể bạn nên kiểm tra xem RAM của mình có nằm trong Danh sách nhà cung cấp đủ điều kiện cho bo mạch chủ của mình không.

Tôi hiểu tại sao bạn cần 128GB, nhưng tôi hơi ngạc nhiên khi biết rằng có sẵn DIMM DDR4 64GB. Có lẽ tôi chỉ không theo kịp thời đại.

Theo mô tả của bạn, suy nghĩ đầu tiên của tôi là vấn đề liên quan đến RAM. MemTest có vượt qua mà không có lỗi nào không?

Bạn đang chạy bộ nhớ ở tốc độ DDR4 mặc định hay bạn đã bật ép xung bộ nhớ XMP?

Nếu RAM của bạn hiện đang chạy XMP ở tốc độ 3600MT/giây hoặc tương tự, hãy tắt XMP và xem hệ thống có ổn định ở tốc độ RAM DDR4 mặc định của JEDEC không (có thể là 2133 hoặc 2400MT/giây).

Nếu bất kỳ người bạn nào của bạn sẵn sàng cho bạn "mượn" RAM từ PC của họ, bạn có thể đổi RAM của mình để xem RAM của họ có ổn định hơn không. Điều này giả định rằng họ có DDR4 tương thích, không phải DDR3 hoặc DDR5.

Mặc dù PSU của bạn đã khoảng 7 năm tuổi, nhưng dòng RM750X vẫn có khả năng cung cấp năng lượng cho 5950X và GTX1650 một cách dễ dàng. Có thể đáng để kiểm tra thông số kỹ thuật cho RM750X cụ thể của bạn để xem nó có đi kèm với bảo hành 7 hay 10 năm không.

GPU: NVIDIA GeForce GTX 1650 SUPER
Đây là một card khá cũ (tôi có một GTX1650 tiêu chuẩn trong giàn đa phương tiện cũ của mình). Bạn có đang chạy Trình điều khiển trò chơi hay Studio của NVidia không?

Về lý thuyết, Trình điều khiển Studio (nếu có cho card của bạn) có thể ổn định hơn Trình điều khiển trò chơi. Tôi chạy trình điều khiển NVidia Studio trên GPU trong thiết bị chỉnh sửa 7950X của mình.

Tôi cho rằng bạn có bộ làm mát CPU (lớn) tốt trên 5950X của mình phải không? Một cái gì đó giống như Thermalright Peerless Assassin 120 hoặc AIO 240/360/420mm?

Như bài đánh giá này cho thấy, không khó để đẩy mức tản nhiệt của 5950X lên hơn 200W trong một số trường hợp.
https://www.techpowerup.com/review/amd-ryzen-9-5950x/19.html

Tôi thấy 190W đến 200W trên 7950X của tôi (bộ làm mát Noctua NH-D15) ở 85 đến 92°C tất cả các lõi trong quá trình chuyển đổi Handbrake trong HWMonitor.
https://www.cpuid.com/softwares/hwmonitor.html

Nếu bạn đang sử dụng bộ làm mát CPU thực sự nhỏ, 5950X của bạn có thể bị giảm tốc độ hoặc quá nhiệt.
 
Back
Bên trên