Hỏi / Đáp Sự cố nghiêm trọng - màn hình bị đóng băng, 0 phản hồi, nhiệt độ VBAT cao

Larry.F

New member
Xin chào!

Trong 3 ngày qua, tôi đã gặp phải một số sự cố sập cứng kiểu này. Đầu tiên chỉ là một lần, sau đó chỉ là một lần, rồi liên tiếp nhiều lần. Không có cảnh báo.
Cả hai đều dưới một chút tải và ~30 giây sau khi khởi động máy tính mà không có gì xảy ra. Tôi đã gặp 3 BSOD (cả 3 loại khác nhau [ngoại lệ kmod không được xử lý, IRQL không ít hơn và một loại khác mà tôi quên]).
Cho đến nay, tôi đã cài đặt lại trình điều khiển GPU của mình 20 lần, cả thông qua trải nghiệm Nvidia geforce, phiên bản mới nhất từ trang web chính thức và bản phát hành tháng 12. Tôi cũng đã sử dụng DDU hai lần để cài đặt lại sạch. Chạy công cụ chẩn đoán bộ nhớ - không tìm thấy lỗi. PC có thể chạy hoàn toàn tốt dưới tải trong nhiều giờ liền và có thể bị sập khi tôi mở discord.
Tôi không bật bộ tăng tốc GPU trong bất kỳ chương trình nào. Tự chẩn đoán của Windows cho biết tôi ổn.

Tôi đã tháo rời toàn bộ máy tính, thổi sạch bụi, kiểm tra cáp, lắp lại thanh RAM, ổ SSD, v.v.
Bây giờ khi sử dụng "màn hình phần cứng mở", tôi thấy nhiệt độ VBAT đạt đỉnh 120°C (tăng từ 28 lên 60 rồi lên hơn 100°C trong vài giây, bản thân pin không thực sự nóng khi chạm vào)
Điều đó có bình thường không? Nó đang chạy ở mức 3.168V, mọi thứ khác trong phần điện áp có nhiệt độ được đo đều dưới 40°C.
Tôi chưa từng sử dụng công cụ này trước đây, vì vậy tôi không biết trước đó nó như thế nào.


NoRqVDQ.png


Trong trình giám sát độ tin cậy và trình xem sự kiện, tôi không thể thấy bất cứ điều gì có thể thu hút con mắt không chuyên nghiệp của tôi là bất thường. Trên thực tế, Reliability Monitor chỉ báo cho tôi biết rằng đã có sự cố tắt máy bất ngờ như thể tôi không biết và khởi tạo sự cố đó.

Có cách nào để tôi có thể biết liệu mình có gặp sự cố với phần cứng, phần mềm, trình điều khiển hay bất kỳ thứ gì khác gây ra sự cố này không?
Để bạn hiểu rõ hơn, tôi đã không cập nhật bất kỳ thứ gì gần đây, không thay đổi bất kỳ bộ phận nào hoặc bất kỳ thứ gì tương tự. GPU đã 3 năm tuổi, những thứ khác là 2. Chưa bao giờ gặp sự cố như thế này trước đây.
Tính đến thời điểm đăng bài, nó đã (sau khi lắp ráp lại) hoạt động hoàn hảo trong 45 phút.

Thông số kỹ thuật:
Asus PRIME Z690-P
MSI 3060 Ventus 2X
i5 13600K
G.Skill 32GB 5600J2834F16G
Bộ nguồn Corsair 750W, hoạt động hoàn hảo kể từ khi tôi có nó
Win 10 22H2
 
Xin chào!

Trong 3 ngày qua, tôi đã gặp một số sự cố sập cứng kiểu này. Đầu tiên chỉ xảy ra một lần, sau đó chỉ xảy ra một lần, rồi lại xảy ra nhiều lần liên tiếp. Không có cảnh báo.
Cả hai đều xảy ra khi đang tải một chút và khoảng 30 giây sau khi khởi động máy tính mà không có gì xảy ra. Tôi đã gặp 3 BSOD (cả 3 loại khác nhau [ngoại lệ kmod không được xử lý, IRQL không ít hơn và một loại khác mà tôi quên]).
Tôi đã cài đặt lại trình điều khiển GPU của mình 20 lần cho đến nay, cả thông qua trải nghiệm Nvidia GeForce, phiên bản mới nhất từ trang web chính thức và bản phát hành tháng 12. Cũng đã sử dụng DDU hai lần để cài đặt lại sạch. Chạy công cụ chẩn đoán bộ nhớ - không tìm thấy lỗi nào. PC có thể chạy hoàn hảo khi tải trong nhiều giờ liền và có thể bị sập khi tôi mở Discord.
Tôi không bật bộ tăng tốc GPU trong bất kỳ chương trình nào. Tự chẩn đoán của Windows cho biết tôi ổn.

Tôi đã tháo rời toàn bộ PC của mình, thổi sạch bụi, kiểm tra cáp, gắn lại thanh RAM, ổ SSD, v.v.
Bây giờ khi sử dụng "màn hình phần cứng mở", tôi thấy nhiệt độ VBAT đạt đỉnh 120°C (nhảy từ 28 lên 60 rồi lên hơn 100 trong vài giây, bản thân pin thực sự không nóng khi chạm vào)
Điều đó có bình thường không? Nó đang chạy ở mức 3.168V, mọi thứ khác trong phần điện áp có nhiệt độ được đo đều dưới 40°C.
Tôi chưa từng sử dụng công cụ này trước đây, vì vậy tôi không biết trước đó nó như thế nào.

NoRqVDQ.png


Trong trình giám sát độ tin cậy và trình xem sự kiện, tôi không thể thấy bất cứ điều gì có thể thu hút con mắt không chuyên nghiệp của tôi là bất thường. Trên thực tế, trình giám sát độ tin cậy chỉ cho tôi biết rằng đã có sự cố tắt máy bất ngờ như thể tôi không biết và khởi tạo sự cố đó.

Có cách nào để tôi có thể biết liệu mình có gặp sự cố với phần cứng, phần mềm, trình điều khiển hay bất kỳ thứ gì khác gây ra sự cố này không?
Để bạn hiểu rõ hơn, gần đây tôi không cập nhật bất kỳ thứ gì, không thay đổi bất kỳ bộ phận nào hoặc bất kỳ thứ gì tương tự. GPU đã 3 năm tuổi, những thứ khác 2. Chưa bao giờ gặp vấn đề như thế này trước đây.
Tính đến thời điểm đăng bài, nó đã hoạt động hoàn hảo (sau khi lắp ráp lại) trong 45 phút.

Thông số kỹ thuật:
Asus PRIME Z690-P
MSI 3060 Ventus 2X
i5 13600K
G.Skill 32GB 5600J2834F16G
Bộ nguồn Corsair 750W, hoạt động hoàn hảo kể từ khi tôi có nó
Win 10 22H2
Nhiệt độ 5 là 115 độ. Có lẽ ai đó có thể tham gia ở đây với tầm quan trọng của điều này.
 
Không thể nói về nhiệt độ; Tôi biết một số thành phần bo mạch có thể trở nên *thực sự* nóng, nhưng nhiệt độ đó nghe có vẻ quá cao.

Trong khi đó, một điều đơn giản bạn có thể làm là chạy thử nghiệm bộ nhớ bằng memtest86 (hoặc thậm chí là thử nghiệm tích hợp sẵn trong Windows cũng đủ tốt, tôi biết là tà giáo). Không bao giờ là thừa khi thực hiện thử nghiệm này khi bạn bắt đầu thấy BSOD, vì nó khá chắc chắn (bất kỳ lỗi nào = thay thế RAM).
 
Không thể nói về nhiệt độ; Tôi biết một số thành phần bo mạch có thể trở nên *thực sự* nóng, nhưng những nhiệt độ đó nghe có vẻ quá mức.

Trong khi chờ đợi, một điều đơn giản bạn có thể làm là chạy thử nghiệm bộ nhớ bằng memtest86 (hoặc thậm chí, ngay cả công cụ tích hợp sẵn trong Windows cũng có thể thực hiện công việc khá tốt, tôi biết là tà giáo). Không bao giờ có hại khi thực hiện một lần khi bạn bắt đầu thấy BSOD, vì nó khá chắc chắn (bất kỳ lỗi nào = thay thế RAM).
Tôi đã chạy nó, không có lỗi nào.

Cập nhật nhỏ: Tôi đã gặp nhiều sự cố hơn, trong khi chạy mà không cài đặt trình điều khiển GPU.
Tôi đã thử cài đặt lại windows, nhưng ổ cứng máy tính của tôi bị sập trong quá trình cài đặt ở mức 1%, thậm chí còn không khởi động được.

Về nhiệt độ, như tôi đã nói, theo như tôi biết, temp 5 được cho là VBAT, tức là pin CR2032 nhỏ, và tôi nghi ngờ rằng đó có thể là một cảm biến bị hỏng, vì nó liên tục nhảy giữa 25-120 độ C trong tích tắc rồi lại giảm xuống. Tôi nghĩ rằng không thể có những biến động như vậy trong PC về mặt vật lý.

Tôi nghi ngờ rằng thực tế có thể là MOBO đang gặp sự cố.
 
Tôi đã chạy nó, không có lỗi nào.

Cập nhật nhỏ: Tôi gặp nhiều sự cố hơn khi chạy mà không cài đặt trình điều khiển GPU.
Tôi đã thử cài đặt lại Windows, nhưng ổ cứng máy tính của tôi bị hỏng trong quá trình cài đặt ở mức 1%, thậm chí còn chưa khởi động.
Nếu RAM tốt và bạn bị hỏng khi không cài đặt trình điều khiển GPU hoặc trong quá trình cài đặt Windows, bạn có thể gặp phải một trong hai trường hợp sau:

  • GPU sắp hỏng
  • Bo mạch chủ lỗi
  • Lỗi CPU
Lỗi cuối cùng là hiếm gặp và tôi mong đợi những thứ khác sẽ xảy ra sai sót nếu GPU bị lỗi khi không cài đặt trình điều khiển. Vì vậy, hãy dựa vào bo mạch chủ.

Về nhiệt độ, như tôi đã nói, theo như tôi biết, nhiệt độ 5 được cho là VBAT, tức là pin CR2032 nhỏ và tôi nghi ngờ có thể là cảm biến bị hỏng, vì nó liên tục nhảy giữa 25-120 độ C trong tích tắc rồi lại giảm xuống. Tôi nghĩ là không thể có những biến động như vậy trong PC.

Tôi nghi ngờ rằng thực ra có thể là MOBO đang gặp vấn đề.
Lưu ý rằng tất cả các cảm biến nhiệt độ không thực sự đo nhiệt độ, mà là điện áp/dòng điện mà về mặt lý thuyết phải ánh xạ tới nhiệt độ. Nếu các biến động thường xuyên như vậy, điều đó sẽ chỉ ra rằng cảm biến bị lỗi hoặc có điều gì đó *thực sự* không ổn đang diễn ra.

Hiện tại, tôi cá là bo mạch chủ đang hỏng, nhưng có lẽ sẽ đơn giản hơn nếu bạn thử nghiệm bằng một GPU khác nếu bạn có. Chết tiệt, vì mục đích thử nghiệm, nếu bạn có GPU tích hợp, hãy thử cài đặt Windows bằng GPU đó (tháo GPU kia ra) chỉ để loại trừ GPU.
 
Xin chào!

Sau khi kiểm tra từng thành phần riêng lẻ, hóa ra CPU của tôi đã hỏng. Tôi chưa bao giờ ép xung, chưa bao giờ nghịch nó, đã cập nhật bất kỳ thứ gì của Intel mà trung tâm Asus cung cấp. Không biết có liên quan đến các vấn đề chung của thế hệ(các thế hệ) hay chỉ là một điều không may.

Dù bằng cách nào, nếu bất kỳ ai gặp lỗi này và thông số kỹ thuật của bạn tương tự, hãy thử CPU trước nếu bạn có thể.
Anh chàng tội nghiệp ở cửa hàng dịch vụ đã thử mọi cách cho đến khi cuối cùng nó rơi vào CPU.

Liên quan đến nhận xét của anh gamerk316, một quan sát thú vị được đưa ra trong cửa hàng sửa chữa (tôi không biết cách trích dẫn ở đây, hãy tha thứ cho tôi vì điều đó):
Với 3060 của tôi, cài đặt windows 11 pro tiêu chuẩn bị đóng băng ở mức 1% trong một xu. Với gpu thử nghiệm yếu hơn của cửa hàng, nó thậm chí đã trải qua quá trình cài đặt một lần, nhưng không thành công trước giai đoạn khởi động ban đầu. Chuyển sang một thanh ram ddr5 chung chung, không thấy sự khác biệt đáng kể nào.
Chúng tôi cũng đã thử nghiệm nó trên một chiếc MSI Z790 Tomahawk hoàn toàn mới, với mọi thành phần khác được thay thế, kết quả vẫn như vậy, không thể cài đặt được windows.
Ngoài ra, khi xem nhiệt độ VBAT, điện áp là 3,168V ổn định như đá mà không di chuyển. Vậy thì có điều gì đó kỳ lạ thực sự xảy ra với điều đó. Tôi đoán rằng sau cùng thì nó có thể được quy cho bộ xử lý.

Sẽ cập nhật thêm một lần nữa khi CPU mới của tôi đến. Mọi thứ khác sẽ ổn thỏa.

Cảm ơn bạn đã chia sẻ mọi hiểu biết sâu sắc của mình!
 
Back
Bên trên