Hỏi / Đáp Sự cố ngẫu nhiên, không hiển thị sau khi khởi động lại, khả năng VRAM/trình điều khiển không ổn định?

CiaranM578

New member
Tôi đã mua một chiếc MSI RTX 3080 Ti Trio đã qua sử dụng trên eBay từ một người bán có uy tín cách đây vài tháng, card còn rất mới và hoạt động tốt, không gặp vấn đề gì cho đến vài ngày trước. Khi đang chơi thì gặp lỗi đầu tiên, màn hình nhấp nháy, màn hình đen, khởi động lại vào windows, điều này xảy ra vài lần sau khi thử lại trò chơi, cho đến khi cuối cùng sau khi gặp lỗi, nó vẫn tắt và không hiển thị. Đặt GPU khác vào hệ thống để khởi động ở chế độ an toàn và gỡ cài đặt trình điều khiển bằng ddu trước khi lắp lại card gốc và cài đặt trình điều khiển mới.

GPU ban đầu hoạt động sau khi cài đặt lại trình điều khiển, chơi game trong vài giờ và ổn định ở chế độ nhàn rỗi. Sau khi tắt PC trong khoảng 20 giờ, tôi bắt đầu một trò chơi và quay lại thì thấy hệ thống đã bị sập. Khi khởi động lại, không có màn hình hiển thị nào xuất ra và quá trình thử nghiệm đã xác nhận sự cố chỉ xảy ra với GPU (bo mạch chủ, PSU và các thành phần khác đã được loại trừ khi sử dụng GPU khác).

Lần thử cài đặt lại trình điều khiển thứ 2 sau khi thực hiện xóa sạch bằng DDU (ở Chế độ an toàn) dẫn đến màn hình xanh trong quá trình cài đặt, với lỗi: "Đã thử ghi vào phân đoạn chỉ đọc". Sau khi gặp sự cố, hệ thống khởi động lại mà không hiển thị. Lần thử thứ 3 để dọn dẹp và cài đặt lại trình điều khiển không có vấn đề gì (lưu ý lần đầu tiên tôi cài đặt lại trình điều khiển mới nhất nên lần này tôi thử với trình điều khiển cũ hơn một chút) nhưng tất nhiên khi đưa vào thử nghiệm ứng suất trong furmark thì hệ thống bị sập. Ngoài ra, sau khi cài đặt MemTestG80, các hiện tượng như nhấp nháy và hình vuông đen xuất hiện trong giây lát khi hệ thống ở chế độ nhàn rỗi (thậm chí memtestg80 chưa được mở lần đầu tiên), ngay cả khi không cài đặt trình điều khiển.

* Đã kiểm tra GPU trên một màn hình và thiết lập cáp khác: vẫn không có đầu ra hiển thị.
* Một GPU khác hoạt động hoàn hảo trong cùng một hệ thống, loại trừ các sự cố với bo mạch chủ, PSU hoặc màn hình.
Chẩn đoán trình điều khiển:
* Trình điều khiển NVIDIA đã được cài đặt thành công sau khi gỡ bỏ sạch sẽ qua DDU, nhưng sự cố vẫn tiếp diễn trong quá trình ứng suất hoặc thử nghiệm.
Chẩn đoán VRAM:
* Đã chạy MemTestG80 để kiểm tra VRAM nhưng gặp phải sự cố và đóng ứng dụng trong quá trình thử nghiệm.
* Các hiện tượng (nhấp nháy, ô vuông đen) cho thấy khả năng mất ổn định VRAM hoặc lỗi ở cấp độ phần cứng.
Giám sát hệ thống/nguồn điện:
* Nguồn điện cung cấp cho GPU được giám sát thông qua MSI Afterburner trong giai đoạn ổn định; không phát hiện bất thường nào.
* Nhiệt độ nằm trong phạm vi hoạt động an toàn khi tải (không có dấu hiệu quá nhiệt hoặc điều tiết).
Độ ổn định của RAM và CPU:
* RAM hệ thống đã vượt qua MemTest86 mà không có vấn đề gì.
* Không có dấu hiệu mất ổn định liên quan đến CPU hoặc vấn đề nhiệt.
Bạn có biết điều gì đang xảy ra ở đây không? Card khá đắt tiền mà tôi lại gặp lỗi…


Ps. Một số thông tin bổ sung khi phân tích bản dump trong who crashes, nó hiển thị lỗi trình điều khiển nvidia kernel.

Cảm ơn!
 
CẬP NHẬT: Tôi nhận thấy card thực sự bị võng đáng kể, tôi đã mua một giá đỡ GPU có thước thủy mini và nó cho thấy bị võng nghiêm trọng… Tôi đã lắp giá đỡ để GPU cân bằng hoàn hảo và giờ tôi đã chạy thành công nhiều bài kiểm tra furmark ở 4k mà không gặp vấn đề gì! Đối với bất kỳ ai gặp vấn đề tương tự như trên, tôi thực sự khuyên bạn nên kiểm tra bằng thước thủy/thước kẻ.
 
Bạn có thể thử ép xung bộ nhớ để xem nó có cải thiện không, nhưng nếu một trong các chip bị lỗi thì không có nhiều việc phải làm.

Chỉ vì một số cảm biến GPU trả về nhiệt độ tốt không có nghĩa là mọi thứ đều tốt. Có thể đáng để tháo rời card và đảm bảo rằng tất cả bộ nhớ đều tiếp xúc tốt với miếng tản nhiệt, làm lại keo.

Kiểm tra trực quan để tìm vết nứt PCB và những thứ tương tự.

Bạn có thể sửa chữa được, nhưng sẽ tốn vài trăm đô la nếu bạn thấy xứng đáng.
 
Khi đăng một chủ đề về bản chất khắc phục sự cố, thông thường bạn nên bao gồm thông số kỹ thuật đầy đủ của hệ thống. Vui lòng liệt kê thông số kỹ thuật cho bản dựng của bạn như sau:
CPU:
Bộ làm mát CPU:
Bo mạch chủ:
Ram:
SSD/HDD:
GPU:
PSU:
Khung máy:
HĐH:
Màn hình:
bao gồm tuổi của PSU ngoài nhãn hiệu và kiểu máy. Phiên bản BIOS cho bo mạch chủ của bạn tại thời điểm này.

Khi khởi động lại, không có đầu ra hiển thị và thử nghiệm đã xác nhận sự cố chỉ xảy ra với GPU (bo mạch chủ, PSU và các thành phần khác đã được loại trừ khi sử dụng GPU khác).
Có thể muốn đề cập đến GPU được sử dụng để khắc phục sự cố cho hệ thống của bạn. Xin lưu ý rằng hệ thống được trang bị RTX3080Ti sẽ cần PSU 850W+ do các đột biến tải tạm thời.

Bạn có biết điều gì đang xảy ra ở đây không? Một chiếc thẻ khá đắt mà lại không dùng được với tôi…
Có thể là chiếc thẻ đã hỏng sau khi nằm trong tay người khác trước khi bạn mua
 
Bạn có thể thử ép xung bộ nhớ để xem nó có cải thiện không, nhưng nếu một trong các chip bị lỗi thì không có nhiều việc để làm.

Chỉ vì một số cảm biến GPU trả về nhiệt độ tốt không có nghĩa là mọi thứ đều tốt. Có thể đáng để tháo rời card và đảm bảo rằng tất cả bộ nhớ đều tiếp xúc tốt với miếng tản nhiệt, làm lại keo dán.

Kiểm tra trực quan để tìm vết nứt PCB và những thứ tương tự.

Bạn có thể sửa chữa được, nhưng sẽ tốn vài trăm nếu bạn thấy xứng đáng.
Tôi chưa thử ép xung bộ nhớ, sẽ thử hôm nay, cảm ơn. Nếu tất cả các cách trên đều không hiệu quả, có lẽ tôi sẽ chỉ trả tiền sửa chữa vì vài trăm còn hơn phải trả hơn 600 đô la cho một cái mới…
 
Khi đăng một chủ đề về bản chất khắc phục sự cố, thông thường bạn phải bao gồm thông số kỹ thuật đầy đủ của hệ thống. Vui lòng liệt kê thông số kỹ thuật cho bản dựng của bạn như sau:
CPU:
Bộ làm mát CPU:
Bo mạch chủ:
Ram:
SSD/HDD:
GPU:
PSU:
Khung máy:
Hệ điều hành:
Màn hình:
bao gồm tuổi của PSU ngoài nhãn hiệu và kiểu máy. Phiên bản BIOS cho bo mạch chủ của bạn tại thời điểm này.

Khi khởi động lại, không có đầu ra hiển thị và thử nghiệm đã xác nhận sự cố chỉ xảy ra với GPU (bo mạch chủ, PSU và các thành phần khác đã được loại trừ khi sử dụng GPU khác).
Cũng có thể muốn đề cập đến GPU được sử dụng để khắc phục sự cố hệ thống của bạn. Xin lưu ý rằng hệ thống được trang bị RTX3080Ti sẽ cần PSU 850W+ do các đột biến tải tạm thời.

Bạn có biết điều gì đang xảy ra ở đây không? Card khá đắt mà lại hỏng đối với tôi...
Có thể card đã hỏng sau khi nằm trong tay người khác trước khi bạn mua
Thông số kỹ thuật PC

Mobo: Gigabyte B450M DS3H
CPU: Ryzen 5 3600
GPU: MSI RTX 3080 Ti Trio
RAM: 16GB
PSU: Seasonic g80 750w (hoàn toàn mới)

GPU dự phòng là GTX 1050 Ti
 
Khi khởi động lại, không có đầu ra hiển thị nào và thử nghiệm đã xác nhận sự cố chỉ xảy ra với GPU (bo mạch chủ, PSU và các thành phần khác đã được loại trừ khi sử dụng GPU khác).
Cũng có thể muốn đề cập đến GPU được sử dụng để khắc phục sự cố cho hệ thống của bạn. Xin lưu ý rằng hệ thống được trang bị RTX3080Ti sẽ cần PSU 850W+ do các đột biến tải tạm thời.

Bạn có biết điều gì đang xảy ra ở đây không? Card khá đắt mà lại hỏng đối với tôi…
Có thể card đã hỏng sau khi nằm trong tay người khác trước khi bạn mua
Tôi định nói rằng RTX 3080Ti sẽ cần bộ nguồn 850W ATX 3.0 hoặc 1000W ATX 2.0 cho các xung tải tạm thời.
 
Tôi định nói rằng RTX 3080Ti sẽ cần PSU 850W ATX 3.0 hoặc 1000W ATX 2.0 cho các xung tải tạm thời.
Nguồn điện chắc chắn có thể là một vấn đề… mặc dù thực tế là nó hoạt động trong thời gian dài mà không có bất kỳ vấn đề nào có vẻ lạ trong trường hợp đó.. ryzen 5 cũng không cần quá nhiều điện năng nên bạn sẽ nghĩ rằng nó sẽ để lại đủ cho gpu nhưng vẫn có thể, trực tuyến nói rằng 750 sẽ tốt cho combo này nhưng như bạn đã nói, xung tải có thể yêu cầu hơn.
 
Bạn đang cố chạy một chiếc 3080Ti tùy chỉnh trên PSU 750w, theo kinh nghiệm cá nhân của tôi, tôi có thể nói với bạn rằng - điều này sẽ không hiệu quả.

Khi tôi mua 3080Ti Aorus Master, tôi cũng chạy nó trên PSU Sensonic Prime 750w, đây là PSU cao cấp nhất vào thời điểm đó. 99% thời gian nó chạy ổn, nhưng có một trò chơi cụ thể trong một cảnh cụ thể mà tôi gặp sự cố sập trong khoảng 90% trường hợp.

Sau khi nâng cấp PSU lên 1000w, điều này không bao giờ xảy ra nữa. Tôi chắc chắn rằng bạn đã gặp phải sự cố chính xác này, khi cuối cùng bạn tìm thấy một trò chơi mà vì lý do nào đó, điện áp tăng đột biến và dẫn đến sự cố sập nghiêm trọng đòi hỏi phải khởi động lại.
 
Chỉ là một bản cập nhật, tôi đã cố gắng giữ cho card đủ ổn định trong thời gian dài để giảm điện áp dưới xung nhịp và cố gắng giảm mức sử dụng điện năng, nhưng khi cố gắng chạy thử nghiệm ứng suất (furmark), thật không may là nó bị sập sau vài giây…
 
Furmark khá là khắc nghiệt, tôi sẽ thử một trò chơi hoặc một chuẩn mực đơn giản hơn để xem nó có ổn định trong điều kiện bình thường hơn không. Nếu nguồn điện là vấn đề thì điều đó có nghĩa là phải mua hoặc mượn PSU, hoặc phải kiểm tra GPU ở nơi khác.

Đối với những điều trên, các PSU PRIME có sẵn trước khi ra mắt dòng 30 đã được biết đến là có vấn đề về đột biến điện áp, về cơ bản là lý do tại sao ATX 3.0/3.1 được tạo ra vì ngay cả nhiều PSU cao cấp cũ hơn vẫn sẽ kích hoạt bảo vệ quá dòng với các card dòng 30.
 
CẬP NHẬT: Tôi nhận thấy card thực sự bị võng đáng kể, tôi đã mua một giá đỡ GPU có thước thủy mini và nó cho thấy bị võng nghiêm trọng… Tôi đã lắp giá đỡ để GPU cân bằng hoàn hảo và giờ tôi đã chạy thành công nhiều bài kiểm tra furmark ở 4k mà không gặp vấn đề gì! Đối với bất kỳ ai gặp vấn đề tương tự như trên, tôi thực sự khuyên bạn nên kiểm tra bằng thước thủy/thước kẻ.
 
Back
Bên trên