3 GPU trong 2 năm, có thứ gì đó trong máy tính của tôi làm hỏng chúng?

VOEW

New member
Tôi muốn bắt đầu bằng cách nói rằng tôi không thực sự rành về máy tính, nhưng tôi sẽ cố gắng hết sức để liệt kê mọi thứ rõ ràng nhất có thể. Tôi đoán là tôi cần bắt đầu từ đầu, khoảng năm 2022, tôi đã mua một chiếc PC dựng sẵn từ NZXT. Tôi đã thay đổi ram và bộ nhớ, nhưng tất cả các thành phần khác được liệt kê bên dưới (bên cạnh GPU vì những lý do hiển nhiên) đều là những gì ban đầu đi kèm và hiện vẫn được cài đặt:
AMD Ryzen 9 5900X 12 nhân
NVIDIA GeForce RTX 3080 - GIGABYTE
Gigabyte X570S Aorus Master Wi-Fi
Team T-FORCE XTREEM ARGB 4000MHz DDR4 - 16 GB x 4
EVGA SuperNOVA 1000W G5 Gold
ổ đĩa khởi động 1TB Samsung SSD
và bộ làm mát là NZXT Kraken X73

Mọi thứ hoàn toàn ổn trong khoảng một năm, không có vấn đề gì mà tôi có thể nhớ lại. Tôi đã chơi War Thunder được 3 giờ ở cài đặt tối đa, khi PC của tôi dường như đã làm những gì tôi sẽ gọi là "tắt máy một phần". Tại sao lại tắt máy một phần? Bởi vì PSU và Bo mạch chủ dường như vẫn đang bật. GPU và tất cả các quạt của vỏ máy đều tắt. Để khắc phục, tất cả những gì tôi phải làm là tắt PSU và bật lại.

Điều này lại xảy ra 3 ngày sau đó, cùng một trò chơi. Sau đó bắt đầu xảy ra cứ sau 2 ngày, cùng một trò chơi. Sau đó, nó xảy ra 2 ngày sau đó trên một trò chơi khác. Đây là lúc nó báo động với tôi, rõ ràng là sự cố không phải do trò chơi gây ra, mà thay vào đó là do một thứ gì đó ở PC. Sự cố bắt đầu xảy ra ngay cả khi không có trò chơi nào đang chạy, mỗi ngày một lần. Mở YouTube hoặc thậm chí không có bất kỳ ứng dụng nào. Vào thời điểm này, đôi khi nó cũng sẽ hiển thị đầy đủ, với mọi thứ đều tắt hoàn toàn. Có vẻ như khả năng nó sẽ tắt hoàn toàn hay một phần là khoảng 50/50.

Khi bạn tìm kiếm trên Google về việc tắt ngẫu nhiên, vấn đề chính là quá nhiệt. Tôi chưa bao giờ thấy CPU của mình vượt quá 65 và GPU vượt quá 70. Tôi đã thực hiện bài kiểm tra ứng suất tối đa 100% trên máy tính trong 8 giờ hai lần và không bao giờ gặp sự cố. Tôi cũng đã tiến hành các bài kiểm tra ứng suất riêng lẻ của GPU, CPU, PSU, UPS và Ram. Với tôi, điều này chứng minh rằng đó không phải là vấn đề về nhiệt độ hoặc một thành phần bị hỏng do sử dụng ở mức tối đa

Nguyên nhân lớn thứ 2 gây ra tình trạng tắt máy mà tôi từng nghe là về nguồn điện. Hệ thống của tôi thường tiêu thụ khoảng 450 watt và không bao giờ thực sự vượt quá 650 watt. PSU là 1000W và được cắm vào UPS 1200. Tôi đã chạy toàn bộ bản dựng chỉ với pin của UPS. Điều này cho thấy rằng nguồn điện không phải là vấn đề đáng lo ngại.

Việc tắt máy bắt đầu xảy ra sau mỗi vài giờ, sau đó là mỗi giờ, rồi mỗi nửa giờ. Bạn có thể thấy điều này sẽ đi đến đâu. Nó đã đến mức cứ sau vài phút lại xảy ra một lần. Sau đó, nó tắt máy trước khi tôi thậm chí có thể đăng nhập. Điều này dường như "đặt lại" vấn đề. Với việc tắt máy xảy ra sau mỗi 3 ngày hoặc lâu hơn và giảm dần theo thời gian. Mẫu hình trở nên rõ ràng đến khó tin.


Những gì tôi đã làm để cố gắng giải quyết vấn đề

Về phần mềm:
-Cập nhật mọi thứ lên trình điều khiển mới nhất
-Hạ cấp xuống trình điều khiển cũ hơn
-Đặt lại BIOS
-Cập nhật BIOS
-Cài đặt lại Windows sạch

Về vật lý:
-Rút từng thiết bị ngoại vi một (rút một thiết bị khác nhau sau mỗi lần tắt máy)
-Rút tất cả các thiết bị ngoại vi (bao gồm cả chuột và bàn phím)
-Ngắt kết nối tất cả các thiết bị ngoại vi VÀ màn hình sau khi đăng nhập
-Đặt lại CMOS trên bo mạch chủ
-Cắm PSU vào các ổ cắm khác nhau, cũng như các ổ cắm ở các tòa nhà khác nhau

Không có gì hiệu quả. Do Bo mạch chủ và PSU vẫn bật trong quá trình "tắt máy một phần", tôi kết luận rằng GPU có lỗi. Vì vậy, tôi đã sử dụng nó như một cái cớ để nâng cấp


GPU thứ 2

Tôi đã mua một chiếc MSI 4080 hoàn toàn mới từ amazon, cũng như các loại cáp phù hợp để nó hoạt động với PSU thế hệ trước của tôi. Hiệu suất tốt hơn nhiều, nhưng quan trọng hơn là vấn đề dường như đã được giải quyết hoàn toàn

Chuyển tiếp nhanh 4 tháng...

Tắt máy ngẫu nhiên, ôi không. vấn đề đã quay trở lại và nó tuân theo cùng một mô hình chính xác. Theo như tôi biết, không có gì liên quan đến hiệu suất có vẻ như gây ra nó. Bây giờ, tôi đã biết chuyện này sẽ diễn ra như thế nào. Chiếc GPU tương đối mới này vẫn còn trong thời gian bảo hành, vì vậy tôi sẽ gửi nó đến RNA. Tôi không đủ khả năng để có máy tính của mình trong nhiều tuần, hoặc thậm chí nhiều tháng để xử lý vấn đề đó. Vì vậy, tôi đã mua một GPU khác


GPU thứ 3


Tôi đã mua một chiếc XLR8 4080 khác từ amazon. Rẻ hơn 400$ so với MSI, và hiệu năng thì tệ hơn đáng kể, nhưng ai quan tâm, vì PC đã chạy lại.

Điều này kéo dài một tháng? có thể là 2 tháng là cùng.

Máy tính của tôi đột nhiên tắt YouTube hai ngày trước. Vấn đề đã quay trở lại, nó cũng nhắc tôi rằng thực ra tôi đã quên gửi GPU MSI cho RMA, vì vậy tôi đang chuẩn bị thực hiện việc đó ngay bây giờ. Bây giờ tôi đã nhận thấy trước khi những lần tắt máy này thực sự xuất hiện. Mọi thứ chậm hơn. Nhưng không phải về mặt hiệu suất, hoặc ít nhất là không phải những lần tôi có thể phát hiện ra. Tôi biết điều đó không có nhiều ý nghĩa, nhưng tôi sẽ cố gắng giải thích theo cách tốt nhất có thể. Việc tải vào trò chơi đã mất 2 giây, 4 giây, 10 giây, sau đó sự cố tắt máy xuất hiện. Hình thu nhỏ trên video YouTube sẽ mất nhiều thời gian hơn để tải khi tôi cuộn xuống trang. Không có sự cố nào trong số này liên quan đến internet.

Nhưng hiệu suất của tôi trong các trò chơi thực tế không thay đổi, vẫn như vậy về tải, nhiệt độ và FPS. Đăng nhập trên máy tính cũng chậm hơn. Khi bật nguồn, màn hình đầu tiên sẽ hiển thị thông tin đăng nhập của tôi với bộ lọc tối khoảng 30%, trước khi chuyển sang chế độ xem bình thường sau 1-2 giây, cho thấy rằng nó đang gặp khó khăn khi tải trong màn hình đăng nhập? Tôi không chắc. Nhưng nhìn chung mọi thứ có vẻ chậm hơn, mặc dù hiệu suất trong các ứng dụng dường như không bị ảnh hưởng gì cả.

Lịch sử sự kiện hiển thị những lần tắt máy này là "Đã xảy ra tắt máy bất ngờ" và không bao giờ chỉ ra bất kỳ hướng nào. Ngay cả Lịch sử cũng hiển thị nhiều lỗi nghiêm trọng, nhưng một lần nữa, tất cả đều là do tắt máy bất ngờ ngẫu nhiên, được phân loại là "Đã ngừng hoạt động" hoặc "Đã ngừng phản hồi và đã đóng". Hệ thống không bao giờ nêu rõ hơn "một sự cố đã ngăn chương trình này tương tác với Windows". Theo như tôi biết, tất cả các lỗi này chỉ đơn giản là do tắt máy ngẫu nhiên gây ra, không có gì có thể xác định được nguyên nhân thực sự của chính việc tắt máy.

Tôi đã cố gắng khắc phục sự cố này và rõ ràng là việc mua GPU mới thậm chí không còn là giải pháp băng tần nữa. Giả thuyết mới của tôi là nó liên quan đến bo mạch chủ. Tại sao vậy? vì đó là thứ mà GPU được kết nối trực tiếp, và bản dựng của tôi đã dần dần xuống cấp một chiếc 3080 và 2 chiếc 4080 hoàn toàn tốt. Tôi không có hệ thống hoặc người bạn nào khác có bản dựng có thể kiểm tra GPU hoặc thực sự là các thành phần của tôi trong cả hai trường hợp. Có điều gì đó đang xảy ra mà không có phần mềm tích hợp hoặc của bên thứ ba nào phát hiện ra. Đối với tôi, điều đó có nghĩa là có lỗi ở một thành phần phần cứng mà phần mềm không thể phát hiện ra. Tôi sẽ rất biết ơn nếu có bất kỳ loại hỗ trợ nào có thể được cung cấp. Tôi thực sự đã chạm đáy về khả năng giải quyết vấn đề này của mình,

Đây là hai hình ảnh cũ về các lần tắt máy được ghi lại:

 
Số lượng lỗi ngày càng tăng và/hoặc các lỗi khác nhau khiến PSU trở thành nghi phạm chính.

Bạn đã đề cập đến việc thử nghiệm PSU: PSU được thử nghiệm như thế nào?

Bạn có đồng hồ vạn năng và biết cách sử dụng nó không. Hoặc biết ai đó làm như vậy không?

FYI:

https://www.lifewire.com/how-to-manually-test-a-power-supply-with-a-multimeter-2626158

Không phải là bài kiểm tra đầy đủ vì PSU không chịu tải. Tuy nhiên, bất kỳ điện áp nào vượt quá mức dung sai đều chỉ ra PSU đang gặp trục trặc/hỏng.

Có cách nào để mượn một PSU khác đang hoạt động để lắp vào bản dựng của bạn không? (Nhớ chỉ sử dụng cáp đi kèm với bất kỳ PSU nào.)

Ngoài ra (sửa đổi muộn) hãy xem các lỗi thông tin đó nữa - có thể là do một số hành động của bạn hoặc do một số ứng dụng.

https://learn.microsoft.com/en-us/t...erformance/incorrect-shutdown-reason-code-sel

Tìm kiếm các mã lỗi khác trên Google và tìm kiếm một số yếu tố chung.
 
Tôi sẽ xem xét mua một PSU mới. Tôi không có đồng hồ vạn năng, cũng không biết cách sử dụng. Tôi cũng không thể mượn PSU của bất kỳ ai.

Theo tôi biết thì PSU khá rẻ, nên tôi sẽ mua nó. Trường hợp xấu nhất là tôi chỉ mua một PSU hoàn toàn mới, trường hợp tốt nhất là nó khắc phục được sự cố.

Tôi cũng sẽ xem xét thêm một chút về mã lỗi. Cảm ơn bạn
 
Số lượng lỗi ngày càng tăng và/hoặc các lỗi khác nhau khiến PSU trở thành nghi phạm chính.
Tôi vẫn không hiểu làm thế nào việc thay thế GPU có thể tạm thời khắc phục được sự cố này, giả sử lỗi là do PSU? Đặc biệt là lần đầu tiên tôi đổi 3080 sang 4080, loại này có mức tiêu thụ điện năng cao hơn nhưng lại khắc phục được vấn đề tắt máy ngay lập tức và phải mất vài tháng sau mới khắc phục được.
 
Bất cứ điều gì xảy ra đều không phải là thảm họa.

GPU bị lỗi/chết chậm.

Và trở nên có vấn đề hơn vào gần cuối.....
 
Cập nhật nhanh. Đã mua và lắp đặt PSU mới, cùng model như trước. Cho đến nay không có vấn đề gì. Giả sử không có gì xảy ra trong tuần tới hoặc lâu hơn, tôi tin rằng có thể cho rằng PSU là vấn đề
 
Đã tìm thấy bài đánh giá về bộ nguồn đó.

https://www.tomshardware.com/reviews/evga-supernova-1000-g5-power-supply,6337.html

Có vẻ như họ cảm thấy g5 kém hơn g3 một chút.

Chúc bạn may mắn. Có thể chỉ cần mua thêm bảo hành cho bất kỳ card nào bạn lắp và theo dõi cách bộ nguồn mới hoạt động.
Bạn có thực sự nghĩ rằng các nhà sản xuất card màn hình không biết vấn đề về bộ nguồn khi họ nhìn thấy nó không? Việc mua bảo hành mở rộng chỉ là lãng phí tiền bạc khi nó bị vô hiệu do nguồn điện kém.
 
Tôi muốn nghĩ rằng EVGA sản xuất các đơn vị tốt nhưng có rất nhiều nguồn cung cấp điện ngoài trời và có chất lượng khác nhau. Tôi nghĩ nếu tôi sản xuất GPU hoặc bất kỳ thiết bị nào khác, có thể sẽ khó để kiểm tra tất cả chúng. Bạn có rất nhiều thương hiệu nước ngoài và nhiều thương hiệu khác nhau có thể hầu như không được biết đến. Vì vậy, tôi hình dung các nhà sản xuất phần cứng phải tin rằng các đơn vị đang đáp ứng các tiêu chuẩn. Hãy xem tại đây. Điều này có thể đã lỗi thời nhưng sẽ cung cấp ý tưởng về chất lượng của các đơn vị khác nhau. Tôi nghĩ rằng nói chung bạn không muốn thấp hơn cấp C nhưng tất nhiên cao hơn thì tốt hơn. Tôi có thể nói rằng tôi đã thử các thành phần với nguồn cung cấp điện giá rẻ trong thời gian của mình nên chắc chắn là quan trọng để có được một cái tốt. Hy vọng là đơn vị bạn vừa nhận được là một đơn vị tốt. Tôi nghĩ nó có thể là cấp B. Nhưng hiện tại tôi cũng đang dùng điện thoại.



psutierlist.jpg

Danh sách phân loại PSU phiên bản 17.0g - Cultists Network

Danh sách phân loại PSU sẽ giúp bạn chọn được PSU tốt nhất trong số hàng trăm mẫu trên thị trường. Từ nguồn điện giá rẻ đến cao cấp nhất.
cropped-Artboard_1-32x32.png

cultists.network
Nhưng các nhà sản xuất card có thể biết, tùy thuộc vào bằng chứng. Không chắc bạn lấy linh kiện ở đâu nhưng nếu bạn ở Hoa Kỳ và mua sắm tại một trung tâm vi mô, chế độ bảo hành tại cửa hàng của họ từng khá tốt. Tôi đã xây dựng lại toàn bộ hệ thống bằng các linh kiện từ chế độ bảo hành mà tôi mua thông qua họ với giá gần như không mất tiền túi. Tôi nghĩ tôi đã phải mua lại chế độ bảo hành nhưng chắc chắn là xứng đáng.
 
Không có lần tắt máy nào kể từ khi thay thế PSU. Tôi nghĩ điều này kết luận rằng PSU ban đầu có thể bị lỗi. Chỉ muốn đưa ra bản cập nhật (hy vọng là) cuối cùng để kết thúc bài đăng này
 
Back
Bên trên