Hỏi / Đáp Máy tính bị sập. Có cách nào hiệu quả hơn để chẩn đoán sự cố không?

dgordo11

New member
Thông số kỹ thuật
GPU: EVGA RTX 3080 XC3 Ultra Gaming (2020)
CPU: Ryzen 7 5800x (2021)
Bộ làm mát: Arctic Liquid Freezer II 280 AIO (2020)
MOBO: ASUS ROG X570 Crosshair VIII Hero WiFi. (2021)
RAM: 2x8GB G.Skill TridentZ RGB DDR4-3200 14 CAS (2020)
PSU: ASUS ROG Strix 750w 80 Plus Gold (2022)
Ổ đĩa Windows: 2TB: Crucial MX500 SSD (2019)
Ổ cứng: Seagate Barracuda 4TB 5400RPM (2021)
Màn hình 1: Acer Predator XB271HU bmiprz 27" 1440p 144hz. (2019)
Màn hình 2: LG 27UL500-W 27" 4K 60hz (2019)
HĐH: Windows 10

Trước đây đã cài đặt windows trên ổ đĩa NVMe m.2 Sabrent 1TB rocket. (2020)
Trước đây đã sử dụng Seasonic Focus+ 750W (2019)

Cung cấp đầy đủ các vấn đề với thứ chết tiệt này trong vài năm qua. Vào tháng 11 năm 2022, tôi bắt đầu gặp sự cố nghiêm trọng khi PC tự khởi động lại. Không thấy màn hình xanh nào và không tạo được Minidump nào. Cuối cùng, tôi đã mua một PSU thay thế và điều đó dường như đã khắc phục được mọi thứ trong một thời gian. Sau đó, vào tháng 3 năm ngoái, tôi lại bắt đầu gặp sự cố sập máy. Lần này ít nhất là liên quan đến BSOD. Vẫn không có tệp Minidump nào. Thấy mọi người nói rằng có thể là do ổ m.2 bị lỗi nên tôi đã thử nghiệm và cài đặt sạch Windows vào ổ M.2 mà tôi đã sử dụng làm ổ khởi động trong một thời gian dài. Sự cố vẫn tiếp diễn. Tháo ổ m.2 và cài đặt sạch vào ổ SSD của tôi và sự cố đã dừng lại. Vì vậy, tôi đã mua một ổ m.2 mới nhưng tôi quá lười để thực sự cài đặt Windows sạch khác và cắm ổ m.2 mới vào.

Bây giờ, trong vài tuần trở lại đây, tôi lại gặp sự cố với PC của mình khi chơi game. Màn hình đen, âm thanh tiếp tục phát trong vài giây trước khi ngắt và PC khởi động lại. Ít nhất thì nó cũng tạo ra các bản sao lưu nhỏ mà bạn có thể thấy bên dưới. Tôi chỉ chạy 2 bản qua windowsdbg, nhưng cả hai đều báo lỗi khá giống nhau. Lỗi TDR video. Khi tôi chơi Skyrim trên đó, hầu như mọi thứ đều ổn. Nó bị sập một vài lần khi tôi chạy ở chế độ cửa sổ không viền toàn màn hình ở độ phân giải 4k. Nhưng nó chạy ở chế độ toàn màn hình 4K cũng như chế độ toàn màn hình hoặc cửa sổ không viền trên màn hình 1440p của tôi cũng tốt. Hell Let Loose thậm chí còn không vào được menu chính trước khi sập. Alien Isolation bị sập trong vòng 5 phút sau khi chơi. 3D Mark Timespy Extreme bị sập ngay khi tôi nhấn chạy thử nghiệm.

Tôi đã thử lắp lại GPU và mọi thứ hoạt động hoàn hảo sau đó. Tôi đã có thể chơi Alien trong nhiều giờ và hoàn thành trò chơi đó. Tôi đã chơi hết một trận trên Hell Let Loose. Chạy hết 20 vòng trên Timespy Extreme mà không có vấn đề gì. Mua Kingdom Come Deliverance và chơi trong khoảng một giờ mà không có vấn đề gì. Tôi tạm dừng trò chơi và bước ra xa một lúc rồi quay lại sau một lúc. Màn hình đã chuyển sang chế độ ngủ nên tôi lắc chuột và đeo tai nghe. Vẫn còn âm thanh phát ra từ trò chơi. Màn hình dường như không thức dậy và sau vài giây, âm thanh bị cắt trong tai nghe và PC của tôi tự khởi động lại. Tôi khởi động lại trò chơi và chơi được khoảng 5 hoặc 10 phút trước khi màn hình đen và khởi động lại lần nữa. Đã thử tắt hoàn toàn và khởi động lại thay vì chỉ khởi động lại để xem điều đó có hiệu quả gì không. Sau đó, trò chơi thậm chí không vào được menu chính trước khi bị sập.

Tôi sẽ thử cài đặt lại Windows vào tối nay và xem điều đó có tác dụng gì. Nếu vẫn gặp sự cố, tôi có một người bạn đã đề nghị mang chiếc Super 2070 của anh ấy đến để thử nghiệm. Tuy nhiên, tôi không biết phải làm sao. Có thực sự không có cách nào để tìm ra đây là sự cố phần mềm hay phần cứng (cũng như phần cứng nào bị lỗi) ngoài việc chỉ cần hoán đổi các bộ phận để xem có bộ phận nào bị hỏng không? Chưa kể đến việc dựa trên kịch bản trước đó là chơi game bình thường trong nhiều ngày rồi lại quay lại gặp sự cố sập máy - khiến tôi không thể biết được liệu việc mượn GPU của bạn tôi trong vài giờ có cho tôi biết điều gì không.

Có bình thường không khi gặp nhiều sự cố như vậy chỉ trong 3 năm với một chiếc PC. Điều này thật điên rồ.

******************************************************************************

* *

* Phân tích kiểm tra lỗi *

* *

***************************************************************************************

VIDEO_TDR_FAILURE (116)

Cố gắng đặt lại trình điều khiển hiển thị và khôi phục sau thời gian chờ không thành công.

Đối số:

Đối số 1: ffff800f6b750010, Con trỏ tùy chọn đến ngữ cảnh khôi phục TDR nội bộ (TDR_RECOVERY_CONTEXT).

Đối số 2: fffff80398a7f690, Con trỏ đến mô-đun trình điều khiển thiết bị có trách nhiệm (ví dụ: thẻ chủ sở hữu).

Đối số 3: ffffffffc000009a, Mã lỗi tùy chọn (NTSTATUS) của thao tác không thành công gần đây nhất.

Arg4: 00000000000000004, Dữ liệu phụ thuộc ngữ cảnh nội bộ tùy chọn.

Chi tiết gỡ lỗi:

------------------

Không thể tải hình ảnh \SystemRoot\System32\DriverStore\FileRepository\nv_dispi.inf_amd64_1e8724cced6e93d4\nvlddmkm.sys, Lỗi Win32 0n2

*** CẢNH BÁO: Không thể xác minh dấu thời gian cho nvlddmkm.sys

KEY_VALUES_STRING: 1

Khóa : Analysis.CPU.mSec

Giá trị: 1250

Khóa : Analysis.Elapsed.mSec

Giá trị: 2506

Khóa: Analysis.IO.Other.Mb

Giá trị: 0

Khóa: Analysis.IO.Read.Mb

Giá trị: 1

Khóa: Analysis.IO.Write.Mb

Giá trị: 3

Khóa: Analysis.Init.CPU.mSec

Giá trị: 265

Khóa: Analysis.Init.Elapsed.mSec

Giá trị: 18742

Khóa: Analysis.Memory.CommitPeak.Mb

Giá trị: 160

Khóa: Analysis.Version.DbgEng

Giá trị: 10.0.27725.1000

Khóa: Analysis.Version.Description

Giá trị: 10.2408.27.01 amd64fre

Khóa: Analysis.Version.Ext

Giá trị: 1.2408.27.1

Khóa: Bugcheck.Code.LegacyAPI

Giá trị: 0x116

Khóa: Bugcheck.Code.TargetModel

Giá trị: 0x116

Khóa: Failure.Bucket

Giá trị: 0x116_IMAGE_nvlddmkm.sys

Khóa: Failure.Hash

Giá trị: {c89bfe8c-ed39-f658-ef27-f2898997fdbd}

Khóa: WER.OS.Branch

Giá trị: vb_release

Khóa: WER.OS.Version

Giá trị: 10.0.19041.1

BUGCHECK_CODE: 116

BUGCHECK_P1: ffff800f6b750010

BUGCHECK_P2: fffff80398a7f690

BUGCHECK_P3: ffffffffffc000009a

BUGCHECK_P4: 4

FILE_IN_CAB: 020325-12687-01.dmp

FAULTING_THREAD: ffff800f643265c0

VIDEO_TDR_CONTEXT: dt dxgkrnl!_TDR_RECOVERY_CONTEXT ffff800f6b750010

Biểu tượng dxgkrnl!_TDR_RECOVERY_CONTEXT không tìm thấy.

PROCESS_OBJECT: 0000000000000004

BLACKBOXBSD: 1 (!blackboxbsd)

BLACKBOXNTFS: 1 (!blackboxntfs)

BLACKBOXPNP: 1 (!blackboxpnp)

BLACKBOXWINLOGON: 1

CUSTOMER_CRASH_COUNT: 1

PROCESS_NAME: Hệ thống

STACK_TEXT:

ffffff98a`9d6479d8 fffff803`7e6668de : 00000000`00000116 ffff800f`6b750010 fffff803`98a7f690 ffffffff`c000009a : nt!KeBugCheckEx

fffff98a`9d6479e0 fffff803`7e616fa4 : fffff803`98a7f690 ffff800f`68b02720 00000000`00002000 ffff800f`68b027e0 : dxgkrnl!TdrBugcheckOnTimeout+0xfe

fffff98a`9d647a20 fffff803`7e60fadc : ffff800f`68adb000 00000000`01000000 00000000`00000004 00000000`00000004 : dxgkrnl!ADAPTER_RENDER::Reset+0x174

fffff98a`9d647a50 fffff803`7e666005 : 00000000`00000100 ffff800f`68adba70 00000000`63a4e700 fffff803`70ab499c : dxgkrnl!DXGADAPTER::Reset+0x4dc

fffff98a`9d647ad0 fffff803`7e666177 : fffff803`71525440 ffff800f`6a131d70 00000000`00000000 00000000`00000100 : dxgkrnl!TdrResetFromTimeout+0x15

fffff98a`9d647b00 fffff803`70a171c5 : ffff800f`643265c0 fffff803`7e666150 ffff800f`5a69e980 ffff800f`0000000 : dxgkrnl!TdrResetFromTimeoutWorkItem+0x27

fffff98a`9d647b30 fffff803`70b5a165 : ffff800f`643265c0 00000000`00000080 ffff800f`5a6be200 000fe067`b4bbbdff : nt!ExpWorkerThread+0x105

fffff98a`9d647bd0 fffff803`70c078f8 : fffff803`6ba51180 ffff800f`643265c0 fffff803`70b5a110 04d172e8`8f1a54c8 : nt!PspSystemThreadStartup+0x55

fffff98a`9d647c20 00000000`0000000 : fffff98a`9d648000 fffff98a`9d641000 000000000`0000000 000000000`00000000 : nt!KiStartSystemThread+0x28

TÊN_KÝ_HỆ: nvlddmkm+184f690

TÊN_MODULE: nvlddmkm

TÊN_HÌNH ẢNH: nvlddmkm.sys

LỆNH_XẾP_LỆNH: .process /r /p 0xffff800f5a6be200; .thread 0xffff800f643265c0 ; kb

FAILURE_BUCKET_ID: 0x116_IMAGE_nvlddmkm.sys

OS_VERSION: 10.0.19041.1

BUILDLAB_STR: vb_release

OSPLATFORM_TYPE: x64

OSNAME: Windows 10

FAILURE_ID_HASH: {c89bfe8c-ed39-f658-ef27-f2898997fdbd}

Theo dõi: MachineOwner
 
Chào mừng đến với diễn đàn, người mới!

Những người sở hữu RTX3080 được khuyên nên sử dụng PSU được chế tạo đáng tin cậy, có công suất ít nhất là 850W hoặc 1KW để bù đắp cho các đợt tăng đột biến tải tạm thời của GPU.

Bạn đang sử dụng phiên bản BIOS nào cho bo mạch chủ của mình?

Đối với việc cài đặt mới hệ điều hành, hãy tạo lại trình cài đặt USB có thể khởi động, ngắt kết nối tất cả các ổ đĩa ngoại trừ ổ đĩa bạn muốn cài đặt hệ điều hành, cài đặt hệ điều hành ở chế độ ngoại tuyến, sau đó cài đặt tất cả các trình điều khiển cần thiết trong lệnh nâng cao, tức là Nhấp chuột phải vào trình cài đặt>Chạy với tư cách Quản trị viên.

Theo tình hình hiện tại, bạn có thể thử sử dụng DDU ở Chế độ an toàn để xóa tất cả các trình điều khiển GPU (intel, AMD và Nvidia), sau đó cài đặt thủ công trình điều khiển GPU mới nhất có nguồn từ trang web hỗ trợ của Nvidia, trong lệnh nâng cao.
 
Chào mừng bạn đến với diễn đàn, người mới!

Những người sở hữu RTX3080 được khuyên nên sử dụng PSU được chế tạo đáng tin cậy, có công suất ít nhất là 850W hoặc 1KW để bù đắp cho các đợt tăng tải tạm thời của GPU.

Bạn đang sử dụng phiên bản BIOS nào cho bo mạch chủ của mình?

Đối với việc cài đặt mới hệ điều hành, hãy tạo lại trình cài đặt USB có thể khởi động, ngắt kết nối tất cả các ổ đĩa ngoại trừ ổ đĩa bạn muốn cài đặt hệ điều hành, cài đặt hệ điều hành ở chế độ ngoại tuyến, sau đó cài đặt tất cả các trình điều khiển cần thiết trong lệnh nâng cao, tức là Nhấp chuột phải installer>Chạy với tư cách Quản trị viên.

Theo tình hình hiện tại, bạn có thể thử và sử dụng DDU ở Chế độ an toàn để xóa tất cả trình điều khiển GPU (intel, AMD và Nvidia), sau đó cài đặt thủ công trình điều khiển GPU mới nhất có nguồn từ trang hỗ trợ của Nvidia, trong lệnh nâng cao.
Xin lỗi vì đã đề cập đến việc tôi đã chạy DDU một vài lần rồi. Tôi chắc chắn luôn có thể thử lại. BIOS của tôi là bất kỳ bios nào mới nhất vào tháng 11 năm 2022 cho bo mạch của tôi. Trước khi thay thế PSU, tôi đã cập nhật nó để dùng thử.
 
Nó chỉ làm như vậy với trò chơi (và điểm chuẩn GPU) thôi sao? Nếu bạn chạy Cinebench hoặc Prime95 thì sao?
Tôi đã thử Prime95 vài năm trước và giải quyết được vấn đề với PSU mới. Tuy nhiên, khi đó tôi không gặp vấn đề gì khi chạy nó. Tôi không chạy nó nữa kể từ đó, nhưng chắc chắn không liên quan đến CPU nếu nó cho tôi lỗi TDR video phải không?
 
Tôi đã thử Prime95 cách đây vài năm trước khi giải quyết được sự cố với PSU mới. Tuy nhiên, khi đó không gặp sự cố nào khi chạy nó. Tôi không chạy nó kể từ đó, nhưng chắc chắn nó không liên quan đến CPU nếu nó cho tôi lỗi TDR video phải không?
Bạn không mất gì khi thử lại chỉ để đảm bảo hệ thống của bạn ổn định. Báo cáo lỗi cho biết hệ thống của bạn không thể tải hình ảnh trình điều khiển. Có thể là lỗi CPU, tệp bị hỏng, sự cố GPU, v.v. nên tốt hơn là loại trừ khả năng hệ thống không ổn định bằng một bài kiểm tra dễ dàng và nhanh chóng (chỉ cần để Prime chạy trong khoảng 10 phút).

Nó có tạo ra cùng một báo cáo lỗi khi nó bị sập (với cùng một lỗi) không? Bạn đã thử cài đặt lại Windows như bạn đã nói trong OP của mình chưa?
 
Việc xử lý các sự cố ngẫu nhiên thật bực bội! Ước gì có cách nhanh hơn để xác định vấn đề thay vì thử và sai với nhật ký và thử nghiệm phần cứng.
 
Chạy Prime95 trong hơn 10 phút một chút và mọi thứ đều ổn. Tôi đã mượn 2070 Super của một người bạn, nhưng hóa ra card của anh ấy rất lớn và không vừa với case của tôi. Tôi đã cài đặt lại windows (lần này là ổ m.2 mà tôi đã mua gần một năm trước và chưa bao giờ cài đặt để thay thế ổ trước đó) và sự cố vẫn tiếp diễn, nhưng bây giờ nó không tạo ra bản dump nhỏ. Việc không tạo bản dump nhỏ là điều tôi đã gặp phải trong các sự cố trước đây với máy tính của mình.

Tôi đã có thể chạy các bài kiểm tra ứng suất trong 3D Mark cho Steel Nomad và Timespy extreme. Chạy 20 vòng lặp trong mỗi vòng lặp mà không có sự cố nào.

Tôi có thể đã mắc lỗi khi cài đặt windows vào m.2. Trước đây, tôi đã gặp phải hai sự cố riêng biệt với sự cố sập như đã đề cập trong bài đăng gốc của mình. Sự cố đầu tiên đã được giải quyết bằng cách thay thế PSU và sự cố thứ hai đã được giải quyết bằng cách tháo ổ m.2 của tôi và cài đặt windows trên SSD của tôi. Tôi đã mua một ổ m.2 mới sau sự cố gần đây hơn đó, nhưng không bao giờ dành thời gian để cài đặt nó. Tôi nghĩ rằng vì tôi đang cài lại windows nên có lẽ cũng là thời điểm tốt để cài đặt m.2 mới hơn. Có cách nào để tìm ra xem khe cắm m.2 có phải là nguyên nhân gây ra sự cố đó không?

Tôi đoán là tôi có thể tháo m.2 ra và cài lại windows sạch vào SSD để xem nó hoạt động như thế nào, nhưng giờ tôi cảm thấy mình sắp phát điên rồi. Vấn đề của tôi là do GPU, windows, bo mạch chủ hay PSU? Lúc này, liệu có dễ hơn không nếu chỉ mang máy đến cửa hàng sửa chữa để họ có thể cho tôi biết sự cố là gì? Trừ khi mua một máy tính hoàn toàn mới từng bộ phận để tìm ra thủ phạm, tôi không còn lựa chọn nào khác nữa.
 
Cập nhật chủ đề này. Tôi đã ra ngoài và mua một PSU Corsair RMx 1000w từ BestBuy chỉ để thử nghiệm và xem PC của tôi hoạt động như thế nào với một PSU quá mức. Nghĩ rằng nếu sự cố vẫn tiếp diễn thì tôi có thể chỉ cần đặt mọi thứ trở lại hộp và trả lại, nhưng tôi có thể ít nhất gạch bỏ một phần cứng khỏi danh sách những thủ phạm tiềm ẩn. Đã chơi trên đó vào đêm qua trong vài giờ và không bị sự cố nào. Hy vọng rằng đó chỉ là PSU một lần nữa. Có khả năng là 3080 của tôi chỉ làm hỏng các PSU 750w trong vài năm cho đến khi chúng không còn xử lý được các đợt tăng đột biến tạm thời về điện năng mà dòng 3000 nổi tiếng không? Đối với tôi, thật kỳ lạ khi mọi thứ đều chạy tốt trong khoảng 2 năm trên Seasonic Focus+ rồi lại hỏng. Chạy tốt trên ASUS ROG Strix trong khoảng 2 năm rồi lại hỏng. Làm hỏng PSU như vậy có phải là vấn đề không?

Tôi sẽ tiếp tục thử nghiệm để xem nó có tiếp tục chạy mà không bị sập không. Tôi đã từng gặp trường hợp mọi thứ chạy tốt trong nhiều giờ chơi game, khiến tôi hy vọng rồi nó lại sập lần nữa nên vẫn còn nguyên vị trí chờ cú đá vào đai ốc.
Bộ nguồn là một trong những thành phần có xu hướng lão hóa và không phải lúc nào cũng có thể cấp nguồn cho các thành phần. Theo những gì tôi thấy, Nvidia yêu cầu bộ nguồn 750 watt. Nhưng tại thời điểm đó, theo tôi, đúng là nó sẽ hoạt động, nhưng bạn có thể đang đẩy gần đến những gì PSU có thể làm.

Ví dụ, khi tôi mua 7900xtx của mình vào năm ngoái, mặc dù nó yêu cầu một đơn vị 800 watt và tôi đã có một PSU 850 watt, tôi đã tiếp tục và nâng cấp lên một đơn vị 1200 watt. Ban đầu tôi đã định mua một đơn vị 1000 watt, nhưng Newegg có một đơn vị Thermaltake được xếp hạng A 1200 watt với giá không cao hơn nhiều so với các đơn vị khác mà tôi đã xem. Vì vậy, cá nhân tôi, tôi thích tăng kích thước bộ nguồn một chút. Đối với một người như tôi đã nói, bạn biết rằng chúng sẽ cũ đi và không phải lúc nào cũng có thể cung cấp cùng một lượng điện năng, đặc biệt là nếu bạn đang đẩy chúng lên mức cao nhất trong phạm vi của chúng. Thêm vào đó, nếu bạn tăng một chút về bộ nguồn thì nó sẽ xử lý được các nâng cấp mà bạn muốn thực hiện sau này. Có thể bạn nên xem xét chế độ bảo hành của PSU khác mà bạn đã có và lấy RMA để đổi sang một cái khác, sau đó bạn có thể có một cái dự phòng hoặc nếu họ gửi cho bạn một cái mới, bạn có thể bán nó hoặc làm gì đó tương tự.
 
Back
Bên trên