Hỏi / Đáp Trợ giúp với lỗi BSOD tái diễn (nvlddmkm.sys)

l0r

New member
Xin chào!
Tôi đã gặp phải lỗi BSOD này cùng với một số lỗi khác trong vài tuần/tháng qua và vẫn chưa thể khắc phục được kể từ đó.

BSOD dường như xuất hiện đột ngột, khi đang ở chế độ chờ, chỉ mở luồng Twitch, khi duyệt trong Chrome hoặc mở một tệp hình ảnh ngẫu nhiên.
Các triệu chứng luôn giống nhau: con trỏ chuột bị treo, âm thanh nền lặp lại và hệ thống bị treo (đôi khi đầu ra video bị trục trặc) trong vài giây cho đến khi tự khởi động lại.
Tôi đã kiểm tra WinDbg và nó luôn hiển thị "nvlddmkm.sys" là thủ phạm.

Thông số kỹ thuật của hệ thống như sau:

  • PSU: Corsair RM850x
  • MB: ASUS ROG Strix Z490-E Gaming
  • CPU: Intel i7-10700K
  • RAM: Corsair Vengeance LPX 64GB (2x32GB) DDR4 3600MHz C18 (đã xác minh QVL)
  • GPU: Gigabyte NVIDIA GeForce RTX 4060 GAMING OC (khe cắm PCIe x16 trên cùng)
  • SSD: Samsung 980 PRO NVMe M.2 SSD (khe cắm M.2_2 dưới cùng)
Một số điều cần lưu ý:
  • BIOS được cập nhật (Phiên bản 1. 3001)
  • GPU hoàn toàn mới (khoảng 2 tháng tuổi)
  • Tôi cũng đã gặp phải các BSOD khác trong quá khứ, cụ thể là "SYSTEM_ THREAD_EXCEPTION_NOT_HANDLED", "DPC_WATCHDOG_VIOLATION" và "VIDEO_TDR_FAILURE" và khi sử dụng WinDbg, tất cả các tệp dump đều trỏ đến "nvlddmkm.sys".
Vì vậy, tôi nghĩ: trường hợp này không đúng, chắc chắn là do GPU hoặc/và trình điều khiển bị lỗi, đúng không? Vâng... tất cả các BSOD này đều xảy ra với một GPU (cũ hơn) khác và RAM không phải qvl và trên Windows 10 trước đó.

Kể từ đó, tôi đã thay thế GPU bằng một GPU mới (RTX 4060), RAM QVL mới rõ ràng và xóa ổ đĩa của mình, cài đặt một bản sao Windows 11 mới. Và vẫn: DRIVER_OVERRAN_STACK_BUFFER với nvlddmkm.sys theo thời gian.

Ngoài ra, tại một số thời điểm, tôi nghĩ lý do có thể là bật XMP 1, có thể là tác nhân gây ra các BSOD đó nên tôi đã tắt nó và thực sự không gặp bất kỳ sự cố nào trong một tuần kể từ đó. Nhưng liệu đây có phải chỉ là sự trùng hợp ngẫu nhiên không? Mọi thứ khác đều đang chạy ở chế độ mặc định, BIOS hoàn toàn ở chế độ mặc định ngoại trừ XMP.
Hiện tại, tôi đang chạy RAM của mình với XMP 2 được bật, điều này đưa điện áp DRAM lên 1,361 (thay vì 1,35). Cho đến nay vẫn chưa có sự cố nào, nhưng vẫn đang thử nghiệm.
Liệu có thể vì lý do nào đó mà việc bật XMP 1 lại là thủ phạm không? Nhưng nếu vậy, tại sao lại phải như vậy?


Ngoài ra, hiệu suất hệ thống nhìn chung rất tốt, tôi có thể chạy Prime95 + Furmark cùng lúc mà không gặp sự cố nào và nhiệt độ cũng tốt.
Chỉ có lỗi BSOD DRIVER_OVERRAN_STACK_BUFFER khó chịu này đôi khi xuất hiện...

Tôi thực sự bối rối ở đây. Vui lòng giúp tôi.
 
Tôi nghĩ: không có lỗi, có lẽ là do GPU hoặc trình điều khiển bị lỗi, đúng không? Vâng... tất cả các BSOD này đều xảy ra với một GPU (cũ hơn) khác và RAM không phải qvl và trên Windows 10 trước đó.

Kể từ đó, tôi đã thay thế GPU bằng một GPU mới
chỉ việc thay đổi card vật lý sẽ không mang theo trình điều khiển mới.
bạn sẽ phải xóa/thay thế thủ công gói trình điều khiển hiện có.

chạy DDU từ Chế độ an toàn của Windows và chọn xóa tất cả dữ liệu tùy chọn.
sau đó cài đặt lại gói trình điều khiển mới nhất có sẵn trực tiếp từ Nvidia, không có GeForce Experience.
 
Xin chào và cảm ơn bạn đã trả lời!

chỉ thay đổi card vật lý sẽ không mang theo trình điều khiển mới.
bạn sẽ phải xóa/thay thế thủ công gói trình điều khiển hiện có.

chạy DDU từ Chế độ an toàn của Windows và chọn xóa tất cả dữ liệu tùy chọn.
sau đó cài đặt lại gói trình điều khiển mới nhất có sẵn trực tiếp từ Nvidia, không có GeForce Experience.
Vâng, tôi biết nhưng như tôi đã nói, tôi đã cài đặt lại hoàn toàn Windows thậm chí để đảm bảo rằng tôi không gặp sự cố nào trình điều khiển.

Lỗi BSOD bộ đệm ngăn xếp tràn gần đây nhất xảy ra cách đây vài ngày trên hệ điều hành Win 11 mới và tôi chỉ để Windows cài đặt trình điều khiển cho GPU của mình (mặc dù đó là trình điều khiển cũ từ năm 2023). Tôi hiện đang thử nghiệm với trình điều khiển mới nhất từ Nvidia (không phải GeForce Experience).

Và đúng vậy, tôi đã thử DDU nhiều lần (ở chế độ an toàn) khi tôi sử dụng hệ điều hành Win 10 cũ của mình.

Chỉnh sửa 1:
Vẫn còn câu hỏi về XMP treo trong phòng, liệu nó có liên quan đến vấn đề đó theo bất kỳ cách nào hay không.Ngoài ra: có phải là hành vi bình thường khi điện áp DRAM tăng lên 1,361V khi XMP 2 được bật mặc dù nó được đặt thành 1,35V không?
Chỉnh sửa 2:
Tôi vừa kiểm tra với các cài đặt RAM khác trong BIOS: khi đặt thành TỰ ĐỘNG (= cài đặt mặc định), RAM chạy ở tốc độ 2133Mhz và điện áp DRAM dao động trong khoảng từ 1,200V đến 1,217V. Như vậy cũng bình thường chứ?


NYUgj4o.jpeg



z549GDf.jpeg
 
có phải là hiện tượng bình thường khi điện áp DRAM tăng lên 1,361V khi XMP 2 được bật không
các cấu hình XMP được nhà sản xuất định cấu hình và thử nghiệm cho các bộ RAM cụ thể đó.
tôi sẽ để nguyên @ XMP I trừ khi bạn nhận thấy các vấn đề lạ khác phát sinh.

nếu bạn thấy nhiệt tỏa ra nhiều hơn mức bạn muốn hoặc cho là cần thiết, chỉ cần sử dụng cài đặt thủ công và nhập thông số kỹ thuật được nhà sản xuất RAM đánh giá. nhưng .011v có lẽ không đủ để tạo ra bất kỳ sự khác biệt nào.

nhiều nhà sản xuất bo mạch chủ hiện đại sử dụng các cấu hình tích hợp có xu hướng tăng điện áp cho chế độ 'ép xung tự động' hoặc các chế độ 'hiệu suất nâng cao' khác.
 
Cảm ơn bạn một lần nữa vì đã trả lời!Tôi xin lưu ý rằng tôi đã kiểm tra và XMP 1 cũng đặt điện áp DRAM ở mức 1,3500V và BIOS đọc điện áp là 1,361V, do đó không có sự khác biệt nào giữa XMP 1 và 2 ở đây.

Vậy thì tôi kết luận rằng mọi thứ đều hoạt động như mong đợi, phải không?

Tôi có một câu hỏi khác:
một cấu hình XMP không hoạt động OOB với việc sử dụng rõ ràng bộ RAM QVL không phải là lý do để nghi ngờ có sự cố phần cứng ở đâu đó sao?
 
Tôi vừa nhận được một lỗi BSOD khác "VIDEO_SCHEDULER_INTERNAL_ERROR" trỏ đến "nvlddmkm.sys" trong khi không làm gì ngoài việc duyệt qua các tệp Windows Explorer.
Bây giờ tôi có thể làm gì? 🙁
 
Xin chào một lần nữa.

Vì vậy, tôi đã vô hiệu hóa hoàn toàn XMP cách đây vài ngày, chạy RAM ở mức mặc định 2133 mhz, rõ ràng là không lý tưởng.

Tôi chưa gặp bất kỳ sự cố nào kể từ đó và hệ thống rất ổn định trong 3 ngày nay, vì vậy tôi chắc chắn 99% rằng đó phải là cấu hình XMP khiến trình điều khiển Nvidia của tôi bị sập vì một lý do nào đó.

Bạn có gợi ý nào về lý do cho hành vi đó không và phải làm gì tiếp theo không?
Liệu đây cũng có thể là sự cố của bo mạch chủ hay tôi nên thử một bộ RAM (thứ ba) khác?

Một điều nữa cũng xuất hiện trong đầu tôi là khi tôi flash BIOS của mình lên phiên bản mới nhất (3001) cách đây vài tuần, tôi đã không xóa CMOS. Điều này có cần thiết không?

Cảm ơn vì mọi gợi ý!
 
Xin chào một lần nữa.

Vì vậy, tôi đã tắt hoàn toàn XMP cách đây vài ngày, chạy RAM ở mức mặc định 2133 mhz, rõ ràng là không lý tưởng.

Tôi chưa gặp bất kỳ sự cố nào kể từ đó và hệ thống rất ổn định trong 3 ngày nay, vì vậy tôi chắc chắn 99% rằng đó phải là cấu hình XMP khiến trình điều khiển Nvidia của tôi bị sập vì một lý do nào đó.

Bạn có gợi ý nào về lý do gây ra hành vi đó không và cần làm gì tiếp theo không?
Liệu đây cũng có thể là sự cố của bo mạch chủ hay tôi nên thử một (thứ ba) khác Bộ RAM?

Một điều nữa cũng xuất hiện trong đầu tôi là khi tôi flash BIOS của mình lên phiên bản mới nhất (3001) cách đây vài tuần, tôi đã không xóa CMOS. Điều này có cần thiết không?

Cảm ơn mọi gợi ý!
Bạn có thể ép xung RAM thủ công thay vì sử dụng cài đặt XMP. Hãy thử 3200Mhz với cùng thời gian như cài đặt XMP.
 
Trình điều khiển video, thật kỳ lạ, đặc biệt nhạy cảm với sự bất ổn nhỏ nhất của RAM. Đã xảy ra với tôi trong nhóm red, và giống như bạn, việc vô hiệu hóa XMP đã khắc phục được sự cố như thể bằng phép thuật. Và đó cũng không phải là cấu hình XMP hung hăng.
 
Một bản cập nhật khác: Hệ thống đã ổn định và không có BSOD trong hơn một tuần trong khi XMP vẫn bị vô hiệu hóa. Vì vậy, bây giờ tôi chắc chắn 100% rằng XMP là nguyên nhân khiến trình điều khiển video bị sập.

Tôi đã đặt mua một bộ RAM khác, có thể được ép xung lên 3200 mhz. Cần phải tiến hành thêm các thử nghiệm và tôi sẽ báo cáo lại.
 
Back
Bên trên