Hỏi / Đáp Ổ SSD NVMe ngắt kết nối ngẫu nhiên khi tải nặng (Trò chơi / Kiểm tra căng thẳng)

sojoya

New member
Xin chào mọi người,
Tôi cần trợ giúp để chẩn đoán sự cố dai dẳng với PC của mình. Vấn đề là Ổ SSD NVMe (ổ SSD giá rẻ có tên là RX7 1TB)
của tôi đột nhiên biến mất khỏi hệ thống khi tải nặng — thường là khi khởi chạy hoặc vài phút sau khi chơi các trò chơi đòi hỏi cao được lưu trữ trên ổ D: hoặc khi chạy FurMark + CrystalDiskMark cùng nhau để mô phỏng trường hợp chơi game tệ nhất. Khi điều này xảy ra, Windows sẽ bị sập với BSOD như "Lỗi trang nhân" hoặc "Ngoại lệ lưu trữ không mong muốn" hoặc chỉ bị treo. Ổ đĩa sẽ xuất hiện trở lại sau khi tắt nguồn một lúc. Nếu tôi không chơi bất kỳ trò chơi nào trên ổ D đó thì hệ thống hoạt động hoàn hảo, ví dụ như chỉ duyệt web hoặc trò chơi rất nhẹ.

Thông số kỹ thuật hệ thống:?utm_source=diendancongnghe.com#-system-specs​

  • CPU:
  • Ryzen 5 5600
  • GPU: MSI RX 6700 XT (12GB)
  • Bo mạch chủ: Gigabyte AB350M Gaming 3 (BIOS mới nhất, Phiên bản F53g) vừa cập nhật BIOS và sự cố vẫn tiếp diễn
  • RAM: Adata XPG Gammix 32GB DDR4 3200MHz
  • Ổ đĩa khởi động: SATA SSD 128 GB (Windows đã cài đặt tại đây)
  • Ổ đĩa trò chơi: RX7 NVMe 1TB (Ổ đĩa D
  • PSU: Corsair TX750M Gold
  • Vỏ máy: Gamemax Spark M-ATX

Bằng chứng & Kiểm tra:?utm_source=diendancongnghe.com#-evidence-testing​

  • Kiểm tra kết hợp OCCT (CPU + RAM, GPU Adaptive và VRAM) cũng gặp sự cố tương tự
  • Vấn đề chỉ xảy ra khi GPU + NVMe đều đang tải. Điều này không xảy ra nếu tôi chạy Furmark hoặc CrystalDiskMark riêng biệt
  • Nhật ký HWiNFO cho thấy đường ray +3,3V giảm xuống 3,06–3,10V ngay trước khi ổ đĩa biến mất. Trong các tình huống nhàn rỗi/tải nhẹ, 3,3V vẫn ở mức trên 3,20V.
  • Nhật ký Windows Event Viewerxác nhận lặp lại:Stornvme Event ID 129 – Đặt lại về thiết bị \Device\RaidPort1
  • Disk Event ID 51 – Lỗi thao tác phân trang trên ổ D:
  • ntfs Event ID 50/140 – Lỗi ghi bị trì hoãn
[*] Kiểm tra tự động BIOS NVMe đạt; không có vấn đề SMART.
[*] Giảm điện áp GPU (xuống 1110mV, giới hạn công suất -6%) sẽ làm giảm tổng công suất nhưng không ngăn chặn sự cố trong quá trình chịu tải.
[*] Pure CrystalDiskMark hoặc chơi game thực tế (tựa game UE5) không gây ra sự cố nếu GPU được tải nhẹ.
[*] Điều kỳ lạ là ổ đĩa bị kẹt ở nhiệt độ 40 độ C bất kể công việc có chuyên sâu đến đâu, nghi ngờ có vấn đề gì đó với cảm biến hoặc bộ điều khiển

Những gì tôi nghi ngờ:?utm_source=diendancongnghe.com#-what-i-suspect​

  • Sự mất ổn định đường ray +3,3V khi hệ thống tải đầy đủ đang khiến bộ điều khiển NVMe mất liên kết.
  • Có thể là do PSU bị sụt áp hoặc đường ray 3.3V của bo mạch chủ cung cấp cho khe cắm M.2 yếu.

Đang tìm lời khuyên về:?utm_source=diendancongnghe.com#-looking-for-advice-on​

  • Có cách nào để đảm bảo đây chỉ là sự cố ổ đĩa NVME
  • Hay đây là sự cố của PSU hay sự cố của bo mạch chủ?
  • Sử dụng SATA SSD để chơi game có phải là giải pháp an toàn lâu dài không?
  • Tôi có thể thử bất kỳ điều chỉnh BIOS nào khác (trạng thái C, phổ trải rộng, v.v.) không?
Cảm ơn — Tôi có thể cung cấp HWiNFO CSV và Event Viewer XML nếu cần.

(Chỉnh sửa: Thông tin đặc tả bổ sung)

image.png
 
(SSD giá rẻ có tên RX7 1TB)Tôi nghĩ đó là vấn đề của bạn. Thêm vào đó, Adata chưa bao giờ sản xuất SSD với tên gọi RX7.

Ổ đĩa xuất hiện trở lại sau khi tắt nguồn một lúc.
Điều này cho thấy có vấn đề về nhiệt. Có lẽ nhiệt từ GPU trên SSD đang khiến hiệu suất của nó giảm xuống. Nhãn hiệu và kiểu máy của vỏ máy và nhiệt độ của SSD khi sự cố xảy ra?

Bo mạch chủ:
Gigabyte AB350M Gaming 3 (BIOS mới nhất)Để có liên quan, vui lòng nêu rõ phiên bản BIOS cho bo mạch chủ của bạn.

PSU:
Corsair TX750M Gold
PSU bao nhiêu tuổi?
 
(SSD giá rẻ có tên là RX7 1TB)Tôi nghĩ đó là vấn đề của bạn. Thêm vào đó, Adata chưa bao giờ sản xuất SSD với tên gọi RX7.

Ổ đĩa xuất hiện trở lại sau khi tắt nguồn một lúc.
Điều này cho thấy có vấn đề về nhiệt. Có lẽ nhiệt từ GPU trên SSD đang khiến hiệu suất của nó giảm xuống. Nhãn hiệu và kiểu máy của vỏ máy và nhiệt độ của ổ SSD khi sự cố xảy ra?

Bo mạch chủ:
Gigabyte AB350M Gaming 3 (BIOS mới nhất)Để có liên quan, vui lòng nêu phiên bản BIOS cho bo mạch chủ của bạn.

PSU:
Corsair TX750M Gold
PSU này bao nhiêu tuổi?Cảm ơn bạn đã trả lời nhanh chóng, đúng vậy, đó không phải là ổ SSD Adata như bạn đã đề cập, tôi đã thêm thông số kỹ thuật bổ sung

- Vỏ máy là Gamemax Spark M-ATX
- Nhiệt độ ổ SSD không thay đổi chút nào và bị kẹt ở mức 40 độ C (trên HDSentinel, CrystalDisk, HWInfo, v.v.)
- BIOS là Phiên bản F53g vừa cập nhật bios từ F51h đêm qua và sự cố vẫn tiếp diễn
- giả định nhiệt sẽ ảnh hưởng khi tôi chỉ kiểm tra FurMark mà không có bất kỳ hoạt động ổ đĩa nào vì M.2 nằm ngay bên dưới GPU, nhưng ổ đĩa vẫn được phát hiện ngay cả khi GPU đạt 86 độ C
- PSU là một cái cũ, tôi nghĩ là từ năm 2017 hoặc lâu hơn
 
Có lẽ bộ điều khiển ổ đĩa giá rẻ không chịu được nhiệt (từ chính nó hoặc các thành phần khác như GPU) và hỏng khi chơi game.

Ổ đĩa có lẽ là thứ tệ nhất để tiết kiệm sau PSU. Có rất nhiều ổ SSD tệ hại ngoài kia có giá rất rẻ nhưng không thể chạy bất cứ thứ gì mà không bị sập hoặc hỏng sau vài tháng. Bạn nên sao lưu mọi thứ bạn muốn giữ từ ổ đĩa này và mua một ổ đĩa tốt. Một ổ NVMe 1 TB tốt từ một thương hiệu nổi tiếng (Samsung, WD, Crucial) có giá khoảng 60-70 đô la Mỹ. Không có lý do gì để mua loại vớ vẩn đó.
 
Back
Bên trên