Hỏi / Đáp Vấn đề quá nhiệt của GPU?

mstojanovic

New member
Tôi cũng thử vận may ở đây cũng như đã đăng trên các nền tảng khác và không nhận được phản hồi nào.
Tôi liên tục gặp sự cố nhiệt với ASUS ROG STRIX 4090 GAMING WHITE OC
của mình trong khoảng 2 năm. Sự cố bắt đầu vào khoảng tháng 9/tháng 10 năm ngoái. Tôi nhận thấy rằng trong các trò chơi đòi hỏi cao, quạt sẽ quay rất to, lớn hơn bình thường rất nhiều. Sau đó, tôi phát hiện ra rằng một trong ba quạt không quay chút nào vì giá đỡ card giúp card không bị xệ (giá đỡ đi kèm trong hộp) đã bị dịch chuyển một chút, đè vào bên ngoài quạt. Tôi đã khắc phục bằng cách di chuyển nó trở lại vị trí thích hợp và may mắn là không có hư hỏng nào xảy ra với quạt. Nhưng ngay cả sau khi khắc phục, nhiệt độ GPU vẫn ở mức cao. Sau đây là một số dữ liệu:

  • Khi tải nặng (>60%), nhiệt độ luôn ở mức khoảng 85–90°C, với điểm nóng đạt khoảng 105°C.
  • ⁠Khi nhàn rỗi hoặc tải thấp (<60%), nhiệt độ nhàn rỗi vào khoảng 28–30°C và dưới 50°C khi sử dụng nhẹ.
  • ⁠Trong các trò chơi như CP2077 và Diablo IV (cài đặt tối đa), nhiệt độ duy trì ở mức khoảng 89–90°C trong hầu hết quá trình chơi (trừ trong menu).
Tôi đã thử một số bước khắc phục sự cố:
  • ⁠Đã khôi phục trình điều khiển bằng DDU về phiên bản ổn định khi sự cố bắt đầu.
  • ⁠Đảm bảo luồng không khí trong trường hợp của tôi là tốt và đã xác minh không có quy trình bất hợp pháp nào gây căng thẳng cho GPU.
  • ⁠Vài ngày trước, tôi đã mang card đến trung tâm dịch vụ. Họ đã dán lại GPU (lớp dán ban đầu gần như biến mất) và thay thế các miếng đệm nhiệt và họ báo cáo nhiệt độ bình thường (khoảng 70–75°C) trong các bài kiểm tra tải cao trên băng ghế của họ (sử dụng thiết lập khác).
Khi tôi trả lại card và cài đặt lại vào PC (với trình điều khiển mới nhất), nhiệt độ cao (khoảng 89–90°C) vẫn ở đó. Để giải trí, tôi thậm chí đã chạy Heaven Benchmark và nó đẩy nó lên 89°C gần như ngay lập tức và trong suốt quá trình kiểm tra.

Sau khi nghiên cứu thêm, tôi đã tìm thấy một số bài đăng trên reddit về việc giới hạn FPS trong NVCP. Tôi đã thử giới hạn FPS toàn cầu trong NVCP (đặt thành -3 hoặc hơn tốc độ làm mới của màn hình của tôi) và bật VSync toàn cầu (nhưng tắt trong trò chơi, vì tôi sử dụng màn hình G-Sync 144Hz). Sự điều chỉnh này 'thần kỳ' đã hạ nhiệt độ trong các trò chơi mà tôi đang thử nghiệm xuống mức trung bình là 68–72°C ở mức tải GPU 80–85%. Tôi vẫn gặp phải một số vấn đề bổ sung khi trong CP2077, tôi phải đặt mô hình máy biến áp thành "Cân bằng" thay vì Tự động/Chất lượng để kiểm soát nhiệt độ. Nhưng nếu tôi đặt FPS tối đa thành 120, thì trò chơi hoạt động rất tốt và không có nhiệt độ quá cao.

Vì vậy, nhìn chung, hiện tại tôi 'hài lòng' với các giải pháp thay thế này - tôi đạt được FPS rất tốt ở 1440p, trong khi GPU vẫn 'mát'. Nhưng tôi vẫn nghĩ rằng vấn đề cốt lõi vẫn chưa được giải quyết. Tôi đã thấy ví dụ về những người chạy tốc độ khung hình và tải GPU cao hơn, với nhiệt độ không quá cao. Có ai gặp phải sự cố tương tự hoặc có đề xuất bổ sung nào không? Có thể có vấn đề gì đó với thiết lập của tôi hoặc có thể việc dán lại/thay thế miếng tản nhiệt không giải quyết được hoàn toàn vấn đề?
Để tham khảo, đây là thiết lập đã sử dụng:

Cấu hình hệ thống của tôi:
  • Hệ điều hành: Windows 11 Pro 24H2 (bản dựng Insider Preview)
  • ⁠CPU: Intel Core i9-13900K
  • ⁠Bo mạch chủ: ASUS ROG MAXIMUS Z790 APEX
  • ⁠PSU: Hydro PTM PRO ATX3.0 (PCIe 5.0) 1200W (sử dụng đầu nối 12vhpwr cho GPU)
  • ⁠RAM: 2x G.Skill F5-6000J3040G32G (tổng cộng 64GB)
  • ⁠GPU: ASUS ROG STRIX RTX 4090 GAMING WHITE OC (trình điều khiển mới nhất)
  • ⁠Lưu trữ: Kingston SKC3000S 1TB, Samsung SSD 990 PRO 2TB
  • ⁠Vỏ: Phanteks Evolv X
  • ⁠Một số hình ảnh về cách lắp đặt card: https://postimg.cc/gallery/dZRrwBF
Bàn thử nghiệm trong cửa hàng (ít chính xác hơn vì tôi nhận được thông tin này từ họ qua email):
  • Hệ điều hành: Windows 10 Pro 22H2
  • ⁠CPU: AMD Ryzen 7 5700X
  • ⁠Bo mạch chủ: Gigabyte A520 K V2
  • ⁠PSU: Antec 850W HCG850 Gold
  • ⁠RAM: Kingston Fury Renegade DDR4 16GB/3200MHz
  • ⁠SSD: Kingston 1TB NVMe
  • ⁠(Họ cũng sử dụng trình điều khiển Nvidia mới nhất)
Cảm ơn trước!
 
Khi bạn nói "hằng số" có nghĩa là từ ngày đầu tiên không?

FYI: RAM của bạn được cài đặt không đúng cách. Nó phải là a2-b2 hoặc khe cắm thứ 2 và cuối cùng từ CPU.
 
Khi bạn nói "hằng số", ý bạn là từ ngày đầu tiên phải không?

FYI: RAM của bạn được cài đặt không đúng cách. Nó phải là a2-b2 hoặc khe thứ 2 và cuối cùng tính từ CPU.
Khi tôi nói "hằng số", ý tôi là từ tháng 9/tháng 10 năm 2024 khi sự cố bắt đầu xảy ra. Trước đó tôi không gặp vấn đề tương tự nào (kể từ khi tôi mua nó vào H1 2023).

Về các mô-đun RAM - Z790 MAXIMUS APEX có 2 khe cắm thông thường mà tôi sử dụng (2 mô-đun 32GB) và có một khe cắm DIMM.2 bên phải, tôi sử dụng khe cắm này cho thẻ DIMM.2 dành cho ổ SSD M.2 thứ hai
 
Khi tôi nói "hằng số", ý tôi là kể từ tháng 9/tháng 10 năm 2024 khi sự cố bắt đầu xảy ra. Trước đó tôi không gặp vấn đề tương tự nào (kể từ khi tôi mua nó vào H1 2023).

Về các mô-đun RAM - Z790 MAXIMUS APEX có 2 khe cắm thông thường mà tôi sử dụng (2 mô-đun 32GB) và có một khe cắm DIMM.2 bên phải, tôi sử dụng cho thẻ DIMM.2 cho ổ SSD M.2 thứ hai
Được rồi. Tôi hiểu rồi. Thật tuyệt!

Bạn đang sử dụng gì để theo dõi nhiệt độ?

Để thử nghiệm, hãy thử đặt PC nằm nghiêng và kiểm tra nhiệt độ.
 
Tôi đang sử dụng HWiNFO để đo nhiệt độ.

Tôi đã thử những gì bạn gợi ý, và thật không may là không có thay đổi nào. Đây là ảnh chụp màn hình cửa sổ HWiNFO sau khoảng 5 phút trong trò chơi Expedition 33



Screenshot-2025-05-04-103032.png



Ngoài ra, đây là tệp CSV từ lần chạy thử nghiệm: HWiNFO_test-run.CSV
 
Tôi đoán là vỏ máy không có đủ luồng khí để làm mát 450W từ GPU (khi chạy tối đa) ngoài khoảng ~100W từ CPU.

Bạn đã thử mở tấm chắn bên hông chỉ để xem nhiệt độ như thế nào chưa?

Đây là cách đơn giản để kiểm tra và xem GPU có nhận đủ luồng khí mát không.
 
Tôi đoán là vỏ máy không có đủ luồng khí để làm mát 450W từ GPU (khi chạy tối đa) ngoài khoảng ~100W từ CPU.

Bạn đã thử mở tấm chắn bên hông chỉ để xem nhiệt độ như thế nào chưa?

Đây là một cách đơn giản để kiểm tra và xem GPU có nhận đủ luồng khí mát hay không.
Có, tôi cũng đã thử cách đó trong một số bài kiểm tra mà tôi đã thực hiện, kể từ lần đầu tiên nhận thấy sự cố (xin lỗi vì đã không đưa điều đó vào bản gốc bài đăng).

Thật đáng buồn là nó không tạo ra sự khác biệt nào trong các bài kiểm tra 🙁

Đây là ảnh chụp màn hình của HWiNFO từ bài kiểm tra mới nhất với bảng điều khiển bên mở:
Screenshot-2025-05-04-135044.png
 
Vâng, tôi cũng đã thử điều đó trong một số thử nghiệm mà tôi đã thực hiện, kể từ lần đầu tiên nhận thấy vấn đề (xin lỗi vì đã không đưa điều đó vào bài đăng gốc).

Thật đáng buồn là nó không tạo ra sự khác biệt trong các thử nghiệm 🙁

Đây là ảnh chụp màn hình HWiNFO từ thử nghiệm mới nhất với bảng điều khiển bên mở:
Screenshot-2025-05-04-135044.png
Vậy thì có điều gì đó cực kỳ sai trái vì trong khi mọi thứ có vẻ bình thường về điện áp/xung nhịp bộ nhớ/nhiệt độ bộ nhớ thì xung nhịp GPU lại không cao như vậy như nó phải thế. Thông thường đây sẽ là lúc tôi nói dán lại, nhưng cửa hàng đã làm rồi và đây là vấn đề đang diễn ra. Điều duy nhất có thể sửa được mà tôi thực sự nghĩ đến là nếu độ dày của miếng tản nhiệt quá cao trên card thì điều này có thể xảy ra.

Thành thật mà nói, đây là thứ mà tôi có thể đã RMA một card đắt tiền như thế này, nhưng tôi đoán rằng có lẽ không phải là một lựa chọn hiện tại. Theo kinh nghiệm của tôi, thiết lập TIM tốt nhất mà bạn có thể sử dụng trên card màn hình là sử dụng miếng tản nhiệt PTM7950 trên GPU sau đó là một loại bột trét chất lượng ở bất kỳ nơi nào sử dụng miếng tản nhiệt.
 
Back
Bên trên