Hỏi / Đáp RTX 4060 Ti bị sập và phát ra tiếng động lớn khi thực hiện các tác vụ đơn giản trên Ubuntu và Windows 11 ?

Mar2012sep

New member
Tôi mới mua một chiếc RTX 4060 Ti nhưng không thể sử dụng bình thường. Mỗi lần tôi thử chơi một trò chơi tương đối đơn giản như Planet Coaster, GPU bắt đầu phát ra tiếng ồn rất lớn, quay như điên và toàn bộ máy tính bị treo. Trong một số trường hợp, màn hình cũng chuyển sang màu đen.

Sự cố này xảy ra trên cả Ubuntu 24.04.2 LTS và Windows 11, vì vậy có vẻ như nó không chỉ giới hạn ở hệ điều hành. Tuy nhiên, vì tôi chủ yếu sử dụng Ubuntu nên tôi thích các giải pháp hoạt động trên Ubuntu hơn.

Để biết thêm bối cảnh, máy tính của tôi được chế tạo riêng và bo mạch chủ là ASUS Prime. Tất cả các loại cáp dường như được kết nối đúng cách và mọi thứ khác trong hệ thống dường như đều hoạt động tốt.
 
Chào mừng đến với diễn đàn, người mới!

Tôi vừa mới mua một chiếc RTX 4060 Ti hoàn toàn mới
Vậy là bạn đã thực hiện nâng cấp GPU. Bạn có chạy DDU ở Chế độ an toàn (dành cho Windows 11) để xóa tất cả trình điều khiển GPU (Intel, AMD và Nvidia) để sau đó cài đặt thủ công trình điều khiển GPU mới nhất có nguồn từ trang hỗ trợ của Nvidia trong lệnh nâng cao không?

Bạn quên đề cập đến nhãn hiệu, kiểu máy và tuổi của PSU.

Để biết thêm bối cảnh, máy tính của tôi được chế tạo riêng và bo mạch chủ là ASUS Prime.
Khi đăng một chủ đề về bản chất khắc phục sự cố, bạn thường phải bao gồm thông số kỹ thuật đầy đủ của hệ thống. Vui lòng liệt kê thông số kỹ thuật cho bản dựng của bạn như sau:
CPU:
Bộ làm mát CPU:
Bo mạch chủ:
Ram:
SSD/HDD:
GPU:
PSU:
Khung máy:
Hệ điều hành:
Màn hình:
bao gồm tuổi của PSU ngoài nhãn hiệu và kiểu máy. Phiên bản BIOS cho bo mạch chủ của bạn tại thời điểm này.
 
Cảm ơn bạn đã chào đón và trả lời!

Tôi chưa nâng cấp GPU, tôi đã mua linh kiện và tự lắp ráp máy tính.
Tôi xin lỗi vì đã thiếu thông tin, thông tin như sau:

CPU - AMD Ryzen 7 7700 (16) @ 5.389GH
Bộ tản nhiệt CPU – AMD, đi kèm với CPU
Bo mạch chủ – Asus Prime X670-P WI-FI
RAM – Kingston Fury Beast 64x2 GB KIT 5600Mhz DDR5
SSD/HDD - Kingston NV2 M.2 2000GB
Bo mạch chủ GPU - AMD
GPU – MSI GeForce RTX 4060 Ti VENTUS 3X OC
PSU – Corsair RMe Series RM850e
Vỏ máy - Vỏ máy HYTE Y40 S-Tier Aesthetic Case Mid Tower
Hệ điều hành - Ubuntu 24.04.2 LTS x86_64 (cũng gặp vấn đề tương tự trên Windows 11)
Màn hình – Samsung G5 Odyssey C34G55 34”

Tất cả các linh kiện đều được mua vào tháng 9 năm 2023 và phiên bản BIOS của bo mạch chủ là 1654.
 
Card màn hình không thực sự được cho là tạo ra tiếng ồn lớn, vì vậy, điều hợp lý là phải điều tra điều đó trước. Có thể quạt bị hỏng và quá nhiệt. Hoặc, nếu đó là tiếng rít chói tai, thì có thể là một bộ điều chỉnh điện áp nào đó.

Bạn có thể chạy nó khi mở vỏ máy để xác định vị trí phát ra âm thanh không? Ngoài ra còn có một ứng dụng phổ cho Android cho phép bạn vẽ phổ âm thanh theo thời gian thực - nếu có một đỉnh tần số cụ thể thì đó có thể là một manh mối.
 
Có vẻ như tiếng ồn lớn phát ra từ quạt, tiếng ma sát không khí chứ không phải tiếng rít.
Khi quạt chuyển sang chế độ điên cuồng, tần số cao nhất vào khoảng 2.800 Hz (máy phân tích phổ như đã đề xuất).

Bạn có thể nghe thấy âm thanh và xem điều gì đang xảy ra khi tôi bắt đầu trò chơi: Ở đây
 
Được rồi, tiếng ồn là bình thường. Quạt chỉ đang chạy hết công suất. Nvidia nên có bảng điều khiển hiển thị nhiệt độ GPU. Kiểm tra điều đó trước khi khởi động ứng dụng và xem khi nó bắt đầu. Nếu nó tăng thực sự nhanh, hãy thử tìm một tải GPU nhỏ hơn, thậm chí có thể nhỏ như di chuyển một cửa sổ xung quanh khi bộ soạn thảo sử dụng GPU. Nếu bạn thấy nhiệt độ đạt đỉnh ở tải nhỏ, tôi sẽ nghi ngờ có vấn đề với giao diện nhiệt giữa chip và bộ tản nhiệt.
 
Tôi đã khởi động ứng dụng, GPU đã tăng từ mức sử dụng 0 lên 44%, 61 độ C. Rất nhanh, tôi đã đóng ứng dụng và thậm chí bây giờ sau vài phút, trong khi tôi đang gõ ở đây, quạt vẫn đang chạy ầm ầm, nhiệt độ và mức sử dụng vẫn vậy. Các giá trị bị chặn ở mức 44% và 61 độ.
Tôi đã khởi động lại "mission center", một cái gì đó tương tự như trình quản lý tác vụ của Windows và nó chỉ thấy một GPU, bo mạch chủ (AMD), GEFORCE thậm chí còn không được liệt kê và thứ tội nghiệp vẫn hoạt động hết công suất, nhưng vô hình...

Tôi cũng đã thử di chuyển một cửa sổ xung quanh, nhiệt độ ổn, trong khoảng 44-45 độ C, không có đỉnh.

Cảm ơn bạn rất nhiều vì những gợi ý của bạn, tiếp theo là gì?

Được rồi, tiếng ồn là bình thường. Quạt chỉ đang chạy hết công suất. Nvidia nên có bảng điều khiển hiển thị nhiệt độ GPU. Kiểm tra bảng điều khiển đó trước khi khởi động ứng dụng và xem khi ứng dụng khởi động. Nếu nó tăng tốc thực sự nhanh, hãy thử tìm tải GPU nhỏ hơn, thậm chí có thể nhỏ như di chuyển cửa sổ xung quanh khi trình soạn thảo sử dụng GPU. Nếu bạn thấy nhiệt độ đạt đỉnh ở tải nhỏ, tôi nghi ngờ có vấn đề với giao diện nhiệt giữa chip và bộ tản nhiệt.
 
Trên Linux có một công cụ dòng lệnh "nvidia-smi" - nó hiển thị gì trước khi bắt đầu và sau khi bắt đầu và dừng?
 
Bạn cũng có thể thử đợi 10-30 giây và chạy lại nvidia-smi - nhiệt độ và tốc độ quạt sẽ giảm khi không sử dụng card.
 
Cũng hãy thử đợi 10-30 giây và chạy lại nvidia-smi - nó sẽ hiển thị nhiệt độ và tốc độ quạt giảm khi không sử dụng card.
Trước khi bắt đầu: Đây
Sau khi bắt đầu, quạt quay hết công suất, đóng băng: Hđây
Tôi đã dừng chương trình và thông tin vẫn như vậy.
Tôi phải khởi động lại máy tính để quạt ngừng chạy.
 
Cũng thử đợi 10-30 giây và chạy lại nvidia-smi - nó sẽ hiển thị nhiệt độ và tốc độ quạt giảm khi không sử dụng card.
Một điều buồn cười nữa là khi máy tính khởi động, tôi phải rút cáp khỏi GPU, nếu không thì nó sẽ không bao giờ khởi động được. Tôi chỉ thấy màn hình đen và không có gì cả. Tôi rút cáp ra và Linux khởi động. Cắm cáp vào GPU sau khi khởi động và mọi thứ lại ổn. Vâng... tốt nhất có thể....
Có thể là do vấn đề tương thích không? Tôi chỉ có một màn hình, HDMI trong card bo mạch chủ và cổng Display Port trong GEForce.
Điều này có hợp lý không?
 
Vấn đề về cáp màn hình thật kỳ lạ. Hãy thử xem qua các thiết lập BIOS của bạn trong trường hợp có điều gì đó nói về sở thích dành cho đồ họa bo mạch chủ so với card. Ngoài ra, có bất kỳ điều gì nói về khe cắm hoặc phân bổ bộ nhớ. Có thể có điều gì đó can thiệp.

Một điều khác cần thử là nâng cấp lên trình điều khiển NVidia mới nhất - Tôi nghĩ rằng họ đã phát hành CUDA 12.7 và một trình điều khiển mới hơn nữa. Có thể trình điều khiển đi kèm với Ubuntu không đủ mới cho card của bạn.
 
Ngoài ra, tôi có hiểu đúng không khi ở ảnh chụp màn hình thứ hai nvidia-smi từ chối kết nối? Điều này chắc chắn chỉ ra lỗi card bị sập, có thông báo nào trong dmesg nếu bạn vẫn có thể truy cập không?

Một cách để có được thông tin thứ hai là chạy một thiết bị đầu cuối cho dmesg
while [ x==x] ; do sleep 1; dmesg ; done

Và một cách khác với "nvidia-smi -l"

Bạn cũng có thể thấy lệnh "nvtop" hữu ích
 
Ngoài ra, tôi có hiểu đúng không khi ở ảnh chụp màn hình thứ hai, nvidia-smi từ chối kết nối? Điều này chắc chắn chỉ ra lỗi card bị sập, có thông báo nào trong dmesg nếu bạn vẫn có thể truy cập không?

Một cách để có được thông tin thứ hai là chạy một thiết bị đầu cuối cho dmesg
while [ x==x] ; do sleep 1; dmesg ; xong

Và một lệnh khác với "nvidia-smi -l"

Bạn cũng có thể thấy lệnh "nvtop" hữu ích
Đúng vậy, GPU từ chối kết nối, "GPU bị mất" là thông báo.
Lệnh nvidia-smi-l:
Sk%C3%A6rmbillede%20fra%202025-03-02%2020-17-20.png
 
Có vẻ như nvtop có vấn đề với trình điều khiển AMD của bạn, không liên quan gì đến việc tắt GeForce.

Thông báo "GPU is lost" là lần đầu tiên tôi thấy, nhưng có vẻ như điều này có thể xảy ra với các card NVidia bị quá nhiệt:

https://forums.developer.nvidia.com...aring-after-installing-nvidia-driver/289770/8

Trong liên kết ở trên, có người đã cố gắng sử dụng GPU máy chủ không có quạt. Bạn có một chiếc quạt (thực tế là ba chiếc), nhưng có thể nó là thứ gì đó tương tự - hãy thử làm theo các bước tương tự và so sánh nhật ký nhiệt độ với những gì bạn thấy ở người đăng khác.

Ngoài ra, hãy kiểm tra lại xem card có bị cản trở không - có thể có một chút băng dính cản trở bộ tản nhiệt không?
 
Back
Bên trên