citybreeze
New member
Chào buổi chiều mọi người,
Tôi hy vọng ai đó ngoài kia có thể giúp tôi giải quyết vấn đề khó chịu này, vì tôi sắp hết ý tưởng rồi (xin lỗi, bài đăng dài).
Sự cố này hầu như luôn xảy ra trong khi chơi game hoặc khi chạy thử nghiệm điểm chuẩn GPU. Máy tính của tôi tự khởi động lại mà không có cảnh báo; không có BSOD; không có gì rõ ràng trong trình xem sự kiện (ít nhất là không rõ ràng với tôi); không có vấn đề sắp xảy ra rõ ràng nào từ việc theo dõi nhiệt độ/điện áp/tải trước khi nó xảy ra.
Tôi sẽ trình bày nhiều bước mà tôi đã trải qua để cố gắng giải quyết vấn đề này bên dưới, nhưng trước tiên, có thể hữu ích khi biết một chút thông tin cơ bản. Tôi sống tại Vương quốc Anh. Tôi đã mua các thành phần vào năm 2024 và cuối cùng đã lắp ráp máy trong kỳ nghỉ Giáng sinh năm 2024. Đây là lần đầu tiên sau khoảng 20 năm tôi tự lắp ráp một giàn máy từ đầu, vì vậy hoàn toàn có thể tôi đã mắc phải một số lỗi ở đâu đó. Máy hoạt động hoàn hảo kể từ tháng 12 cho đến khoảng 2 tuần trước (vào giữa ngày 25 tháng 4, tôi lần đầu nhận thấy bất kỳ vấn đề nào).
* Tất cả các thành phần đều được mua mới, ngoại trừ những thành phần được đánh dấu * là những thành phần được chuyển từ máy trước của tôi (hai ổ cứng HDD, PSU và màn hình).
** GPU được mua dưới dạng thiết bị tân trang màn hình cũ từ Ebuyer. Nhãn dán trên hộp ghi là máy được tân trang vào ngày 17 tháng 4 năm 2024 và tôi đã mua vào tháng 10 năm 2024. Tôi phải kiểm tra lại, nhưng tôi tin là máy được bảo hành 1 năm nên vẫn được bảo hành.
CPU: AMD Ryzen 7 7700X
Bộ tản nhiệt CPU: Corsair H100x RGB ELITE
Bo mạch chủ: Gigabyte X670 AORUS ELITE AX Rev 1.3 (BIOS hiện tại - FB4 - 12 tháng 3 năm 25)
Ram: 64GB DDR5 (2x 32GB - G.Skill F5-6000J3040G32GX2-FX5, Flare X5, bộ AMD EXPO)
SSD/HDD: 1x Crucial P3 PLUS M.2 NVME PCIe Gen 4 1TB SSD, 1x Western Digital 2TB HDD*, 1x Toshiba Ổ cứng 3TB*
GPU: MSI Radeon RX 6750 XT Gaming X Trio 12gb**
PSU: Corsair RM850x* (5 năm tuổi)
Vỏ máy: Cooler Master HAF 700 Full Tower
HĐH: Windows 11 Home 10.0.26100 (24H2) được cập nhật đầy đủ
Màn hình: Màn hình AOC 27B1H 27" IPS Full HD* (1920x1080) - cũng được kết nối với TV chính bằng bộ chia HDMI
+ Tôi không hề can thiệp vào bất kỳ cài đặt CPU nào hoặc ép xung - nó luôn ở cài đặt gốc
+ Cũng đáng nói đến là thiết lập của tôi có cách bố trí hơi khác thường. Máy tính của tôi được đặt ở phòng trước cạnh TV chính (được kết nối qua bộ chia HD) mặc dù bàn làm việc của tôi lại ở phòng bên cạnh. Tôi sử dụng cáp HDMI 10m (có bộ khuếch đại) và cáp USB 10m có hub để nối đến bàn làm việc bên cạnh. Tôi không nghĩ điều này sẽ tạo ra bất kỳ sự khác biệt nào, nhưng tôi nghĩ tôi sẽ đề cập đến nó trong trường hợp
-
Tôi chơi game ở mức vừa phải nhưng không có trò nào quá đòi hỏi GPU. Fallout 4, Skyrim và Sea Power có lẽ là những trò chơi khó nhất. Sau đó, vài tuần trước, tôi chơi Borderlands 3 mà tôi chưa từng chơi trên PC trước đây. Đây là nơi các vấn đề bắt đầu. Nhiều giờ chơi trò chơi này ở cài đặt Ultra trôi qua mà không gặp trục trặc nào, bao gồm cả chế độ nhiều người chơi hợp tác trực tuyến, cho đến một ngày tôi phải khởi động lại lần đầu tiên trong số nhiều lần. Đây là khoảng 4 giờ trong phiên nhiều người chơi trực tuyến kéo dài 6 giờ. Sau khi khởi động lại, tôi đã quay lại trò chơi và không có vấn đề nào nữa trong phần còn lại của phiên, mặc dù tôi đã giảm cài đặt đồ họa xuống mức Trung bình để phòng ngừa.
Kể từ đó, tôi nghĩ mọi thứ -có thể- đã trở nên tồi tệ hơn. Vấn đề là tôi không thể 'gây ra' vấn đề một cách đáng tin cậy; đôi khi nó sẽ hoạt động trong nhiều giờ trong nhiều trò chơi khác nhau mà không cần khởi động lại, đôi khi nó sẽ khởi động lại sau 10 phút. Đôi khi nó sẽ vượt qua các bài kiểm tra chuẩn GPU, và đôi khi thì không. Như bạn sẽ thấy từ các bước tôi đã thực hiện bên dưới, điều này hầu như luôn xảy ra khi GPU đang chịu một số dạng tải, nhưng lượng tải dường như không quá quan trọng miễn là nó ở trên mức độ của màn hình nền.
-
Dưới đây là một loại mốc thời gian về các bước tôi đã thực hiện để cố gắng khắc phục sự cố. Theo như tôi nhớ thì nó gần giống với thứ tự tôi đã thử từng bản sửa lỗi.
- Theo dõi nhiệt độ bằng HWINFO và lớp phủ AMD Adrenaline. CPU trung bình là 36c khi nghỉ và khoảng 45c khi chơi game với mức tăng đột biến tối đa lên tới khoảng 80c. GPU trung bình là khoảng 28c khi nghỉ và khoảng 50c khi chơi game/chuẩn với mức cao nhất lên tới khoảng 58c.
- Thử nghiệm với các cấu hình quạt, bao gồm cả việc chơi với tất cả các quạt chạy 100% mọi lúc - không tạo ra sự khác biệt đáng kể nào đối với sự cố khởi động lại.
- Đã kiểm tra Windows được cập nhật đầy đủ
- Đã cập nhật BIOS vì tôi nhận thấy nó không phải là phiên bản mới nhất hiện có (hiện có trên FB4 phát hành ngày 12 tháng 3 năm 25)
- Đã cập nhật tất cả trình điều khiển chipset và GPU lên phiên bản mới nhất hiện có
- Chạy SFC /Scannow và DISM image-cleanup trong Dấu nhắc lệnh
Không có cách nào trong số này giải quyết được sự cố. Lúc này tôi nghĩ RAM có thể là nghi phạm chính, vì vậy tôi đã thực hiện các kiểm tra sau trên RAM:
- Kiểm tra lại RAM của tôi có nằm trong danh sách QVL cho bo mạch chủ của tôi không (đúng là vậy)
- Tháo và lắp lại các thanh để kiểm tra xem chúng có nằm đúng vị trí không
- Đổi các thanh xung quanh
- Đã thử chạy với từng thanh một (cho cả hai thanh)
- Chạy Windows Memory Diagnostic - không tìm thấy sự cố nào
- Chạy MemTest86 - 14 lần kiểm tra x 3 lần (mất một lúc!) - không tìm thấy sự cố nào
- Đã kiểm tra RAM trong BIOS (chưa thay đổi bất kỳ cài đặt nào từ nhà sản xuất cho đến thời điểm này) và nhận thấy nó đang chạy ở mức 6000MT trên cấu hình EXPO 1. Tôi quyết định tắt cấu hình EXPO 1 và đặt mọi thứ ở cài đặt tiêu chuẩn ở mức 4800MT để xem liệu nó có cải thiện được độ ổn định hay không.
Không có cách nào trong số này có vẻ tạo ra sự khác biệt nào. Sau khi RAM của tôi vượt qua mọi kiểm tra mà tôi đã thực hiện, tôi đã loại trừ nó là nghi phạm. Thật không may, hiện tại tôi không có bất kỳ thanh DDR5 'dự phòng' nào để hoán đổi hoặc một máy khác để kiểm tra. Nếu một số câu trả lời cho bài đăng này quay trở lại RAM là nguyên nhân có thể xảy ra, thì tôi sẽ cố gắng tìm một số câu trả lời.
Sau đó, tôi chuyển sang GPU là nghi phạm chính của mình.
- Tháo GPU ra, kiểm tra trực quan (không thấy vấn đề gì) và lắp lại
- Kiểm tra cáp đến GPU - nhận thấy có 2 đầu nối 8 chân nhưng tôi đã sử dụng cáp 'chuỗi nối tiếp' cho cả hai từ một đầu ra trên PSU. Thay thế cáp 'chuỗi nối tiếp' đơn bằng hai cáp riêng biệt trực tiếp từ PSU.
- Kiểm tra/làm mới trình điều khiển
Một lần nữa, không có gì trong số này có vẻ tạo ra sự khác biệt. Vì vậy, sau đó tôi chuyển sang xem xét các thứ ngẫu nhiên khác và thực hiện kiểm tra tình trạng chung của PC trong trường hợp có xung đột hoặc sự cố nền nào đó.
- Chạy kiểm tra CHKDSK trên tất cả các ổ đĩa của tôi - không tìm thấy sự cố nào
- Chạy disk optimizer/defrag - ổ cứng 3TB bị phân mảnh 1% và ổ cứng 2TB bị phân mảnh 10%, do đó đã khắc phục những sự cố đó.
- Chạy System File Checker (SFC /scannow) trong dấu nhắc lệnh - không tìm thấy sự cố nào
- Chạy lệnh DISM cleanup-image trong dấu nhắc lệnh - không tìm thấy sự cố nào
- Sử dụng công cụ gỡ Norton để (cuối cùng) xóa hoàn toàn phần mềm diệt vi-rút Norton đã hết hạn được cài đặt cùng với thứ gì đó (Windows?)
- Tải xuống Malwarebytes và chạy kiểm tra đầy đủ - không tìm thấy sự cố nào
- Kiểm tra/xóa/cập nhật trình điều khiển cho các thiết bị âm thanh và bộ điều hợp mạng. Tắt bộ điều hợp WiFi (máy của tôi được cắm trực tiếp vào bộ định tuyến)
- Xóa bộ nhớ đệm của trình duyệt (Chrome); đã ngừng sử dụng Chrome và bắt đầu sử dụng Opera GX thay thế.
- Đã kiểm tra xem 'Khởi động nhanh' đã tắt trong BIOS chưa (đúng là vậy)
- Đã kiểm tra cài đặt trong BIOS liên quan đến mất điện - đặt thành 'tắt' khi mất điện (vẫn khởi động lại, không tắt)
- Đã thay đổi cấu hình nguồn toàn hệ thống thành Cân bằng (trước đó là Hiệu suất cao)
- Đã thay đổi cài đặt bộ nhớ ảo (trong cài đặt hiệu suất hệ thống) thành 1,5x dung lượng RAM ban đầu và 3x dung lượng RAM tối đa (điều tôi đọc được trên diễn đàn Windows)
Một lần nữa, không có cách nào trong số đó có vẻ tạo ra sự khác biệt đối với sự cố khởi động lại của tôi. Lúc này, tôi bắt đầu hơi bực bội nên quyết định thực hiện một biện pháp quyết liệt hơn:
- Tháo rời PC của tôi, đảm bảo kiểm tra trực quan tất cả các thành phần và đầu nối - không phát hiện thấy vấn đề rõ ràng nào.
- Đã kiểm tra chức năng PSU bằng cách nối hai chân để quạt quay - hoạt động.
- Lắp ráp lại PC của tôi, sử dụng keo tản nhiệt mới, v.v. Thay đổi duy nhất tôi thực hiện là trong cách đi dây cáp và cách nhóm một số quạt lại với nhau để hợp lý hơn (hai quạt lớn trên SYSFANS2, quạt ở đế trên SYSFANS3, v.v.).
- Xóa trình điều khiển GPU bằng DDU (ở Chế độ an toàn) và cài đặt lại trình điều khiển mới trực tiếp từ trang web của nhà sản xuất
- Chạy lại SFC/scannow và DISM image-cleanup - không tìm thấy sự cố nào.
Lúc này lại là cuối tuần và là thời gian cho phiên Borderlands 3 trực tuyến tiếp theo của tôi. Tôi chơi ở cài đặt đồ họa trung bình, theo dõi nhiệt độ, FPS, tải GPU và CPU, mức sử dụng bộ nhớ hệ thống, v.v. - Tôi khởi động lại sau khoảng 2 giờ, không có thông tin nào từ quá trình theo dõi cho thấy bất kỳ vấn đề tiềm ẩn nào - sau khi khởi động lại, tôi tiếp tục chơi trong 3 giờ tiếp theo mà không cần khởi động lại.
Sau đó, tôi quyết định xem liệu mình có thể 'kích động' khởi động lại để cố gắng tìm ra nguyên nhân cơ bản hay không - Tôi đang nghĩ theo hướng GPU rút quá nhiều điện từ PSU (hoặc PSU bị lỗi) hoặc một số lỗi nội bộ khác với GPU tại thời điểm này.
- Chạy nhiều bài kiểm tra điểm chuẩn trong Borderlands 3, nhận được kết quả tốt như mong đợi (98 FPS ở chế độ 'badass', 104 FPS ở chế độ 'siêu', 120 FPS ở chế độ 'cao', 149 FPS ở chế độ 'trung bình') mà không có vấn đề khởi động lại nào và nhiệt độ đều thấp.
- Chạy bài kiểm tra điểm chuẩn FurMark GL (điểm chuẩn 1080p 1); 2 trong số 3 lần nó đã vượt qua với điểm số tuyệt đối, đạt 11747 và 11552. Lần còn lại, tôi phải khởi động lại.
- Chạy chuẩn Unigine Valley v1 ở nhiều cài đặt khác nhau; nó chỉ hoàn thành bài kiểm tra mà không khởi động lại một lần (ở cài đặt cao, mặc dù nó liên tục không vượt qua ở cài đặt trung bình).
- Yêu cầu một người bạn chạy thử nghiệm Unigine Valley trên máy của anh ấy (i7-9700k được dựng sẵn khoảng 7 năm với GTX 1080) ở cài đặt trung bình để so sánh; không có vấn đề gì khi anh ấy chạy thử nghiệm nhiều lần ở nhiều chế độ khác nhau.
- Chạy CPU Burner trong FurMark chỉ để cố gắng loại trừ các vấn đề về CPU - CPU nóng lên (lên đến đỉnh điểm khoảng 93c) nhưng không có vấn đề gì hoặc khởi động lại.
- Quay lại Borderlands 3, đặt cài đặt ở chế độ 'badass' và để nhân vật của tôi đứng ở một vị trí tương đối bận rộn (NPC đi ngang qua và hoạt động nền) trong khoảng 8 giờ (qua đêm) - không khởi động lại, mọi thứ đều ổn.
Sau đó, tôi bắt đầu xem cài đặt card đồ họa trong phần mềm AMD Adrenalin để xem liệu việc giảm hiệu chỉnh card một chút để giảm mức tiêu thụ điện có tạo ra sự khác biệt nào không:
- Thay đổi cài đặt tổng thể từ 'hiệu suất cao' thành 'HYPR-RX Eco' với Radeon Chill được bật; nhằm mục đích tiêu thụ ít điện năng nhất có thể trong khi vẫn duy trì 60FPS. Điều này đã làm giảm công suất khá nhiều. Mặc dù trước đây tôi đã thấy mức tiêu thụ hơn 200w, nhưng giờ tôi không thể đạt được mức đó nữa. Tôi đã thực hiện thêm một số bài kiểm tra chuẩn trong Borderlands 3 và ghi nhận mức công suất cao nhất (xấp xỉ) mà tôi nhận thấy ở mỗi cài đặt. Trong suốt quá trình, nhiệt độ GPU không bao giờ vượt quá 48 độ C.
Badass - 160w
Ultra - 150w
High - 130w
Medium - 90w
Low - 80w
Tuy nhiên, ngay cả ở những cài đặt này, tôi vẫn thỉnh thoảng bị khởi động lại trong trò chơi. không có cải thiện thực sự nào.
Tôi đã thực hiện thêm một số thử nghiệm trên các trò chơi khác, chơi mỗi trò chơi trong một giờ trên Fallout 4, Skyrim, FTL, Plague Inc và Sea Power để cố gắng kết hợp các trò chơi khác nhau vào đó. Tôi đã chơi tất cả ở cài đặt đồ họa 'cao' hoặc tương đương. Fallout 4 và Skyrim đều hoạt động tốt với mức tiêu thụ điện khoảng 70-90w với mức sử dụng GPU đạt mức cao nhất là 48% và nhiệt độ GPU tối đa là 51 độ C. FLT chỉ đạt 10w và mức sử dụng 5% ở 33c, trong khi Plague Inc không cao hơn thế nhiều. Tôi đạt tới 120w trong Sea Power ở mức sử dụng GPU khoảng 75% và nhiệt độ khoảng 50c, đó là lúc cuối cùng tôi cũng khởi động lại.
Sau đó, tôi quyết định xem xét việc undervolt GPU để xem liệu tôi có thể giảm mọi thứ thêm nữa không.
- Kích hoạt tùy chọn undervolt tiêu chuẩn trong AMD Adrenalin, giúp giảm từ 1200mV xuống 1175mV, nhưng tôi không nhận thấy bất kỳ sự khác biệt có ý nghĩa nào khi chơi các trò chơi tương tự ở trên.
- Đã thử một số cài đặt mà tôi tìm thấy trực tuyến ở đâu đó (có thể là Reddit?) undervolt xuống 1100mV, thay đổi tốc độ xung nhịp lên 2600, tăng tần số VRAM và bật chế độ VRAM nhanh. Lúc đầu, cách này có vẻ tốt hơn một chút, nhưng sau đó tôi gặp phải BSOD ngay lập tức trong Borderlands 3.
- Đã thay đổi cài đặt GPU trở lại chế độ 'eco' tiêu chuẩn.
- Đã thử chạy lại các bài kiểm tra chuẩn FurMark và Valley - nó liên tục không hoàn thành các bài kiểm tra này, dẫn đến phải khởi động lại.
Bây giờ tôi đã hết ý tưởng, vì vậy hãy xem xét việc cung cấp điện:
- Đã thay đổi cáp nguồn giữa ổ cắm trên tường tại PSU (hai lần, vì vậy tổng cộng sử dụng ba loại cáp khác nhau, bao gồm cả một loại cáp hoàn toàn mới)
- Đã thay đổi ổ cắm trên tường mà cáp nguồn chính được cắm vào. (mặc dù vẫn trên cùng một mạch - tất cả các ổ cắm của tôi đều nằm trên một mạch (trừ nhà bếp) vì đó là một ngôi nhà nhỏ và cũ).
Sau tất cả những điều đó, tôi vẫn không tiến gần hơn đến việc tìm ra nguyên nhân gây ra các lần khởi động lại này. Nếu có bất cứ điều gì, thì có vẻ như việc gây ra một lần khởi động lại này dễ dàng hơn bây giờ khi tôi đã trải qua 2 tuần kể từ lần đầu tiên xảy ra.
Tuy nhiên, nghi phạm chính của tôi vẫn là PSU và GPU, theo như mọi thứ tôi biết/đã đọc thì tôi đi theo hướng đó.
Các bước tiếp theo của tôi sẽ là:
- Đổi PSU (một người bạn của tôi có một chiếc Cooler Master MWE 650 v2 (MPE-6501-ACABW) hoàn toàn mới mà anh ấy đồng ý cho tôi thử)
- Đổi GPU (Tôi có Gigabyte 1050ti OC cũ để thử)
- Cài đặt lại Windows?
Tôi sẽ rất cảm kích nếu bất kỳ ai ở đây có bất kỳ ý tưởng nào khác để kiểm tra hoặc kinh nghiệm trước đây để chia sẻ về cách giải quyết vấn đề này. Cảm ơn trước.
Tôi hy vọng ai đó ngoài kia có thể giúp tôi giải quyết vấn đề khó chịu này, vì tôi sắp hết ý tưởng rồi (xin lỗi, bài đăng dài).
Sự cố này hầu như luôn xảy ra trong khi chơi game hoặc khi chạy thử nghiệm điểm chuẩn GPU. Máy tính của tôi tự khởi động lại mà không có cảnh báo; không có BSOD; không có gì rõ ràng trong trình xem sự kiện (ít nhất là không rõ ràng với tôi); không có vấn đề sắp xảy ra rõ ràng nào từ việc theo dõi nhiệt độ/điện áp/tải trước khi nó xảy ra.
Tôi sẽ trình bày nhiều bước mà tôi đã trải qua để cố gắng giải quyết vấn đề này bên dưới, nhưng trước tiên, có thể hữu ích khi biết một chút thông tin cơ bản. Tôi sống tại Vương quốc Anh. Tôi đã mua các thành phần vào năm 2024 và cuối cùng đã lắp ráp máy trong kỳ nghỉ Giáng sinh năm 2024. Đây là lần đầu tiên sau khoảng 20 năm tôi tự lắp ráp một giàn máy từ đầu, vì vậy hoàn toàn có thể tôi đã mắc phải một số lỗi ở đâu đó. Máy hoạt động hoàn hảo kể từ tháng 12 cho đến khoảng 2 tuần trước (vào giữa ngày 25 tháng 4, tôi lần đầu nhận thấy bất kỳ vấn đề nào).
* Tất cả các thành phần đều được mua mới, ngoại trừ những thành phần được đánh dấu * là những thành phần được chuyển từ máy trước của tôi (hai ổ cứng HDD, PSU và màn hình).
** GPU được mua dưới dạng thiết bị tân trang màn hình cũ từ Ebuyer. Nhãn dán trên hộp ghi là máy được tân trang vào ngày 17 tháng 4 năm 2024 và tôi đã mua vào tháng 10 năm 2024. Tôi phải kiểm tra lại, nhưng tôi tin là máy được bảo hành 1 năm nên vẫn được bảo hành.
CPU: AMD Ryzen 7 7700X
Bộ tản nhiệt CPU: Corsair H100x RGB ELITE
Bo mạch chủ: Gigabyte X670 AORUS ELITE AX Rev 1.3 (BIOS hiện tại - FB4 - 12 tháng 3 năm 25)
Ram: 64GB DDR5 (2x 32GB - G.Skill F5-6000J3040G32GX2-FX5, Flare X5, bộ AMD EXPO)
SSD/HDD: 1x Crucial P3 PLUS M.2 NVME PCIe Gen 4 1TB SSD, 1x Western Digital 2TB HDD*, 1x Toshiba Ổ cứng 3TB*
GPU: MSI Radeon RX 6750 XT Gaming X Trio 12gb**
PSU: Corsair RM850x* (5 năm tuổi)
Vỏ máy: Cooler Master HAF 700 Full Tower
HĐH: Windows 11 Home 10.0.26100 (24H2) được cập nhật đầy đủ
Màn hình: Màn hình AOC 27B1H 27" IPS Full HD* (1920x1080) - cũng được kết nối với TV chính bằng bộ chia HDMI
+ Tôi không hề can thiệp vào bất kỳ cài đặt CPU nào hoặc ép xung - nó luôn ở cài đặt gốc
+ Cũng đáng nói đến là thiết lập của tôi có cách bố trí hơi khác thường. Máy tính của tôi được đặt ở phòng trước cạnh TV chính (được kết nối qua bộ chia HD) mặc dù bàn làm việc của tôi lại ở phòng bên cạnh. Tôi sử dụng cáp HDMI 10m (có bộ khuếch đại) và cáp USB 10m có hub để nối đến bàn làm việc bên cạnh. Tôi không nghĩ điều này sẽ tạo ra bất kỳ sự khác biệt nào, nhưng tôi nghĩ tôi sẽ đề cập đến nó trong trường hợp
-
Tôi chơi game ở mức vừa phải nhưng không có trò nào quá đòi hỏi GPU. Fallout 4, Skyrim và Sea Power có lẽ là những trò chơi khó nhất. Sau đó, vài tuần trước, tôi chơi Borderlands 3 mà tôi chưa từng chơi trên PC trước đây. Đây là nơi các vấn đề bắt đầu. Nhiều giờ chơi trò chơi này ở cài đặt Ultra trôi qua mà không gặp trục trặc nào, bao gồm cả chế độ nhiều người chơi hợp tác trực tuyến, cho đến một ngày tôi phải khởi động lại lần đầu tiên trong số nhiều lần. Đây là khoảng 4 giờ trong phiên nhiều người chơi trực tuyến kéo dài 6 giờ. Sau khi khởi động lại, tôi đã quay lại trò chơi và không có vấn đề nào nữa trong phần còn lại của phiên, mặc dù tôi đã giảm cài đặt đồ họa xuống mức Trung bình để phòng ngừa.
Kể từ đó, tôi nghĩ mọi thứ -có thể- đã trở nên tồi tệ hơn. Vấn đề là tôi không thể 'gây ra' vấn đề một cách đáng tin cậy; đôi khi nó sẽ hoạt động trong nhiều giờ trong nhiều trò chơi khác nhau mà không cần khởi động lại, đôi khi nó sẽ khởi động lại sau 10 phút. Đôi khi nó sẽ vượt qua các bài kiểm tra chuẩn GPU, và đôi khi thì không. Như bạn sẽ thấy từ các bước tôi đã thực hiện bên dưới, điều này hầu như luôn xảy ra khi GPU đang chịu một số dạng tải, nhưng lượng tải dường như không quá quan trọng miễn là nó ở trên mức độ của màn hình nền.
-
Dưới đây là một loại mốc thời gian về các bước tôi đã thực hiện để cố gắng khắc phục sự cố. Theo như tôi nhớ thì nó gần giống với thứ tự tôi đã thử từng bản sửa lỗi.
- Theo dõi nhiệt độ bằng HWINFO và lớp phủ AMD Adrenaline. CPU trung bình là 36c khi nghỉ và khoảng 45c khi chơi game với mức tăng đột biến tối đa lên tới khoảng 80c. GPU trung bình là khoảng 28c khi nghỉ và khoảng 50c khi chơi game/chuẩn với mức cao nhất lên tới khoảng 58c.
- Thử nghiệm với các cấu hình quạt, bao gồm cả việc chơi với tất cả các quạt chạy 100% mọi lúc - không tạo ra sự khác biệt đáng kể nào đối với sự cố khởi động lại.
- Đã kiểm tra Windows được cập nhật đầy đủ
- Đã cập nhật BIOS vì tôi nhận thấy nó không phải là phiên bản mới nhất hiện có (hiện có trên FB4 phát hành ngày 12 tháng 3 năm 25)
- Đã cập nhật tất cả trình điều khiển chipset và GPU lên phiên bản mới nhất hiện có
- Chạy SFC /Scannow và DISM image-cleanup trong Dấu nhắc lệnh
Không có cách nào trong số này giải quyết được sự cố. Lúc này tôi nghĩ RAM có thể là nghi phạm chính, vì vậy tôi đã thực hiện các kiểm tra sau trên RAM:
- Kiểm tra lại RAM của tôi có nằm trong danh sách QVL cho bo mạch chủ của tôi không (đúng là vậy)
- Tháo và lắp lại các thanh để kiểm tra xem chúng có nằm đúng vị trí không
- Đổi các thanh xung quanh
- Đã thử chạy với từng thanh một (cho cả hai thanh)
- Chạy Windows Memory Diagnostic - không tìm thấy sự cố nào
- Chạy MemTest86 - 14 lần kiểm tra x 3 lần (mất một lúc!) - không tìm thấy sự cố nào
- Đã kiểm tra RAM trong BIOS (chưa thay đổi bất kỳ cài đặt nào từ nhà sản xuất cho đến thời điểm này) và nhận thấy nó đang chạy ở mức 6000MT trên cấu hình EXPO 1. Tôi quyết định tắt cấu hình EXPO 1 và đặt mọi thứ ở cài đặt tiêu chuẩn ở mức 4800MT để xem liệu nó có cải thiện được độ ổn định hay không.
Không có cách nào trong số này có vẻ tạo ra sự khác biệt nào. Sau khi RAM của tôi vượt qua mọi kiểm tra mà tôi đã thực hiện, tôi đã loại trừ nó là nghi phạm. Thật không may, hiện tại tôi không có bất kỳ thanh DDR5 'dự phòng' nào để hoán đổi hoặc một máy khác để kiểm tra. Nếu một số câu trả lời cho bài đăng này quay trở lại RAM là nguyên nhân có thể xảy ra, thì tôi sẽ cố gắng tìm một số câu trả lời.
Sau đó, tôi chuyển sang GPU là nghi phạm chính của mình.
- Tháo GPU ra, kiểm tra trực quan (không thấy vấn đề gì) và lắp lại
- Kiểm tra cáp đến GPU - nhận thấy có 2 đầu nối 8 chân nhưng tôi đã sử dụng cáp 'chuỗi nối tiếp' cho cả hai từ một đầu ra trên PSU. Thay thế cáp 'chuỗi nối tiếp' đơn bằng hai cáp riêng biệt trực tiếp từ PSU.
- Kiểm tra/làm mới trình điều khiển
Một lần nữa, không có gì trong số này có vẻ tạo ra sự khác biệt. Vì vậy, sau đó tôi chuyển sang xem xét các thứ ngẫu nhiên khác và thực hiện kiểm tra tình trạng chung của PC trong trường hợp có xung đột hoặc sự cố nền nào đó.
- Chạy kiểm tra CHKDSK trên tất cả các ổ đĩa của tôi - không tìm thấy sự cố nào
- Chạy disk optimizer/defrag - ổ cứng 3TB bị phân mảnh 1% và ổ cứng 2TB bị phân mảnh 10%, do đó đã khắc phục những sự cố đó.
- Chạy System File Checker (SFC /scannow) trong dấu nhắc lệnh - không tìm thấy sự cố nào
- Chạy lệnh DISM cleanup-image trong dấu nhắc lệnh - không tìm thấy sự cố nào
- Sử dụng công cụ gỡ Norton để (cuối cùng) xóa hoàn toàn phần mềm diệt vi-rút Norton đã hết hạn được cài đặt cùng với thứ gì đó (Windows?)
- Tải xuống Malwarebytes và chạy kiểm tra đầy đủ - không tìm thấy sự cố nào
- Kiểm tra/xóa/cập nhật trình điều khiển cho các thiết bị âm thanh và bộ điều hợp mạng. Tắt bộ điều hợp WiFi (máy của tôi được cắm trực tiếp vào bộ định tuyến)
- Xóa bộ nhớ đệm của trình duyệt (Chrome); đã ngừng sử dụng Chrome và bắt đầu sử dụng Opera GX thay thế.
- Đã kiểm tra xem 'Khởi động nhanh' đã tắt trong BIOS chưa (đúng là vậy)
- Đã kiểm tra cài đặt trong BIOS liên quan đến mất điện - đặt thành 'tắt' khi mất điện (vẫn khởi động lại, không tắt)
- Đã thay đổi cấu hình nguồn toàn hệ thống thành Cân bằng (trước đó là Hiệu suất cao)
- Đã thay đổi cài đặt bộ nhớ ảo (trong cài đặt hiệu suất hệ thống) thành 1,5x dung lượng RAM ban đầu và 3x dung lượng RAM tối đa (điều tôi đọc được trên diễn đàn Windows)
Một lần nữa, không có cách nào trong số đó có vẻ tạo ra sự khác biệt đối với sự cố khởi động lại của tôi. Lúc này, tôi bắt đầu hơi bực bội nên quyết định thực hiện một biện pháp quyết liệt hơn:
- Tháo rời PC của tôi, đảm bảo kiểm tra trực quan tất cả các thành phần và đầu nối - không phát hiện thấy vấn đề rõ ràng nào.
- Đã kiểm tra chức năng PSU bằng cách nối hai chân để quạt quay - hoạt động.
- Lắp ráp lại PC của tôi, sử dụng keo tản nhiệt mới, v.v. Thay đổi duy nhất tôi thực hiện là trong cách đi dây cáp và cách nhóm một số quạt lại với nhau để hợp lý hơn (hai quạt lớn trên SYSFANS2, quạt ở đế trên SYSFANS3, v.v.).
- Xóa trình điều khiển GPU bằng DDU (ở Chế độ an toàn) và cài đặt lại trình điều khiển mới trực tiếp từ trang web của nhà sản xuất
- Chạy lại SFC/scannow và DISM image-cleanup - không tìm thấy sự cố nào.
Lúc này lại là cuối tuần và là thời gian cho phiên Borderlands 3 trực tuyến tiếp theo của tôi. Tôi chơi ở cài đặt đồ họa trung bình, theo dõi nhiệt độ, FPS, tải GPU và CPU, mức sử dụng bộ nhớ hệ thống, v.v. - Tôi khởi động lại sau khoảng 2 giờ, không có thông tin nào từ quá trình theo dõi cho thấy bất kỳ vấn đề tiềm ẩn nào - sau khi khởi động lại, tôi tiếp tục chơi trong 3 giờ tiếp theo mà không cần khởi động lại.
Sau đó, tôi quyết định xem liệu mình có thể 'kích động' khởi động lại để cố gắng tìm ra nguyên nhân cơ bản hay không - Tôi đang nghĩ theo hướng GPU rút quá nhiều điện từ PSU (hoặc PSU bị lỗi) hoặc một số lỗi nội bộ khác với GPU tại thời điểm này.
- Chạy nhiều bài kiểm tra điểm chuẩn trong Borderlands 3, nhận được kết quả tốt như mong đợi (98 FPS ở chế độ 'badass', 104 FPS ở chế độ 'siêu', 120 FPS ở chế độ 'cao', 149 FPS ở chế độ 'trung bình') mà không có vấn đề khởi động lại nào và nhiệt độ đều thấp.
- Chạy bài kiểm tra điểm chuẩn FurMark GL (điểm chuẩn 1080p 1); 2 trong số 3 lần nó đã vượt qua với điểm số tuyệt đối, đạt 11747 và 11552. Lần còn lại, tôi phải khởi động lại.
- Chạy chuẩn Unigine Valley v1 ở nhiều cài đặt khác nhau; nó chỉ hoàn thành bài kiểm tra mà không khởi động lại một lần (ở cài đặt cao, mặc dù nó liên tục không vượt qua ở cài đặt trung bình).
- Yêu cầu một người bạn chạy thử nghiệm Unigine Valley trên máy của anh ấy (i7-9700k được dựng sẵn khoảng 7 năm với GTX 1080) ở cài đặt trung bình để so sánh; không có vấn đề gì khi anh ấy chạy thử nghiệm nhiều lần ở nhiều chế độ khác nhau.
- Chạy CPU Burner trong FurMark chỉ để cố gắng loại trừ các vấn đề về CPU - CPU nóng lên (lên đến đỉnh điểm khoảng 93c) nhưng không có vấn đề gì hoặc khởi động lại.
- Quay lại Borderlands 3, đặt cài đặt ở chế độ 'badass' và để nhân vật của tôi đứng ở một vị trí tương đối bận rộn (NPC đi ngang qua và hoạt động nền) trong khoảng 8 giờ (qua đêm) - không khởi động lại, mọi thứ đều ổn.
Sau đó, tôi bắt đầu xem cài đặt card đồ họa trong phần mềm AMD Adrenalin để xem liệu việc giảm hiệu chỉnh card một chút để giảm mức tiêu thụ điện có tạo ra sự khác biệt nào không:
- Thay đổi cài đặt tổng thể từ 'hiệu suất cao' thành 'HYPR-RX Eco' với Radeon Chill được bật; nhằm mục đích tiêu thụ ít điện năng nhất có thể trong khi vẫn duy trì 60FPS. Điều này đã làm giảm công suất khá nhiều. Mặc dù trước đây tôi đã thấy mức tiêu thụ hơn 200w, nhưng giờ tôi không thể đạt được mức đó nữa. Tôi đã thực hiện thêm một số bài kiểm tra chuẩn trong Borderlands 3 và ghi nhận mức công suất cao nhất (xấp xỉ) mà tôi nhận thấy ở mỗi cài đặt. Trong suốt quá trình, nhiệt độ GPU không bao giờ vượt quá 48 độ C.
Badass - 160w
Ultra - 150w
High - 130w
Medium - 90w
Low - 80w
Tuy nhiên, ngay cả ở những cài đặt này, tôi vẫn thỉnh thoảng bị khởi động lại trong trò chơi. không có cải thiện thực sự nào.
Tôi đã thực hiện thêm một số thử nghiệm trên các trò chơi khác, chơi mỗi trò chơi trong một giờ trên Fallout 4, Skyrim, FTL, Plague Inc và Sea Power để cố gắng kết hợp các trò chơi khác nhau vào đó. Tôi đã chơi tất cả ở cài đặt đồ họa 'cao' hoặc tương đương. Fallout 4 và Skyrim đều hoạt động tốt với mức tiêu thụ điện khoảng 70-90w với mức sử dụng GPU đạt mức cao nhất là 48% và nhiệt độ GPU tối đa là 51 độ C. FLT chỉ đạt 10w và mức sử dụng 5% ở 33c, trong khi Plague Inc không cao hơn thế nhiều. Tôi đạt tới 120w trong Sea Power ở mức sử dụng GPU khoảng 75% và nhiệt độ khoảng 50c, đó là lúc cuối cùng tôi cũng khởi động lại.
Sau đó, tôi quyết định xem xét việc undervolt GPU để xem liệu tôi có thể giảm mọi thứ thêm nữa không.
- Kích hoạt tùy chọn undervolt tiêu chuẩn trong AMD Adrenalin, giúp giảm từ 1200mV xuống 1175mV, nhưng tôi không nhận thấy bất kỳ sự khác biệt có ý nghĩa nào khi chơi các trò chơi tương tự ở trên.
- Đã thử một số cài đặt mà tôi tìm thấy trực tuyến ở đâu đó (có thể là Reddit?) undervolt xuống 1100mV, thay đổi tốc độ xung nhịp lên 2600, tăng tần số VRAM và bật chế độ VRAM nhanh. Lúc đầu, cách này có vẻ tốt hơn một chút, nhưng sau đó tôi gặp phải BSOD ngay lập tức trong Borderlands 3.
- Đã thay đổi cài đặt GPU trở lại chế độ 'eco' tiêu chuẩn.
- Đã thử chạy lại các bài kiểm tra chuẩn FurMark và Valley - nó liên tục không hoàn thành các bài kiểm tra này, dẫn đến phải khởi động lại.
Bây giờ tôi đã hết ý tưởng, vì vậy hãy xem xét việc cung cấp điện:
- Đã thay đổi cáp nguồn giữa ổ cắm trên tường tại PSU (hai lần, vì vậy tổng cộng sử dụng ba loại cáp khác nhau, bao gồm cả một loại cáp hoàn toàn mới)
- Đã thay đổi ổ cắm trên tường mà cáp nguồn chính được cắm vào. (mặc dù vẫn trên cùng một mạch - tất cả các ổ cắm của tôi đều nằm trên một mạch (trừ nhà bếp) vì đó là một ngôi nhà nhỏ và cũ).
Sau tất cả những điều đó, tôi vẫn không tiến gần hơn đến việc tìm ra nguyên nhân gây ra các lần khởi động lại này. Nếu có bất cứ điều gì, thì có vẻ như việc gây ra một lần khởi động lại này dễ dàng hơn bây giờ khi tôi đã trải qua 2 tuần kể từ lần đầu tiên xảy ra.
Tuy nhiên, nghi phạm chính của tôi vẫn là PSU và GPU, theo như mọi thứ tôi biết/đã đọc thì tôi đi theo hướng đó.
Các bước tiếp theo của tôi sẽ là:
- Đổi PSU (một người bạn của tôi có một chiếc Cooler Master MWE 650 v2 (MPE-6501-ACABW) hoàn toàn mới mà anh ấy đồng ý cho tôi thử)
- Đổi GPU (Tôi có Gigabyte 1050ti OC cũ để thử)
- Cài đặt lại Windows?
Tôi sẽ rất cảm kích nếu bất kỳ ai ở đây có bất kỳ ý tưởng nào khác để kiểm tra hoặc kinh nghiệm trước đây để chia sẻ về cách giải quyết vấn đề này. Cảm ơn trước.