Hỏi / Đáp Thẻ RAID không còn hoạt động, báo lỗi phần mềm khi POST?

Cyber_Akuma

New member
Tôi có một LSI 9260-8i, thực ra nó đã được flash lại từ IRM ServeRAID M5014 ban đầu khi nó được đưa đến. Kể từ đó, nó cũng đã được nâng cấp lên chương trình cơ sở mới nhất từ LSI/Broadcom, đó là 12.15.0-0239 (thẻ cũng được xác định là phiên bản BIOS khi khởi động là "3.30.02.2 (Bản dựng ngày 17 tháng 6 năm 2014)"). Tôi chỉ đơn giản là sử dụng nó trong hệ thống Windows 10 của mình, không phải là một phần của máy chủ hoặc NAS.

Thẻ này đã bị ngắt kết nối khỏi hệ thống của tôi trong khoảng 6-12 tháng, cũng như các ổ đĩa của nó, gần đây tôi đã kết nối lại mọi thứ trong một hệ thống mới. Tôi có bốn ổ cứng trong RAID5, nhưng gần đây đã có được khóa cấp phép để bật RAID6 và đã cài đặt ổ cứng thứ 5 để chuẩn bị cho việc đó. Lúc đầu tôi gặp một vài lỗi, nhưng nhiều thứ trong hệ thống lúc đầu báo lỗi nên tôi không nghĩ nhiều về điều đó vì tôi đã thực hiện nhiều nâng cấp và thay đổi cùng một lúc.

Cuối cùng tôi cũng khởi động được mọi thứ bình thường và sau đó mở phần mềm quản lý RAID Windows (Phiên bản 17.05.02.01 vào thời điểm đó) và có vẻ như mọi thứ đều ổn. Nó thực hiện Đọc tuần tra trên tất cả các ổ đĩa của tôi và đang sạc lại pin (Mặc dù nó tuyên bố rằng pin đã hỏng, nhưng vì pin mới nên tôi nghĩ nó cần thực hiện một chu kỳ sạc lại và học lại để thấy pin hoạt động tốt trở lại). Nó nói rằng Đọc tuần tra chỉ mất 10 phút nhưng tôi biết sẽ mất hàng giờ. Đến giữa chừng, vào khoảng thời gian 3-4 giờ, phần mềm hoàn toàn ngừng phản hồi. Tôi đã khởi động lại nó và bây giờ card cho thấy rằng không có bất cứ thứ gì được cài đặt vào card.

Tôi đã khởi động lại và bây giờ tôi liên tục nhận được thông báo lỗi này trong quá trình khởi tạo card trong POST:


LSI MegaRAID SAS-MFI BIOS Phiên bản 3.30.02.2 (Bản dựng ngày 17 tháng 6 năm 2014) Bản quyền(c) 2014 LSI Corporation Host Adapter Bus 5 Dev 0:

F/W đang ở Trạng thái Lỗi Trạng thái Đăng ký MFI 0xF0010002

Bộ điều hợp tại Baseport không phản hồi

Không có MegaRAID Bộ điều hợp đã cài đặt
Sau đó, có thể thấy thẻ đã được cài đặt, nhưng các ổ đĩa không hiển thị và phần mềm quản lý thậm chí không thể biết thẻ đã được cài đặt nữa. Tôi đã thử cập nhật lên phần mềm quản lý mới nhất (17.05.06.00) trong trường hợp ít nhất nó có thể thấy có một thẻ đã được cài đặt, vì đó là một vấn đề rắc rối của riêng nó khi mong đợi tôi cài đặt OpenJDK theo cách thủ công và tự thiết lập đường dẫn môi trường, nó cũng chỉ bị kẹt khi tải ứng dụng.

Tôi đã thử MegaCLI, StorCLI và MegaSCU (tôi thừa nhận rằng tôi không quen lắm với việc quản lý thẻ này thông qua CLI) nhưng -v và -AdpAllInfo -aALL nhưng tất cả đều không trả về kết quả nào. Tôi đã thử ngắt kết nối các ổ đĩa trong trường hợp một ổ đĩa bị lỗi trong quá trình lưu trữ khiến ổ đĩa bị sập và không có sự khác biệt. Tôi đã thử ổ cắm PCI duy nhất khác trên bo mạch chủ của mình và nó thậm chí còn không khởi động được, tôi đoán ổ cắm đó thậm chí còn không hoạt động với mọi thứ khác được cài đặt trong hệ thống của tôi.

Tôi không biết phải làm gì bây giờ. Thẻ từ chối hoạt động, tuyên bố rằng nó đang gặp phải một số lỗi phần mềm trên POST, không có phần mềm nào có vẻ phát hiện ra sự hiện diện của thẻ mặc dù nó hiển thị vật lý trong Trình quản lý thiết bị (mặc dù có lỗi "Đã xảy ra lỗi phần cứng bộ điều hợp I/O.") và HWiNFO, và tôi không biết bất kỳ cách nào tôi có thể thử flash lại phần mềm trong trường hợp đó là sự cố phần mềm (mặc dù tôi có phần nghi ngờ) hoặc những gì khác để thử.

Và vâng, tôi có bản sao lưu dữ liệu của mình.
 
Trừ khi có lý do rất cụ thể để sử dụng RAID (bất kỳ loại nào) thì RAID không cần thiết cho hầu hết các môi trường máy tính và mạng.

Do đó, RAID đang hoặc sẽ trở thành vấn đề nói chung.

Tôi đề xuất ngừng sử dụng RAID hoàn toàn.

Trừ khi có lý do/yêu cầu cụ thể hỗ trợ nhu cầu sử dụng RAID như đã nêu trong câu đầu tiên.

Cần thêm thông tin. Tại sao lại là RAID?
 
Cung cấp cho tôi ổ đĩa lớn hơn ổ đĩa đơn trong khi vẫn có tính dự phòng. Tôi chỉ muốn làm cho nó hoạt động trở lại, không phải đại tu toàn bộ hệ thống của tôi để hoàn tác thiết lập RAID.
 
Cung cấp cho tôi ổ đĩa lớn hơn so với ổ đĩa đơn trong khi vẫn có tính dự phòng. Tôi chỉ muốn làm cho nó hoạt động trở lại, không phải đại tu toàn bộ hệ thống của mình để hoàn tác thiết lập RAID.
Loại RAID nào?

0, 1, 5, khác?
 
Như tôi đã nói, đó là RAID5 nhưng tôi đã thêm một ổ đĩa khác và đang có kế hoạch chuyển đổi nó thành RAID6.
bạn đã thử ngắt kết nối mọi thứ khỏi card RAID chưa? lỗi chương trình cơ sở đó có nghĩa là không có hoặc chỉ có một phần giao tiếp với bộ điều khiển, có một khả năng nhỏ là một số ổ đĩa khiến bộ điều khiển của bạn không khởi động được, nhưng nếu bạn ngắt kết nối mọi thứ khỏi card đó và vẫn không có kết nối nào từ bộ điều khiển, điều đó có nghĩa là card RAID của bạn hiện là rác thải điện tử
 
Vâng, tôi đã thử ngắt kết nối tất cả các ổ đĩa. Thẻ có hai cổng SAS và các ổ đĩa được kết nối bằng bộ chuyển đổi SAS sang 4xSATA, vì vậy tôi vừa thử rút cả hai cáp SAS khỏi thẻ, vẫn gặp lỗi FW khi POST.
 
Tôi nghĩ mình có thể có manh mối, nhưng nó cực kỳ kỳ lạ và không hợp lý chút nào. Bạn còn nhớ lúc đầu tôi đã nói rằng card hoạt động nhưng sau đó bị sập trong khi Đọc tuần tra và không hoạt động nữa không? Tôi nhận thấy card báo cáo nhiệt độ BBU cao khi đang Đọc tuần tra. Thông thường, case của tôi có quạt bên 200mm thổi qua tất cả các cổng PCIe, nhưng vì tôi đang làm việc trên máy tính nên tất cả các tấm ốp bên đều bị tắt. Trước đó, tôi nhận thấy card sẽ nóng khi tháo tấm ốp bên/quạt nhưng vẫn ổn khi lắp vào nên tôi quyết định chỉ cần đặt một quạt bàn thổi về phía card, card bị sập ngay sau đó.

Quạt được đặt nghiêng về phía PC trong suốt thời gian tôi cố gắng làm việc trên đó và đó không phải là điều tôi đang chủ động nghĩ đến. Tôi cũng đã thực hiện nhiều bài kiểm tra ứng suất với card không được ngắt kết nối và quạt thổi vào hệ thống mà không có vấn đề gì.

Gần đây tôi đã tắt nó đi để di chuyển nó ra khỏi đường đi để tôi có nhiều không gian hơn để làm việc, và đó là lúc card bắt đầu hoạt động trở lại một cách bí ẩn. Tôi để nó như thế này và nó không chỉ hoàn thành quá trình đọc tuần tra mà còn tiếp tục hoạt động tốt, tôi để nó qua đêm và nó vẫn hoạt động tốt vào buổi sáng. Tôi đã thử bật và hướng quạt vào nó một lần nữa và trong vòng vài phút, hệ thống chuyển sang màn hình xanh, khi tôi khởi động lại phần mềm máy khách Windows cho card RAID, ngay lập tức hiển thị cho tôi một cửa sổ bật lên rằng card đã gặp lỗi nghiêm trọng và đã được đặt lại.

Chuyện quái gì đang xảy ra vậy? Card chạy tốt khi nó chỉ ở trong/trên nhiệt độ hoạt động tiêu chuẩn một chút nhưng nó bị sập nếu tôi cố làm mát nó? Có ai từng nghe nói đến điều gì như thế này chưa? Đây có phải là dấu hiệu cho thấy card bị hỏng hay việc hướng quạt bàn vào PC thường gây ra sự cố như thế này không? Điều này không có ý nghĩa gì với tôi.
 
Có thể IC flash lưu trữ chương trình cơ sở của thẻ bị hỏng khi lạnh (bit rot?) và bây giờ phản ứng khi được làm nóng không? Hãy thử nhắm mục tiêu vào con chip này bằng cách sưởi ấm và làm mát.

https://m.media-amazon.com/images/I/91jF+TExYfL.jpg

Tôi thấy hai IC Atmel 8 chân gần góc trên bên phải của bộ tản nhiệt. Chip 24C0x là EEPROM dung lượng thấp, có thể để lưu trữ siêu dữ liệu RAID, thông tin cấu hình, v.v. Tôi không nhận ra chip kia, nhưng có thể là bộ nhớ flash nối tiếp sê-ri 25xxx, trong trường hợp đó, nó sẽ chứa chương trình cơ sở của thẻ.

Một khả năng khác là việc làm ấm thẻ sẽ làm hỏng mối hàn không liên tục. Trong trường hợp này, bạn có thể kích hoạt lỗi bằng cách chạm hoặc uốn cong thẻ.
 
Tôi nghĩ hai con chip mà bạn đang nói đến nằm ở mặt sau của thẻ, một con chip (nand?) lưu trữ chương trình cơ sở và một con chip NVRAM lưu trữ các thiết lập/cấu hình:

https://m.media-amazon.com/images/I/61OHYKIuWJL._AC_SL1000_.jpg

Mặc dù rõ ràng là CPU nếu không phải các chip khác sẽ nằm dưới bộ tản nhiệt, mà tôi chưa bao giờ tháo ra (và thậm chí không biết cách).

Mối hàn hỏng? Vậy thì tôi có nên để card quá nóng với hy vọng nó sẽ tan chảy trở lại không? Đùa thôi, nếu đó là một con chip bị bong tróc hoặc mối hàn hỏng trên thứ phức tạp như thế này thì tôi không thể sửa được. Tôi đã đặt mua một cái khác trên eBay, người bán khẳng định là mới nhưng tôi rất nghi ngờ rằng có cái mới nào tồn tại trong nhiều năm nữa, đặc biệt là trên eBay. Tôi chỉ hy vọng nó không gặp vấn đề gì.

Vậy thì, vì card hiện đang hoạt động, tôi có thể sử dụng Trình quản lý lưu trữ MegaRAID của Windows để lưu cấu hình của nó, tôi có thể tải nó vào card mới rồi cắm ổ đĩa vào và tiếp tục như không có chuyện gì xảy ra không? Chưa bao giờ phải hoán đổi card RAID trước đây, vì vậy tôi không muốn thực hiện theo cách có thể khiến dữ liệu của tôi bị xóa.

Như tôi đã đề cập, tôi cũng đang có kế hoạch di chuyển RAID5 sang RAID6 và đã thêm một ổ đĩa hiện chưa được cấu hình cho việc này. Một lần nữa, đây là điều tôi chưa từng làm trước đây. Theo những gì tôi hiểu trong phần mềm, tôi sẽ vào danh sách các ổ đĩa logic, nhấp chuột phải vào Nhóm ổ đĩa là RAID5 và chọn "Sửa đổi nhóm ổ đĩa" để chuyển sang RAID6 và thêm ổ đĩa thứ 5 để thực hiện mà không xóa dữ liệu của tôi, đúng không?

Mặc dù card hiện tại này hiện có thể hoàn tất Đọc tuần tra và thực hiện Kiểm tra tính nhất quán mà không có sự cố, nhưng tôi không tin rằng nó sẽ không bị sập trong quá trình chuyển đổi RAID6, vì vậy tôi sẽ đợi cho đến khi có ổ đĩa thay thế. Ổ đĩa thay thế sẽ không bị sập khi tôi chĩa quạt vào, đúng không?
 
IC TSOP-56 có vẻ là bộ lưu trữ chương trình cơ sở chính. Tôi nghĩ rằng chip 24C0x ở phía bên kia sẽ là NVRAM. Nếu bạn có thể cho tôi biết các ký hiệu của bộ phận, tôi sẽ có thể đoán tốt hơn.
 
Back
Bên trên