Cách kiểm tra tình trạng ổ SSD/HDD trên Linux

theanh

Administrator
Nhân viên
Nếu bạn là quản trị viên hệ thống và chịu trách nhiệm quản lý các hệ thống Linux trong Datacenter. Sau đó, bạn nên kiểm tra tình trạng ổ SSD và HDD thường xuyên. Điều này sẽ giúp bạn xác định các ổ đĩa bị lỗi có thể thay thế trước khi xảy ra mất dữ liệu. Để kiểm tra tình trạng ổ SSD hoặc HDD trong Linux, bạn có thể sử dụng các công cụ như smartctl (một phần của gói smartmontools) và gnome-disks. smartctl cung cấp thông tin chi tiết và chẩn đoán cho các thiết bị lưu trữ, bao gồm tỷ lệ lỗi, nhiệt độ và trạng thái hoạt động chung. Bạn có thể cài đặt nó bằng trình quản lý gói của mình.

Điều kiện tiên quyết​

  • Máy chủ hoặc máy tính để bàn chạy hệ điều hành Linux.
  • Mật khẩu gốc được cấu hình trên máy chủ.

Cài đặt Smartctl​

Smartctl được bao gồm trong kho lưu trữ mặc định của tất cả các bản phân phối Linux chính. Các lệnh sau được chạy dưới dạng người dùng gốc. nếu bạn không đăng nhập với tư cách là root, hãy hối hận "sudo " vào các lệnh.

Đối với các bản phân phối Debian và Ubuntu, hãy cài đặt Smartctl bằng lệnh sau:
Mã:
apt install smartmontools -y
Đối với các bản phân phối RHEL, CentOS và Fedora, hãy cài đặt Smartctl bằng lệnh sau lệnh:
Mã:
dnf install smartmontools
Sau khi cài đặt Smartctl, hãy khởi động dịch vụ Smartctl bằng lệnh sau:
Mã:
systemctl start smartd
Bạn có thể kiểm tra trạng thái của smartd bằng lệnh sau lệnh:
Mã:
systemctl status smartd
Bạn sẽ nhận được kết quả sau:
Mã:
? smartmontools.service - Self Monitoring and Reporting Technology (SMART) Daemon Loaded: loaded (/lib/systemd/system/smartmontools.service; enabled; vendor preset: enabled) Active: active (running) since Fri 2024-07-02 08:58:33 UTC; 11s ago Docs: man:smartd(8) man:smartd.conf(5) Main PID: 1042 (smartd) Status: "Next check of 0 devices will start at 09:28:33" Tasks: 1 (limit: 2353) Memory: 1.2M CGroup: /system.slice/smartmontools.service ??1042 /usr/sbin/smartd -n
Jul 02 08:58:33 ubuntu2404 smartd[1042]: Device: /dev/sda, opened
Jul 02 08:58:33 ubuntu2404 smartd[1042]: Device: /dev/sda, [QEMU QEMU HARDDISK 2.5+], 53.6 GB
Jul 02 08:58:33 ubuntu2404 smartd[1042]: Device: /dev/sda, IE (SMART) not enabled, skip device
Jul 02 08:58:33 ubuntu2404 smartd[1042]: Try 'smartctl -s on /dev/sda' to turn on SMART features
Jul 02 08:58:33 ubuntu2404 smartd[1042]: Device: /dev/sdb, opened
Jul 02 08:58:33 ubuntu2404 smartd[1042]: Device: /dev/sdb, [AN Volume 2.5+], S/N: sdb, 53.6 GB
Jul 02 08:58:33 ubuntu2404 smartd[1042]: Device: /dev/sdb, IE (SMART) not enabled, skip device
Jul 02 08:58:33 ubuntu2404 smartd[1042]: Try 'smartctl -s on /dev/sdb' to turn on SMART features
Jul 02 08:58:33 ubuntu2404 smartd[1042]: Monitoring 0 ATA/SATA, 0 SCSI/SAS and 0 NVMe devices
Jul 02 08:58:33 ubuntu2404 systemd[1]: Started Self Monitoring and Reporting Technology (SMART) Daemon.

Kiểm tra tình trạng sức khỏe của SSD/HDD​

Sau khi cài đặt Smartctl, bạn sẽ cần bật các tính năng SMART trên ổ cứng của mình.

Bạn có thể thực hiện bằng cách sau lệnh:
Mã:
smartctl -s on /dev/sda
Điều đầu tiên bạn cần làm là lấy thông tin về SSD hoặc HDD.

Bạn có thể thực hiện bằng lệnh sau:
Mã:
smartctl -i /dev/sda
Điều này sẽ cung cấp cho bạn thông tin chi tiết về ổ cứng của bạn ổ đĩa.
Mã:
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-4.4.0-148-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Device Model: WDC WD5000LPVX-75V0TT0
Serial Number: WXV1EC4KN2N7
LU WWN Device Id: 5 0014ee 65af65611
Firmware Version: 01.01A01
User Capacity: 500,107,862,016 bytes [500 GB]
Sector Sizes: 512 bytes logical, 4096 bytes physical
Rotation Rate: 5400 rpm
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: ACS-2 (minor revision not indicated)
SATA Version is: SATA 3.0, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is: Fri Jul 2 14:39:33 2021 IST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
Nếu bạn muốn thực hiện một bài kiểm tra ngắn trên ổ đĩa, hãy chạy lệnh sau:
Mã:
smartctl -t short -a /dev/sda
Bạn sẽ nhận được kết quả đầu ra sau:
Mã:
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-4.4.0-148-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Device Model: WDC WD5000LPVX-75V0TT0
Serial Number: WXV1EC4KN2N7
LU WWN Device Id: 5 0014ee 65af65611
Firmware Version: 01.01A01
User Capacity: 500,107,862,016 bytes [500 GB]
Sector Sizes: 512 bytes logical, 4096 bytes physical
Rotation Rate: 5400 rpm
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: ACS-2 (minor revision not indicated)
SATA Version is: SATA 3.0, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is: Fri Jul 2 14:40:23 2021 IST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
General SMART Values:
Offline data collection status: (0x00)	Offline data collection activity	was never started.	Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0)	The previous self-test routine completed	without error or no self-test has ever	been run.
Total time to complete Offline
data collection:	( 9360) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.	Auto Offline data collection on/off support.
Bài kiểm tra ngắn sẽ kiểm tra các tính chất điện và tính chất cơ học, cũng như đọc/xác minh.

Để tìm và in kết quả tự kiểm tra, hãy chạy lệnh sau:
Mã:
smartctl -l selftest /dev/sda
Bạn sẽ nhận được kết quả sau đầu ra:
Mã:
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-4.4.0-148-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 7609 -
# 2 Short offline Interrupted (host reset) 90% 6972 -
# 3 Short offline Aborted by host 70% 6972 -
# 4 Short offline Interrupted (host reset) 70% 2 -
Để chạy thử nghiệm dài, hãy sử dụng lệnh sau:
Mã:
smartctl -t long -a /dev/sda
Bạn sẽ nhận được kết quả sau đầu ra:
Mã:
SMART Selective self-test log data structure revision number 1 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 Not_testing 2 0 0 Not_testing 3 0 0 Not_testing 4 0 0 Not_testing 5 0 0 Not_testing
Selective self-test flags (0x0): After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: "Execute SMART Extended self-test routine immediately in off-line mode".
Drive command "Execute SMART Extended self-test routine immediately in off-line mode" successful.
Testing has begun.
Please wait 107 minutes for test to complete.
Test will complete after Fri Jul 2 16:30:41 2021
Use smartctl -X to abort test.
Kiểm tra dài sẽ kiểm tra mọi thứ có trong kiểm tra ngắn.

Bạn có thể dừng kiểm tra, chạy lệnh sau:
Mã:
smartctl -X /dev/sda
Bạn sẽ thấy thông báo sau đầu ra:
Mã:
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-4.4.0-148-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: "Abort SMART off-line mode self-test routine".
Self-testing aborted!
Để kiểm tra tình trạng chung của ổ đĩa, hãy chạy lệnh sau:
Mã:
smartctl -d ata -H /dev/sda
Bạn sẽ nhận được thông báo sau đầu ra:
Mã:
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-4.4.0-148-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
Để kiểm tra thời gian ước tính để thực hiện thử nghiệm, hãy chạy lệnh sau:
Mã:
smartctl -c /dev/sda
Bạn sẽ nhận được đầu ra sau:
Mã:
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-4.4.0-148-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF READ SMART DATA SECTION ===
General SMART Values:
Offline data collection status: (0x00)	Offline data collection activity	was never started.	Auto Offline Data Collection: Disabled.
Self-test execution status: ( 25)	The self-test routine was aborted by	the host.
Total time to complete Offline
data collection:	( 9360) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.	Auto Offline data collection on/off support.	Suspend Offline collection upon new	command.	Offline surface scan supported.	Self-test supported.	Conveyance Self-test supported.	Selective Self-test supported.
SMART capabilities: (0x0003)	Saves SMART data before entering	power-saving mode.	Supports SMART auto save timer.
Error logging capability: (0x01)	Error logging supported.	General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 107) minutes.
Conveyance self-test routine
recommended polling time: ( 5) minutes.
SCT capabilities: (0x7035)	SCT Status supported.	SCT Feature Control supported.	SCT Data Table supported.
Để chỉ in nhật ký lỗi, hãy chạy lệnh sau:
Mã:
smartctl -l error /dev/sda
Để nhận thông tin trợ giúp, hãy chạy lệnh sau lệnh:
Mã:
smartctl --help

Kết luận​

Trong hướng dẫn trên, bạn đã học cách cài đặt và sử dụng công cụ S.M.A.R.T để kiểm tra tình trạng ổ đĩa SSH và HDD của mình. Tôi hy vọng điều này sẽ giúp ích cho bạn rất nhiều. Để biết thêm thông tin, hãy đọc trang hướng dẫn của smartctl.
 
Back
Bên trên