Sebelumnya kita pernah membuat artikel perihal cara pengecekan kesehatan SSD Storage pada server di : https://www.natanetwork.com/portal/knowledgebase/260/Tutorial-melakukan-pengecekan-kesehatan-SSD-Storage-di-Linux-OS.html
Namun tutorial tersebut berlaku jika kamu menggunakan raid software (mdadm). Nah, trus gimana kalo menggunakan raid hardware? ini kadang yang menjadi permasalahan. Namun jangan kawatir, kami akan mencoba menjelaskan secara rinci. Simak artikel ini sampe habis ya!
Install MegaCLI
Langkah awal yang harus kamu lakukan adalah install MegaCli. Ini tergantung jenis raid hardware yang kamu gunakan ya.
Sebagai contoh:
Raid Hardware model 9361-8i menggunakan chipset LSI SAS3108, yaitu setara dengan Dell Perc H730 + BBU
Raid Hardware model 9341-8i menggunakan chipset LSI SAS3008, yaitu setara dengan Dell Perc H330
Jika kamu pengguna raid hardware dell, silahkan install PERCCLI for linux di: https://www.dell.com/support/kbdoc/en-id/000217748/how-to-install-perccli-utility-on-red-hat-linux-ubuntu-linux-vmware-esxi-and-windows-server
Namun jika kamu menggunakan raid hardware adaptor jenis lain, mungkin bisa juga mencoba ini : MegaCli-8.07.14-1.noarch.rpm
https://www.mellowhost.com/billing/index.php?rp=/knowledgebase/69/How-to-Install-LSI-Command-Line-Tool.html
Melihat Virtual Drive
Setelah install, biasanya file akan disimpan di lokasi /opt/MegaRAID/MegaCli/
jalankan perintah ini untuk membaca Virtual Drive yang sudah kamu buat.
[root@sgp-server MegaCli]# /opt/MegaRAID/MegaCli/MegaCli64 -LdPdInfo -aAll
Contoh salah satu Virtual Drive yang saya miliki yaitu :
Virtual Drive: 1 (Target Id: 1)
Name :VD02
RAID Level : Primary-1, Secondary-0, RAID Level Qualifier-0
Size : 1.745 TB
Sector Size : 512
Is VD emulated : No
Mirror Data : 1.745 TB
State : Degraded
Strip Size : 256 KB
Number Of Drives : 2
Span Depth : 1
Default Cache Policy: WriteThrough, ReadAheadNone, Direct, No Write Cache if Bad BBU
Current Cache Policy: WriteThrough, ReadAheadNone, Direct, No Write Cache if Bad BBU
Default Access Policy: Read/Write
Current Access Policy: Read/Write
Disk Cache Policy : Disk's Default
Encryption Type : None
Bad Blocks Exist: No
PI type: No PI
Terlihat disana menggunakan RAID-1 mirroring
dengan konfigurasi WriteThrough
dan No Read Ahead.
berikut detail salah satu ssd storage yang digunakan.
=== START OF INFORMATION SECTION ===
Model Family: Samsung based SSDs
Device Model: SAMSUNG MZ7KM1T9HMJP-00005
Serial Number: xxxxxxxxxxx
LU WWN Device Id: 5 002538 c40a4fc6a
Firmware Version: GXM1003Q
User Capacity: 1.920.383.410.176 bytes [1,92 TB]
Sector Size: 512 bytes logical/physical
Rotation Rate: Solid State Device
Device is: In smartctl database [for details use: -P show]
ATA Version is: ACS-2, ATA8-ACS T13/1699-D revision 4c
SATA Version is: SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is: Thu Mar 13 20:34:34 2025 WIB
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
PD: 0 Information
Enclosure Device ID: 252
Slot Number: 3
Drive's position: DiskGroup: 1, Span: 0, Arm: 0
Enclosure position: N/A
Device Id: 70
WWN: 5002538c40a4fc6a
Sequence Number: 2
Media Error Count: 0
Other Error Count: 4829
Predictive Failure Count: 0
Last Predictive Failure Event Seq Number: 0
PD Type: SATA
Cek Kesehatan SSD via SMART
Dilihat di sini dia sudah suport SMART, jadi kita bisa cek kesehatan SSD nya.
Gunakan perintah smartctl
dengan addon megaraid. Lalu cek Device ID yaitu 70. Syntax nya bisa dilihat dibawah ini:
[root@sgp-server MegaCli]# smartctl -d megaraid,70 /dev/sdb -a
SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0
9 Power_On_Hours 0x0032 095 095 000 Old_age Always - 24110
12 Power_Cycle_Count 0x0032 099 099 000 Old_age Always - 11
177 Wear_Leveling_Count 0x0013 097 097 005 Pre-fail Always - 911
179 Used_Rsvd_Blk_Cnt_Tot 0x0013 100 100 010 Pre-fail Always - 0
180 Unused_Rsvd_Blk_Cnt_Tot 0x0013 100 100 010 Pre-fail Always - 15259
181 Program_Fail_Cnt_Total 0x0032 100 100 010 Old_age Always - 0
182 Erase_Fail_Count_Total 0x0032 100 100 010 Old_age Always - 0
183 Runtime_Bad_Block 0x0013 100 100 010 Pre-fail Always - 0
184 End-to-End_Error 0x0033 100 100 097 Pre-fail Always - 0
187 Uncorrectable_Error_Cnt 0x0032 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0032 059 050 000 Old_age Always - 41
195 ECC_Error_Rate 0x001a 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 100 100 000 Old_age Always - 0
199 CRC_Error_Count 0x003e 095 095 000 Old_age Always - 4777
202 Exception_Mode_Status 0x0033 100 100 010 Pre-fail Always - 0
235 POR_Recovery_Count 0x0012 099 099 000 Old_age Always - 10
241 Total_LBAs_Written 0x0032 099 099 000 Old_age Always - 384396059168
242 Total_LBAs_Read 0x0032 098 098 000 Old_age Always - 5496400536207
243 SATA_Downshift_Ct 0x0032 100 100 000 Old_age Always - 0
244 Thermal_Throttle_St 0x0032 100 100 000 Old_age Always - 0
245 Timed_Workld_Media_Wear 0x0032 100 100 000 Old_age Always - 65535
246 Timed_Workld_RdWr_Ratio 0x0032 100 100 000 Old_age Always - 65535
247 Timed_Workld_Timer 0x0032 100 100 000 Old_age Always - 65535
251 NAND_Writes 0x0032 100 100 000 Old_age Always - 3817332726848
Perhatikan baris Wear_Leveling_Count
, dimana indikator tersebut menunjukan kesehatan disk SSD. Bisa terlihat menunjukan angka 97, artinya SSD Health = 97%
Kesimpulan
Ilmu baru nih, sekarang kamu sudah paham kan cara cek SSD Health menggunakan smartctl + raid hardware. Sering-seringlah cek kesehatan storage terutama SSD atau NVMe. Karena mereka punya umur tersendiri. Kalo Health sudah dibawah 95%, kemungkinan besar kemampuan baca dan tulis nya sudah menurun. jadi sebaiknya segera dijadwalkan untuk replace yang baru.
Kalo kamu punya masukan lainnya, silahkan hubungi kami ya! Semoga dengan artikel ini bisa membantu kamu untuk lebih peduli terhadap data, apalagi kalo datamu penting.!