DELL磁盤陣列控制卡(RAID卡)MegaCli常用管理命令彙總

前言:

MegaCli 是LSI公司官方提供的SCSI卡管理工具,由於LSI被收購變成了現在的Broadcom,所以現在想下載MegaCli,需要去Broadcom官網查找Legacy產品支持,搜索MegaRAID即可。現在官方有storcli,整合了LSI和3ware所有產品。但是個人認爲Megacli用起來更順手,而且線上用了幾家國產廠商服務器,用Megacli都能管理好RAID,所以換不換無所謂。

準備: 

新版本的 MegaCli-1.01.39-0.i386.rpm (下載地址:http://docs.avagotech.com/docs-and-downloads/legacy-raid-controllers/legacy-raid-controllers-common-files/1-01-39_Linux_Cli.zip)(在文章結尾已上傳,方便下載)該包會把程序安裝在/opt下,當然也可以自定義安裝目錄,例如:rpm --relocate /opt/=/usr/sbin/ -i MegaCli-1.01.39-0.i386.rpm (即把安裝目錄 /opt 替換成 /usr/sbin)。

(linux文件夾下有個MegaCli文件裏面有I386 RPM)

相關命令及其解析: 
查看機器型號    # dmidecode | grep "Product" 
查看廠商    # dmidecode| grep  "Manufacturer" 
查看序列號    # dmidecode | grep  "Serial Number" 
查看CPU信息    # dmidecode | grep  "CPU" 
查看CPU個數    # dmidecode | grep  "Socket Designation: CPU" |wc –l 
查看出廠日期    # dmidecode | grep "Date" 
查看充電狀態    # MegaCli -AdpBbuCmd -GetBbuStatus -aALL |grep "Charger Status" 
顯示BBU狀態信息    # MegaCli -AdpBbuCmd -GetBbuStatus –aALL 
顯示BBU容量信息    # MegaCli -AdpBbuCmd -GetBbuCapacityInfo –aALL 
顯示BBU設計參數    # MegaCli -AdpBbuCmd -GetBbuDesignInfo –aALL 
顯示當前BBU屬性    # MegaCli -AdpBbuCmd -GetBbuProperties –aALL 
查看充電進度百分比    # MegaCli -AdpBbuCmd -GetBbuStatus -aALL |grep "Relative State of Charge" 
查詢Raid陣列數    # MegaCli -cfgdsply -aALL |grep "Number of DISK GROUPS:" 
顯示Raid卡型號,Raid設置,Disk相關信息      # MegaCli -cfgdsply –aALL 
顯示所有物理信息    # MegaCli -PDList -aALL 
顯示所有邏輯磁盤組信息    # MegaCli -LDInfo -LALL –aAll 
查看物理磁盤重建進度(重要)    # MegaCli -PDRbld -ShowProg -PhysDrv [1:5] -a0 
查看適配器個數    #MegaCli –adpCount 
查看適配器時間    #MegaCli -AdpGetTime –aALL 
顯示所有適配器信息    #MegaCli -AdpAllInfo –aAll 
查看Cache 策略設置    # MegaCli -cfgdsply -aALL |grep Polic

硬盤方面:

1、查看所有物理磁盤信息 
MegaCli -PDList -aALL

Adapter #0

Enclosure Number: 1 
Slot Number: 5 
Device Id: 5 
Sequence Number: 2 
Media Error Count: 0 
Other Error Count: 0 
Predictive Failure Count: 0 
Last Predictive Failure Event Seq Number: 0 
Raw Size: 140014MB [0x11177328 Sectors] 
Non Coerced Size: 139502MB [0x11077328 Sectors] 
Coerced Size: 139392MB [0x11040000 Sectors] 
Firmware state: Hotspare 
SAS Address(0): 0x5000c50008e5cca9 
SAS Address(1): 0x0 
Inquiry Data: SEAGATE ST3146855SS     S5273LN4Y1X0 
..... 
2、查看磁盤緩存策略 
MegaCli -LDGetProp -Cache -L0 -a0

Adapter 0-VD 0: Cache Policy:WriteBack, ReadAheadNone, Direct 
or 
MegaCli -LDGetProp -Cache -L1 -a0

Adapter 0-VD 1: Cache Policy:WriteBack, ReadAheadNone, Direct 
or 
MegaCli -LDGetProp -Cache -LALL -a0

Adapter 0-VD 0: Cache Policy:WriteBack, ReadAheadNone, Direct 
Adapter 0-VD 1: Cache Policy:WriteBack, ReadAheadNone, Direct 
or 
MegaCli -LDGetProp -Cache -LALL -aALL

Adapter 0-VD 0: Cache Policy:WriteBack, ReadAheadNone, Direct 
Adapter 0-VD 1: Cache Policy:WriteBack, ReadAheadNone, Direct 
or 
MegaCli -LDGetProp -DskCache -LALL -aALL

Adapter 0-VD 0: Disk Write Cache : Disk's Default 
Adapter 0-VD 1: Disk Write Cache : Disk's Default 
3、設置磁盤緩存策略 
緩存策略解釋: 
WT    (Write through 
WB    (Write back) 
NORA  (No read ahead) 
RA    (Read ahead) 
ADRA  (Adaptive read ahead) 
Cached 
Direct 
例子: 
MegaCli -LDSetProp WT|WB|NORA|RA|ADRA -L0 -a0 
or 
MegaCli -LDSetProp -Cached|-Direct -L0 -a0 
or 
enable / disable disk cache 
MegaCli -LDSetProp -EnDskCache|-DisDskCache -L0 -a0 
4、創建/刪除 陣列 
    4.1 創建一個 raid5 陣列,由物理盤 2,3,4 構成,該陣列的熱備盤是物理盤 5 
MegaCli -CfgLdAdd -r5 [1:2,1:3,1:4] WB Direct -Hsp[1:5] –a0 
    4.2 創建陣列,不指定熱備 
MegaCli -CfgLdAdd -r5 [1:2,1:3,1:4] WB Direct –a0 
    4.3 刪除陣列 
MegaCli -CfgLdDel -L1 –a0 
    4.4 在線添加磁盤 
MegaCli -LDRecon -Start -r5 -Add -PhysDrv[1:4] -L1 -a0 
意思是,重建邏輯磁盤組1,raid級別是5,添加物理磁盤號:1:4。重建完後,新添加的物理磁盤會自動處於重建(同步)狀態,這個 時候 fdisk -l是看不到陣列的空間變大的,只有在系統重啓後才能看見。 
5、查看陣列初始化信息 
    5.1 陣列創建完後,會有一個初始化同步塊的過程,可以看看其進度。 
MegaCli -LDInit -ShowProg -LALL -aALL 
或者以動態可視化文字界面顯示 
MegaCli -LDInit -ProgDsply -LALL –aALL 
    5.2 查看陣列後臺初始化進度 
MegaCli -LDBI -ShowProg -LALL -aALL 
或者以動態可視化文字界面顯示 
MegaCli -LDBI -ProgDsply -LALL -aALL 
6、創建全局熱備 
指定第 5 塊盤作爲全局熱備 
MegaCli -PDHSP -Set [-EnclAffinity] [-nonRevertible] -PhysDrv[1:5] -a0 
也可以指定爲某個陣列的專用熱備 
MegaCli -PDHSP -Set [-Dedicated [-Array1]] [-EnclAffinity] [-nonRevertible] -PhysDrv[1:5] -a0 
7、刪除全局熱備 
MegaCli -PDHSP -Rmv -PhysDrv[1:5] -a0 
8、將某塊物理盤下線/上線 
MegaCli -PDOffline -PhysDrv [1:4] -a0 
MegaCli -PDOnline -PhysDrv [1:4] -a0 
9、查看物理磁盤重建進度 
MegaCli -PDRbld -ShowProg -PhysDrv [1:5] -a0


MegaCli64 -PDRbld -ShowProg -PhysDrv [32:4] -a0

PhysDrv 參數32代表" Enclosure Device ID", 參數4代表 "Slot Number"


RAID Level對應關係:

RAID Level : Primary-1, Secondary-0, RAID Level Qualifier-0RAID 1
RAID Level : Primary-0, Secondary-0, RAID Level Qualifier-0RAID 0
RAID Level : Primary-5, Secondary-0, RAID Level Qualifier-3RAID 5
RAID Level : Primary-1, Secondary-3, RAID Level Qualifier-0RAID 10


1、Slot Number:slot號,應該跟機器外觀上的標識一致。如果機器上有多塊盤,直接告訴現場工程師slot X的硬盤有問題,工程師就會直接換盤。

2、Inquiry Data: 這裏是磁盤的序列號,跟磁盤標籤上一致。磁盤標籤需要拔盤才能看到,按slot拔盤看到磁盤的序列號應該跟Inquiry Data一致。

3、Firmware state: 這裏能看到磁盤的狀態,Online是我們期望看到的最好狀態,除此之外還有 Unconfigured Offline Failed等等,大多表達一個悲傷的事實:你要加班報修/修復他們了。。。

4、需要特別關注這幾個指標:Media Error / Other Error / Predictive Failure Count / Last Predictive Failure Event Seq Number 都有可能不是0。這意味着磁盤雖然能用但已經不再可靠,很有可能存在壞簇、壞道之類的問題,必須儘快換掉這塊盤。如果堅持使用,那磁盤就離徹底壞掉不遠了。網上流傳的說法是前3個Count越大代表磁盤狀態越差,實際並不是這樣,以下2個截圖就可以說明。

01_articlex.png

02_articlex.png

同事爲這個問題專門與服務器RAID卡磁盤廠家溝通,得到的反饋是:
查到之前的資料,Medium error、other error數值的絕對值,不能直接反應硬盤的狀態。
根據與RAID卡、硬盤廠家的溝通,建議做法是監控Predictive Failure 的數值,不爲零說明硬盤有問題。另外,如果硬盤failed,也可以直接報修。
Predictive Failure Count
指令:storcli /c0/eall/sall show all
監控關鍵字Predictive Failure Count,標準爲不能大於0,若有計數,將對應的硬盤換掉;
Predictive Failure中已經涵蓋media error,而且比media error的範圍更廣、更全面。
硬盤的 SMART 子系統已經具備一套完整的算法來評估硬盤的健康狀況
SMART 子系統算法會參考硬盤運行時各個方面的參數,media error 是其中一項
SMART 對於 media error 的評估是基於單位時間增長數來計算的
當 SMART 子系統中任何一個評估項達到對應的閾值時,硬盤會報告 Sense Code: 01 5D 00 (FAILURE PREDICTION THRESHOLD EXCEEDED)
遵循 SCSI 協議標準的 host (OS SCSI 子系統,SAS 控制器, RAID 卡等) 可以正確解析出該 Sense Code
綜上,由於 media error 已經被硬盤 SMART 子系統所涵蓋,並且會依據 SCSI 協議標準上報 predictive failure,所有硬盤部分只需要在Raid卡下監控Predictive Failure就好,標準爲不能大於0。


查看生產商:

dmidecode -s system-manufacturer


查看主機型號:

dmidecode -s system-product-name


查看主機序列號:

dmidecode -s system-serial-number 


參考:http://fangpeishi.com/raid_cheatsheet1.html

          https://segmentfault.com/a/1190000011402256

          http://blog.51cto.com/1130739/1771506

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章