IBM520小型機RAID卡電池更換

1、 問題發現及分析
數據庫服務器告警黃燈亮,檢查日誌發現時raid卡電池告警導致
2、 問題分析診斷
輸入命令:# sisraidmgr -M o0 -l'sisioa0'
或輸入命令:# smitty pxdam 後選擇操作
或按如下操作:#smit ->Devices -Disk Array ->IBM PCI-X SCSI Disk Array->PCI-X SCSI Disk Array Manager Select -> Diagnostics and Recovery Options -> Select Controller Rechargeable Battery Maintenance. -> Select Display Controller Rechargeable Battery Information.
顯示電池信息如下:
IBM520小型機RAID卡電池更換

電池信息各參數含義如下:
battery state:顯示電池當前具體狀態,有以下幾個可能的值
No battery warning/error:No warning or error condition currently exist 這種是電池的正常狀態
Warning condition:A warning condition currently exists and an error has been logged 出現了一個警告並被記錄在日誌中
Error condition:An error condition currently exists and an error has been logged 電池已經出錯
Unknow:Information is not available to determine whether a warning or error condition currently exists 無法判斷
Power-on time(days):電池持續使用的天數
Adjusted power-on time(time):
Indicates the adjusted (prorated) power-on time, in units of days ,of the rechargeable Cache Battery Pack
Note:Some rechargeable Cache Battery Packs are negatively affected by higher temperatures and thus are prorated based on the amount of time that they spend at various ambient temperatures
Estimated(估算的) time to warning(days):
Estimated time, in units of days, until a message is issued indicating that the replacement fo the rechargeable Cache Bettery Pack should be scheduled
Estimated time to error(days):當值爲0時,此時Cache被自動禁用,必須更換電池
Estimated time , in units of days ,until an error is reported indicating that the rechargeable Cache Bettery Pack must be replaced
Concurrently maintainable battery pack:該電池是否可以在線更換
Indicates that the rechargeable Cache Battery Pack can by replaced while the adapter continues to operate
Battery pack can be safely replaced:當值爲YES時,該電池可以安全地更換,不會造成Cache數據丟失
Indicates that the adapter's write cache has been disabled and the rechargeable Cache Battery Pack can be safely replaced
根據信息顯示:距離ERROR還有26天時間,電池安全取代更換狀態爲NO,需要強行控制電池錯誤纔可以更換;如果電池包安全取代狀態爲YES,則可以直接更換。
3、 具體處理步驟如下:
1) 操作前先檢查P52A系統狀態,查看是否有其他報錯信息;
2) 跟客戶協調更換控制器電池時間並且在約定時間停止業務;
3) 檢查電池信息是否沒電了;
4) 請用戶停止業務服務,不要關機;
5) 檢查電池狀態是否可以安全更換;
輸入命令:# sisraidmgr -M o0 -l'sisioa0'
或輸入命令:# smitty pxdam 後選擇操作
或按如下操作:#smit ->Devices -Disk Array -> IBM PCI-X SCSI Disk Array->PCI-X SCSI Disk Array Manager Select -> Diagnostics and Recovery Options -> Select Controller Rechargeable Battery Maintenance. -> Select Display Controller Rechargeable Battery Information.
IBM520小型機RAID卡電池更換
IBM520小型機RAID卡電池更換

當Battery pack can be safely replaced . . : YES顯示安全狀態爲YES,則可以直接關機更換RAID卡電池;如果顯示爲NO,需要強行控制電池錯誤後關機更換RAID卡電池。
6) 強行控制電池錯誤執行如下命令:
Smitty—> devices->Disk Array->IBM PCI-X SCSI Disk Array-> PCI -X SCSI Disk Array Manager->DiagnosticsandRecovery Options->Controller Rechargeable Battery Maintenance->Force Controller Rechargeable Battery Error;
或輸入命令:# smitty pxdam 後選擇操作
爲了安全操作,再次查詢RAID卡電池狀態;
7) 系統關機;
8) 更換控制器RAID卡電池;
注意:必須將舊電池拆下來至少15秒後,再安裝新電池,否則PCI-X SCSI RAID卡將不能正常識別電池已更換。
9) 更換完成後檢查無問題後開機;
10) 系統啓動後複查報錯信息是否已經解決
IBM520小型機RAID卡電池更換

電池天數1087天,電池更換成功。
11) 重新激活寫cache
輸入命令# smitty pxdam
IBM520小型機RAID卡電池更換

12) 消除IBM小型機告警信息
操作步驟如下:# diag -> Task Selection (Diagnostics, Advanced Diagnostics, Service Aids, etc.) -> Log Repair Action -> sys0 System Object 回車確認此時,sys0前面出現了一個“+”符號,表示已選中該項
按F7(或ESC+7)提交確認
ESC+0退出
告警清除!
13) 確認無問題後開啓業務;
14) 維修結束
可以參考:http://blog.51cto.com/eric1026/1883319
4、 風險及應急:
更換控制器電池需要停止業務,系統啓動停止操作,在維修處理前一定要確認無其他報錯信息不影響系統重新啓動後方可操作
5、維護建議:
1) 對系統應定時檢查,出現故障時及時聯繫維護人員,儘快解決故障,保證業務正常運行。
2) 當硬盤發生故障時,不要盲目更換配件,否則極易造成系統損壞,整個系統的癱瘓,因此要謹慎操作。
3) 當硬盤或背板故障時,不要盲目更換,應逐一排查,防止數據丟失。
5、 容易出現的問題
1、 更換電池後開機啓動時,系統找不到鏡像
問題分析:關機拔下raid卡,開機啓動系統可以找到鏡像,說明raid卡接觸不良
解決辦法:給raid卡除塵

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章