在H80安裝AIX5L 5.3導致E443故障

一臺H80(p660 7026-6H1),之前運行AIX 5.1,客戶要求重新安裝AIX5.3後裝Oracle和WebSphere。但是之前不知道H80不支持AIX 5.3,於是導致讀安裝介質後服務器掛起(可能是介質裏的信息和微碼有衝突),LED代碼爲E443,手動重啓,按reset,斷電再加電後再重啓都無濟於事(SMS沒試),冒汗。上網一查才知道,H80必須要升級Firmware纔可以支持AIX5.3(以前確實不知道,手裏的十幾臺H80跑的都是5.1),而且版本必須是CM040712(Added support for AIX 5.3)或更高的才行。沒辦法,必須先讓機器啓動到先前的5.1下才好升級Firmware。又搜了一下,跟我一樣的衰人還真不少,原來要解決E443問題除了斷掉電源之外還得把電池也拿掉。趕快查H80的文檔(SA38-0566-02),436頁,電池在I/O櫃的PCI板上。機櫃上沒裝一條滑軌,還碼得密密實實的,開了蓋也沒辦法下手,費了半天勁兒纔在同事的幫助下把那臺H80的I/O櫃子抽出來一半,剛好能看到電池(鈕釦電池),下手把它扣了下來,然後兩個人站在那冒汗。等了幾分鐘,再把電池扣上。都拾掇好後加電重起,果然OK,系統終於能夠正常啓動到舊的5.1下了。(放電後日期需要重設)

升級微碼:

1. 先登錄到服務器查一下目前的Firmware版本。
web-pub-01[/]#lscfg -vp|grep -F .CM
ROM Level.(alterable).......CM020916
或者:
web-pub-01[/]#lscfg -vp | grep -p alterable
10/100 Mbps Ethernet PCI Adapter II:
Part Number.................09P5023
FRU Number..................09P5023
EC Level....................H10971A
Manufacture ID..............YL1021
Network Address.............000255AFB2BC
ROM Level.(alterable).......SCU004
Product Specific.(Z0).......A5204206
Device Specific.(YL)........U0.1-P1-I2/E1

System Firmware:
ROM Level.(alterable).......M2P020910
Version.....................RS6K
System Info Specific.(YL)...U0.1-P1/Y1
Physical Location: U0.1-P1/Y1

SPCN firmware:
ROM Level.(alterable).......0000CMD02252
Version.....................RS6K
System Info Specific.(YL)...U0.1-P1/Y3
Physical Location: U0.1-P1/Y3

Platform Firmware:
ROM Level.(alterable).......CM020916
Version.....................RS6K
System Info Specific.(YL)...U0.1-P1/Y2
Physical Location: U0.1-P1/Y2

2. 到http://www-912.ibm.com/eserver/support/fixes/ 下7026-6H1的Firmware,最新的是CM060505,建議下AIX的,不要下DOS的。下完後FTP到服務器上。

3. 釋放文件。
web-pub-01[/]#ls -l 7026HM80.BIN
-rw-r----- 1 root system 4475976 Jan 01 08:23 7026HM80.BIN
web-pub-01[/]#chmod u+x 7026HM80.BIN
web-pub-01[/]#./7026HM80.BIN
UnZipSFX 5.51 of 22 May 2004, by Info-ZIP (
http://www.info-zip.org).
inflating: CM_MM_060505.img
web-pub-01[/]#ls -l CM_MM_060505.img
-r-xr-xr-x 1 root system 5104410 Jun 24 2006 CM_MM_060505.img

4. 下面的一步至關重要,一定要做,否則哭都來不及。
web-pub-01[/]#sum CM_MM_060505.img
28838 4985 CM_MM_060505.img

將sum的結果(28838)和網站上這個版本Firmware的說明頁中“Firmware Levels, File Sizes and Checksums Table”的File Sizes和Checksums仔細覈對,確認無誤後再做下面的事情,切記,切記!

5. 確認無誤後執行下面的命令。 web-pub-01[/]#cd /usr/lpp/diagnostics/bin
web-pub-01[/usr/lpp/diagnostics/bin]#./update_flash -f /CM_MM_060505.img

***** WARNING: Continuing will reboot the system! *****

Do you wish to continue?
Enter 1=Yes or 2=No

(焚香沐浴後....)回車,系統會自動重啓。

6. 等一會,如果成功,系統會正常啓動。(還好,到目前爲止,刷的十臺機器還沒失手過,感覺只要嚴格地執行第4步的校驗,應該不會有什麼問題。)

7. 機器重啓後登錄系統,檢查Firmware是否已經更新。
web-pub-01[/]#lscfg -vp|grep -F .CM
ROM Level.(alterable).......CM060505
或者:
web-pub-01[/]#lscfg -vp | grep -p alterable
10/100 Mbps Ethernet PCI Adapter II:
Part Number.................09P5023
FRU Number..................09P5023
EC Level....................H10971A
Manufacture ID..............YL1021
Network Address.............000255AFB2BC
ROM Level.(alterable).......SCU004
Product Specific.(Z0).......A5204206
Device Specific.(YL)........U0.1-P1-I2/E1

System Firmware:
ROM Level.(alterable).......M2P060505_condor_
Version.....................RS6K
System Info Specific.(YL)...U0.1-P1/Y1
Physical Location: U0.1-P1/Y1

SPCN firmware:
ROM Level.(alterable).......0000CMD02252
Version.....................RS6K
System Info Specific.(YL)...U0.1-P1/Y3
Physical Location: U0.1-P1/Y3

Platform Firmware:
ROM Level.(alterable).......CM060505
Version.....................RS6K
System Info Specific.(YL)...U0.1-P1/Y2
Physical Location: U0.1-P1/Y2

8. 再次安裝AIX 5.3,一切正常了。

經驗總結:
1. 其實從網上找到的都是F85出現的這種問題,估計老型號的RS/6000都可能存在類似的問題,畢竟他們橫行的時候AIX還沒有到5.3。
2. 如果用FTP命令上傳Firmware文件時一定要使用Binary模式(BIN),多數升級Firmware失敗都是忽略了這個問題。使用FTP客戶端應該可以自動識別文件類型,不過還是千萬不要忘了sum校驗這一步。
3. 升級Firmware的確可以解決系統(特別是硬件)的一些莫名其妙的問題。
4. 遇到問題千萬要冷靜,上網查查,不但可以少走彎路,還能節約大量的時間。
5. 不管是做系統、還是做數據庫的,雖然總感覺機器裏幾十G的文檔是雞肋,但是最好還是留着吧,不一定什麼時候就能用到,到時候現找又是麻煩事。
 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章