ThinkServer KVM網絡故障一例

最近新上了一批ThinkServerRD640,KVM的網口lan0,在BIOS裏可以設置爲專有,共享等模式,默認爲共享模式。共享模式下,該網口除了能做KVM管理外,還能在操作系統裏當做一個百兆的網卡,不清楚聯想的設計是怎麼想的,這個年代服務器上要個百兆的網口做什麼。

最大的問題是,如果作爲共享模式呢(默認配置),如果服務器冷啓動,熱啓動等等操作,如果你ping管理口的管理IP會發現 在服務器自檢到網卡以前是ping不通的,就是說 這個管理口KVM你想進入BIOS或raid卡是不可能的。則在BIOS裏改爲專享模式。改爲專享模式,機器自檢時只能檢測到2個網卡,此時的KVM口只能做KVM作用。

在一直ping該KVMIP的時候會發現,機器在重啓操作的時候會有個10秒左右的丟包現象。接顯示器看的話,可以發現等你能ping通可以遠程KVM管理操作的時候,機器已經過了F1進入BIOS的階段了。

當時就在想,這他媽的是誰設計的!

再與800工程師聯繫後,工程師得出的結論是某些批次(不是所有RD640的服務器)的KVM的BMC芯片和CISCO的生成樹協議有衝突,機器重啓的時候,導致交換機認爲此時該網口離線了,因此把交換機該端口進行重啓檢測該端口,cisco的交換機端口檢測是需要時間的,因此會有該現象。

800工程師給的解決方案是 給我提供一個特殊的BMC 然後刷新進去就可以了,同時800工程師表示刷進去後該網口就可能是10M的了。

爲了驗證工程師的說話,將筆記本網線和服務器的KVM口直連,ping 然後重啓,發現這時候不會有掉包現象,準確的說是掉一個包,不影響KVM管理。

刷BMC是可以接受的,刷新後KVM變10M 實際上也可以接受,不能接受的是 可能變10M 這個可能 的潛臺詞莫非是說也有其他可能性?

因此決定從交換機頭來解決。

登錄交換機後:

Password: 

s041>enable

Password: 

s041#ping 192.168.48.X  (ping 管理口IP)


Type escape sequence to abort.

Sending 5, 100-byte ICMP Echos to 192.168.48.122, timeout is 2 seconds:

!!!!!

Success rate is 100 percent (5/5), round-trip min/avg/max = 1/5/17 ms

s041#show arp

Protocol  Address          Age (min)  Hardware Addr   Type   Interface

Internet  192.168.48.X           -   5006.04d5.4ac0  ARPA   Vlan1

Internet  192.168.48.1X          0   70e2.8405.a0ca  ARPA   Vlan1

Internet  192.168.51.X           5   0050.56b2.4383  ARPA   Vlan1

Internet  192.168.50.XX          0   000d.b004.03b8  ARPA   Vlan1

s041#show mac add

s041#show mac address-table | i 70e2.8405.a0ca 查該mac在哪個端口上

   1    70e2.8405.a0ca    DYNAMIC     Fa0/36

conf t  進入配置

interface fastEthernet 0/36 進入端口

spanning-tree portfast trunk 啓用該端口的port fast

exit

exit

wr

然後在測試,機器重啓過程 一直能ping通KVM IP

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章