特殊網絡故障處理方案(二)

網絡在如今的生活中起到了無可替代的作用,比如網上購物,網上股票交易,網上商店,網絡電話......等等。總之網絡給人類帶來了便捷!但是網絡的故障卻時時給人帶來不快!快速的解決網絡故障是我們網絡管理者的首要任務,也是我們的職責!

    隨着經濟的快速增長,一家一端口一臺電腦的設計方案,也遠遠不夠部分炒股者的需求,作爲學校的03年的網絡設計方案的不足也慢慢浮現出水面。網絡故障也不可預知的頻頻發生!

    一些用戶因爲端口的不足,往往選擇自己加設備。誰加了他們也不上報,這樣給我們的管理帶來許多不便!網絡故障也層出不窮。教學區固定ip,不選擇mac地址綁定,但在用戶申請ip的時候至少有其mac地址的記錄,發現某用戶流量過高還可以打電話警告,但是部分用戶不服從該制度,不登記。挺聰明得,看看隔壁辦公室的ip配置,在該ip附近隨便找一個用,這樣就出現了,ip濫用現象,ip衝突現象時有發生;家屬區dhcp,又沒有很好的管理方案!許多網管軟件也派不上用場。對dhcp用戶來說:比如某用戶中毒,向設備狂發包,影響網絡設備性能,造成網絡出口速率低,部分用戶上網慢,網絡有嚴重丟包現象,我們也沒有什麼高級的網絡測試工具。只有帶個筆記本,一根跳線在接入層的設備配線間內,時時ping網關,拔線,尋找狂發包用戶。無疑這樣的工作我們管理員很累!

  也就是在11月初,一個特殊的網絡問題出現了,估計大家也應該沒出現過的,真的是莫不着頭腦了.我們大領導出差,辦公室除了我們4個網絡管理員,一個技術主管,他掌管我們機房所有的服務器,路由器,核心交換機.還有一個接故障電話的女孩.近來1,2,3,4,5號家屬院分別有用戶反映,近來網絡特慢,時通時不通.我們也沒留意!都是強調他們查毒,殺毒.可是沒過多久,這幾棟樓都上不了網了.有用戶電話反映獲取IP地址是169.92.2.115,我們院裏正確的DHCP獲取的IP地址是100.100.X.X.根據我以前的經驗總結很可能是的網絡光鏈路故障,具體看連接[url]http://joysuny.blog.51cto.com/97261/35912[/url].我們就去看主機房到匯聚交換及接入層交換光路,一切正常.將主交換設備重起還是無濟於事,到接入層設備機房查看,設備狀態正常.筆記本接到consol口,查看交換配置一切正常,接入普通端口獲取ip地址還是169.X.X.X.將交換機重新啓動,馬上獲取ip地址,突然獲取正常,但是不能瀏覽網頁.將網卡禁用啓用,又獲取的是那個169.X.X.X.

    起初斷定可能是上層主機房問題,回去檢查覈心交換,一切都是原來的配置,一切正常,沒辦法,去研究已前的網絡拓撲和一手的網絡配置信息資料.有一個不小的發現,故障所在區的1#,2#,3#,4#.5#,這5棟樓屬於同一個Vlan125.當時我們幾個人一起坐在會議室研究解決方案.一直到晚上9:00.最後決定將嘗試的將Vlan125改劃分到Vlan126上,主負責有我的一個同事處理.第二天常識的改了vlan後當時是好了,我不時有個疑問,我問領導爲什麼Vlan125不行呢?以前Vlan125不是也可以的呀!而且是正常了好多年的呀!我領導也說不上來什麼!他就帶我去了匯聚交換機房,核心交換機房查看Vlan125的信息.分析故障原因.設備配置Vlan125一切正常.正當我和領導思索,其他人狂歡的時候,電話響了.用戶反映故障又出現了,我們百思不得其解.我們冷靜的想想,換Vlan後可以了一會.說明問題是在用戶端!可能有用戶中毒或者架接了DHCP服務.最後決議將這5棟樓分割開來,轉接到不同的Vlan內.

  我於是帶了本子,網絡設備遠程控制密碼,來到匯聚機房,匯聚交換也是LS-3026FM.我的處理辦法是:匯聚交換LS-3026FM配置不變,將它的下邊連接的設備通過LS-3026FM遠程控制訪問,更改下層交換設備配置信息.我起先定了所需的配置規則:1#劃到vlan120;2#劃到vlan121;3#劃到vlan122;4#劃到vlan123;5#劃到vlan124.在匯聚機房找一臺網絡設備也同樣更改,將它的更改和我遠程控制樓號的更改相一致.這樣我可以不用下樓到其他樓層看效果.直接拿跟跳線連接到這個設備上,查看獲取到的ip地址,嘗試上網,測試網絡連通性.直接在匯聚機房找到有問題的樓.這個方法不錯,當我調試到第3號樓的時候,測試獲取的ip地址是169.X.X.X,問題就出在這個樓上,但是我還是耐着性子繼續更改其它樓的配置.測試完後,其它樓都正常,我欣喜萬千,一想這樣找到了,主要對3號樓單獨處理,就用我們以前最原始的隔離用戶的方法處理.於是我就遠程將所更改的設備配置恢復(因爲是測試,我就沒有保存我當時更改的配置信息,重起交換機配置自動恢復,我就遠程重起.這樣和耗時間,每遠程重起一設備都需要3~5分鐘.我沒有那麼好的性子,要想想如果遠程控制重起設備.設備的數量有18個之多!於是就想起到個單元樓道,將樓道電源斷掉再打開就可以實現設備重起了.

  就那樣做過之後,這5棟樓的Vlan又回到了Vlan125.(我當時的想法是,既然已經確定了3#樓有問題,我直接用用戶隔離法,將用戶一個一個隔離,知道找到有問題用戶!)但是出人意料的事又發生了.當我恢復其他樓的配置之後,來到3#將筆記本接到交換機普通端口上,測試獲得ip地址還是169.X.X.X,無奈之下將所有的接入用戶拔掉.只留一個我自己筆記本那個端口,將設備重起,問題依舊!進入交換機控制端,查看配置,設備不停的警告2fun shutdown 交換機上第二個風扇壞了!個人感覺應該與這個警告沒關係.即使是它的原因也不至於影響其他4棟樓的網絡.我有些惱火了,既然是這棟樓的問題,就先將它斷掉,隨即我就斷掉了3#樓的交換機電源.其他樓網絡應該沒問題!到了晚上,我電話回訪用戶,他們反映說是下午好了時間不長,問題又出現了!

  晚上我躺在牀上一直在想,這個問題應該與設備本身的性能有關,該類型的網絡設備有華爲S2403,E026.可以說在市場上都看不到的設備,設備陳舊,設備性能下降,是一個原因;最主要的問題可以追究到存放設備的環境中,我們都知道,灰塵是網絡設備的無形殺手!我們的接入層設備都是壁掛於單元樓頂陽臺內的鐵箱子.設備都是立放的!久而久之灰塵就瀰漫了整個箱子.我們沒次排除故障都不關清理裏邊的灰塵!再就是有用戶私設DHCP服務!同事們都灰心了,說這問題沒辦法處理!我不管那麼多,申請自己去嘗試下!第二天我爭的領導同意,將我以前所做的配置保存到網絡設備中.一大早我就去了故障地點.還是按以前的操作更改設備所在的Vlan,改好後保存退出!我更改一個辦公室就打電話報信說1#故障消失.......當聽到這話我不知道有多高興!繼續更改,當到3#時網絡是通了,只有一個用戶反映它那不行.尾巴終於露出來了!我按辦公室給我的電話找到那個用戶,進去後查看他們的佈局使我大吃一驚.它是三室一廳,每個房間一臺臺式機,還有好幾檯筆記本.無語真是有錢人!查看它家佈局,門外網絡端口引進,接入一6口路由器,通過路由接入一臺式機.

查看網絡,一切正常,不能瀏覽網頁.Ping網關也正常,起初以爲是瀏覽器問題,不過帶我筆記本後故障依舊!隨後斷掉他們的路由,直接接到筆記本,一切正常.問題就在這個路由器上!就是因爲它造成一大片網絡故障;就是因爲它折磨的我吃不飽,睡不好!至今那樣的問題再也沒出現過!哎,問題算是解決了.但是還是有點模糊!
  估計大家對這個處理問題過程不感興趣,但是那種將大網絡劃分爲小網絡處理的方法值得大家學習! 
                        出處:joysuny
                                                  2007年11月20日
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章