故障現象描述
1、故障現象描述
某運營商爲3G用戶提供訪問的web portal系統,在每天業務高峯(22:30至23:30)時段都會接到大量的用戶投訴:網站訪問不了!在故障時間段, web服務器和各網絡設備的進程、資源開銷與平時相比並無異常;事後查看各設備的日誌,也找不到故障的原因。
2、基本環境描述
用戶基本網絡拓撲如下圖所示,3G手機用戶經過無線網絡後,通過3G核心網訪問web portal系統,web portal系統內部由多臺服務器上聯到一臺交換機,通過Redware做負載均衡, 再通過出口路由器和防火牆上聯到3G核心網:
系統管理員一直嘗試通過監控服務器和網絡設備本身的狀態、進程和日誌的手段來解決問題,但這種傳統的網管方式存在以下幾個難點:
系統結構複雜:系統管理員沒有3G核心網的管理權限,而web portal系統內部需要監控的設備很多,工作量大,無法迅速定位是web portal系統內部還是3G核心網端的問題;
無法關聯分析:不同設備的監控數據無法進行有效的關聯分析,無法拿出一個整體解決方案 ;
缺乏故障回溯數據:各設備的日誌系統內容有限,無法對故障進行回溯;
監控網絡設備時無法獲取應用信息,監控應用服務器時無法獲取網絡信息...完整案例http://www.colasoft.com.cn/cases-and-application/network-troubleshooting001.php
案例來自科來官方網站(http://www.colasoft.com.cn/)
CSNA網絡分析論壇(http://www.csna.cn/)
歡迎關注科來軟件微博、CSNA網絡分析論壇微博,即可活動任務獎勵。