文章目錄
-
企業辦公網絡:指的是享受服務的網絡
-
企業數據中心網絡:指的是爲用戶提供服務的網絡
這裏主要講述提供服務的網絡
一:從無到有——網絡集成,新建網絡
國內集成商:系統+集成
系統:網絡、數據庫、主機(網絡資源、存儲資源、計算資源)
備註:硬件方面的
計算資源————服務器
網絡資源————網絡設備、網線、光纖
存儲資源————存儲設備
1.1 案例
比如訪問百度的資源,就需要涉及到網絡資源(搜索引擎)、存儲資源(數據存儲)、計算資源(整理你可能需要的數據)
1.2 集成
甲方不想搞,把業務外包出去,甲方要找系統集成商
系統集成商:華爲系統集成商、亞信科技(用戶多是運營商)、華訊(用戶多是金融、政府)
集成商被視爲乙方,千人以上的系統集成商內工作可以鍛鍊人,接觸到不少東西
1.3 網絡架構評判標準
- 可用性
網絡設備不會出現故障、出現故障的概率低
- 可靠性
網絡設備冗餘
一層————物理層:設備冗餘——堆疊
二層————數據鏈路層:鏈路捆綁——兩條及以上邏輯組成一條鏈路
STP——邏輯阻斷接口
三層————網絡層:HSRP(思科私有)、VRRP(通用)、GLBP(思科私有)、VGMP(華爲私有)
四層————傳輸層:負載均衡
七層————應用層:負載均衡
- 安全性
支付型公司注意端口攻擊、ACL、防火牆
- 速度
網絡的傳輸速度快,用戶體驗度好
- 成本
根據業務需要購買帶寬——對等
比如家用的100M寬帶,下載100M,上傳4M,就是不對等
- 後期擴展性
預留網絡擴展接口,10G,4G,2G, 根據28原則分配
乙方包了甲方的活
乙方把活拆出來,包給第三方
第三方,去甲方幹活
乙方,提供方案,第三方是幹活
二:從有到強————網絡運維
當從無到有,網絡架構已經成形了,企業單位便會招相關的運維人員,做網絡維護,保證網絡正常工作
運維的意義:運維並不是僅僅看着讓網絡不出問題
還有優化網絡、網絡故障排查的思路
2.1 優化網絡
設備的老化,業務的發展不斷完善
2.2 網絡故障排查
當網絡出現問題的時候,需要一套排障的思路————需要時間積累
2.3 如何衡量網絡質量的好壞
三個方面
- 丟包
- 延時
- 抖動
2.3.1 丟包
丟包分兩種
網絡中斷,丟包率百分之百
丟包率小於百分之百
判斷一個網絡是否中斷(丟包)
使用pin工具
例如:
ping www.baidu.com
tracert(windows)/traceroute(linux)————跟蹤網絡中的路徑
tracert -d www.baidu.com
選項:
-d 不將地址解析成主機名。
-h maximum_hops 搜索目標的最大躍點數。
-j host-list 與主機列表一起的鬆散源路由(僅適用於 IPv4)。
-w timeout 等待每個回覆的超時時間(以毫秒爲單位)。
-R 跟蹤往返行程路徑(僅適用於 IPv6)。
-S srcaddr 要使用的源地址(僅適用於 IPv6)。
-4 強制使用 IPv4。
-6 強制使用 IPv6。
可能中間有防火牆,被過濾掉
通過最多30個躍點跟蹤
記錄序號從1開始,每個記錄就是一跳,每跳就表示一個網關,我們看到每行有三個時間,單位是ms,其實就是-q的默認參數。探測數據包向每個網關發送三個數據包後,網關響應後返回時間,如果指定-q 4,表示向每個網關發送4個數據包
有時我們traceroute一臺主機時,會看到有一些行是以*表示的,出現這樣的情況,可能是防火牆封掉了ICMP的返回信息,所以得不到相關的數據包返回的數據
有時我們在某一網關處延時比較長,有可能是某臺網關比較阻塞,也可能是物理設備本身的原因。當然,如果某臺DNS出現問題時,不能解析主機名、域名,也會有延時長的現象,可以-n 指定避免dns解析,以IP格式輸出數據
如果在局域網中的不同網段之間,我們可以通過traceroute來排查問題所在,是主機的問題還是網關的問題
如果我們通過遠程來訪問某臺服務器遇到問題時,使用traceroute追蹤數據包所經過的網關,將出現問題的節點提交給IDC服務商,可以幫助我們解決問題
tracert/traceroute 這個辦法只能判斷網絡中斷在哪個地方
如果是丟包,就要使用linux中的MTR工具,來判斷在哪個地方丟的包
[root@ceph00 ~]# yum install mtr -y
[root@ceph00 ~]# mtr www.baidu.com
在最後一行看到的丟包率是0%,說明網絡質量是好的
總結:當網絡出現故障時(丟包或是中斷)
辦法一:使用ping探測網絡是中斷還是丟包
如果是中斷,使用tracert/traceroute 去判斷中斷在什麼地方,然後到該節點去開啓相應端口
如果是丟包,使用mtr判斷丟包的位置
中斷容易排查——網線端口down
丟包難以排查——端口解除不良,中間未知節點阻止放行,造成丟包的現象有很多
延時:語音網絡,開視頻會議直播,會有延時
抖動——每個數據包的延時若是固定的話,不會影響體驗;當每個數據包的延時不是固定的,便會造成抖動
3.4 網絡故障定位
- 人爲故障————錯誤增刪改、命令不熟悉
物理操作:增改拔線路
命令操作:增刪除vlan、stp
錯增刪路由、動態路由協議過濾路由條目等——子路由條目
錯誤增防火牆安全策略
錯誤的nat轉換
做了限制QOS時配置錯誤(流量限速)
負載均衡產品錯誤增加策略
- 無人爲運行故障
企業辦公網絡問題——瞭解企業數據中心問題如何解決,企業辦公網絡問題會變得很簡單
企業數據中心問題——判斷企業的業務問題是否和網絡有關
極個別的業務故障:1-2臺業務出現問題,與網絡關係不大,沒但是不能排除與網絡沒有關係
排查思路:
有日誌服務器:查看日誌服務器,查看交換機是否有問題,查看交換機的接口是否有問題
無日誌服務器:通過服務器的mac地址查看在哪個交換機接口上(最好做個網絡監控),然後判斷鏈路是否有問題
小面積業務故障(與網絡相關的故障點)
與接入交換機有關係
大面積業務故障(與網絡相關的故障點)
與核心交換機有關係
丟包問題:
1.主機資源耗盡————CPU/memory資源使用100%、webserver連接數滿、服務器接口流量滿
2.網絡資源耗盡————交換機CU使用率100%(二層、三層不一樣)、交換機流量打滿、交換機關閉STP導致環路、防火牆會話數打滿、防火牆nat TCP轉換端口被耗盡(65535)
3.數據包來回路徑不一致——一般這種問題在剛開始配置時就應該出現問題;在運維中出現這個問題可能是設備斷電或者重啓導致某些配置丟失
4.設備版本問題——需要升級
ping ip 地址能用
pingDNS不通
dns網絡問題
dns自身配置問題
ping 通,telnet不同
可能中間鏈路將端口給過濾了
telnet www.baidu.com 443 會話能通
如何判斷哪個策略有問題
traceroute -p 443 www.baidu.com 判斷哪個地方不同
ping telnet 通, TCP傳遞數據不同
一般和鏈路數據MTU有關係
某些業務傳遞的數據是大於1500的,但是端口的上限設置時1470,這會造成部分數據丟失(端口不能分片)
telnet ip(域名) 端口號 判斷對方有沒有啓動業務端口
業務端口有沒有起來,服務器有沒有啓動
路由層面ACL規則,端口有沒有被封掉
防火牆規則:低到高,端口有沒有放通