理論:企業網絡的兩種網絡工作模式

  • 企業辦公網絡:指的是享受服務的網絡

  • 企業數據中心網絡:指的是爲用戶提供服務的網絡

這裏主要講述提供服務的網絡

一:從無到有——網絡集成,新建網絡

國內集成商:系統+集成

系統:網絡、數據庫、主機(網絡資源、存儲資源、計算資源)

備註:硬件方面的

計算資源————服務器

網絡資源————網絡設備、網線、光纖

存儲資源————存儲設備

1.1 案例

比如訪問百度的資源,就需要涉及到網絡資源(搜索引擎)、存儲資源(數據存儲)、計算資源(整理你可能需要的數據)

1.2 集成

甲方不想搞,把業務外包出去,甲方要找系統集成商

系統集成商:華爲系統集成商、亞信科技(用戶多是運營商)、華訊(用戶多是金融、政府)

集成商被視爲乙方,千人以上的系統集成商內工作可以鍛鍊人,接觸到不少東西

1.3 網絡架構評判標準

  • 可用性

網絡設備不會出現故障、出現故障的概率低

  • 可靠性

網絡設備冗餘

一層————物理層:設備冗餘——堆疊

二層————數據鏈路層:鏈路捆綁——兩條及以上邏輯組成一條鏈路

​ STP——邏輯阻斷接口

三層————網絡層:HSRP(思科私有)、VRRP(通用)、GLBP(思科私有)、VGMP(華爲私有)

四層————傳輸層:負載均衡

七層————應用層:負載均衡

  • 安全性

支付型公司注意端口攻擊、ACL、防火牆

  • 速度

網絡的傳輸速度快,用戶體驗度好

  • 成本

根據業務需要購買帶寬——對等

比如家用的100M寬帶,下載100M,上傳4M,就是不對等

  • 後期擴展性

預留網絡擴展接口,10G,4G,2G, 根據28原則分配

乙方包了甲方的活
乙方把活拆出來,包給第三方
第三方,去甲方幹活

乙方,提供方案,第三方是幹活

二:從有到強————網絡運維

當從無到有,網絡架構已經成形了,企業單位便會招相關的運維人員,做網絡維護,保證網絡正常工作

運維的意義:運維並不是僅僅看着讓網絡不出問題

還有優化網絡、網絡故障排查的思路

2.1 優化網絡

設備的老化,業務的發展不斷完善

2.2 網絡故障排查

當網絡出現問題的時候,需要一套排障的思路————需要時間積累

2.3 如何衡量網絡質量的好壞

三個方面

  • 丟包
  • 延時
  • 抖動

2.3.1 丟包

丟包分兩種

網絡中斷,丟包率百分之百

丟包率小於百分之百

判斷一個網絡是否中斷(丟包)

使用pin工具

例如:

ping www.baidu.com

tracert(windows)/traceroute(linux)————跟蹤網絡中的路徑

tracert -d www.baidu.com

選項:
-d 不將地址解析成主機名。
-h maximum_hops 搜索目標的最大躍點數。
-j host-list 與主機列表一起的鬆散源路由(僅適用於 IPv4)。
-w timeout 等待每個回覆的超時時間(以毫秒爲單位)。
-R 跟蹤往返行程路徑(僅適用於 IPv6)。
-S srcaddr 要使用的源地址(僅適用於 IPv6)。
-4 強制使用 IPv4。
-6 強制使用 IPv6。

可能中間有防火牆,被過濾掉

通過最多30個躍點跟蹤

在這裏插入圖片描述

記錄序號從1開始,每個記錄就是一跳,每跳就表示一個網關,我們看到每行有三個時間,單位是ms,其實就是-q的默認參數。探測數據包向每個網關發送三個數據包後,網關響應後返回時間,如果指定-q 4,表示向每個網關發送4個數據包

有時我們traceroute一臺主機時,會看到有一些行是以*表示的,出現這樣的情況,可能是防火牆封掉了ICMP的返回信息,所以得不到相關的數據包返回的數據

有時我們在某一網關處延時比較長,有可能是某臺網關比較阻塞,也可能是物理設備本身的原因。當然,如果某臺DNS出現問題時,不能解析主機名、域名,也會有延時長的現象,可以-n 指定避免dns解析,以IP格式輸出數據

如果在局域網中的不同網段之間,我們可以通過traceroute來排查問題所在,是主機的問題還是網關的問題

如果我們通過遠程來訪問某臺服務器遇到問題時,使用traceroute追蹤數據包所經過的網關,將出現問題的節點提交給IDC服務商,可以幫助我們解決問題

tracert/traceroute 這個辦法只能判斷網絡中斷在哪個地方

如果是丟包,就要使用linux中的MTR工具,來判斷在哪個地方丟的包

[root@ceph00 ~]# yum install mtr -y
[root@ceph00 ~]# mtr www.baidu.com

在這裏插入圖片描述

在最後一行看到的丟包率是0%,說明網絡質量是好的

總結:當網絡出現故障時(丟包或是中斷)

辦法一:使用ping探測網絡是中斷還是丟包

如果是中斷,使用tracert/traceroute 去判斷中斷在什麼地方,然後到該節點去開啓相應端口

如果是丟包,使用mtr判斷丟包的位置

中斷容易排查——網線端口down

丟包難以排查——端口解除不良,中間未知節點阻止放行,造成丟包的現象有很多

延時:語音網絡,開視頻會議直播,會有延時

抖動——每個數據包的延時若是固定的話,不會影響體驗;當每個數據包的延時不是固定的,便會造成抖動

3.4 網絡故障定位

  • 人爲故障————錯誤增刪改、命令不熟悉

物理操作:增改拔線路

命令操作:增刪除vlan、stp

錯增刪路由、動態路由協議過濾路由條目等——子路由條目

錯誤增防火牆安全策略

錯誤的nat轉換

做了限制QOS時配置錯誤(流量限速)

負載均衡產品錯誤增加策略

  • 無人爲運行故障

企業辦公網絡問題——瞭解企業數據中心問題如何解決,企業辦公網絡問題會變得很簡單

企業數據中心問題——判斷企業的業務問題是否和網絡有關

極個別的業務故障:1-2臺業務出現問題,與網絡關係不大,沒但是不能排除與網絡沒有關係

排查思路:

有日誌服務器:查看日誌服務器,查看交換機是否有問題,查看交換機的接口是否有問題

無日誌服務器:通過服務器的mac地址查看在哪個交換機接口上(最好做個網絡監控),然後判斷鏈路是否有問題

小面積業務故障(與網絡相關的故障點)

與接入交換機有關係

大面積業務故障(與網絡相關的故障點)

與核心交換機有關係

丟包問題:

1.主機資源耗盡————CPU/memory資源使用100%、webserver連接數滿、服務器接口流量滿

2.網絡資源耗盡————交換機CU使用率100%(二層、三層不一樣)、交換機流量打滿、交換機關閉STP導致環路、防火牆會話數打滿、防火牆nat TCP轉換端口被耗盡(65535)

3.數據包來回路徑不一致——一般這種問題在剛開始配置時就應該出現問題;在運維中出現這個問題可能是設備斷電或者重啓導致某些配置丟失

4.設備版本問題——需要升級

ping ip 地址能用

pingDNS不通

dns網絡問題

dns自身配置問題

ping 通,telnet不同

可能中間鏈路將端口給過濾了

telnet www.baidu.com 443 會話能通

如何判斷哪個策略有問題

traceroute -p 443 www.baidu.com 判斷哪個地方不同

ping telnet 通, TCP傳遞數據不同

一般和鏈路數據MTU有關係

某些業務傳遞的數據是大於1500的,但是端口的上限設置時1470,這會造成部分數據丟失(端口不能分片)

telnet ip(域名) 端口號 判斷對方有沒有啓動業務端口

業務端口有沒有起來,服務器有沒有啓動

路由層面ACL規則,端口有沒有被封掉

防火牆規則:低到高,端口有沒有放通

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章