我們需要一顆強勁的心臟(2)--機房改造篇

已發表在《網管員世界》
 
轉載支持,批評更支持,另投就不支持嘍!
 
機房落成以後,窗明几淨的環境,整體劃一的佈局,很容易讓我們放鬆心情並沉浸在成功的喜悅之中,當慵懶的情緒佔據我們大腦太多空間的時候,前期精心策劃的機房也將逐漸步入危險地境界,恐怕一個網線的短路即能給機房造成致命打擊,因此時間久了我們的擔心也逐漸強了起來。
擔心機房設備增加,UPS安時過小不能滿足需求;擔心單個空調不能滿足整個機房的溫、溼度要求;擔心機架凌亂的網線對網絡造成強烈串擾;再或者擔心終端無限制的擴容,給網絡、交換機帶來巨大的負載。當越來越多的擔心充斥在我們內心深處時,慵懶的心情該收斂一下了,機房維護中長期而持久的主旋律將是—改造。
 
遷址
 
這應該是所有網絡管理員最爲頭痛的事情。機房建設之初,充其量也只是考慮未來5~10年的網絡發展,時間久了服務器增多,原始的機房已經裝不下那些服務設備,或者公司主營業務拓寬,建設了新的廠房,更多的信息點,更穩定的使用環境註定要將機房遷移到新的地址。搬新家的喜悅感雖然能很長時間主導我們的思想,但是由遷址帶來的一系列問題卻是不能忽視的。
1、考慮用途
       遷移機房並不是遷移所有設備,留給舊機房的至少還包括原核心交換機和機架,當偌大的機房只剩下一、兩個獨立設備時該如何處理呢?留作其他人員使用,IT部門不會答應,更何況防靜電地板、消防系統、門禁系統都是經過嚴格測試後搭建的,所以原始機房不能拆,也不能借用,最好的結果就是作爲其他服務器的備用機房。
       理論上講,備份服務器和主服務器最好要隔離100米,尤其是備份用的磁盤、磁帶等存儲設備,更要遠離主服務器,於是在遷移機房時,看似閒置的原始機房我們可以用來存放備份域服務器、冗餘的代理服務器、備份的文件服務器、磁盤、磁帶等存儲設備,這樣原始機房能夠充分利用,主機房也可以免去無框玻璃隔斷的建設,節約成本。
2、考慮距離
       公司園區內能夠落成新的建築佔地自然不菲,距離的限制讓雙絞線不能作爲主要的傳輸介質,光纖是必選項,但是這裏也有一個注意的事項,光纖的傳輸速率和傳輸距離的限制。
傳輸速率在1Gb/s,波長爲850nm,普通50μm多模光纖傳輸距離550m,62.5μm多模光纖傳輸距離爲275m,而傳輸速率10Gb/s,波長爲850nm,普通50μm多模光纖傳輸距離則銳減至250m,普通62.5μm多模光纖傳輸距離只有100m。
這裏我們可以得知,傳輸速率越高則距離越近,如果我們需要長距離傳輸,又要求維持高傳輸速率,那麼我們就需要採用單模光纖,傳輸速率10Gb/s,波長在1550nm,g.652單模光纖傳輸距離可達到60km,這足夠滿足大部分企業的需要了。
以上數據我們可以作爲參考,合適的距離和速率選擇合適的介質。
3、考慮分層
       公司園區的地理規模較大,那麼涉及的交換機的就會越多。一般會是這樣分佈:核心交換機→建築羣子系統的交換機→垂直幹線子系統的交換機→桌面交換機→最終用戶,如果這一路徑跨越多達七層的交換機,那麼網絡的負擔將會相當大的,不管是核心層的還是桌面級的數據通訊都會很吃力,所以,在遷址時要嚴格控制的網絡的分層,這個分層不是OSI分層(開放式通信系統互聯參考模型),而是從核心交換機到最後的桌面級交換機需要經過的路徑。這個路徑不要超過7層。
4、考慮時間
       如果交換機、服務器遷移的過程中衆多終端用戶正在使用網絡,那麼ERP的數據無法進行查詢、郵件的發送接收也會中斷,文件服務器的存儲工作即告失敗,基於網絡的信息化流程全部癱瘓,所以做遷移工作對時間的選擇非常重要。如果遇到十一或者春節長假那最好不過了,我們可以有充分的轉移服務器和測試網絡的時間,但是長假可遇而不可求,通常給我們的時間只是週六、週日這兩天的時間,於是我們可以這樣做。
       週五之前聯繫各部門經理詢問休息日的加班情況,先期安排時間,儘量避開大規模加班日,然後郵件通知網內所有用戶,告知具體的網絡停機維護時間(這裏假設個別部門週六加班,則我們選擇週日維護)。
週六晚22:00之前關閉所有需轉移服務器→等待30分鐘降低設備溫度→轉移服務器→連接所有服務器和網絡設備,進行初步測試→週日全天對所有服務進行全面測試→週一觀察並記錄網絡整體使用情況,有問題,進行相應改造,無問題,機房遷址成功。
 
       整個機房的搬家在網絡規劃中是重中之重,我們要根據企業的實際情況和網絡的自身情況做出合理的安排,同時也要與建築安全公司、物業部門精誠合作,共同完成。
 
機房設施改造
 
       在機房建設的那篇文章中,筆者介紹了幾個需要注意的地方,但是隨着網絡環境的不斷擴充,終端的不斷增加,服務器、交換機等設備的持續升級,除了無框玻璃隔斷、防靜電活動地板這些內部的裝飾,很多設備需要我們進行升級改造。
 
線路改造
       5年前的網絡多采用超五類雙絞線作爲主要傳輸介質,包括機房內的網絡的傳輸。隨着
網絡終端的不斷擴充,用戶對網絡速度的要求越來越高,時常會抱怨某個服務器提供的數據回送比較慢,其實服務器的硬件速度倒是完全能跟得上節奏,跟不上的是網絡的速度。當然,將整個網絡全部予以重新佈線顯然不現實,但是對機房內的主幹線路進行一下改造和重新規劃是完全有必要的。
這裏我們可以選擇六類佈線系統。
首先它的速度可迅速提升一個新的高度,達到千兆網絡,最大可達到1.2Gbit/s,同時它在物理層也影響着電氣指標,在新一代全雙工的高速網絡中,最大的敵人就是RERURN LOSS(回波損耗)和NEXT(串擾),這兩個干擾值越大對網路速度的影響也就越強,而六類佈線系統自身的質量特性即可有效的屏蔽這兩大影響網絡的天敵,可保證信道的整體性能長期處在最優狀態。
 
機櫃改造
       單一的工作做久了,漫不經心的情緒會越來越強,最直觀的現象就是機櫃中的網線,常因此變得雜亂無章。網管把它推脫於工作的繁忙,無暇整理,殊不知這種無序的堆放網線會對網絡造成巨大影響,這是我們要整改的一部分。
首先,考慮將網線部分與電話線部分分開佈線,即左側全部走網線,右側全部走電話線,然後將線纜每隔1.5米進行綁紮,防止線纜相互拉拽產生損壞,也可以有效地減少近端串擾;
       其次,將網線和電話線超長部分進行截取,規範佈線,同時對出現氧化層或者卡頭鬆弛的水晶頭重新制作(日常維護中很多時候都是一號線通訊失敗,後測均是水晶頭出現問題,這種情況在悶熱、潮溼的夏天尤爲嚴重),這可以有效減少網絡通斷故障的發生,更減少回波損耗造成的干擾。
       第三,如遇網線與電話線共同使用的情況(注:網線使用1、2、3、6號線,其餘的可做電話線),嚴格拆除,只做電話線路使用,同時找尋網絡另一端,採用接駁HUB的方式重新予以佈線,可減少電話振鈴時產生的72V瞬間高電壓擊穿交換機現象,以避免損壞交換機。
       第四,清理廢棄線路,節省網絡資源,也便於我們進行控制。
       經過上述處理,機櫃的整潔性會大大提高,同時也方便我們查找線路,最大的好處是可以在物理層面先行減少網絡信號的干擾。
 
空調系統改造
機房建設之初我們考慮空氣環境的潔淨度、溫溼度等情況。設備比較少的時候單一空調能滿足控溫、控溼的需求,但隨着機房設備的不斷增加,單一的空調已經不能滿足日常的需要,更何況一臺空調7×24小時的不停運轉,多強悍的設備也終會有罷工的一天,所以這時候有兩種選擇。
1、聯動空調
購買2臺或者更多臺空調,將其做成聯動系統,由軟件控制每一臺空調的運行時間、停機時間,並週期性地自由切換。當一臺空調出現故障時,其餘正常使用的空調自動接管聯動任務,同時通知機房管理員以作應急處理。它可保證每臺空調都會有充分的“休息”時間,能有效延長空調的使用壽命。
  
 
2、精密空調
    這是一個大成本的解決方案,因爲精密空調的造價非常昂貴,但是它所能提供的工作精度、可靠性和穩定服務卻是一般空調設備不能比擬的。它可以在室外溫度達到-45仍能提供服務,而且它對機房內部的溫溼度監控更爲精確,溫度差不會超過1℃,溼度不會超過5%,同時,它的使用壽命相當長,最低也要求使用10年,連續運行超過85000小時,平均無故率要達到25000小時。所以,精密空調無疑是空調系統中最爲穩定的設備,它多用於銀行、通訊、證劵、石化、航天等大型企業中。
 
UPS系統改造
      設備的增加不僅加大了空調系統的壓力,還考驗着UPS系統,當負荷超過UPS可控範圍,那麼光是UPS無休止的報警就夠我們腦袋疼一天的,嚴重的是這種滿負荷運行極易損壞UPS設備,小至減少使用壽命,大至直接爆掉電池,這樣的損失太大有些得不償失。UPS不是買來就一勞永逸的物件,它也是需要改造的。
       首先,重新覈算機房內需要UPS供電的電源功率,根據下列公式重新計算UPS電池的安時數:
UPS電源功率(VA)×延時時間(小時數)÷UPS電源啓動直流=所需蓄電池安時數(AH)
       得出結果後,採購足量的電池以滿足機房供電需求,這是其一。
       其二,爲了更加安全的使用UPS,我們可以做成冗餘UPS方案,即購買2組UPS系統(最好是同一型號的),通過控制檯將其並行連接,這兩組UPS系統的輸出電流、電壓等指標一定要保持同一狀態,當一組UPS因故障而停機時,控制檯通過變換器迅速切換到另一組UPS,保證電力系統不中斷連接,如果再配合使用2路供電系統,那麼它的可靠性更能得以保證。
 
供電系統改造
       設備增加,空調升級,UPS改造都會要求擁有足夠的電力系統,當停電是“拒絕”選項的時候,我們對供電系統更要進行近乎嚴格的改造。
首先,爲了保證電力的絕對可靠,至少配備兩路供電系統,當一條線路出現故障的時候可以迅速切換到備用線路,保證數據通訊不中斷。
其次,如果對電力要求極高,不允許出現任何閃失,那麼還需要配備一臺柴油發電機。當供電系統運轉正常是,柴油發電機組處於待機狀態,一旦兩路市電都中斷時,機組立即接管,馬達動力可提供100%負荷的能力。市電恢復時,機組自動退出運行開始延時停機工作,等待市電重新接掌供電系統。
 
       以上是對機房基礎設施的改造,很多小的細節方面也要注意,比如電源的插排,我們一定要選擇正規廠家的產品,並且在使用插排時務必要留出一、兩個空閒插座,這不是爲了日後使用方便,而是保證插排的負荷不是處在最大強度,避免過載產生火災。這些細微之處也時刻威脅着機房的安全,這要求我們時刻保持警惕狀態,發現問題立刻整改。
 
服務改造
 
       交換機也好,服務器也罷,它們都是爲網絡和用戶提供最終服務的設備,它們的穩定與否,性能好壞直接影響着網絡的正常運行。終端接入的越多,它們的壓力也就越大,網絡速度也越緩慢,不能正常提供服務這是最常見的表象,也是我們最不願意看到的情形,爲了網絡能夠流暢、穩定、安全的運行,這兩者的改造也是我們要重點關注的。
 
交換機、路由器改造
       網絡發展速度之迅猛可能連交換機、路由器的生產廠家都不曾預見,所以早期的設備在功能、使用等方面多少會有點缺陷。隨着網絡的規模越來越大,先前的網絡設備已經無法滿足快速、可靠的網絡連接,升級設備是必然的。我們在升級網絡設備時最好要考慮一下這幾方面的內容。
1、需求
       既然要升級網絡通訊設備,那麼肯定是對當前網絡的的某個方面不太滿意,或者是包轉發率過低,或者是端口容量太小,亦或者是對背壓不滿意,每個企業的網絡不同,考慮的側重點也不一樣,這就要求從實際情況出發,選擇適合自己的產品。並不是越貴的產品就越好,超高的性能閒置不用本身就是一種浪費。
       再有,我們選購設備還要有一些側重點。
比如:針對性。
       早期規劃中,交換機出現在OSI七層模型中的第二層,即數據鏈路層,路由器則出現在第三層,網絡層。如今隨着網絡設備的不斷髮展,交換機已經可以做到第三層甚至第四層,很多交換機已然能夠囊括路由器的部分功能,但是三層交換機的路由功能和支持的路由協議都十分有限,它只適合中小企業等較少路徑的網絡環境,而路由器可以根據自身的攜帶的協議處理複雜的網絡環境,並且可以計算出最優的網絡路徑,這多用於大型網絡。
       再比如:考慮未來。
無線網絡逐步邁入企業,這是未來網絡的發展方向,這樣我們就需要考慮無線設備的規劃,如AP的覆蓋位置,怎樣走線,如何與有線網絡完美的結合,當一臺電腦同時接入有線與無線時,交換機分配的IP地址又會是怎樣?也些都是我們要考慮的對象。
 
2、兼容性
       不是每個產品買來就能適用的,它能否與先前產品完美的協同工作,基於某種協議的通訊是否有障礙,速度是否得以提升都是我們要甄別的地方,它的兼容性我們要多做考慮。
a、協議的兼容性
       設備越多,升級時我們越要全面考慮。比如:網絡中使用EIGRP作爲路由通訊協議,它結合了最短距離矢量和快速收斂鏈路狀態等路由優點,這個協議在實際應用方面能大大提高網絡的使用效率,但是它的使用很有侷限性,因爲這個協議是思科的專有協議,其他路由廠家或許不集成EIGRP。
這樣的情形還有很多,比如:端口聚集協議(PAgP)、思科發現協議(CDP)、思科交換鏈路內協議(ISL)和動態 ISL 協議(DISL),這些單一廠家開發的協議在別的產品上是否適用是個問題,所以我們在升級時首先要考慮協議的兼容性。
b、速度的兼容性
       幾乎所有的核心交換機都能提供100/1000M自適應功能,但是不同品牌之間的交換機自適應能力卻值得商榷,曾經遇到過這樣一個案例。
       聯想D-LINK的一款三層交換機通過光纖連接至華爲的一款核心級交換機時網絡不通,沒有任何數據流量,採用D-LINK DFE-855光電轉換模塊連接到交換機時,網絡即恢復正常。光纖自然是通的,交換機也是好的,網絡不通的原因就是2臺交換機不能同步相互的速度,這個時候需要我們強行設置它們的交換速度,在主核心上將通往聯想D-LINK的光口上把速度設置爲1000M/FUL,這樣就能交換機就能夠相互識別、通訊了。
       本例中,強行限速能夠實現握手通訊,如果限速了也不能連接那就只能靠DFE-855來維持了,需要明確的是DFE-855只能提供100M的速率,雖然是連接了,但速度沒有任何提升,這樣的升級不做也罷,所以速度的兼容性亦要考慮。
       這些都是我們在對交換機、路由器進行升級改造時需要注意的幾個方面,其它的細節方面還有很多,我們還需要適時而動。
 
服務器改造
       企業主營業務增長必然帶動信息化的聯動升級,隨着信息化項目的不斷增加,很多網管都經歷了機房內從幾臺服務器膨脹到的幾十臺服務器的過程,這種爆發式的增長必須要有軟硬件的配合方能實現。
1、硬件的改造
       越來越多的服務器佔據的機房空間也會越來越飽滿,如果存在大量的塔式服務器,終有一天機房會被它龐大的身軀所佔滿,爲了節省不太充裕的機房空間我們不妨選購性能相當,體型嬌小的服務器,這其中當屬機架式服務器和刀片服務器。
a、機架服務器
       這種服務器是按U爲計量單位的,它的大小基本上是按照普通19英寸機櫃定做的,從1U至8U不等,多數控制在4U以下。相對於塔式服務器它的體積非常小,這是優點,但是也由此帶來一些不便,多數機架服務器只提供2個PCI插槽,內存插槽也不是很多,這樣可擴展性就相對差一些,另外散熱方面也頗爲不暢,如機房溫度過高,則需外力協助散熱纔可以。
 
b、刀片服務器
       它需要的只是一個大型主體機箱,在它的內部可以放置多塊“刀片”(也就是我們所說的系統母版),每一片刀片都有一個獨立的硬盤,獨立的系統,提供獨立的服務,它只活動於主體機箱內,佔據的空間更小,同時也改善了機架服務器的兩大弊端。
       可擴展性,當需要升級的時候只需將新的刀片插入主體機箱中即完成操作,此相當於添加一臺新的服務器;散熱方面則被刀片服務器處理得更爲簡單,它在主體機箱內部安裝一個超大的散熱風扇,多熱的溫度也能瞬間排放一空,因此刀片服務器多是小型機房的選購重點。
       另外,市場中新一代服務器—“模塊化服務器”逐漸轉露頭角,更經濟的價格、更靈活的配置、更簡單的管理正在大肆挖角服務器市場的份額,未來服務器的選購,它也應該步入我們的視野範圍之內了。
 
 
2、系統的改造
       中小型企業多數還是採用微軟的“域”結構,雖然將“域”定義爲安全邊界,但是它的安全性卻飽受詬病,畢竟用Windows的企業和***Windows的***實在是太多了,所以改變一下思路,使用安全性更高一點的Linux作爲服務器在很多方面能夠抵禦***的***,而它所能提供的服務絲毫不比Windows少,郵件服務、代理服務、WEB服務該有的應有盡有,配置簡單、性能也很好,注重安全的企業不妨多關注一下Linux。
       另外,諸如網絡版殺毒軟件、防火牆系統、IDS/IPS系統、網管軟件系統等等安全防禦和控制系統也需要及時的升級以應對網絡的不斷擴充,不過這些系統級的改造工程是複雜而又長期工作,這裏不再細細贅述。
 
 
結語
       一個機房可能也就佔據公司整個面積的1%,甚至更小,但是不要忽略這個近乎可以忽略不計的地方,公司園區的所有數據全部經此流轉,或者是商業機密數據,或者是研發數據,再或者是服務器之間的核心數據,都是不容有任何閃失的。發揮我們的想象,哪些設備還徘徊在危險地邊緣?哪些手段能夠爲我們提供更深層的保障?哪些地方我們還能做的更安全?只要可行,立刻去做!
改造不能給我帶來立竿見影的實際效果,但是卻能爲整個網絡的安全、穩定的運行打下堅實的基礎,讓我們時刻準備着。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章