IDC機房運維經驗淺談


一、        什麼是IDC機房運維?


IDC機房運維涉及到方方面面的問題,它不同於其他運維,處理的問題都是比較低沉的問題。在很多公司可能都是將服務器託管的到專門的IDC機房讓專業的人士進行維護,還有些大公司建有自己的IDC機房,但管理層面上可能只是網絡信息部門的一個子部門,但我們仍要面對很多機房管理的問題。IDC機房運維可以簡單的從五個方面來概括:主機監控、信息統計、硬件維護、系統維護、網絡維護。處理這些問題就是IDC機房的運維。


二、        分層運維


我認爲我們所熟知的計算機能有今天的成就很大一個成功是在於它的模塊化設計,以及分層體系,現在我們用的PC的硬件是由CPU、內存、硬盤、主板、輸入輸出設備等組成。正是這些模塊化的構造讓人們對計算機的維護更加的方便,快捷。


現在我們正在步入雲計算時代,雲計算的實施卻是阻礙重重。但是雲計算是必然的趨勢,因爲這是人們對信息自由的渴望、是對資源合理利用的迫切需要。所以說雲計算的發展也少不了用模塊化,分層次的進行設計和優化。


我們來看看雲計算的分類 雲計算可以認爲包括以下幾個層次的服務:基礎設施即服務(IaaS),平臺即服務(PaaS)和軟件即服務(SaaS)。


我覺得我們現在的系統分層多且繁雜,無法體現我們在IDC機房的運維,我認爲IDC機房的運維應該根據服務提供的角度去對IDC機房進行維護,從終端角度來看,所有提供網絡服務的資源都是一朵朵的網雲。我們在IDC機房中的運維都是爲了面向終端進行服務。所以說我們應該根據服務來對我們的IDC機房進行運維。


我根據雲計算服務的分類認爲我們在運維分層的問題上應該和雲服務的分類相呼應來進行維護,所以我認爲,IDC機房的運維應該分成:基礎設施維護,耦合層維護,應用服務維護三個層面。


基礎設施維護


基礎設施維護顧名思義,指的是對設施設備的維護,包括設備的環境維護,設備的統計等等。在這個層面我們需要保證每一臺機器是可以正常連接的,是可以正常使用對外提供服務的,並且我們得保障機器的正常運行並且是可管理的。總的來說基礎設施層的維護是爲了對耦合層的交付使用而服務的。


耦合層維護


在這個層面我們對設備有了統一的管理,在這個層面有系統性的架構統一的管理系統,指令系統,和監控系統,在這個層面我們可以發現底層的問題,並交由底層處理,並在這個層面保證應用服務的正常運行。在這個層面將會涉及負載均衡和備份等技術。


應用服務維護


在這個層面主要是客戶對自己應用的維護,在這個層面裏客戶對自己運行的運營軟件進行維護。


當然這個分層的維護只是個萌生概念,如果有一天這個理論可以被建立,相信會被更加的完善。並且爲我們更好的理解運維體系服務。


三、        運維工程師


在我之前有很多人都對運維工程師進行過很多定義,大家都說運維工程師是神仙,不是人乾的活。因爲運維工程師所承擔的東西太多了,這讓很多做運維工作的朋友們都表示傷不起啊。我們可以來看看以前別人是怎麼來定義運維工程師的。


運維工作師需要什麼樣的技能及素質


做爲一名運維工程師需要什麼樣的技能及素質呢,首先說說技能吧,如大家上面所看到,運維是一個集多IT工種技能與一身的崗位,對系統->網絡->存儲->協議->需求->開發->測試->安全等各環節都需要了解一些,但對於某些環節需熟悉甚至精通,如系統(基本操作系統的熟悉使用,*nix,windows..)、協議、系統開發(日常很重要的工作是自動運維化相關開發、大規模集羣工具開發、管理)、通用應用(如lvs、ha、web server、db、中間件、存儲等)、網絡,IDC拓樸架構等等,但是我們知道每個人不肯能樣樣都很精通,每個人的知識層面不可能像水桶一樣,我不否認這種人的處在,但是人的精力是有限的,一個人挖10口1米的井估計很難挖出水來,但是一個人挖一口10米的井我想挖出水的可能性還是很高的。所以說如果運維工程師通過分層運維將運維的知識面分開來進行突破,我想運維水平的提高指日可待,運維工程師的工作負擔也會相應的減輕。


那麼運維工程師在技能和個人素質方面需要什麼要求呢?


我覺得在技能方面不需要過分去強求,只要懂得計算機的基本原理等計算機知識就可以,其他的個方面知識都可以通過後天的培養獲得。


在個人素質方面應該具備以下幾點:


個人素質方面:


1、 溝通能力、團隊協作:運維工作跨部門、跨工種工作很多,需善於溝通、並且團隊協作能力要強;這應該是現代企業的基本素質要求了,不多說。


2、工作中需膽大心細:膽大才能創新、不走尋常路,特別對於運維這種新的工種,更需創新才能促進發展;心細,運維工程師是網站admin,最高線上權限者,一不小心就會遺憾終生或打入十八層地獄。


3、主動性、執行力、精力旺盛、抗壓能力強:由於IT行業的特性,變化快;往往計劃趕不上變化,運維工作就更突出了,比如國內各大公司服務器往往是全國各地,哪裏便宜性價比高,就那往搬,進行大規模服務遷移(牽扯的服務器成百上千臺),這是一個非常頭痛的問題;往往時間非常緊迫,如限1周內完成,這種情況下,運維工程師的主動性及執行力就有很高的要求了:計劃、方案、服務無縫遷移、機器搬遷上架、環境準備、安全評估、性能評估、基建、各關聯部門扯皮,7X24小緊急事故響應等。


4、其它就是一些基本素質了:頭腦要靈光、邏輯思維能力強、爲人謙虛穩重、親和力、樂於助人、有大局觀。


5、最後一點,做網站運維需要有探索創新精神,通過創新型思維解決現實中的問題,因爲這是一個處於幼年的職業(國外也一樣,但比國內起步早點),沒有成熟體系或方法論可以借鑑,只能靠大家自已摸索努力。


四、        機房運維技術體系


在機房中我們要面對各種各樣的事情,如服務器上架,服務器下架,處理問題服務器等等。在機房運維中我覺得也應該建立起我們的技術體系,從這幾方面入手使得我們的機房運營的更加平穩健康。


1、  監控體系,一個健壯的身體裏不開每天的觀察,我們需要時時刻刻觀察我們的機房,看看機房發生的細小問題,所以說強大而有健全的監控體系有利於我們更好的維護我們的機房。


2、  統計體系,在IDC機房我們管理着數以百計的服務器,統計工作可馬虎不得,每一臺機器的配置,存放位置等等,都關係着數千元的設備的物理安全,其他的還有帶寬安全等等。數量少還好,數量一多就有可能出錯,如何快速高效的統計,並不出錯也是門技術。所以單獨爲一個體系也是有必要的。


3、  故障管理體系,在機房中我們要處理每一臺服務器發生的故障,有些問題很棘手,有些問題很簡單,但大多數問題都有相似性,可以參考其他問題的處理過程處理,良好的故障管理體系肯定是有助於我們快速的響應和處理問題的。


4、  自動化體系,太多的手動執行大大影響了我們處理問題的工作效率,機房運維引入自動化的理念開發自動化管理工具可以大幅度的提高我們機房的管理效率。


5、  評估優化體系,正所謂人無完人,在好的東西也有不好的地方,如IPONG待機時間短,建立評估優化體系使得我們可以在定期的時間內發現我們不足的地方,更好的優化我們的不足之處


五、        如何成爲一個合格的運維工程師


我認爲做好IDC機房的運維就是要保障最底層的運維維護安全。如何高效的維護好底層的設備是每一個IDC運維工程師應當具備的職責。我們可以做好以下幾個方面。


第一、   統計記錄好機房機器運行的信息。如上下架記錄,故障處理記錄,監控記錄等等,做到高效快速的統計好所有機房信息。


第二、   監控。熟悉和掌握監控軟件的使用,做到可以更具監控工具的組合應用定位故障點,初步反應故障原因等。


第三、   通過創新思維以及熟練操作提高並解決運維效率問題;目前各公司大部份運維主要工作還是依賴人工操作干預,需要儘可能的解放雙手。以及熟悉每一個運維環節的操作。


第四、   運維知識的積累與沉澱、文檔的完備性。運維是一個經驗性非常強的崗位,好的經驗與陷阱都需積累下來,避免重複性範錯。並且可以在相似問題發生的情況下快速反應。


第五、   有計劃的做事;工作有計劃,計劃後想方設法達到目標,不找藉口。機房運維工作大多都比較少,通常都是處理問題,但有很多事情是需要定期去做的,比如統計、評估、優化等等。


六、        運維職業的迷惘、現狀與發展前景


運維崗位不像其它崗位,如研發工程師、測試工程師等,有非常明確的職責定位及職業規劃,比較有職業認同感與成就感;而運維工作可能給人的感覺是哪方面都瞭解一些,但又都比上專職工程師更精通、感覺平時被關注度比較低(除非線上出現故障),慢慢的大家就會迷惘,對職業發展產生困惑,爲什麼會有這種現象呢? 除了職業本身特點外,主要還是因爲對運維瞭解不深入、做得不深入導致;其實這個問題其它崗位也會出現,但我發現運維更典型,更容易出現這個問題;針對這個問題我談一下機房運維的現狀及發展前景(也在思考中,可能不太深入全面,也請大家斧正補充)


運維現狀:


1、處於剛起步的初級階段,各大公司有此專職,但重視或重要承度不高,可替代性強;小公司更多是由其它崗位來兼顧做這一塊工作,沒有專職,也不可能做得深入


2、技術層次比較低;主要處於技術探索、積累階段,沒有型成體系化的理念、技術。


3、體力勞動偏大;這個問題主要與第二點有關係,很多事情還是依靠人力進行,沒有完成好的提練。


發展前景:


2、從個人角度,運維工程師技術含量及要求會越來越高,同時也是對公司應用、架構最瞭解最熟悉的人、越來越得到重視。


3、運維將成爲一個融合多學科(網絡、系統、開發、安全、應用架構、存儲等)的綜合性技術崗位,給大家提供一個很好的個人能力與技術廣度的發展空間。


4、運維工作的相關經驗將會變得非常重要,而且也將成爲個人的核心競爭力,具備很好的各層面問題的解決能力及方案提供、全局思考能力等。


5、特長髮控和興趣的培養;由於運維崗位所接觸的知識面非常廣闊,更容易培養或發揮出個人某些方面的特長或愛好,如內核、網絡、開發、數據庫等方面,可以做得非常深入精通、成爲這方面的專家。


6、如果真要以後不想做運維了,轉到其它崗位也比較容易,不會有太大的侷限性。當然了,你得真正用心去做。


7、技術發展方向、網站/系統架構師。

ps:本文內容來自網絡

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章