無需深厚技術背景,也可以做好系統和應用維護管理

版權聲明:原創作品,允許轉載,轉載時請務必以超鏈接形式標明文章 原始出處 、作者信息和本聲明。否則將追究法律責任。http://lauef.blog.51cto.com/413888/165636
做好系統和應用維護勢在必行
  如何做好IT系統的運行維護是IT領域的熱點問題. 隨着信息化技術的蓬勃發展,信息化建設的深入,運維管理的難度也越來越大。 如何管理好IT系統,保證其可用、安全、可靠、高效地運行,提高用戶滿意度、降低運維服務成本、保證系統能夠在遇到突發事件時快速地解決。是當下嚴峻而又 現實的問題。
  作爲運維服務提供者,無論是管理人員還是運維人員,經常會遇到這樣的情景:
夢深時分,急促的鈴聲響起,電話接通,在電話 的另一頭,有人急切地說道:“一位公司領導反映,公司的網站登錄不了,郵件無法正常發送,首頁顯示空白”,一般這種情況下,你會要求現場人員嘗試恢復服 務,但現場人員往往不能獨立解決,此時你需要協調技術專家去出面搞定這個問題,但如果問題棘手呢,那此時就需要綜合各方高人進行會診。通過逐一詢問運維組 的檢查情況,細緻瞭解了包括防火牆、***監測、操作系統、數據庫的設置、Web服務器以及自身的運行情況後,系統問題仍然無法定位。
  就在你準備放棄的時候,打算採取應急方案的時候,正常的界面又忽然顯示了,只是很快,但刷新後又重複出現非正常。他們的聯繫在哪裏,問題在哪裏,你得找出根本原因。
  經過多番種種努力,你忽然想到一點,昨天客戶好像提過要對硬件做升級,如果所料不錯的話,應該是昨天晚上就進行了,但因爲某種原因,升級並沒有成功,客戶的操作步驟也沒提前通知,具體操作如何誰也不清楚。這時候你會給客戶打電話彙報情況,並要求客戶方安排人員來解決,
  終於在多方人員的努力下,系統恢復正常運行,大家一起舒了一口長氣,同時開始抱怨“怎麼能這樣?他們也太過分了,居然進行升級都不跟我們打個招呼,明天一定得好好的跟他們領導反映”。
  以上的情景我相信絕大多數運維服務提供者都能遇到,並且不止一次兩次。爲什麼會產生這些問題呢?如果在此次事件中,整個系統有了變更管理環節,當客戶進行 升級,就必須通過變更管理的審覈和批准,否則是無法進行相應操作的,也自然不會出現應用無法訪問的問題,這對運營維護好IT系統以及提供完善的IT服務有 着重要的意義。
系統與應用維護都有哪些困難
  -服務器操作系統
  操作系統是服務器運行的軟件基礎,其重要性不用說大家都明白。如果使用Windows xp或Windows 2000 Server作爲操作系統,維護起來還是比較容易的,只要按時打好補丁,定時查看日誌就可以。但如果是LINUX和UNIX操作系統的話,需要對運維人員 的技術有相當高的要求,需要具備一定的專業知識。
  -服務器上的應用維護
  服務器上的應用軟件是企業的核心數據,是企業最重要的數據之一,如果數據丟失或者服務異常終止對於企業來說所造成的損失是不可估量的,企業的應用已經成了 企業生存和發展的重要組成部分。當企業應用的規模越來越大時,應用也隨之越來越多,如何快速有效的對這些關鍵應用進行監控就成爲了迫切的問題。
  -7*24小時服務週期
  除了上述二點列出的技術上的困難之外,還有一個重要的問題就是企業的服務器以及上面所運行的應用都是實時性很高的業務,必須得保證7*24小時不間斷提供 服務,單純的靠人工維護的話實時性太差,管理員不可能一天二十四小時盯着服務器,所以在現實情況中,經常出現服務器宕機或者服務器上的應用不能訪問,運維 人員往往無法第一時間知曉,而是由實際使用服務器或使用應用的人去通知,此時業務可能已經停止了很長時間,這對於企業來說無疑是很大的損失,從而造成對 IT運維人員的滿意度下降。
系統和應用誰來維護,誰來管理
  所謂系統和應用維護就是指能夠面對並處理IT系統涉及到計算機所出現的各種故障,說白了就是軟硬兼施。故障從系統級到應用級,從網絡到硬件設備。
  在系統和應用維護中,人的因素至關重要。因爲我們都知道人可以解決問題,但人又同樣會帶來問題,比如一個資深的運維人員離崗後,問題再次發生時就很難快速 響應,即使交接人技術很強卻也無法獲取到前人的運維經驗。這使得系統和應用維護管理的不穩定因素日益增多,如何減少由人員變更導致得系統和應用維護管理的 難度加大,是擺在我們眼前而必須解決的問題。
  維護管理軟件的產生,使得人在運維管理中所起到的作用被量化和標準化。通過運維管理軟件,所有IT設備都可以被監控管理。設備遇到問題,會自動分類報警, 無論是系統自動報警還是使用人工故障上報,工程師只要按照系統相關知識庫的知識,一步一步操作下去就可以,因此,對於工程師來說,不需要很高的技術水平, 就可以進行維護支持。
  爲了發揮IT系統的最大作用,系統和應用不僅僅需要人的運維,更需要有合適的維護管理軟件來支撐,幫助企業實現IT運維自動化,標準化。
  通常情況下,維護管理軟件應主動告訴我們應該關注什麼內容,指導我們如何去進行管理,問題出在哪裏,該從什麼角度入手分析,主動定位問題的位置等等。它至少應具備以下幾個方面的特點:
a) 提供綜合的一體化管理平臺:整合網絡、主機、應用、服務等各層面 IT 資源的、統一的IT 服務管理信息視圖。
b) 提供直觀的管理呈現方式:統一的監控資源視圖。
c) 提供多種發現問題和準確定位的管理機制:能夠準確、快速地定位故障產生的根本原因。
d) 提供統計報告和分析圖表,方便公司領導層做出決策。
e) 保障業務系統的穩定運行:從業務角度切入,以業務爲導向,通過對整個業務系統的關注,從而達到保障業務系統穩定運行和透明化管理的目的。
簡單易用的維護管理軟件的優勢
  簡單易用最主要的標準,就是無需深厚技術背景,也可以輕鬆做好系統和應用維護管理。
“哪怕是一個只有基礎技術能力的人,也能做專業IT維護”,這是我們維護管理軟件應該幫助用戶達到的運維水平。
  -監控信息統一展現
  面向業務監控和統一portal展現,整合第三方監控系統,提供覆蓋網絡、系統及應用服務等全方位監控的統一頁面展現。統一告警平臺彙總、壓縮和關聯各種設備或服務的告警信息,實現統一監控和展現。
  可針對不同角色的管理人員,提供各取所需的不同內容。比如爲部門經理提供實時的服務儀表盤Dashboard,輔助IT決策,爲運維人員提供資源可用性與性能指標,確定資源狀態。
  -網絡拓撲圖
  日常的運維工作中,系統維護管理人員對網絡的監控只是單點地針對設備,無法對整體進行有效的監控。網絡拓撲圖應提供網絡資源實時監控功能,能夠實時展現網 絡所有設備各個部分工作狀態變化,能真實地體現網絡中的物理運行狀態。能夠支持自動發現網絡拓撲,也支持手工繪製各種網絡拓撲,使網絡管理員能夠更加集 中、方便和有效的管理企業的網絡資源。

  -可視化管理
  可視化管理用於對企業的各種系統、應用、數據庫等資源進行實時的性能監控和診斷的軟件產品,它是個實時系統狀態監控軟件,在前端交互界面上主要採用Flash 技術,生動形象的展現系統各個部分的狀態變化。

  -快速監控
  一款強大的網絡資源監控軟件,應能快捷易用,使用戶能夠快速上手。不但可以快速發現資源,而且可以立即開始監控,使用戶可以立即查看所有資源的狀態、可用性、性能指標取值、報警信息等等。
  -Dashboard
  服務Dashboard(業務服務管理儀表盤),提供對IT 基礎架構的全面管理,並且能把IT 服務和相關用戶串聯連一起,提供直觀的可視化界面。一旦發生問題,系統管理員能很快通知受影響的客戶並及時瞭解服務故障嚴重程度。前端交互界面採用 Flash 展現,爲用戶提供完整的信息視圖和工作平臺。
總結
  一個真正綜合而全面的IT運行維護管理軟件,纔是用戶的最終選擇。它必須從用戶角度出發,對業務/應用服務,及其背後的IT基礎架構(路由器、交換機、服 務器等)進行全面監控;提供保障業務的服務質量,不僅能在服務可用性、響應時間等方面提供良好的服務保證,還能在服務中斷時,及時發出通知並解決問題。

 
 

本文出自 “賴永鋒” 博客,請務必保留此出處http://lauef.blog.51cto.com/413888/165636

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章