關於ITIL/ITSM以及以前的一點實踐

最近因爲某些原因寫了一些東西,發到這裏。
 
由於信息技術在組織中應用的範圍趨於廣泛,應用程度趨於深入,組織對於IT服務的依賴程度相應的持續提高,對於服務質量的要求也不斷的提高,但是考慮到信息技術本身以及信息產業的極大發展,IT服務本身的複雜度也有了巨大的提升,這就形成了一對矛盾。傳統的解決方法是養一些技術上全能的員工,出了什麼問題都能解決,但是這樣的方式也存在很大的問題,首先存在比較大的風險,如果這樣的資源進入不可用的狀態,例如離職或者假期,那麼組織的業務就存在因爲IT服務的故障而遭受巨大沖擊的風險;其次,擁有成本高,全能的員工需要大量的成本來培養以及挽留;第三,替代成本高,如果這樣的員工流失,尋求其替代者將是非常困難並且昂貴的;其他的一些問題不多討論。典型的現代解決方法是收集所有可能的信息,包括環境、硬件、軟件、人員等等的信息,識別出其中各個要素對於IT服務的影響及影響程度,以及要素本身的變動程度等信息,通過系統的方法論,以流程的形式,對於各要素進行管理與控制,以期在合理的成本下達到符合用戶要求的IT服務水準。有關的基本要素(不包括人員要素,因其不具備普適性)以及方法論、流程等的集合,就是ITIL,而在ITIL基礎上構建的對於IT服務的管理體系以及實踐,則是ITSM
ITIL/ITSM
的基本思想可以在全面質量管理(TQM)中找到其源頭,因此實際上可以認爲ITIL與同樣脫胎自TQM6西格瑪、CMM/CMMIISO9000等體系有相通之處,或者都是TQM在不同領域內的投影。
ITIL/ITSM
的實踐,基本的原則是通過把IT系統的要素與出現的問題結合分析,發現問題的根源,對於其中一部分,通過改變相應的要素,永久性的消除問題,對於另一部分,則通過把解決方法固化並形成相應的知識,保證IT服務的提供者可以以較低的成本獲得解決問題所必須的信息,這就在一定程度上避免了前面所描述的風險、擁有成本以及替代成本方面的問題。同時,還通過對於有關要素對於問題的影響,來預先控制可能會對IT服務出現衝擊的行爲。
從具體的實踐來看,沒有組織可以100%的按照ITIL的指導來構建自身的IT服務管理實踐,這需要根據組織自身的情況對於ITIL進行一定的剪裁,這也體現在不同的廠商基於ITIL開發出了不同的IT服務管理實踐框架,例如HPIT服務參考模型,IBMIT流程模型,微軟的運營框架(MOF)等,具體的組織也可以根據自身的情況來定義自己的IT服務管理架構,但是應注意到的是這一過程應該是一個動態的過程,根據組織自身不斷的發展與變化,相應的一些實踐也需要進行不斷的優化,這也可以參考戴明質量環PDCA:計劃(PLAN執行(DO檢查(CHECK行動(ACT),通過持續的改進,可以不斷的提高組織的服務水平,而對於影響服務及其質量的要素的掌握,以及流程的規範與標準化,則可以對於服務的成本進行度量以及管理和改進。
這是我對於ITIL/ITSM的一些體會,在幾年前,我也有機會對於這個領域進行一些探索和實踐。對於國內的企業來說,很少有企業能夠接受對一個ITIL/ITSM項目進行投資,因爲大部分企業都把IT部門視爲一個花錢的部門,如果要投資業務上的IT系統還沒有太大的問題,如果要投資IT部門自己的項目就難以接受了。事實上我當時也處於這樣的一個環境下,所以,有關的實踐只能是在不增加投資的前提下來進行。
ITSM常規的11個部分中,我們主要在配置管理、服務檯、事件管理、問題管理、變更管理、發佈管理上做了一些工作,在能力管理與可用性管理上有少量工作,對於IT服務連續性管理、IT服務財務管理以及服務水平管理則安排在後續的工作計劃中。
在配置管理方面,主要對公司內部的所有IT設備,包括PC、筆記本、PC服務器、小型機、存儲設備、網絡設備、安全設備、電源設備、打印/輸出設備、與IT部門有關的空調設備等,IT環境如網絡環境、軟件環境等進行了信息的收集與整理,並且彙總管理。收集的信息包括型號、基本的硬件配置、廠商、採購時間、保修時間、所處地點、所有者(或責任人、使用者)、關聯項、版本(針對軟件)、許可證(針對軟件)、維護紀錄等等,有關信息的維護由專人負責,產生一個EXCEL文件,IT部門員工都有一份副本,服務器上也保存一份副本,更新時需要同步更新,這部分準備在未來作爲CMDB的基礎;
在服務檯方面,我們在公司內部網上發佈了一個專門的分機號碼作爲服務號,有關的服務請求儘量由同一位同事接聽,並且要進行記錄,對於其他同事接聽的服務請求電話,也需要在這位同事處進行記錄,我們開發了記錄的統一表單格式,對記錄進行統一管理,對於服務的請求,可以通過電話解決的都通過電話解決,需要現場服務的,由負責接聽電話的同事調派人員去解決,無論通過什麼途徑解決,都有自行開發的統一服務表單進行記錄;
在事件管理和問題管理方面,我們是將這兩部分合並執行的,對於一些常見的事件通常是通過電話指導用戶動手解決,如果無法解決,再將問題轉到二線支持的同事到現場解決,如果無法立即解決的,我們視情況提供一些替代的方式,並且通過供應商等三線力量試圖解決,在解決的流程中都有表單記錄跟蹤,在查明原因並且解決問題後,根據實際情況,將解決方法記錄下來,轉爲已知錯誤,在部門內部確定支持層級,並共享給所有部門同事瞭解;
變更管理也是與發佈管理結合起來進行的,主要是對於硬件更換組件以及軟件的版本發佈和升級定義了流程進行管理,同時也對配置文件進行相應的管理;
在能力管理方面,主要的工作在於通過用戶報告的情況對於設備或軟件資源進行管理,對於出現資源不足的情況時提供必要的設備支持,同時,對於支持人員進行培訓以提高服務能力,安排支持人員的工作以確保服務能力被投入到高優先級的事件上,例如,IT部門有兩位同事專門負責二線的服務,同時,另一位同事和我也作爲後備支持人員提供服務,平時在安排調休或休假時,保證部門至少有兩個可以提供服務的人員,在發生大規模的緊急事件時,全部門的人員都可能被投入到服務中去,而另一方面,我們通過在業務部門中選擇一些較年輕並且對電腦比較有興趣的同事,作爲類似兼職的服務人員,通過平時對於一些已知錯誤解決方法的共享和臨時的電話支持,可以負擔一部分的現場服務;
可用性管理方面的工作主要在於一方面在規劃上儘量提供周全的防護,例如對電源等環境因素影響的規避,另一方面則是加強日常的維護與巡檢,這樣可以把一些可能影響到可用性的問題消除在前期,例如我們有一個規定,二線支持的同事在到某部門進行支持後,要儘可能的對該部門的其他設備進行健康檢查,包括檢查系統補丁情況,殺毒軟件版本,系統資源等等,或者對部門內其他用戶進行訪談,瞭解設備使用情況,通過這樣的方式可以將可用性提高(這也牽涉到問題管理部分的前饋活動);
對於IT服務連續性管理、財務管理以及服務水平管理三個方面,因爲資源不足,因此未開展有組織的活動。
限於條件,我們當時的實踐是比較有限的,就長期來看,我們準備在積累一定的數據以及經驗後,選擇一個時機自行開發一個供部門內部使用的簡單的管理系統,因爲隨着公司IT系統和設備的增加,依靠手工進行管理的工作量也在增加,這對於保持一定的服務質量是不利的,並且通過數據的積累,也可以對於一些問題出現的趨勢以及提供服務的成本進行一定的分析,對後續開展IT服務的財務管理以及服務水平管理積累一定的信息。更進一步則是在IT服務管理獲得一定的收效之後,向公司申請立項以及相應的資源來實施一個比較規範的IT服務管理項目。

該項目的實際收益在於IT部門很好的保障了公司IT系統以及IT基礎架構的順利運行,用戶平均MTBF可達到500工作小時以上,同時,通過對服務過程中的表單收集的數據進行分析,可以提供對IT方面一些問題的決策支持,例如,通過對服務記錄有關PC故障的分析,我們制定了公司內部PC的更新策略,通過購買原廠商的延長保修服務,比其他方式可以節約至少20%左右的成本。

 
 
實際上,ITIL沒有一個固定的框框,做什麼,怎麼做,做多少,都可以根據自己的實際情況來剪裁,關鍵是要抓住問題的核心,做的內容,一定是要對於降低業務的不確定性有益處的,如果反而增加了不確定性,那還不如不做了。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章