運維轉型 | 運維人不再只是“救火英雄”

各行各業都開啓了數字化轉型的進程,運維團隊在這種時代的浪潮中又該何去何從?我在幫助一些企業落地了運維技術平臺之後,開始反思這個問題,並將所思所想整理成本篇文章。


雖然各行各業都開啓了數字化轉型的進程,但很多運維人員仍然非常辛苦,在企業中揹負着 “救火英雄”的稱號。往好的說是“救火英雄”,換一種糟糕的說法是“背鍋俠”,似乎永遠深陷於好事不出門壞事傳千里的泥潭中。


爲什麼會這樣?我認爲這是由生產力決定的,熟悉政治經濟學的人應該知道著名理論生產力決定生產關係,那麼什麼是運維生產力?企業數字化轉型時代下,運維人應該具備哪些生產力?

1.png傳統組織中的運維職責

相信大家過往應該看過很多的分享、資料,有的圍繞着ITIL講述如何高瞻遠矚地去設計頂層,有的通過繁雜的技術語言講述五花八門的落地經驗,卻發現在結合自身現狀時,這些經驗有着諸多不適。

我在幫助幾個企業落地了運維技術平臺後,開始反思,很多人習慣將運維理解爲一個工種或一項工作,而我更傾向於將運維理解是管理服務的組合。管理的意思是我能擁有什麼,服務的意思是我能提供什麼,我大體想表達的是:

  • 管理是對內的,指的是對我所擁有的各種IT要素計劃、組織、協調和控制的過程,強調效率。

  • 服務是對外的,指的是我們運維團隊具備哪些能力、用何種方式夠進行對外輸出,強調敏捷。


如何充分發揮核心要素?

我認爲運維作爲技術團隊,其擁有的四樣核心要素是人員流程技術數據。那麼數字化轉型背景下,這個四個核心要素如何發揮作用呢?

2.png數字化轉型下運維核心四要素

1、人與技術

人是最重要的要素之一,當人與技術互動的時候就會產生創新。我們可以先用技術解決我們熟悉的事情,然後打開思路,嘗試新的方法來做新的事情。

我們需要通過專注於技術創新和利用破壞性技術的跨職能小組,在整個運維團隊中展開更多的協同,以實現更高階的運維自動化,提升日常運維管理工作效率。

我們應確保運維人員尤其是新加入的運維人員對掌握技術是充滿熱情的,並感受到運維工作擁有未來職業發展的道路。我們甚至可以提供一些獎項,以表彰他們對運維技術建設所作出的貢獻。


2、技術與流程

在數字化轉型下,流程已經不是孤立的存在於流程系統中,更不能僅僅停留在線下的紙上,而是要與工具和技術結合起來。

流程 + 技術 = 自動化,用工具系統驅動流程的執行和落地,既能保證流程在管理活動中是被遵循的,又可以提升運維管理的效率。

而隨着機器學習、深度學習以及無處不在的低成本雲計算出現,機器執行流程的速度比任何人夠快。一個人創建100臺虛擬機要花多長時間,機器可以在數分鐘內完成此任務。


3、流程與人

在固有思維中運維管理流程是影響效率的,其作用是管控和評級,是降低用戶(指的是管理員)體驗的一種存在。

通過數字化轉型,人們要轉變這種想法,實際上應該是流程+自動化=高效率。當人們能夠與流程真正互動起來,我們就可以實現“複製”。

在流程完整的組織中,一個人可能與十個人有同樣的影響力,試想快餐公司是如何進行標準化的,例如:去北京麥當勞與去香港麥當勞的就餐過程應該大致相同。

爲了達到最佳狀態,運維團隊需要分析流程系統中留存下來的信息數據,逐步提升運維管理能力。


4、數據

數據是數字化轉型的基礎,在運維領域玩數據已經不是什麼新鮮事了,AIOps在各種行業大會中出現的頻度越來越高。

如果說自動化是爲了解決運維人員的執行效率問題,AIOps就是解決運維人員的決策效率問題。目前AIOps應用最廣的場景還是監控方面,如根因定位、故障影響分析、容量預測等。


然而,我認爲運維組織手裏的數據可不僅僅是運維數據,稍誇張的講是企業的全量數據,如何利用好手裏的數據,是運維團隊持續提升生產力的主要因素。

當運維團隊開始改進人、流程、技術三個方面的互動,並嘗試用數據創造價值時,我們運維團隊就正走在數字化轉型的路上了。如果你還不知道怎麼開始行動,可以試着考慮以下幾個問題:


  • 我們不夠快麼?

  • 我們效率不高麼?

  • 我們在創造價值麼?


如果我們的速度不夠快,我們是不是該考慮自動化了,做好技術與流程的結合。

如果我們的效率不夠高,我們要審視一下我們流程與人的設計是否合理。

如果我們的工作體現不出價值,我們應該找找能創新的地方,充分發揮技術與流程數據的作用。


如何提升運維價值?

過往我們會認爲運維是保障性部門,職責就是爲各個IT應用系統提供可用性保障。然而,我認爲在企業數字化轉型過程中,運維團隊還應該藉着轉型的契機讓自己能夠提供更多,提升更多。


運維是幾乎一切IT資源的供給者。如果把數字化轉型比喻做一列高速行駛的列車,這趟列車的功力都是由運維團隊提供和保障。與過往不同的是,運維團隊應該讓其他人獲取資源的方式更容易、更敏捷、成本更低。我想這應該是企業都在大規模地上各種雲的原因之一吧。


運維應該成爲數字化能力的建設者。企業在數字化轉型肯定是一個漸進的進程,這過程中需要建設各種各樣的能力,比如大數據分析、人工智能、……等,企業數字化轉型進入ABC(AI、Bigdata、Cloud)時代已經是必然趨勢。


那麼團隊能在其中參與到何種程度,將一定程度上決定運維團隊未來在企業中的地位。如果你的企業在考慮數字化轉型,一定要抓住機遇,擁抱未來。

我認爲還有一個重點,運維還應該成爲成爲數字化轉型過程中的工具開發者。我們固有觀念中,運維團隊與開發似乎風馬牛不相及。然而,企業在數字化轉型後,將會有大量的工作需要轉爲線上處理,尤其是IT部門與其他部門的協作更要轉變爲線上操作,這就需要很多工具或系統需要建設。比如其他部門找我們申請IT基礎資源、業務部門找我們提取業務數據、開發團隊找我們查看應用日誌……等等,我們不能指望所有事情都由專業開發團隊或外包開發團隊去實現,自有的開發力量是運維團隊提升地位的重要保障。


到這裏我再總結一下,運維團隊在面對數字化轉型的大勢下,需要做好的三點升級:


效率升級

提升運維自身團隊的效率,通過各類運維工具和平臺的建設,提升運維工作的效率,如自動化工具,智能監控等。在一定程度上釋放運維人的精力和時間,繼而投入到數字化轉型的思考上。


能力升級

要幹大事總要有點像樣的武器,運維團隊可以先從自身的業務需求上着手,比如目前比較熱門的AIOps、RPA等技術,可以結合日常的運維場景進行一定程度的探索,積累了經驗後可以推廣到其他業務場景。


團隊升級

如果運維團隊還是停留傳統IOE體系架構下積累的經驗,那面臨來勢洶洶的互聯網時代就要小心了,抓緊時間提升自己的技能。很多金融行業、科技行業的企業已經組建了自己運維開發團隊,或積極嘗試開源產品,或借鑑互聯網公司經驗。


如何將運維轉型進行下去?

有很多企業雖已經開始行動,但轉型效果甚微。所以,我想再囉嗦另外一點思考,就是如何打破固有思維,保證轉型持久地執行下去。我將其總結爲5P

8.png

1、目的 Purpose

在任何組織的轉型中,都希望有更多的人能夠參與到轉型計劃中,由此我們必須爲組織轉型設定有影響力的目標,這是我把Purpose放在第一位的原因。

很多人會覺得定目標很容易,不就是給自己立個響噹噹的flag嘛,如“建設智能化運維體系”、“打造SRE團隊組織”…。事實上真的是這樣麼?你的目標需要與企業的戰略結合起來,如在我接觸到的一個銀行中,提出了“提產能、促轉型,爲打造一流數字生態銀行夯實技術基礎”的總體目標。實際上當你設定Purpose的同時,你必須爲你的Purpose回答下面幾個問題:

  • 你爲什麼相信自己能轉型成功?—— 轉型需要有力量Power

  • 你需要讓哪些人蔘與到轉型中?—— 轉型需要發動羣衆People

  • 你打算如何影響相關的人們?—— 轉型需要制定計劃Plan

  • 轉型後會產生什麼樣的影響?—— 轉型需要講收益Payback

也就是我們接下來要討論的另外4P。


2、力量 Power

你爲什麼相信自己能轉型成功?你必須爲自己的轉型計劃找到力量源泉,並讓這種力量在團隊中能夠被充分認識到,可以嘗試從四個方向去找:


企業戰略

影響:將運維轉型目標與企業戰略關聯,從而得到更高層領導的關注與支持。

思路:很多企業將數字化轉型定爲企業的戰略,而IT能力是數字化轉型中的重點建設內容,運維(或運營)管理又是其中不可或缺的一部分。


業務形態

影響:在業務發展過程中,企業運營模式也會隨調整,運維也是其中一環。

思路:比如,很多企業都在發展互聯網+業務,其特點就是敏捷,從而要求運維既能適應敏態,又能兼顧穩態,也就是大家都說的雙態運維。


外部環境

影響:多瞭解同業的發展情況,畢竟企業要面對的是市場競爭,確保自己領先不落後。

思路:據我所知金融業間經常走訪交流,對比行業領先企業的發展,保持自身競爭力。同時,也可以多參考頂級互聯網公司的經驗,如BAT的分享。


運維現狀

影響:同時,自身現狀不可忽略,找到當前和未來工作中的切實痛點,對症下藥。

思路:運維轉型肯定會有一定的內驅力,很多運維團隊都面臨着人手不足、效率不高等問題,從這些具體問題開始,制定對應的行動計劃。

另外一個獲取力量的要點就是高層的支持,凡是涉及到組織轉型的項目,必不可少的需要相應的資源向其傾斜。並且從過往的經歷來看,越是得到層領導支持的項目,其獲得的資源就越豐富,項目也就成功了一半。在得到高層支持的前提下,爲了運維轉型的氣氛營造的熱烈起來,可以採取一下行動:


  1. 讓領導參加運維轉型項目相關的重要會議

  2. 在公開場合討論運維轉型項目的進展情況

  3. 迫使有反對意見的領導參與到運維轉型推進工作

  4. 組織更廣泛的培訓學習,讓每個人感受到運維轉型的決心


總而言之,運維轉型必須讓所有人感受到是有力量的,讓每個人深刻感受到是一種大勢所趨,不能消極逃避而要積極主動。


3、人 People

人是重要的,在運維轉型項目中,項目經理必須是有力量的人,並且是有時間和精力專注推動轉型工作的人。

在過往的觀察中,有部分公司會指派專門的項目經理負責運維轉型的推動工作,並賦予項目經理很大的指揮權。而兼職的項目經理往往難以抽出足夠的精力推動項目,因爲如果項目經理同時肩負運維管理工作,運維是一件瑣碎而繁雜的工作,一個人很難同時兼顧運維管理和推動項目兩件事情,這不是人的問題是客觀規律。

關於項目團隊組建,主要有線性組織結構矩陣組織結構兩種,選擇適合自己公司的實際情況就好。實際上,在不同的公司兩個組織方式都有采用,有的公司成立了專職的工具建設小組,還有的公司從不同的運維團隊抽人組成虛擬工作組。我過去合作過的一個客戶,他們發起了運維開發倡議,讓大家自願加入到運維開發學習中,效果也很好。


4、計劃 Plan

定計劃是非常難的,這會涉及到路線選擇的問題,是選擇全自主研發路線,還是找合作伙伴支撐?

選擇完全依靠自有力量的企業是非常勇敢的,需要很大的決心。這個過程需要面對很多的難題,遠遠不是簡單堆砌一些開源工具就能滿足的。一旦走上了轉型這條路就很難停下來,解決了自動化的問題,還有DevOps、AIOps在前面等着,對着轉型逐漸進入深水區,需要投入的人力資源是巨大的,需要許多艱難的技術。

5.png

當然,還有部分企業選擇跟隨策略,現在如BAT這些大型互聯網公司開放出來的運維平臺都是很好可選項例如:騰訊藍鯨智雲,一套用於構建企業研發運營一體化體系的 PaaS 開發框架,提供了 aPaaS(DevOps 流水線、運行環境託管、前後臺框架)和 iPaaS(持續集成、CMDB、作業平臺、容器管理、數據平臺、AI 等原子平臺)等模塊,幫助企業技術人員快速構建基礎運營 PaaS。

6.png


羅馬不是一天建成的,轉型也不是一蹴而就的,必然是一個持續迭代的過程,每家公司的運維都涉及很多技術領域,如硬件、網絡、系統、應用、安全、……。傳統技術架構的穩態業務運維尚未完全解決,現在又開始面臨容器化、微服務化的敏捷業務,實在令人頭疼。ITOM、ITSM體系還沒玩轉,又出現了DevOps、AIOps等理論體系,該何去何從?

7.png我在哪裏?要去哪裏?【自動化能力成熟度】

5、收益 Payback

轉型需要持續投入精力和成本,你必須在前期就考慮好這麼做的收益是什麼?我們可以從三個層面去考慮:

經濟效益:主要體現就是降本增效,每個企業從這個層面都很相似,因路線選擇而有所不同,我這裏不過多討論。

能力提升:在轉型過程中會建設很多能力,如機器學習、工具流水線等,根據每個企業的實際情況而不同,也不過多討論。

組織提升:運維團隊經過數字化轉型後,人員技能和組織模式可能會發生變化,比如在人員組成上會區分運維操作人員、運維開發人員、運維分析人員、和運維專家,而轉型的效果將會與幾種人員的比例相關。

總結

想讓運維搭上數字化轉型的風口,首先得對團隊有清晰的瞭解,可以從人員、流程、技術和數據的元素作爲出發點,其次讓運維團隊明確的走出原有的職責,提供更多的價值。

最後,我利用自己在實施一些項目後的體悟,爲大家總結整理了運維轉型的 5個方向:目標、力量、人、計劃、收益,確保大家在擁有轉型的認知與想法後,可以持久地落地下去。

我想寫這樣一篇文章很久了,也花了很長時間才把思路整理清楚,然而還有很多內容仍需在實踐中完善,之後在獲得新的感悟後再繼續與大家分享。

作者:邢晉

優質文章

嘉爲科技榮獲ITSS【2019中國卓越智能運維服務商】

企業上雲如何優化性能?

jmeter集羣下腳本日誌和報告處理

企業應用運維自動化應該如何設計?

域內計算機本地管理員密碼管理


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章