linux運維人員職業發展架構規劃

層級: 搭建好---用好----服務統籌安排-----架構設計

產品成功: 抓住用戶的痛點(培訓機構好是因爲大學生的實際能力差。)

系統架構師(偏管理): 網絡 系統 數據庫 開發 雲計算 自動化 運維管理 服務管理 項目管理 測試 業務

專注於某一個領域

運維分類:

監控運維(7*24運維值班 故障處理)

應用運維(項目上線 服務部署 業務部署 版本管理 灰度發佈)

安全運維(整體的安全方案 規範 漏洞監測 安全防護等)

系統運維(架構層面的分佈式緩存 分佈式文件系統 日誌收集 環境規劃【測試 開發 生產】 架構設計 性能優化)

基礎服務運維(內部dns 負載均衡 系統監控 資產管理 運維平臺)

基礎設施運維(系統初始化 網絡維護)

機房運維(負責設備的上下架 巡檢 報修 硬件監控)

運維自動標準化:

1. 運維標準化

物理設備層面:

1.服務器標籤化,設備負責人,設備採購詳情,【購買機器的時間,路徑】,設備擺放標準。

2.網絡劃分,遠程控制卡,網卡端口,

3.服務器機型,硬盤,內存統一。根據業務分類。

負載均衡佔cpu 內存,但不佔I/O。

數據庫 raid10 ssd 硬盤,cpu 內存

4.資產命令規範,編號規範,類型規範

5.監控標準

操作系統層面:

1.操作系統版本

2.系統初始化(DNS,NTP,內核參數調優)

3.基礎Agent配備(zabbix agent ,logstash agent,saltstack)

4.系統監控標準(CPU 內存 硬盤 網絡 進程)

應用服務層面:

1. web服務器選型(nginx apache)

2. 進程啓動用戶,端口監聽規範,日誌收集規範(訪問日誌,運行日誌,錯誤日誌)

3.配置管理(配置文件 腳本規範)

4.架構規範(nginx+keepalived lvs+keepalived)

5.部署規範(位置 包命名等)

運維操作層面:

1.機房巡檢流程 (週期 內容 報修流程)

2.業務部署流程 (先測試 後生產 回滾)

3.故障處理流程 (緊急處理 故障升級 重大事故處理)

4.業務上線流程 (1.項目發起2.系統安裝3.部署nginx4.域名解析5.測試6.監控7.備份)

5.業務下線流程 (誰發起下線,數據處理,機器是否回收)

6.工作日誌流程 (如何編寫工作日誌)

7.運維安全規範 (密碼複雜度 更改週期 ***使用規範 服務登錄規範)

標準化(規範化 流程化 文檔化 ) 目標:文檔化

運維自動化-工具化

1.shell 腳本【功能化流程腳本 檢查性 報表性】

2.開源工具:zabbix ELKstash saltstack cobber

目標: 1.促進標準化的實施

2.講重複操作簡單化

3.講多次操作,流程化

4.減少人爲操作的低效和故障率

工具化和 標準化 是好基友

痛點:

1.你至少要ssh 到服務器執行,可能犯錯

2.多個腳本有執行順序的時候,可能犯錯。

3.權限不好管理,日誌沒法統計

4.無法避免手工操作

例子: 比如某天我們要對一臺數據庫進行版本停機升級服務,那麼要求進行評估。

停機影響:3:00 晚上有定時任務連接數據庫,做數據統計表

運維自動化-web化

運維平臺

例子:job管理平臺

1.做成界面web

2.權限控制(比如: 數據庫的 增 刪 改 查)

3.日誌記錄

4.弱化流程

5.不用ssh到服務器,減少人爲操作的故障。web ssh

運維自動化的服務化(API化)

DNS web 管理 bind-DLZ dns-api

負載均衡web平臺 slb-api

job管理平臺 job-api

監控web平臺 zabbix zabbix-api

操作系統安裝web平臺 cobber-api

部署平臺 deploy-api

配置管理平臺 saltstack-api

    1.調用cobber-api 安裝操作系統

    2.調用saltstack-api 進行系統初始化

    3.調用dns-api 解析主機名

   4.調用zabbix-api 將新上線的機器加入到監控

   5.再次調用saltstack-api 部署軟件

   6.調用deploy-api 將當前版本的代碼部署到服務器上面

   7.調用test-api 測試當前服務運行十分正常

   8.調用slb-api 將該節點加入到集羣

自動化運維-智能化

智能化的自動化擴容,縮容,服務降級,故障自愈

虛擬化擴容

自動化擴容

觸發機制à決策系統(決策樹)

zabbix 觸發action

觸發:

1.當某個集羣的訪問量超過最大的支撐量,比如10000

1.1 cpu 內存使用率達到。。

2.並持續五分鐘

3.不是***

4.資源池是否有可用資源

        4.1當前網絡帶寬使用率

        4.2 如果是公有云---錢夠不夠

5.當前後端服務支撐量是否超過閾值。如果超過應該後端先擴容,

6.數據庫是否可以支撐當前併發

7.當前自動化擴展隊列,是否有正在擴容的節點

8.其他業務相關的

備註:

1先判斷buffer 是否有最近x小時,已經創建的虛擬機。

並查詢軟件版本是否和當前一致,如果一致,跳過234步驟。如果不一致,跳過23

2. openstack 創建虛擬機

3. saltstack 配置環境

4. 部署系統部署當前代碼

5. 測試服務是否可用

先啓動----然後沒反應,需要sleep 一會,然後在測試。

6.加入集羣

7.通知(短信 郵件 微信)

自動化縮容:

1.觸發條件和決策

2.從集羣中移除節點

3. 通知

4.移除的節點存放於buffer裏面

5.buffer裏面的虛擬機有效時間一天,存放於xx區,超時會自動關閉。

6.xx區的虛擬機,每7天清理刪除

ITIL --(IT基礎架構庫)-------運維經理學的

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章