什麼是運維

術語名詞

  • IDC--(Internet Data Center)互聯網數據中心,主要服務包括整機租用、服務器託管、機櫃租用、機房租用、專線接入和網絡管理服務等。廣義上的IDC業務,實際上就是數據中心所提供的一切服務。客戶租用數據中心的服務器和帶寬,並利用數據中心的技術力量,來實現自己對軟、硬件的要求,搭建自己的互聯網平臺,享用數據中心所提供的一系列服務。
  • ISP--(Internet Service Provider)互聯網服務提供商,即向廣大用戶綜合提供互聯網接入業務、信息業務、和增值業務的電信運營商。
  • ICP--(Internet Content Provider)互聯網內容提供商,向廣大用戶綜合提供互聯網信息業務和增值業務的電信運營商。 根據中華人民共和國國務院令第292號《互聯網信息服務管理辦法》規定,國家對提供互聯網信息服務的ICP實行許可證制度。從而,ICP證成爲網站經營的許可證,經營性網站必須辦理ICP證,否則就屬於非法經營。因此,辦理ICP證是企業網站合法經營的需要.
  • CDN--(Content Delivery Network)內容分發網絡,依靠部署在各地的邊緣服務器,通過中心平臺的負載均衡、內容分發、調度等功能模塊,使用戶就近獲取所需內容,降低網絡擁塞,提高用戶訪問響應速度和命中率。CDN的關鍵技術主要有內容存儲和分發技術。 CDN的基本原理是廣泛採用各種緩存服務器,將這些緩存服務器分佈到用戶訪問相對集中的地區或網絡中,在用戶訪問網站時,利用全局負載技術將用戶的訪問指向距離最近的工作正常的緩存服務器上,由緩存服務器直接響應用戶請求。
  • LVS--(Linux Virtual Server)的簡寫,意即Linux虛擬服務器,是一個虛擬的服務器集羣系統。LVS集羣採用IP負載均衡技術和基於內容請求分發技術。調度器具有很好的吞吐率,將請求均衡地轉移到不同的服務器上執行,且調度器自動屏蔽掉服務器的故障,從而將一組服務器構成一個高性能的、高可用的虛擬服務器。整個服務器集羣的結構對客戶是透明的,而且無需修改客戶端和服務器端的程序。爲此,在設計時需要考慮系統的透明性、可伸縮性、高可用性和易管理性。
  • CGI--(Common Gateway Interface)通用網關接口。CGI規範允許Web服務器執行外部程序,並將它們的輸出發送給Web瀏覽器,CGI將Web的一組簡單的靜態超媒體文檔變成一個完整的新的交互式媒體

  • GSLB--(Global Server Load Balance,全局負載均衡)作爲 CDN 系統架構中最核心的部分,負責流量調度.基於DNS的GSLB 絕大部分使用負載均衡技術的應用都通過域名來訪問目的主機,在用戶發出任何應用連接請求時,首先必須通過DNS請求獲得服務器的IP地址,基於DNS的GSLB正是在返回DNS解析結果的過程中進行智能決策,給用戶返回一個最佳的服務IP。用戶應用流程與沒有GSLB時未發生任何變化。這也是市場上主流的GSLB技術。

  • BOSS--(Business & Operation Support System,BOSS)是業務運營支撐系統。通常所說的BOSS分爲四個部分:計費及結算系統、營業與賬務系統、客戶服務系統和決策支持系統。BOSS從業務層面來看就是一個框架,來承載業務系統、CRM系統、計費系統。實現統一框架中的縱向、橫向管理。該系統最早由電信部門的計費系統發展演變而來,基本功能包括客戶資料管理、產品管理、用戶訂購管理、計費、出帳、結算等,負責登記客戶資料、管理用戶訂購服務的提供、實時的根據不同產品、套餐的資費標準計算業務(手機、固定電話用戶通話時、點播收視、寬帶流量與時間等)的消費金額,準實時及定期計算用戶帳單,實時或定期結算用戶各種消費費用。

管理

  • 配置管理
  • 事件管理
  • 問題管理
  • 成本管理
  • 容量管理
  • 資源管理
  • 需求管理

規劃

  • 架構規劃
  • IDC規劃
  • 服務器規劃
  • ISP規劃
  • 預算規劃

優化

  • 速度優化
  • 成本優化
  • ISP優化
  • CDN優化
  • 告警優化
  • 故障預案
  • 故障演習

安全

  • 漏洞掃描
  • 域名劫持掃描
  • 掛馬掃描
  • CGI掃描
  • 網頁篡改掃描

告警

  • 告警模型
  • 告警故障
  • 告警統計
  • 告警關聯
  • 撥測
    定時curl一下某個url,有問題就告警.
    日誌告警:5分鐘Error大於xxx次告警。
    指標告警:cpu使用率大於xxx告警。
    

告警對象可以分爲兩種:

  • 業務規則監控
  • 系統可靠性監控

對於業務規則監控可以舉一個遊戲的例子。比如遊戲角色在一定裝備的情況下,單次打擊的傷害輸出應該是有一個上限,如果超過了就說明有作弊的情況。又比如鬥地主遊戲裏一個人的連勝場次是有一定上限的,每天的勝率是有一定上限,如果超出平均值太多就可能是作弊。業務規則監控的不是硬件,也不是軟件是否工作正常。而是軟件是否按照業務規則實現的,是否有漏洞。也可以理解爲對“正確性”的監控。

系統可靠性監控是最常見的監控形式,比如發現是不是服務器掛掉了,服務是不是過載了等等。對於大部分後臺服務,系統可以抽象建模成這個樣子:

監控

  • URL監控
  • LVS監控
  • IDC監控
  • 數據庫監控
  • 模塊監控
  • 站點監控
  • 響應監控

系統/平臺

  • CDN平臺
  • 靜態應用平臺
  • 動態應用平臺
  • 點擊流系統
  • 數據庫平臺
  • 下載平臺
  • 網絡健康系統
  • 經營分析系統
  • 存儲平臺
  • 流媒體平臺
  • 質量監測系統
  • GSLB管理系統
  • BOSS系統
  • 立體監控系統
  • 自動發佈系統
  • 站點分析系統
  • 統一告警系統
  • 運維工具系統

規範

  • 項目立項規範
  • 運營故障分級和處罰規範
  • 重大運營故障處理流程
  • 環境一致性規範
  • 運營資源申請流程
  • IDC變更流程
  • 預算管理規範

linux發行版

  • RedHat: Fedora, CentOS, Mandriva
  • SuSE: SLES, OpenSuSE
  • Debian: Ubuntu
  • Gentoo:
  • BackTrace/kali linux (黑客)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章