開源還是商用?十大雲運維監控工具橫評

隨着雲計算和互聯網的高速發展,大量應用需要橫跨不同網絡終端,並廣泛接入第三方服務(如支付、登錄、導航等),IT系統架構越來越複雜。快速迭代的產品需求和良好的用戶體驗,需要IT運維管理者時刻保障核心業務穩定可用,而企業運維中的痛點和難點也急需解決。


1、面向業務的運維,不但關心單點IT資源的運行狀態,更關心整個業務系統的健康狀態

2、如果企業使用了大量的API和模塊化應用,那麼關注每個接口的性能變化情況和指標

3、對於運維主管及企業管理層來說,特別需要上牆的監控大屏

4、運維需要每週、每月查看報告趨勢分析,但傳統運維工具數據導出困難

5、需要第一時間轉雀和快速發現故障節點,減少業務中斷帶來的損失


雲智慧對業內主流的開源運維監控系統和商業運維監控系統進行對比,分析各種產品的定位、目標用戶和功能特點,希望幫助廣大運維、開發和創業者找到最適合自己的運維工具。


開源運維監控產品篇

Zabbix

推薦星級:★★★★★

Zabbix是一個基於WEB界面的提供分佈式系統監控以及網絡監控功能的企業級開源運維平臺,也是目前國內互聯網用戶中使用最廣的監控軟件,雲智慧遇到的85%以上用戶在使用Zabbix做監控解決方案。

101148_1Fot_1792703.jpg

入門容易、上手簡單、功能強大並且開源免費是雲智慧對Zabbix的最直觀評價。Zabbix易於管理和配置,能生成比較漂亮的數據圖,其自動發現功能大大減輕日常管理的工作量,豐富的數據採集方式和API接口可以讓用戶靈活進行數據採集,而分佈式系統架構可以支持監控更多的設備。理論上,通過Zabbix提供的插件式架構,可以滿足企業的任何需求。

用戶羣:85%以上的泛互聯網企業。

優點:

1.支持多平臺的企業級分佈式開源監控軟件

2.安裝部署簡單,多種數據採集插件靈活集成

3.功能強大,可實現複雜多條件告警,

4.自帶畫圖功能,得到的數據可以繪成圖形

5.提供多種API接口,支持調用腳本

6.出現問題時可自動遠程執行命令(需對agent設置執行權限)

缺點:

1.項目批量修改不方便

2.社區雖然成熟,但是中文資料相對較少,服務支持有限;

3.入門容易,能實現基礎的監控,但是深層次需求需要非常熟悉Zabbix並進行大量的二次定製開發,難度較大;

4.系統級別報警設置相對比較多,如果不篩選的話報警郵件會很多;並且自定義的項目報警需要自己設置,過程比較繁瑣;

5.缺少數據彙總功能,如無法查看一組服務器平均值,需進行二次開發;

6.數據報表需要特殊二次開發定義;


Nagios

推薦星級:★★★★☆

Nagios是一款開源的企業級監控系統,能夠實現對系統CPU、磁盤、網絡等方面參數的基本系統監控,以及SMTP,POP3,HTTP,NNTP等各種基本的服務類型。另外通過安裝插件和編寫監控腳本,用戶可以實現應用監控,並針對大量的監控主機和多個對象部署層次化監控架構。

101203_FlrU_1792703.png

Nagios最大的特點是其強大的管理中心,儘管其功能是監控服務和主機的,但Nagios自身並不包括這部分功能代碼,所有的監控、告警功能都是由相關插件完成的。

用戶羣:適合複雜IT環境的企業

優點:

1.出錯的服務器、應用和設備會自動重啓,自動日誌滾動

2.配置靈活,可以自定義shell腳本,通過分佈式監控模式

3.支持以冗餘方式進行主機監控,報警設置多樣

4.命令重新加載配置文件無需打擾Nagios的運行

缺點:

1.事件控制檯功能很弱,插件易用性差

2.對性能、流量等指標的處理不給力

3.看不到歷史數據,只能看到報警事件,很難追查故障原因

4.配置複雜,初學者投入的時間、精力和成本比較大


Ganglia

推薦星級:★★★★☆

Ganglia是加州大學伯克利分校發起的一個開源集羣監控項目,設計之初是用於監控數以千計的網絡節點。Ganglia是一個跨平臺可擴展的,高性能計算系統下的分佈式監控系統。它已被廣泛移植到各種操作系統和處理器架構上。

101403_mckd_1792703.jpg

用戶羣:適用於大型服務器集羣用戶。

優點:

1.適合監控系統性能,通過曲線很容易見到每個節點的工作狀態

2.可以自定義監控項,監控展示有表格和圖像兩種,支持手機版

3.部署方便,通過不同的分層管理上萬臺機器,無需逐個添加配置

缺點:

1.沒有內置的消息通知系統

2.沒有報警機制,出現問題不能夠及時報警


Zenoss

推薦星級:★★★★☆

Zenoss Core是Zenoss的開源版本,其商用版本爲Zenoss Enterprise。作爲企業級智能監控軟件,Zenoss Core允許IT管理員依靠單一的WEB控制檯來監控網絡架構的狀態和健康度。Zenoss Core的強大能力來自於深入的列表與配置管理數據庫,以發現和管理公司IT環境的各類資產。Zenoss同時提供與CMDB關聯的事件和錯誤管理系統,以協助提高各類事件和提醒的管理效率。

101420_XoMi_1792703.png

優點:

1.Zenoss比較出色的地方在於它的Dashboard,可以配置很多portlet

2.每個用戶的界面都是分開管理的,自定義dashboard不會影響其他用戶

3.強大監控功能支持服務器、路由交換、防火牆、存儲、數據庫、中間件監控

4.採用基於HBASE的opentsdb存儲任意時間段的數據

5.將狀態監控,性能監控,資源管理,良好的報告機制進行有機的整合

缺點:

1.對資源要求較高,即使只管理少數幾臺設備,也需要消耗大量硬件及內存等附加資源。

2.針對windows系統,開源版只提供SNMP,通過WMI檢測CPU,Disk,軟硬件和性能只在收費版提供。


Open-falcon

推薦星級:★★★☆☆

Open-falcon是小米運維團隊從互聯網公司的需求出發,根據多年的運維經驗,結合SRE、SA、DEVS的使用經驗和反饋,開發的一套面向互聯網的企業級開源監控產品。

101432_XZa1_1792703.png

Open-falcon架構

用戶羣:目前有幾十家企業用戶不同程度使用。

優點:

1.自動發現,支持falcon-agent、snmp、支持用戶主動push、用戶自定義插件支持

2.支持每個週期上億次的數據採集、告警判定、歷史數據存儲和查詢

3.高效的portal、支持策略模板、模板繼承和覆蓋、多種告警方式、支持callback調用

4.單機支撐200萬metric的上報、歸檔、存儲

5.採用rrdtool的數據歸檔策略,秒級返回上百個metric一年的歷史數據

6.多維度的數據展示,用戶自定義Screen

7.通過各種插件目前支持Linux、Windows、Mysql、Redis、Memache、RabbitMQ和交換機監控。

缺點:由於發佈時間較短,很多基礎的服務監控插件(如Tomcat、apache等)還不支持,很多功能還在不斷完善中,另外由於缺少專門的支持,雖然有開放社區,但是解決問題的效率相對較低。


商用運維監控系統篇

監控寶

推薦星級:★★★★★

監控寶是雲智慧爲用戶提供IT性能監控(IT Performance Monitoring)的SaaS產品,包含網站監控、服務器監控、中間件監控、數據庫監控、應用監控、API監控和頁面性能監控等功能。包含免費版、暢享版和企業版,目前用戶約40萬,監控寶app也是國內唯一提供移動監控服務的產品。

101447_if2X_1792703.png

用戶羣:覆蓋電子商務、移動互聯網、廣告傳媒、在線遊戲、教育醫療等行業的幾十萬用戶,小米、陌陌、高德、用友、金山、途牛、聚美優品、陸金所、中國平安、建行信用卡中心、春雨醫生、暢遊、國家電網、中國電信、滴滴打車、春秋航空、鳳凰網等各行業領先企業和中國互聯網百強企業超過30%在使用監控寶。

優點:

1、 作爲國內最早提供基於SaaS服務的網絡監控平臺,監控寶不但爲初級用戶提供免費的標準服務,企業用戶還可以按需購買所需的監控、告警資源,最大限度的節省企業運維成本;

2、 監控寶通過遍佈全球的300多個分佈式監測節點,對網絡進行穩定性和可用性的主動監控和實時分析,支持http(https)、ftp、ping、udp、tcp、smtp、traceroute等多種協議,測量CDN效果及DNS狀態,全網全地域性能趨勢分析。

3、 實時捕捉服務器深層性能指標,支持Linux/Unix/Windows系統及雲平臺,支持CPU使用率、CPU平均負載、內存使用比例、磁盤IO、磁盤空間使用率、網絡流量和系統進程數統計等物理指標及30多種應用服務,雲主機監控端一鍵開啓,無需複雜配置。對於應用服務的監控,監控寶已經支持常見的應用類型包括:Apache、Lighttpd、Nginx、Tomcat、IIS、Memcache和Redis,存儲層監控支持Hadoop、MySQL、MongoDB、SQLServer、Oracle的健康狀態及性能監控。

4、 監控寶是國內目前唯一支持API監控的網絡監控產品,通過API接口調用模擬用戶使用過程,支持對get、post、put、delete、head、options六種請求方式進行實時監控;支持JSON、XML、Text、Response Status驗證及Postman腳本導入。

5、 Docker監控也是監控寶的獨家功能,能夠實時監控Docker容器的CPU、內存、網絡流量及Swap狀態,讓開發者和運維人員在使用Docker時清晰掌握其資源消耗狀況。

6、 監控寶提供頁面性能管理,基於國際標準制定頁面性能指數,識別加載元素的狀態及正確性,對全網全用戶加載響應時間分析,同時準確定位問題元素及優化建議。

7、 及時有效的告警通知對運維來說至關重要,監控寶可以根據SLA設置告警閾值,第一時間發送告警通知。監控寶覆蓋最全面的告警通知方式:電子郵件、短信、電話語音、URL回調通知、App Push等。另外監控寶提供分級告警通知,能夠根據告警事件的不同等級將不同的告警推送給不同的人員,支持企業分層管理!

8、 監控寶目前對其Smart Agent進行了開源,用戶可以根據業務需求定製化開發Agent,同時用戶的數據安全得到保障。

9、 監控寶提供私有化部署解決方案,滿足政企、金融行業專有網絡監控的需求。

10、 來自Compuware、CA、IBM等企業IT服務資深專家,超過5年的本土化企業級SaaS服務經驗,以及超過百人的技術服務團隊,爲用戶提供最佳的服務保障。


360網站服務監控

推薦星級:★★☆☆☆

360網站服務監控是一款面向廣大站長的網站監控產品,提供免費的網站、服務器監控。

101500_a9Q9_1792703.png

用戶羣:個人站長

優點:

1、 服務免費,支持網站HTTP監控、PING監控、域名DNS監控和服務器監控

2、 提供網站訪問全景數據和簡單配置信息

缺點:

1、 只支持簡單的網站和服務器監控,歷史數據保留15天,且免費監控點數量僅爲四個

2、 最後一次產品更新是2014年9月,目前已停止更新和運營支持


阿里雲監控

推薦星級:★★★★☆

阿里雲監控是一款免費網站監控產品,可監控站點和服務器,並提供多種告警方式:短信,旺旺,郵件。

101511_mszT_1792703.png

用戶羣:阿里雲用戶

優點:

1、 與阿里雲服務捆綁緊密,允許用戶自定義數據監控

2、 阿里雲多IDC間內網數據傳輸,不佔用客戶公網資源

3、 支持對業務數據的通用統計,從各個角度反應服務的運行情況

缺點:

1、 所有服務基於阿里雲,功能單一,擴展性差

2、 功能不夠強大,只能滿足基礎監控需求


百度雲觀測

推薦星級:★★☆☆☆

百度雲觀測是百度推出的一款雲服務產品,類似於360雲監控、阿里雲監控,主要是爲站長提供免費的一站式網站監測、預警服務,功能覆蓋網站運行狀況、安全和訪問速度等多個方面。

101522_ULP0_1792703.png

用戶羣:個人站長

優點:

1. 對於用戶每日訪問的站點進行安全檢測

2. 國內各大城市雲節點覆蓋,支持CDN、DNS狀態和主機監控

缺點:

1. 需要進行網站認證

2. 監控點少,功能簡單,只能監測網站狀態,不支持服務器、應用監控。


小蜜蜂網站監測

推薦星級:★☆☆☆☆

小蜜蜂網站監測是一款針對中小企業需求開發的綜合測量網站運營情況線上工具,可以定時監控網站或服務器器的可用率(Uptime),一旦網站無法連結、或是服務器發生錯誤,即可發送告警通知。

101534_EOMr_1792703.png

用戶羣中小企業網站管理員

優點:

1. 小蜜蜂通過探測節點和Last Mile兩種模式監測網站可用性,支持多種站點監控類型和不同的網絡訪問傳輸協議;

2. 提供多樣化監控告警設置,並支持站內實時告警消息,支持RSS。

缺點:

1. 只支持基本的網站監控,監控點不可選,監控服務不穩定;

2. 網站性能歷史數據不夠詳細,且無法導出。

隨着新技術的不斷髮展,雲服務已經互聯網企業的必須,但是長期以來會存在傳統物理主機和雲主機、私有云和公有云並存的狀態。此外,互聯網企業的發展速度非常快,小米、滴滴出行等很多企業都是在短短几年內發展起來的,因此選擇一款合適的雲監控產品,伴隨企業同步成長,是非常必要的。



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章