prometheus+grafana+alertmanager服務器運維監控並實現釘釘報警

背景

        監控對it運維來說到底有多重要?“因爲你是我的眼,讓我看見這世界就在我眼前”,這是一首耳熟能詳的歌曲《你是我的眼》。監控,對於it運維工程師來說就是眼睛,如果沒有監控,it運維工作就無從談起;如果沒有監控,it運維工程師就成了盲人。

        一個良好的監控系統可以快速地發現並定位問題,減少宕機時間,提高故障處理速度,減輕it運維工作壓力,甚至可以促進家庭和諧。

 

技術選型調研:

Prometheus有Google與Kubernetes 社區強力支持,儘快告警功能簡單,但是開源社區異常火爆,作爲CNCF第二開源項目(第一開源項目Kubernetes Borg的開源版本),Google Borgmon的開源版本(用於監控Borg),未來發展前景看好

TICK 由InfluxData公司支持,高可用、水平擴展、高級備份恢復等功能需要企業License。

Open-falcon最初爲小米公司開發,採用多模塊架構,初始部署比較複雜,監控功能相對完善,不過目前有開源社區人員維護,版本迭代無法保證,且國際化不夠。

Zabbix 傳統企業級監控方案,由Zabbix公司支持。監控功能全面,缺點在於存儲限制與不支持水平擴展。

綜上所述,我們選擇Prometheus

Prometheus簡介:

Prometheus(普

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章