背景:
監控對it運維來說到底有多重要?“因爲你是我的眼,讓我看見這世界就在我眼前”,這是一首耳熟能詳的歌曲《你是我的眼》。監控,對於it運維工程師來說就是眼睛,如果沒有監控,it運維工作就無從談起;如果沒有監控,it運維工程師就成了盲人。
一個良好的監控系統可以快速地發現並定位問題,減少宕機時間,提高故障處理速度,減輕it運維工作壓力,甚至可以促進家庭和諧。
技術選型調研:
Prometheus有Google與Kubernetes 社區強力支持,儘快告警功能簡單,但是開源社區異常火爆,作爲CNCF第二開源項目(第一開源項目Kubernetes Borg的開源版本),Google Borgmon的開源版本(用於監控Borg),未來發展前景看好
TICK 由InfluxData公司支持,高可用、水平擴展、高級備份恢復等功能需要企業License。
Open-falcon最初爲小米公司開發,採用多模塊架構,初始部署比較複雜,監控功能相對完善,不過目前有開源社區人員維護,版本迭代無法保證,且國際化不夠。
Zabbix 傳統企業級監控方案,由Zabbix公司支持。監控功能全面,缺點在於存儲限制與不支持水平擴展。
綜上所述,我們選擇Prometheus!
Prometheus簡介:
Prometheus(普