zabbix總結--由外部原因應該導致的告警卻未被觸發,原因的排查

問題是某園區挖斷了光纜導致了整個園區斷網,但是zabbix監控沒有觸發告警,同時還依舊獲取着數據,根據觸發器的設置是這個園區所有的Ip地址都斷掉纔會觸發告警,那麼沒有觸發告警,是不是就代表有一個活的Ip地址呢?跟着這個思路我開始研究zabbix數據庫字典,希望可以通過找到歷史記錄來獲取有問題的數據

1、我根據數據字典得知:items是一個存放監控項的數據庫表,裏面有兩個字段比較重要,key_ = icmpping 可以區分,value_type存放不同數據的類型,而key_ = icmpping 對應的 value_type=3;根據數據字典知道,這一部分數據是進入history_uint這個數據表的(value_type=3),那麼歷史數據就在history_uint這個表中查找


2、採用聯合查找的方式,找到有問題的那部分IP地址以及時間段,因爲zabbix數據庫的時間都是以時間戳的形式來現實的,所以需要將其轉化爲正常的現實形式,用到的表有hosts(主機表)、items(監控項目表)以及history_uint(歷史數據記錄表)

select h.hostid,h.host,h.status,h.name ,FROM_UNIXTIME(u.clock,'%Y-%m-%d %H:%i:%S') clock,u.value,u.ns 
from hosts h,items i,history_uint u
where h.name like '%某某%'
and i.hostid=h.hostid 
and i.itemid = u.itemid
and clock>'1529337600' 

order by u.clock desc

clock>'1529337600' 這個地方我用到了時間戳來篩選的原因是數據量太大,導致數據檢索太慢,我就省去了轉換的那一步,將這部分數據查找出來之後,我就導出,用excel表格來處理,在數據庫中操作避免數據量太大,導致數據庫崩潰

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章