記一次nagios故障及解決

情景如下:

OS: Ubuntu 12.04 LTS x86_64;

Nagios版本3.2.3;

Nagiosql版本3.2.0;

Pnp4nagios版本0.6.13;

虛擬機,四核,1.5內存;

模式:被動監控

監控主機數量:169

監控服務數量:745

繪圖數量:923  (find /var/lib/pnp4nagios/perfdata -name "*.rrd"|wc -l)

繪圖模式:Synchronous mode

故障現象: 報警和監控持續性延遲,但繪圖正常,各種調優依然無解;關閉pnp4nagios繪圖之後,監控和報警立刻恢復正常;個人感覺像是監控和繪圖在爭搶系統資源;


解決方法: 更改pnp4nagios繪圖模式爲bulk-npcd即可.


簡單敘述一下,個人對pnp4nagios的幾種繪圖模式工作原理的理解:

第一種:synchronous mode 中文:同步模式 。 個人理解,只要接收到數據,就立刻繪圖,如下圖:

synchronous.png

第二種:bulk mode中午:容器模式。個人理解,把需要繪圖的數據做一下轉存先,到達一定的量,再繪圖,聽說這種方式再同時要處理比較多的數據時會造成超時;可以通過修改特定參數緩解。如下圖:

bulk.png

第三種:bulk mode with npcd 中文:由npcd來管理的bulk模式。 個人理解: 等同於第二種,但是由npcd來管理何時繪圖,筆者的解決方案就是這種。見下圖:

bulk-npcd.png

第四種: Bulk Mode with npcdmod ;以nagios模塊化運行npcd,但貌似官網介紹說不支持nagios4,筆者也未做過多的測試,見下圖:

bulk-npcdmod.png

第五種: Gearman Mode..不知道怎麼翻譯...看官方說的很牛的樣子,能讓pnp4nagios和nagios分佈在不同的機器上,筆者未做深入瞭解,有興趣去官網吧...見下圖:

gearman.png


更改方法參考pnp4nagios官網即可。



參考:

http://docs.pnp4nagios.org/pnp-0.6/modes

http://www.360doc.com/content/11/0810/11/1208969_139346861.shtml


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章