nagios簡介與原理


1.Nagios簡介

1.cacti的區別

a) Cacti

1.Cacti比較着重於直觀數據的監控,易於生成圖形,用來監控網絡流量、cpu使用率、硬盤使用率等可以說很在合適不過

2.通過SNMP監控數據

3.展示工具

4.用插件來增加模塊做監控

b) nagios

1.比較注重於主機和服務的監控,並且有很強大的發送報警信息的功能

2.監控方式更多

3.配置靈活的監控工具

4.腳本和agent做監控

2.監控對象

a) 主機、主機組:服務器、虛擬機、網絡設備

b) 服務/資源,服務組:http服務、mysql服務、CPU資源、硬盤、內存資源

c) 聯繫人,聯繫人組:管理員

d) 時段:時間範圍

e) 命令:監控某一對象的模板

對不同的監控對象,使用不同的腳步

對相同的監控對象,也可能使用不同的腳步

3.主要功能

網絡服務監控(SMTPPOP3HTTPNNTPICMPSNMPFTPSSH

 主機資源監控(CPU loaddisk usagesystem logs),也包括Windows主機(使用NSClient++ plugin

 可以指定自己編寫的Plugin通過網絡收集數據來監控任何情況(溫度、警告……)

 可以通過配置Nagios遠程執行插件遠程執行腳本

 遠程監控支持SSHSSL加通道方式進行監控

 簡單的plugin設計允許用戶很容易的開發自己需要的檢查服務,支持很多開發語言(shell scriptsC++PerlrubyPythonPHPC#等)

 包含很多圖形化數據PluginsNagiosgraphNagiosgrapherPNP4Nagios等)

 可並行服務檢查

 能夠定義網絡主機的層次,允許逐級檢查,就是從父主機開始向下檢查

 當服務或主機出現問題時發出通告,可通過email, pager, sms 或任意用戶自定義的plugin進行通知

 能夠自定義事件處理機制重新激活出問題的服務或主機

 自動日誌循環

 支持冗餘監控

 包括Web界面可以查看當前網絡狀態,通知,問題歷史,日誌文件等

2.Nagios工作原理

Nagios的功能是監控服務和主機,但是他自身並不包括這部分功能,所有的監控、檢測功能都是通過各種插件來完成的

 

  啓動Nagios後,它會週期性的自動調用插件去檢測服務器狀態,同時Nagios會維持一個隊列,所有插件返回來的狀態信息都進入隊列,Nagios每次都從隊首開始讀取信息,並進行處理後,把狀態結果通過web顯示出來。

Nagios提供了許多插件,利用這些插件可以方便的監控很多服務狀態。安裝完成後,nagios主目錄下的/libexec放有nagios自帶的可以使用的所有插件,如,check_disk是檢查磁盤空間的插件,check_load是檢查CPU負載的,等等。每一個插件可以通過運行./check_xxx h 來查看其使用方法和功能。

Nagios可以識別4種狀態返回信息,即 0(OK)表示狀態正常/綠色、1(WARNING)表示出現警告/×××、2(CRITICAL)表示出現非常嚴重的錯誤/紅色、3(UNKNOWN)表示未知錯誤/深×××Nagios根據插件返回來的值,來判斷監控對象的狀態,並通過web顯示出來,以供管理員及時發現故障


四種監控狀態

正常 OK 綠色

警告 WARNING ×××

嚴重 CRITICAL 紅色

未知錯誤 UNKOWN 深×××


 對於報警功能,如果監控系統發現問題不能報警那就沒有意義了,所以報警也是nagios很重要的功能之一。但是,同樣的,Nagios 自身也沒有報警部分的代碼,甚至沒有插件,而是交給用戶或者其他相關開源項目組去完成

那麼nzgios如何管理遠端服務器對象的。Nagios 系統提供了一個插件NRPENagios 通過週期性的運行它來獲得遠端服務器的各種狀態信息


Nagios 通過NRPE 來遠端管理服務 

1. Nagios 執行安裝在它裏面的check_nrpe 插件,並告訴check_nrpe 去檢測哪些服務。

2. 通過SSLcheck_nrpe 連接遠端機子上的NRPE daemon

3. NRPE 運行本地的各種插件去檢測本地的服務和狀態(check_disk,..etc)

4. 最後,NRPE 把檢測的結果傳給主機端的check_nrpecheck_nrpe 再把結果送到Nagios狀態隊列中。

5. Nagios 依次讀取隊列中的信息,再把結果顯示出來。




發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章