Docker運維必備:監控寶Docker監控試用手記

本文由肖遠昊深度實踐docker監控的報告

 

    非常榮幸得到監控寶的邀請,試用了他們最近推出的新產品——Docker監控。 

    9月7日,中國APM廠商雲智慧CloudWise正式發佈上線Docker監控,該產品從部署到使用,整個過程都非常的簡單。不僅能夠實時監控宿主機和Docker容器的性能信息(包括CPU、Mem、磁盤、Net In/Out),還可以自定義相應的告警策略。以下將從部署、監控信息、告警這幾個方面聊聊試用體會。大家可以[註冊]監控寶,免費使用Docker監控。

 

部署流程

    閱讀了Dockone上的文章《扒一扒監控寶Docker監控的技術原理》,瞭解到Docker監控的實現是基於SmartAgent架構來完成的,整個部署過程在幾分鐘內便可以完成。

    第一步,點擊“創建監控項目”,輸入基本信息,包括名稱和監控頻率後,就可以看到具體的部署步驟。

 

第二步,在監控機器上安裝代理和Docker插件。

l  首先下載、解壓和啓動SendProxy,SendProxy是一個代理,作爲發送引擎,可以在局域網內進行部署,將局域網內機器的監控信息高效地傳輸到雲智慧的SaaS平臺。SendProxy可以通過SendProxy.sh腳本進行啓動,命令爲 `./SendProxy.sh start`,執行之後,可以通過命令 `./SendProxy.sh status`來查看SendProxy的狀態,如果“States”是“ok”狀態,則表示SendProxy啓動成功。

l  其次,下載、解壓和啓動Docker插件——Docker Agent,Docker Agent是Docker監控的主要模塊,負責在監控機器上採集數據並通過SendProxy將數據傳輸到雲智慧的SaaS平臺,可直接使用start.sh腳本啓動Docker Agent。

經過這兩步後,在監控寶的Docker監控頁面就可以看到,剛剛創建的監控項目已經獲取到了監控機器上的數據了。

不知道大家會不會有個疑問,“數據是怎麼定位到剛剛創建的監控項目?”斗膽猜測一下,創建監控項目時,輸入的名稱和設定的監控頻率在保存監控項目後,將監控項目信息寫入了Docker Agent的配置文件中,這樣就能對應上這個監控項目了。但還有一個疑問,"那一個機器上如果有兩個監控項目怎麼辦?",仔細想想,一臺機器上只對應一個監控項目,而一個監控項目可以監控多臺機器。

 

> 根據親身實踐,對於部署流程中遇到的問題,提幾個小建議。 

> (1)在部署提示中,向用戶說明現在Docker Agent所支持的操作系統類型; 

> (2)提示用戶,監控項目和Docker插件的關聯關係;  

> (3)提示用戶,如果Docker監控頁面一直沒有收到數據,可以使用bin目錄下的docker_py腳本嘗試Push監控信息。

 

監控信息展現

部署完成之後,可以進入具體的信息展示界面。所展示的信息比較全面,包括CPU、內存、磁盤和網絡流量的監控信息以及監控機器上不同狀態Docker容器的統計信息(這麼全面的信息,媽媽再也不用擔心Docker運維了)。以下就是監控信息的整體呈現。

 

監控信息統一使用折線圖展示,比較直觀,如果想知道具體數據的數值,可以在圖表的右側切換到數據視圖。如果想知道某段時間內的數據,可以在頁面最上方進行選擇,默認提供了“今日”、“昨日”和“最近七天”這三個選項,當然也可以根據需要進行自定義時間範圍。圖標上的數據線免不了會出現重疊,可以通過點擊上方的標題來關閉某些數據線。這些細節方便值得稱讚。

具體數據數值的展示如下:

 

在具體類目監控信息的展示頁面,比如說Net In/Out類目,可以看到不同容器的監控數據以及一些統計信息(最大值、平均值和最小值),默認情況下,會展示“資源消耗Top10”的10個容器,當然也可以通過左上角的下拉框選擇具體某個容器的數據展示。

 

 

告警

告警功能,無疑是運維人員和開發者最重視的一個功能。在雲智慧監控寶的Docker監控中,用戶可以自定義告警設置。告警對象主要是針對容器的資源使用情況以及容器的存活率。

告警策略根據統計數據(平均值、和值)進行相應閾值的設定,高於、低於或者等於設定閾值時,進行相應告警。對於資源的使用情況,可以針對所有容器或者單個容器進行告警設置。

值得一提的是,監控寶的的告警方式非常全面,可以通過電子郵件、手機短信、電話語音、APP推送、微信等方式進行通知,特別是通過電話語音和微信的方式能保證你不漏掉任何重要的告警信息。

 

總體感受

自從Docker問世依賴,運維一直是Docker使用者的一個痛點。雲智慧推出的Docker監控,填補了國內Docker監控的空白。從部署到監控,整體上的感覺就是簡單易懂且易用。整個部署過程,只是簡單地下載兩個Zip安裝包,然後修改相應權限,啓動就好了,對於新手或者小白用戶來說,這是非常簡單的操作。

監控信息使用圖表展示,但也沒有忘記給需要具體數據的用戶提供數據視圖的接口,細節方面做的很到位。進入CPU、Mem等具體監控信息部分,能夠看到具體單個容器的監控信息,效果不錯。告警部分,策略比較明確,通過統計的平均值或者和值做衡量,以設定的條件和閥值來觸發告警,可以對單個容器的某個性能監控信息做告警,還是比較細緻的。

最後提個建議,是否能夠加入“組”或者“集羣”的相關概念,在監控展示時,可以選擇展示這個“集羣”的監控信息,在告警設置中,可以設定這個“集羣”的告警信息。有時候在一個宿主機上會把幾個容器當成一個集羣來用,例如一個hadoop集羣。如果對每個容器單獨觀察監控信息或者設置告警信息,就顯得有些繁瑣與不便。

最後,非常感謝監控寶給予了這次試用Docker監控的機會,希望監控寶能夠給我們帶來更多的驚喜。

 



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章