如何在多Kubernetes集羣和多租戶環境中使用Prometheus監控

過去十年裏,我一直在虛擬化和雲計算領域工作,在VMware、Mercury Interactive和Oracle領導產品管理工作,並格外關注DevOps方向。直到2014年,我開始認真關注並研究容器。當2015年Kubernetes面向大衆推出時,我強烈地感受到,企業需要一種更簡單的方法來在其內部環境中部署容器。那時,我創立了Qubeship.io,提供企業級的容器的CI / CD工具。然而——儘管我們盡了全力應對這一問題——管理Kubernetes集羣仍然是一個巨大的挑戰。


而Rancher,解決了這個複雜的問題。它從最初的容器編排引擎,迅速發展成爲多集羣、多租戶Kubernetes管理平臺,並解決了全球成千上萬家企業在重要的生產環境中落地Kubernetes的難題。


Rancher 2.2進一步推動了這一發展。Rancher 2.2中將包含許多新功能和錯誤修復,本文中我將重點分享:


  • 新的Alpha版本發佈流程

  • 爲Rancher所管理的集羣提供的開箱即用的監控解決方案。


Alpha版本發佈流程


從Rancher 2.2.0開始,Rancher Labs計劃在最終2.2 GA發佈之前發佈一系列alpha版本。這將爲用戶提供足夠的時間來試驗新功能,並幫助發現一些潛在問題。


Alpha版本無疑是最新最前沿的,它可能包含新功能、增強功能和錯誤修復。但我們不建議用戶將任何alpha版本部署於生產環境,並且Rancher也不提供升級到alpha版本或從alpha版本升級的測試或支持。


如果某個特定的alpha版本中有某些格外值得注意的功能或修復,我們會在release note裏將它們着重標記出來。重要的已知問題我們也會標記。我們會做到儘量詳細,不過這一清單也並非詳盡無遺。


無比希望大家能夠儘可能多地向Rancher團隊提供您在使用alpha版本時的反饋/意見/建議,這也是在產品正式GA之前幫助我們最大程度地優化產品的絕佳途徑!


多集羣、多租戶環境中Prometheus監控的黑科技


Rancher Labs正式宣佈了將在Rancher 2.2中引入對Prometheus的里程碑級別的增強支持,從而增強所有Kubernetes集羣的可見性,同時確保不同項目與用戶之間的隔離。Rancher也因此成爲唯一一個在多集羣、多租戶環境中支持Prometheus的解決方案。在Rancher 2.2,使用Prometheus監控Rancher管理的Kubernetes環境,只需要兩個步驟:


  1. 選擇集羣

  2. 一鍵啓動監控


搞定!


我們可以做到這一點,因爲Rancher 2.2配備了完全集成的Prometheus和Grafana。


使用教程:


  • 登陸並選擇您要監控的集羣。需要注意的是,CPU利用率、內存利用率和Pods圖表顯示的是系統的當前狀態。這些指標儘管很有用,但僅顯示現在正在發生的事情。


1.png

  • 點開工具選項卡,然後選擇“監控”選項。

    2.png

  • 單擊“Prometheus”按鈕。關於數據留存以及端口,您都可以使用默認配置。

  • 關於存儲Prometheus和Grafana數據的問題,這裏也有添加持久化存儲的選項。如果您要啓用它,請立即選擇它。在本文的這個演示中,我沒有選中它們。

  • 保存更改。


  • 3.png

  • 導航回集羣,此時你就能看到更多其他內容了,包括集羣指標、Etcd指標、Kubernetes組件指標和Rancher日誌指標。

    4.png

  • 展開每個指標後,就能查看到該指標下一層新指標。將鼠標懸停在圖表上,還能查看到更多信信息。



5.png

  • 使用時間序列下拉列表,你還可以進一步放大並查看系統在不同時間段的性能變化。

  • 7.png

  • 單擊Grafana圖標以查看儀表板:

  • 8.png

    下面我們來看看項目級監控。

  • 項目級監控



    在Rancher中,項目是一種強大的方式來讓多個團隊在同一個集羣上擁有自己的多租戶工作區(或項目)。


  • 選擇帶有工作負載的項目,然後導航到工具→監控。如果監控尚未啓用,可以選擇Prometheus監控按鈕來啓用它。



  • 導航回Workload選項卡並展開現在可用的“Workload Metrics”部分,以查看所有利用率和I / O指標。將鼠標懸停在任意圖表上可查看更多詳細信息,使用時間序列下拉列表則可以進一步放大並查看特定時間段的情況。

    9.png

    您還可以繼續深入研究Pod甚至容器級指標。只需單擊您想要觀察的組件,然後參照執行和上文中一樣的步驟,就可以查看到Pod指標和容器指標了。 

    10.png

    結   論


    希望通過本文,您能瞭解到如何通過Rancher 2.2中開箱即用的Prometheus和Grafana監控解決方案,來簡單快速地完成對多Kubernetes集羣、多租戶環境的統一監控。


    現已有多個Alpha版本可供您體驗使用,具體可以參照這裏:

    https://github.com/rancher/rancher/releases


    一如既往,我們無比期待您的使用反饋。產品的beta版本將很快與您見面,GA時間計劃爲2019年初,敬請保持關注!


    Keep Rancher-ing!




發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章