監控微服務

1、監控指標

    1)qps,pv

    2)響應時間。大多數情況下,可以用一段時間內所有調用的平均耗時來反映請求的響應時間。但它只代表了請求的平均快慢情況,有時候我們更關心慢請求的數量。P99 = 500ms,意思是 99% 的請求響應時間在 500ms 以內

    3)錯誤率。錯誤率的監控通常用一段時間內調用失敗的次數佔調用總次數的比率來衡量,比如對於接口的錯誤率一般用接口返回錯誤碼爲 503 的比率來表示

    4)cpu利用率,io讀寫量,內存,磁盤

2、監控系統原理

    監控系統主要包括四個環節:數據採集、數據傳輸、數據處理和數據展示

    1)數據採集:服務主動上報和代理收集

採樣對系統本身的性能也會有一定的影響,尤其是採集後的數據需要寫到本地磁盤的時候,過高的採樣率會導致系統寫入磁盤的 I/O 過高,進而會影響到正常的服務調用。最好是可以動態控制採樣率,在系統比較空閒的時候加大采樣率,追求監控的實時性與精確度;在系統負載比較高的時候減小採樣率,追求監控的可用性與系統的穩定性。

    2)數據傳輸:

        UDP 傳輸,這種處理方式是數據處理單元提供服務器的請求地址,數據採集後通過 UDP 協議與服務器建立連接,然後把數據發送過去

       Kafka 傳輸,這種處理方式是數據採集後發送到指定的 Topic,然後數據處理單元再訂閱對應的 Topic,就可以從 Kafka 消息隊列中讀取到對應的數據

    3)數據處理:

        放入es

    4)數據展示

        數據展示是把處理後的數據以 Dashboard 的方式展示給用戶。數據展示有多種方式,比如曲線圖、餅狀圖、格子圖展示等

            

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章