深入解讀雲原生可觀測性之日誌與告警通知

作者:雷萬鈞,KubeSphere 可觀測性研發工程師

前言

作爲可觀測性的重要組成部分,告警通知可以幫助我們及時發現問題,日誌可以幫助我們快速定位問題。作爲一款開源的容器編排平臺, KubeSphere 提供了強大的日誌收集和查詢功能,以及靈活的告警通知能力。

本文將爲大家介紹 KubeSphere 的日誌和通知功能是如何實現的。

日誌

KubeSphere 的日誌收集是通過 Fluent Bit 實現的,Fluent Bit 將 Pod 日誌收集到 ElasticSearch 集羣,KubeSphere 通過查詢 ElasticSearch 集羣實現日誌檢索。

Fluent Bit

Fluent Bit 是一個開源的日誌處理器和轉發器,它可以從不同來源收集任何數據,如指標和日誌,用過濾器處理它們並將它們發送到多個目的地。它是 Kubernetes 等容器化環境的首選。

Fluent Bit 的設計考慮到了性能:高吞吐量、低 CPU 和內存使用率。它是用 C 語言編寫的,具有可插拔架構,支持 70 多種輸入、過濾器和輸出擴展。

日誌通過數據管道從數據源發送到目的地,一個數據管道通常由 Input、Parser、Filter、Buffer、Routing 和 Output組成。

  • Input:用於從數據源抽取數據,一個數據管道中可以包含多個 Input。
  • Parser:負責將 Input 抽取的非結構化數據轉化爲標準的結構化數據,每個 Input 均可以定義自己的 Parser。
  • Filter:負責對格式化數據進行過濾和修改。一個數據管道中可以包含多個 Filter,Filter 會順序執行,其執行順序與配置文件中的順序一致。
  • Buffer:用戶緩存經過 Filter 處理的數據。
  • Routing:將 Buffer 中緩存的數據路由到不同的 Output。
  • Output:負責將數據發送到不同的目的地,一個數據管道中可以包含多個 Output。

Fluent Bit 支持多種類型的 Input、Parser、Filter、Output 插件,可以應對各種場景。

Fluent Bit 作爲容器平臺下首選的日誌收集工具,有着高效、輕量的優勢,但是其部署方式卻不夠便捷。

  • 首先,使用傳統的方式部署 Fluent Bit,需要手動創建一個 DaemonSet,需要對 Fluent Bit 進行修改時,也需要手動修改此 DaemonSet,不夠便捷且容易出錯。
  • 其次,Fluent Bit 的配置文件不是雲原生領域常用的 yaml 或 json 格式,配置較爲繁瑣且容易出錯。
  • 再次,Fluent Bit 不支持動態加載配置文件,每次更新配置文件需要重啓 DaemonSet。

基於以上問題,KubeSphere 可觀測性團隊開發了 FluentBit Operator 用於部署和管理 Fluent Bit。

FluentBit Operator

FluentBit Operator 是一款開源的 Fluent Bit 管理工具,可以實現 Fluent Bit 的快速部署,可以實現 Fluent Bit 配置文件的動態修改和加載。

  • 管理:自動部署和銷燬 Fluent Bit DaemonSet。
  • 自定義配置:通過 CRD 定義 Fluent Bit 的配置。
  • 動態加載: 無需重新啓動 Fluent Bit pod 即可更新配置。

FluentBit Operator 通過 CRD 創建和管理 Fluent Bit Pod,通過監聽 CRD 的變化動態更新 Fluent Bit Pod 和 Fluent Bit 配置。

FluentBit Operator CRDS

FluentBit Operator 定義的 CRD 包括:

  • FluentBit:用於創建 Fluent Bit DaemonSet。
  • FluentBitConfig:用於選擇 FluentBit Operator 需要管理的插件。
  • Input:用於定義 Fluent Bit Input 插件。
  • Parser:用於定義Fluent Bit Parser 插件。
  • Filter:用於定義Fluent Bit Filter 插件。
  • Output:用於定義Fluent Bit Output 插件。

FluentBit Operator 通過監聽 FluentBitConfig、Input、Parser、Filter、Output CRD,生成 Fluent Bit 的配置文件,並將配置文件寫入到 Secret 中。當 CRD 發生變更時,配置文件會自動更新。

FluentBit Operator 監聽 FluenBit CRD, 當 FluenBit CRD 的實例創建時,FluentBit Operator 會創建 Fluent Bit DaemonSet,並將配置文件掛載到 Fluent Bit DaemonSet 中。當配置文件發生變化時,Fluent Bit Pod 中的配置文件也會同步更新。那麼 FluentBit Operator 是如何實現 Fluent Bit 動態加載配置文件的呢?

Fluent Bit Watcher

Fluent Bit Pod 中不是直接運行的 Fluent Bit,而是運行了一個名爲 fluent-bit-watcher 的進程,fluent-bit-watcher 在啓動後會啓動 Fluent Bit,同時監聽配置文件。當配置文件發生變化時,fluent-bit-watcher 會重啓 Fluent Bit 以重新加載配置文件。

日誌存儲

Fluent Bit 會將日誌收集到 ElasticSearch 集羣中進行持久化,日誌會按照每天一個分片進行存儲,KubeSphere 支持配置日誌的保存週期,超過保存週期的日誌會被自動刪除。

同時 KubeSphere 支持將日誌輸出到 Kafka 和 Fluentd。

日誌檢索

Fluent Bit 在收集日誌時,會將容器的元數據信息添加到日誌,因此 KubeSphere 可以爲用戶提供了豐富的日誌查詢方式。

  • 多租戶日誌管理,實現不同租戶日誌分權分域。每個租戶只能查詢自己有權限訪問的 Namespace 下的 容器的日誌。
  • 多層次日誌查詢 按項目、工作負載、容器組、容器和關鍵字查詢日誌,從多層次定位問題。

通知

KubeSphere 支持多租戶通知功能,每個租戶都可以定製自己的通知渠道,用於接收租戶有權限訪問的 Namespace 下的通知消息。同時可以設置全局的通知渠道用於接收全部的通知消息,包括所有租戶的通知消息和平臺級的通知消息。

KubeSphere 的通知功能是通過 Notification Manager 實現的。

Notification Manager

Notification Manager 是 KubeSphere 可觀測團隊開源的一款 Kubernetes 平臺上的多租戶通知管理系統,其從 Alertmanager 接收告警消息,並根據告警消息的租戶標籤(如 namespace)將告警消息發送到對應的通知渠道,DingTalk,Email,Slack,WeCom,Webhook,短信平臺(阿里、騰訊,華爲)等。

Notification Manager 由 Operator 和 Deployment 兩部分組成,Operator 用於創建和管理 Deployment,Deployment 用於接收告警消息,生成通知消息,並根據告警消息的租戶標籤(如 namespace)將通知消息發送到對應的通知渠道。

Notification Manager 通過 CRD 進行管理和配置,Operator 通過監聽 NotificationManager CRD 創建和管理 Deployment,Deployment 會監聽 NotificationManager、Config、Receiver CRD,當 CRD 發生變更時,會重載 CRD 以更新配置信息,實現了通知渠道的動態更新。

Notification Manager 定義的 CRD 的作用如下:

  • NotificationManager:用於配置 Webhook,包括鏡像、副本數、volumes、親和性、污點、資源配額等。同時定義了發送通知所需的配置,全局接收者和默認配置選擇器、租戶標籤、租戶級接收者選擇器,以及通知渠道的全局配置。
  • Config:用於定義通知渠道的發送方的配置信息,例如郵件發送服務器設置、企業微信用於發送消息的 APP 的信息等。
  • Receiver:用於定義通知渠道的接收方的信息,例如郵件接收者、企業微信中的用戶或部門,slack的頻道等。

Notification Manager 支持多租戶通知,那麼 Notification Manager 是如何實現多租通知管理的呢?

Notification Manager 採用了發送配置和接收配置分離的模式,即使用 Config 定義發送配置,使用 Receiver 定義接收配置,Receiver 通過標籤選擇發送通知需要使用的發送配置。Config 和 Receiver 分爲全局和租戶兩種類型,通過以下標籤進行區分。

type: global // 全局 Receiver

type: default // 全局 Config

type: tenant //租戶 Receiver or Config

全局 Receiver 只能使用全局的 Config,租戶 Receiver 通過標籤選擇器選擇租戶定義的租戶 Config,如果未定義標籤選擇器,或未找到 Config,則使用全局 Config。

使用此種模式,用戶可以快速實現複雜多租戶通知場景的配置。例如對於郵件通知,可以使用統一的發送方,管理員可以設置全局的 Email Config,租戶只需要配置接收郵箱即可完成郵件通知配置。

Notification Manager 會根據通知消息的 namespace 標籤將通知發送到相應的 Receiver。

  • 所有通知消息都會發送到全局 Receiver。
  • 若 namespace 爲空,則只會發送到全局 Receiver。
  • 若 namespace 非空,Notification Manager 會根據 namespace 查找待通知租戶列表,然後根據租戶列表獲取待發送 Receiver。對應原生 Kubernetes 集羣,待通知租戶即爲 namespace。對於其他集羣,例如 KubeSphere,Notification Manager 支持通過 API 獲取待通知租戶列表。用戶可以自己實現獲取待通知租戶列表的邏輯,通過 sidecar 的方式注入到 Notification Manager Deployment 供 Notification Manager 調用。

自定義通知消息

Notification Manager 支持自定義通知消息,用戶可以通過編寫消息模板來自定義通知消息。Notification Manager 的通知模板此採用 Go template 編寫。以下是一個簡單的消息模板。

{{ define "__nm_alert_list" }}{{ range . }}Labels:
{{ range .Labels.SortedPairs }}{{ if ne .Name "runbook_url" }}- {{ .Name }} = {{ .Value }}{{ end }}
{{ end }}Annotations:
{{ range .Annotations.SortedPairs }}{{ if ne .Name "runbook_url"}}- {{ .Name }} = {{ .Value }}{{ end }}
{{ end }}{{ end }}{{ end }}

{{ define "nm.default.text" }}{{ template "nm.default.subject" . }}
{{ if gt (len .Alerts.Firing) 0 -}}
Alerts Firing:
{{ template "__nm_alert_list" .Alerts.Firing }}
{{- end }}
{{ if gt (len .Alerts.Resolved) 0 -}}
Alerts Resolved:
{{ template "__nm_alert_list" .Alerts.Resolved }}
{{- end }}
{{- end }}

其輸出的通知消息如下。

Notification Manager 支持多級別的模板設置。

  • Notification Manager 爲每一種通知渠道設置了默認的消息模板,用戶可以直接使用。
  • 用戶可以設置全局的模板,供所有 Receiver 使用。
  • 用戶可以爲每種通知渠道設置統一的模板。
  • 用戶可以爲每一個 Receiver 設置單獨的模板。

通知消息過濾

Notification Manager 支持對通知消息進行過濾,用戶可以通過設置過濾器來過濾通知消息。Notification Manager 支持對每一個 Receiver 設置單獨的過濾器。

一個簡單的過濾器,過濾掉 warning 級別的告警。

apiVersion: notification.kubesphere.io/v2beta1
kind: Receiver
metadata:
  labels:
    app: notification-manager
    type: global
  name: global-email-receiver
spec:
  email:
    to:
    - [email protected]
    - [email protected]
    alertSelector:
      matchExpressions:
      - key: severity
        operator: In
        values:
        - error
        - critical

KubeSphere 通知的優勢

  • 使用 CRD 管理,支持動態更新
  • 支持豐富的通知渠道
  • 支持通知消息過濾
  • 支持自定義通知消息

本文由博客一文多發平臺 OpenWrite 發佈!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章