k8s異常pod處理

原創

2019-08-10 15:05

自動處理：

靈活運用readinessProbe和livenessProbe探針，對於常規異常(如：服務沒有響應，健康檢查失敗)做到自動處理，業務日誌記錄異常

readinessProbe 主要是用來探測服務是否可用，如果不可用，從service流量負載中刪除
livenessProbe 探測容器是否健康，如果不健康則重啓服務

人工介入

探針沒有關注到的異常，可以通過監控告警，及時發現問題（如cpu負載過高等），人工介入。此時可以通過下面操作，完成流量切換和保留現場

修改異常pod的labels，如：

kubectl -n test edit pod data-message-7974fdd4db-zh692

修改：

  labels:
    cluster: data-message

爲

  labels:
    cluster: data-message-err

原理：k8s提供的service負載均衡是通過labels來選擇同一個ns下的pod作爲endpoints。手動更改異常pod label可以做到切除用戶流量，並保留異常pod。同時k8s會自動起一個新的pod，補充剛剛剔除的異常pod

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

k3d創建集羣並暴露traefik端口

1. 安裝docker curl -fsSL https://get.docker.com | bash -s docker --mirror Aliyun 2. 安裝k3d wget -q -O - https://raw.githu

2024-04-24 21:13:26

教你如何進行Prometheus 分片自動縮放

本文分享自華爲雲社區《使用 Prometheus-Operator 進行 Prometheus + Keda 分片自動縮放》，作者： Kubeservice@董江。垂直縮放與水平縮放 Prometheus已經成爲雲原生時代事實上的監控工

2024-04-23 10:32:56

K8s集羣nginx-ingress監控告警最佳實踐

本文分享自華爲雲社區《K8s集羣nginx-ingress監控告警最佳實踐》，作者：可以交個朋友。一背景 nginx-ingress作爲K8s集羣中的關鍵組成部分。主要負責k8s集羣中的服務發佈，請求轉發等功能。如果在訪問服務過程中出

2024-04-18 10:32:58

ollama使用

ollama 僅支持。gguf的格式其他格式需要llama.cpp 轉換 curl https://ollama.ai/install.sh | sh ollama --version ollama pull llama2-chin

2024-05-01 00:42:55

centos7下Docker 安裝

Docker 是一個開源的商業產品，有兩個版本：社區版（Community Edition，縮寫爲 CE）和企業版（Enterprise Edition，縮寫爲 EE）。企業版包含了一些收費服務，個人開發者一般用不到。下面的介紹都針對社區

2024-04-26 13:11:00

手動給docusaurus添加一個搜索

新版博客用docusaurus重構已經有些日子了，根據docusaurus的文檔上也申請了Algolia,想一勞永逸的解決博客的搜索問題。但是流水有意，落花無情。 algolia總是不給我回復，我只能對着algolia的申請頁面仰天長嘆。

2024-04-19 21:30:54

ACK One x OpenKruiseGame 全球遊戲服多地域一致性交付最佳實踐

作者：劉秋陽、蔡靖前言在當今全球一體化的經濟環境下，數字娛樂產業正日益成爲文化和商業交流的有力代表。在此背景下大量遊戲廠商嘗試遊戲出海並取得了令人矚目的成績，許多遊戲以全球同服架構吸引着世界各地廣泛的玩家羣體。遊戲全球化部署不僅擴大了單

2024-04-30 21:12:18

雲原生週刊：K8s 中的服務和網絡｜ 2024.4.29

開源項目推薦 k8s-image-swapper k8s-image-swapper 是 Kubernetes 的一個變更 Webhook，它將鏡像下載到自己的鏡像倉庫，並將鏡像指向該新位置。它是 docker pull-through p

2024-04-30 10:48:10

華爲云云原生FinOps解決方案，釋放雲原生最大價值

華爲云云原生FinOps通過可視化的成本洞察和成本優化，幫助用戶精細用雲以提升單位成本的資源利用率，實現降本增效目標企業上雲現狀：上雲趨勢持續加深，但云上開支存在顯著浪費根據Flexer 2024年最新的一項調查顯示，當前有超過7

2024-04-29 22:33:46

Sealos 雲主機正式上線，便宜，便宜，便宜！

我們基於 Sealos 雲開發的能力，僅用三天時間就上線 Sealos 的雲主機能力，現在不太懂容器的同學也可以在 Sealos 上開心的使用虛擬機了，本文先說 Sealos 雲主機的優勢，再聊聊我們是怎麼這麼快實現上線的，以及爲什麼我們要

2024-04-26 21:14:40

日誌架構演進：從集中式到分佈式的Kubernetes日誌策略

當我們沒有使用雲原生方案部署應用時採用的日誌方案往往是 ELK 技術棧。這套技術方案比較成熟，穩定性也很高，所以幾乎成爲了當時的標配。可是隨着我們使用 kubernetes 步入雲原生的時代後， kubernetes 把以往的操作系統

2024-04-23 11:47:10

雲原生週刊：Kubernetes v1.30 發佈｜ 2024.4.22

開源項目推薦 pv-migrate pv-migrate 是一個 CLI 工具/kubectl 插件，可輕鬆將一個 Kubernetes 的內容遷移 PersistentVolumeClaim 到另一個 Kubernetes。 Claudi

2024-04-22 22:46:27

活動回顧丨雲原生開源開發者沙龍北京站回放 & PPT 下載

“零信任架構” 是一種安全概念，它要求在任何時候不對任何請求默認信任，無論它的來源內部還是外部。服務安全性已成爲企業的核心關切，4 月 13 日，雲原生開源開發者沙龍在北京順利開展。阿里雲一線工程師圍繞《微服務面臨的安全挑戰、趨勢與解決方

2024-04-22 21:12:01

實踐展示openEuler部署Kubernetes 1.29.4版本集羣

本文分享自華爲雲社區《openEuler部署Kubernetes 1.29.4版本集羣》，作者：江晚正愁餘。一、Kubernetes集羣節點準備 1.1 主機操作系統說明序號操作系統及版本備註 1 CentOS7u9或 Open

2024-04-22 10:33:11

KCD上海站免費報名丨賞玉蘭花開，暢聊雲原生技術

Kubernetes Community Days（KCD）上海2024 現已開放報名通道！這是一場大型的面向開發者的技術交流會在現場，你可以與各路技術社區達人交流 battle 共同探討雲原生技術的最新進展現場感受AI/操作

2024-04-17 22:13:22

24小時熱門文章

最新文章

最新評論文章