k8s集羣服務器宕機重啓後,部分應用、監控不可用處理方法

服務器宕機重啓後,可能導致部分服務及監控不可用:

kubectl top nodes 可以查看

kubectl top pod -n XXX 查看具體應用時,會發下部分pod不在metrics-server統計範圍下

另外還會出現部分內部應用相互不可調用的情況。

 

推測是k8s網絡問題導致,可以通過重置集羣的方法解決:

 

1 在重啓的集羣執行:

  kubeadm reset 

2 在主節點執行

  kubeadm token create --print-join-command

  獲取最新的加入集羣的命令

3 在需要重啓的子節點執行,重新加入集羣

  sudo kubeadm join XX.XX.X.XXX:8443 --token 13a4q5.zf1qo34fqjm38beh     --discovery-token-ca-cert-hash sha256:82284cfa62be95ca7ae628855c1c5cbcb2c98140e9314665c19f5aecca7ea459

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章