服務器宕機重啓後,可能導致部分服務及監控不可用:
kubectl top nodes 可以查看
kubectl top pod -n XXX 查看具體應用時,會發下部分pod不在metrics-server統計範圍下
另外還會出現部分內部應用相互不可調用的情況。
推測是k8s網絡問題導致,可以通過重置集羣的方法解決:
1 在重啓的集羣執行:
kubeadm reset
2 在主節點執行
kubeadm token create --print-join-command
獲取最新的加入集羣的命令
3 在需要重啓的子節點執行,重新加入集羣
sudo kubeadm join XX.XX.X.XXX:8443 --token 13a4q5.zf1qo34fqjm38beh --discovery-token-ca-cert-hash sha256:82284cfa62be95ca7ae628855c1c5cbcb2c98140e9314665c19f5aecca7ea459