由於物理機遷移、網絡環境發生變更,可能導致集羣結構的破壞。
1、 確認集羣中是否還存在該節點:
Kubectl get nodes
2、 確認網絡環境是否通暢:
可以通過 ping 該物理機IP
3、 確認物理機是否正常:
是否可以登錄
登錄後查看kubelet是否正常啓動: systemctl status kubelet
查看內存情況: free –h
查看磁盤情況: df -h
4、 如果是高可用主節點,還需要確認 keepalived 和 proxy 是否正常:
systemctl status keepalived
systemctl status haproxy
5、 重置集羣節點:
(1) 在保證kubelet運行正常的基礎上,在需要重置的節點上執行kubeadm reset
(2) 在集羣主節點創建加入集羣的 secret: kubeadm token create --print-join-command
(3) 運行加入集羣命令:如:
kubeadm join 10.28.1.XXX:8443 --token 13a4q5.zf1qo34fqjm38beh --discovery-token-ca-cert-hash sha256:82284cfa62be95ca7ae628855c1c5cbcb2c98140e9314665c19f5aecca7ea459
6、 在主節點上確認該節點是否加入:
kubectl get nodes
7、 以上步驟也可以解決由於 kubectl delete nodes 導致的節點丟失