1 对于物理服务器安装的k8s集群,我们队故障的节点重新安装操作系统,并且使用原有的ip即可。如果使用EasyStack环境,则只需要登录租户的web控制台,对该主机执行“重建云主机”即可做到。 目的就是回到干净的相同版本的os系统,使用原来的ip
2 安装docker,从其它 master节点拷贝 /etc/docker/daemon.json 到新节点对应目录下
执行
systemctl daemon-reload
systemctl enable docker –now
安装 k8s 基础工具:
1 命令行安装
2 离线安装rpm文件
此步比较容易,不做详细扩展
3重装etcd,加入原有集群,此步不做或者失败将导致后面的kubeadm init 失败
在两个正常服务器的etcd节点,随便选择一台执行:
# 登录到etcd容器内
kubectl exec –it etcd sh
# 查看集群信息
etcdctl member list
# 查看故障节点
etcdctl cluster-health
# 异常故障节点,从上面的 etcdctl cluster-health 就能查到故障节点的 id
etcdctl member remove 故障节点ID