• 云原生Kubernetes:Kubeadm部署K8S单Master架构


    目录

    一、理论

    1.kubeadm

    2.Kubeadm部署K8S单Master架构

    3.环境部署

    4.所有节点安装docker

    5.所有节点安装kubeadm,kubelet和kubectl

    6.部署K8S集群

    7.安装dashboard

    8.安装Harbor私有仓库

    9.内核参数优化方案

    二、实验

    1.Kubeadm部署K8S单Master架构

    2. 部署流程

     3.环境部署

    4.所有节点安装docker

    5.所有节点安装kubeadm,kubelet和kubectl

    6.部署K8S集群

    7.安装dashboard

    8.安装Harbor私有仓库

    三、问题

    1.加入k8s集群报错

    2.Kubernetes各版本对应支持的docker版本列表

    3.Kubernetes 1.24 1.25 集群使用docker作为容器

    4.连接拒绝

    5.kubeadm join命令将node加入master时报错

    6.coredns一直处于ContainerCreating

    7.flannel如何分配子网

    8.其他机器无法登陆Harbor

    四、总结


    一、理论

    1.kubeadm

    (1) 概念

    Kubeadm 是一个提供了 kubeadm init 和 kubeadm join 的工具, 作为创建 Kubernetes 集群的 “快捷途径” 的最佳实践。

    kubeadm 通过执行必要的操作来启动和运行最小可用集群。 按照设计,它只关注启动引导,而非配置机器。同样的, 安装各种 “锦上添花” 的扩展,例如 Kubernetes Dashboard、 监控方案、以及特定云平台的扩展,都不在讨论范围内。

    相反,在 kubeadm 之上构建更高级别以及更加合规的工具, 理想情况下,使用 kubeadm 作为所有部署工作的基准将会更加易于创建一致性集群。

    (2)管理命令

    1. kubeadm init 用于搭建控制平面节点
    2. kubeadm join 用于搭建工作节点并将其加入到集群中
    3. kubeadm upgrade 用于升级 Kubernetes 集群到新版本
    4. kubeadm config 如果你使用了 v1.7.x 或更低版本的 kubeadm 版本初始化你的集群,则使用 kubeadm upgrade 来配置你的集群
    5. kubeadm token 用于管理 kubeadm join 使用的令牌
    6. kubeadm reset 用于恢复通过 kubeadm init 或者 kubeadm join 命令对节点进行的任何变更
    7. kubeadm certs 用于管理 Kubernetes 证书
    8. kubeadm kubeconfig 用于管理 kubeconfig 文件
    9. kubeadm version 用于打印 kubeadm 的版本信息
    10. kubeadm alpha 用于预览一组可用于收集社区反馈的特性

    2.Kubeadm部署K8S单Master架构

    (1)架构


    (2)软件包

    本次实验所需要的软件:

    【免费】K8S单Master节点kubeadm方式(软件与配置文件)资源-CSDN文库

    (3)部署流程

    1. 1、在所有节点上安装Docker和kubeadm
    2. 2、部署Kubernetes Master
    3. 3、部署容器网络插件
    4. 4、部署 Kubernetes Node,将节点加入Kubernetes集群中
    5. 5、部署 Dashboard Web 页面,可视化查看Kubernetes资源
    6. 6、部署 Harbor 私有仓库,存放镜像资源

    3.环境部署

    (1)所有节点,关闭防火墙规则,关闭selinux,关闭swap交换

    1. systemctl stop firewalld
    2. systemctl disable firewalld
    3. setenforce 0
    4. iptables -F && iptables -t nat -F && iptables -t mangle -F && iptables -X
    5. swapoff -a #交换分区必须要关闭
    6. sed -ri 's/.*swap.*/#&/' /etc/fstab #永久关闭swap分区,&符号在sed命令中代表上次匹配的结果

    (2)加载 ip_vs 模块

    for i in $(ls /usr/lib/modules/$(uname -r)/kernel/net/netfilter/ipvs|grep -o "^[^.]*");do echo $i; /sbin/modinfo -F filename $i >/dev/null 2>&1 && /sbin/modprobe $i;done

    (3)修改主机名

    1. hostnamectl set-hostname master
    2. hostnamectl set-hostname node01
    3. hostnamectl set-hostname node02

    所有节点修改hosts文件

    1. vim /etc/hosts
    2. 192.168.204.171 master
    3. 192.168.204.173 node01
    4. 192.168.204.175 node02

    (4)调整内核参数

    1. cat > /etc/sysctl.d/kubernetes.conf << EOF
    2. #开启网桥模式,可将网桥的流量传递给iptables链
    3. net.bridge.bridge-nf-call-ip6tables=1
    4. net.bridge.bridge-nf-call-iptables=1
    5. #关闭ipv6协议
    6. net.ipv6.conf.all.disable_ipv6=1
    7. net.ipv4.ip_forward=1
    8. EOF
    9. 生效参数
    10. sysctl --system

    4.所有节点安装docker

    (1)安装

    1. yum install -y yum-utils device-mapper-persistent-data lvm2
    2. yum-config-manager --add-repo https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo
    3. yum install -y docker-ce docker-ce-cli containerd.io

    (2)加速地址(需要修改为自己的)

    1. mkdir /etc/docker
    2. cat > /etc/docker/daemon.json <<EOF
    3. {
    4. "registry-mirrors": ["https://XXXXXXXX.mirror.aliyuncs.com"],
    5. "exec-opts": ["native.cgroupdriver=systemd"],
    6. "log-driver": "json-file",
    7. "log-opts": {
    8. "max-size": "100m"
    9. }
    10. }
    11. EOF
    12. #使用Systemd管理的Cgroup来进行资源控制与管理,因为相对Cgroupfs而言,Systemd限制CPU、内存等资源更加简单和成熟稳定。
    13. #日志使用json-file格式类型存储,大小为100M,保存在/var/log/containers目录下,方便ELK等日志系统收集和管理日志。
    14. systemctl daemon-reload
    15. systemctl restart docker.service
    16. systemctl enable docker.service
    17. docker info | grep "Cgroup Driver"
    18. Cgroup Driver: systemd

    5.所有节点安装kubeadm,kubelet和kubectl

    (1)定义kubernetes源

    1. cat > /etc/yum.repos.d/kubernetes.repo << EOF
    2. [kubernetes]
    3. name=Kubernetes
    4. baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64
    5. enabled=1
    6. gpgcheck=0
    7. repo_gpgcheck=0
    8. gpgkey=https://mirrors.aliyun.com/kubernetes/yum/doc/yum-key.gpg https://mirrors.aliyun.com/kubernetes/yum/doc/rpm-package-key.gpg
    9. EOF
    10. yum install -y kubelet-1.15.1 kubeadm-1.15.1 kubectl-1.15.1

    开机自启kubelet

    systemctl enable kubelet.service
    

    6.部署K8S集群

    (1)查看初始化需要的镜像

    kubeadm config images list
    

    (2)在 master 节点上传 kubeadm-basic.images.tar.gz 压缩包至 /opt 目录

    1. cd /opt
    2. tar zxvf kubeadm-basic.images.tar.gz

    (3)使用for循环载入镜像

    for i in $(ls /opt/kubeadm-basic.images/*.tar); do docker load -i $i; done

    (4)复制镜像和脚本到 node 节点,并在 node 节点上执行脚本 bash /opt/load-images.sh

    1. scp -r kubeadm-basic.images root@node01:/opt
    2. scp -r kubeadm-basic.images root@node02:/opt

    (5)初始化kubeadm

    方法一:

    kubeadm config print init-defaults > /opt/kubeadm-config.yaml
    

    修改配置文件
     

    1. cd /opt/
    2. vim kubeadm-config.yaml
    3. ......
    4. 11 localAPIEndpoint:
    5. 12 advertiseAddress: 192.168.204.171 #指定master节点的IP地址
    6. 13 bindPort: 6443
    7. ......
    8. 34 kubernetesVersion: v1.15.1 #指定kubernetes版本号
    9. 35 networking:
    10. 36 dnsDomain: cluster.local
    11. 37 podSubnet: "10.244.0.0/16" #指定pod网段,10.244.0.0/16用于匹配flannel默认网段
    12. 38 serviceSubnet: 10.96.0.0/16 #指定service网段
    13. 39 scheduler: {}
    14. --- #末尾再添加以下内容
    15. apiVersion: kubeproxy.config.k8s.io/v1alpha1
    16. kind: KubeProxyConfiguration
    17. mode: ipvs #把默认的service调度方式改为ipvs模式
    1. kubeadm init --config=kubeadm-config.yaml --experimental-upload-certs | tee kubeadm-init.log
    2. #--experimental-upload-certs 参数可以在后续执行加入节点时自动分发证书文件,k8sV1.16版本开始替换为 --upload-certs
    1. #tee kubeadm-init.log 用以输出日志
    2. //查看 kubeadm-init 日志
    3. less kubeadm-init.log
    4. //kubernetes配置文件目录
    5. ls /etc/kubernetes/
    6. //存放ca等证书和密码的目录
    7. ls /etc/kubernetes/pki

    方法二:

    1. kubeadm init \
    2. --apiserver-advertise-address=0.0.0.0 \
    3. --image-repository registry.aliyuncs.com/google_containers \
    4. --kubernetes-version=v1.15.1 \
    5. --service-cidr=10.1.0.0/16 \
    6. --pod-network-cidr=10.244.0.0/16
    7. --------------------------------------------------------------------------------------------
    8. 初始化集群需使用kubeadm init命令,可以指定具体参数初始化,也可以指定配置文件初始化。
    9. 可选参数:
    10. --apiserver-advertise-address:apiserver通告给其他组件的IP地址,一般应该为Master节点的用于集群内部通信的IP地址,0.0.0.0表示节点上所有可用地址
    11. --apiserver-bind-port:apiserver的监听端口,默认是6443
    12. --cert-dir:通讯的ssl证书文件,默认/etc/kubernetes/pki
    13. --control-plane-endpoint:控制台平面的共享终端,可以是负载均衡的ip地址或者dns域名,高可用集群时需要添加
    14. --image-repository:拉取镜像的镜像仓库,默认是k8s.gcr.io
    15. --kubernetes-version:指定kubernetes版本
    16. --pod-network-cidr:pod资源的网段,需与pod网络插件的值设置一致。通常,Flannel网络插件的默认为10.244.0.0/16,Calico插件的默认值为192.168.0.0/16;
    17. --service-cidr:service资源的网段
    18. --service-dns-domain:service全域名的后缀,默认是cluster.local
    19. ---------------------------------------------------------------------------------------------
    20. 方法二初始化后需要修改 kube-proxy 的 configmap,开启 ipvs
    21. kubectl edit cm kube-proxy -n=kube-system
    22. 修改mode: ipvs
    23. 提示:
    24. ......
    25. Your Kubernetes control-plane has initialized successfully!
    26. To start using your cluster, you need to run the following as a regular user:
    27. mkdir -p $HOME/.kube
    28. sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
    29. sudo chown $(id -u):$(id -g) $HOME/.kube/config
    30. You should now deploy a pod network to the cluster.
    31. Run "kubectl apply -f [podnetwork].yaml" with one of the options listed at:
    32. https://kubernetes.io/docs/concepts/cluster-administration/addons/
    33. Then you can join any number of worker nodes by running the following on each as root:
    34. kubeadm join 192.168.204.171:6443 --token abcdef.0123456789abcdef \
    35. --discovery-token-ca-cert-hash sha256:594fd0a687443eb0f161d9ae76efcf27588af78579c8e362d70fc06986f0454b

    更改kube-proxy配置

    kubectl edit configmap kube-proxy -n kube-system

    找到如下部分的内容

    1. minSyncPeriod: 0s
    2. scheduler: ""
    3. syncPeriod: 30s
    4. kind: KubeProxyConfiguration
    5. metricsBindAddress: 127.0.0.1:10249
    6. mode: "ipvs" # 加上这个
    7. nodePortAddresses: null

    其中mode原来是空,默认为iptables模式,改为ipvs

    scheduler默认是空,默认负载均衡算法为轮询

     编辑完,保存退出

    (6)设定kubectl

        kubectl需经由API server认证及授权后方能执行相应的管理操作,kubeadm 部署的集群为其生成了一个具有管理员权限的认证配置文件 /etc/kubernetes/admin.conf,它可由 kubectl 通过默认的 “$HOME/.kube/config” 的路径进行加载。
     

    1. mkdir -p $HOME/.kube
    2. cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
    3. chown $(id -u):$(id -g) $HOME/.kube/config

    在 node 节点上执行 kubeadm join 命令加入群集

    1. kubeadm join 192.168.204.171:6443 --token d3q8kf.wvis2wbfdfymwic4 \
    2. --discovery-token-ca-cert-hash sha256:6d851b46ccd6c61a81d3aa08eae4971bc7a5ba32dd4918f7981c482e3fdd4d52

    (7)所有节点部署网络插件flannel

    方法一:

    所有节点上传flannel镜像 flannel.tar 到 /opt 目录,master节点上传 kube-flannel.yml 文件

    1. cd /opt
    2. docker load < flannel.tar

    在 master 节点创建 flannel 资源

    kubectl apply -f kube-flannel.yml 
    

    方法二:

    kubectl apply -f https://raw.githubusercontent.com/coreos/flannel/master/Documentation/kube-flannel.yml
    

    (8)在master节点查看节点状态(需要等几分钟)

    1. kubectl get nodes
    2. kubectl get pods -n kube-system

    (9)测试 pod 资源创建

    kubectl create deployment nginx --image=nginx
    

    (10)暴露端口提供服务

    kubectl expose deployment nginx --port=80 --type=NodePort
    

    (11)测试访问

    curl http://node01:30833
    

    (12)扩展3个副本

    1. kubectl scale deployment nginx --replicas=3
    2. kubectl get pods -o wide

    7.安装dashboard

    (1)所有节点安装dashboard

    方法一:

    所有节点上传dashboard镜像 dashboard.tar 到 /opt 目录,master节点上传kubernetes-dashboard.yaml文件

    1. cd /opt/
    2. docker load < dashboard.tar
    3. kubectl apply -f kubernetes-dashboard.yaml

    方法二:

    kubectl apply -f https://raw.githubusercontent.com/kubernetes/dashboard/v2.0.0/aio/deploy/recommended.yaml

    (2)查看所有容器运行状态

    kubectl get pods,svc -n kube-system -o wide
    

    (3)使用浏览器访问

    1. https://node02:30001/
    2. https://192.168.204.175:30001/

    (4)创建service account并绑定默认cluster-admin管理员集群角色

    1. kubectl create serviceaccount dashboard-admin -n kube-system
    2. kubectl create clusterrolebinding dashboard-admin --clusterrole=cluster-admin --serviceaccount=kube-system:dashboard-admin

    (5)获取令牌密钥

    kubectl describe secrets -n kube-system $(kubectl -n kube-system get secret | awk '/dashboard-admin/{print $1}')
    

    (6)复制token令牌直接登录网站

    8.安装Harbor私有仓库

    (1)在192.168.204.176服务器操作

    修改主机名

    hostnamectl set-hostname hub.david.com
    

    所有节点加上主机名映射

    echo '192.168.204.176 hub.david.com' >> /etc/hosts

    (2)  安装 docker

    1. yum install -y yum-utils device-mapper-persistent-data lvm2
    2. yum-config-manager --add-repo https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo
    3. yum install -y docker-ce docker-ce-cli containerd.io

    私有仓库配置(加速地址需要修改为自己的)

    1. mkdir /etc/docker
    2. cat > /etc/docker/daemon.json <<EOF
    3. {
    4. "registry-mirrors": ["https://XXXXXXXX.mirror.aliyuncs.com"],
    5. "exec-opts": ["native.cgroupdriver=systemd"],
    6. "log-driver": "json-file",
    7. "log-opts": {
    8. "max-size": "100m"
    9. },
    10. "insecure-registries": ["https://hub.david.com"]
    11. }
    12. EOF
    13. systemctl start docker
    14. systemctl enable docker

    所有 node 节点都修改 docker 配置文件,加上私有仓库配置(加速地址需要修改为自己的)

    1. cat /etc/docker/daemon.json <<EOF
    2. {
    3. "registry-mirrors": ["https://XXXXXXXX.mirror.aliyuncs.com"],
    4. "exec-opts": ["native.cgroupdriver=systemd"],
    5. "log-driver": "json-file",
    6. "log-opts": {
    7. "max-size": "100m"
    8. },
    9. "insecure-registries": ["https://hub.david.com"]
    10. }
    11. EOF

    (3)安装 Harbor

    上传 harbor-offline-installer-v1.2.2.tgz 和 docker-compose 文件到 /opt 目录

    1. cd /opt
    2. cp docker-compose /usr/local/bin/
    3. chmod +x /usr/local/bin/docker-compose
    1. tar zxvf harbor-offline-installer-v1.2.2.tgz
    2. cd harbor/
    3. vim harbor.cfg
    4. 5 hostname = hub.david.com
    5. 9 ui_url_protocol = https
    6. 24 ssl_cert = /data/cert/server.crt
    7. 25 ssl_cert_key = /data/cert/server.key
    8. 59 harbor_admin_password = Harbor12345

     生成证书

    1. mkdir -p /data/cert
    2. cd /data/cert
    3. #生成私钥
    4. openssl genrsa -des3 -out server.key 2048
    5. 输入两遍密码:123456
    1. [root@hub cert]# openssl req -new -key server.key -out server.csr
    2. Enter pass phrase for server.key:
    3. You are about to be asked to enter information that will be incorporated
    4. into your certificate request.
    5. What you are about to enter is what is called a Distinguished Name or a DN.
    6. There are quite a few fields but you can leave some blank
    7. For some fields there will be a default value,
    8. If you enter '.', the field will be left blank.
    9. -----
    10. Country Name (2 letter code) [XX]:CN
    11. State or Province Name (full name) []:JS
    12. Locality Name (eg, city) [Default City]:NJ
    13. Organization Name (eg, company) [Default Company Ltd]:DAVID
    14. Organizational Unit Name (eg, section) []:DAVID
    15. Common Name (eg, your name or your server's hostname) []:hub.david.com
    16. Email Address []:admin@david.com
    17. Please enter the following 'extra' attributes
    18. to be sent with your certificate request
    19. A challenge password []:
    20. An optional company name []:
    21. [root@hub cert]#

    备份私钥

    cp server.key server.key.org
    

    清除私钥密码

    1. openssl rsa -in server.key.org -out server.key
    2. 输入私钥密码:123456

    签名证书

    openssl x509 -req -days 1000 -in server.csr -signkey server.key -out server.crt
    
    1. chmod +x /data/cert/*
    2. cd /opt/harbor/
    3. ./install.sh

    浏览器访问

    1. 浏览器访问:https://hub.david.com
    2. 用户名:admin
    3. 密码:Harbor12345

    在一个node节点上登录harbor

    docker login -u admin -p Harbor12345 https://hub.david.com
    

    上传镜像

    1. docker tag nginx:latest hub.david.com/library/nginx:v1
    2. docker push hub.david.com/library/nginx:v1

    在master节点上删除之前创建的nginx资源

    1. kubectl delete deployment nginx
    2. kubectl run nginx-deployment --image=hub.david.com/library/nginx:v1 --port=80 --replicas=3
    3. kubectl expose deployment nginx-deployment --port=30000 --target-port=80
    4. kubectl get svc,pods
    1. yum install ipvsadm -y
    2. ipvsadm -Ln

    登录测试一下

    curl 10.96.14.134:30000
    
    1. kubectl edit svc nginx-deployment
    2. 25 type: NodePort #把调度策略改成NodePort

    浏览器访问

    1. kubectl get svc
    2. 浏览器访问:
    3. 192.168.204.171:30118
    4. 192.168.204.173:30118
    5. 192.168.204.175:30118

    9.内核参数优化方案

    1. cat > /etc/sysctl.d/kubernetes.conf <<EOF
    2. net.bridge.bridge-nf-call-iptables=1
    3. net.bridge.bridge-nf-call-ip6tables=1
    4. net.ipv4.ip_forward=1
    5. net.ipv4.tcp_tw_recycle=0
    6. vm.swappiness=0 #禁止使用 swap 空间,只有当系统内存不足(OOM)时才允许使用它
    7. vm.overcommit_memory=1 #不检查物理内存是否够用
    8. vm.panic_on_oom=0 #开启 OOM
    9. fs.inotify.max_user_instances=8192
    10. fs.inotify.max_user_watches=1048576
    11. fs.file-max=52706963 #指定最大文件句柄数
    12. fs.nr_open=52706963 #仅4.4以上版本支持
    13. net.ipv6.conf.all.disable_ipv6=1
    14. net.netfilter.nf_conntrack_max=2310720
    15. EOF

    二、实验

    1.Kubeadm部署K8S单Master架构

    (1)环境

    表1 环境

    master192.168.204.171docker、kubeadm、kubelet、kubectl、flannel4C/4G,cpu核心数要求大于2
    node01192.168.204.173docker、kubeadm、kubelet、kubectl、flannel2C/2G
    node02192.168.204.175docker、kubeadm、kubelet、kubectl、flannel2C/2G
    Harbor节点192.168.204.176docker、docker-compose、harbor-offline-v1.2.24C/4G

    2. 部署流程

    1. 1、在所有节点上安装Docker和kubeadm
    2. 2、部署Kubernetes Master
    3. 3、部署容器网络插件
    4. 4、部署 Kubernetes Node,将节点加入Kubernetes集群中
    5. 5、部署 Dashboard Web 页面,可视化查看Kubernetes资源
    6. 6、部署 Harbor 私有仓库,存放镜像资源

     3.环境部署

    (1)所有节点,关闭防火墙规则,关闭selinux,关闭swap交换for i in $(ls 

    (2)加载 ip_vs 模块

    (3)修改主机名

    所有节点修改hosts文件

    (4)调整内核参数

    master

    node1

    node2

    4.所有节点安装docker

    (1)安装

    安装依赖包

    添加repo


    安装docker

    (2)加速地址

    启动

    5.所有节点安装kubeadm,kubelet和kubectl

    (1)定义kubernetes源

    安装

    开机自启kubelet

    6.部署K8S集群

    (1)查看初始化需要的镜像

    (2)在 master 节点上传 kubeadm-basic.images.tar.gz 压缩包至 /opt 目录

    (3)使用for循环载入镜像

    (4)复制镜像和脚本到 node 节点,并在 node 节点上执行脚本 bash /opt/load-images.sh

    (5)初始化kubeadm

    方法一:

    修改配置文件


    启动


    因老版本问题,如此方法启动失败,需要降级docker版本并采用第二种方法

    方法二:

    kubernetes配置文件目录存放ca等证书和密码的目录

    (6)设定kubectl

        kubectl需经由API server认证及授权后方能执行相应的管理操作,kubeadm 部署的集群为其生成了一个具有管理员权限的认证配置文件 /etc/kubernetes/admin.conf,它可由 kubectl 通过默认的 “$HOME/.kube/config” 的路径进行加载。

    master节点生成token

    在 node 节点上执行 kubeadm join 命令加入群集

    查看所有节点(目前状态为NotReady)

    (7)所有节点部署网络插件flannel

    方法一:

    所有节点上传flannel镜像 flannel.tar 到 /opt 目录,master节点上传 kube-flannel.yml 文件

    在 master 节点创建 flannel 资源

    在master节点查看节点状态(需要等几分钟)

    测试 pod 资源创建

    暴露端口提供服务

    查询service

    测试访问

    扩展3个副本

    7.安装dashboard

    (1)所有节点安装dashboard

    方法一:

    所有节点上传dashboard镜像 dashboard.tar 到 /opt 目录,master节点上传kubernetes-dashboard.yaml文件

    查看所有容器运行状态

    使用浏览器访问

    创建service account并绑定默认cluster-admin管理员集群角色

    获取令牌密钥

    需要输入令牌

    复制token令牌直接登录网站

    登录成功

    8.安装Harbor私有仓库

    (1)在192.168.204.176服务器操作

    修改主机名

    所有节点加上主机名映射

    (2)  安装 docker

    已安装(经过20到18版本降级处理)

    修改镜像加速地址,所有 node 节点都修改 docker 配置文件,加上私有仓库配置


    启动

    (3)安装 Harbor

    上传 harbor-offline-installer-v1.2.2.tgz 和 docker-compose 文件到 /opt 目录

    修改配置文件

     生成证书,输入两遍密码:123456

    生成证书

    备份私钥

    清除私钥密码

    签名证书,输入私钥密码:123456

    浏览器访问

    登录界面

    输入账户密码

    登录成功

    在一个node节点上登录harbor

    上传镜像

    推送成功

    在master节点上删除之前创建的nginx资源

    安装

    登录测试一下

    把调度策略改成NodePort

    获取物理机端口映射地址为30118

    1. 浏览器访问:
    2. 192.168.204.171:30118
    3. 192.168.204.173:30118
    4. 192.168:204.175:30118

    三、问题

    1.加入k8s集群报错

    (1)报错

        [WARNING SystemVerification]: this Docker version is not on the list of validated versions: 24.0.5. Latest validated version: 18.09

    (2)原因分析

    此 Docker 版本不在已验证版本列表中:24.0.5。 最新验证版本:18.09

    (3)解决方法

    分别查看docker和k8s的版本

    1. kubectl version
    2. docker version

    降低docker版本到18.09

    查看当前仓库支持的docker版本:

    yum list docker-ce --showduplicates | sort -r
    

    选择18.09的版本,降级到18.06版本会报错

    语法: yum downgrade --setopt=obsoletes=0 -y docker-ce-v e r s i o n d o c k e r − c e − s e l i n u x − {version} docker-ce-selinux-versiondocker−ce−selinux−{version}

    降低docker版本到18.06.3.ce-3.el7
     

    yum downgrade --setopt=obsoletes=0 -y docker-ce-18.09.9-3.el7 docker-ce-cli-18.09.9-3.el7 containerd.io
    

    查看降级后版本

    1. systemctl start docker
    2. docker version

    2.Kubernetes各版本对应支持的docker版本列表

    (1)解决

    Kubernetes主要做Docker的容器化管理,总结一下如何查看k8s对应支持的docker版本的方法。

    在GitHub可以查看所有Kubernetets版本信息:https://github.com/kubernetes/kubernetes/releases

    1. 截止2019.08.09最新的版本支持信息:
    2. Kubernetes 1.15.2 –>Docker版本1.13.1、17.03、17.06、17.09、18.06、18.09
    3. Kubernetes 1.15.1 –>Docker版本1.13.1、17.03、17.06、17.09、18.06、18.09
    4. Kubernetes 1.15.0 –>Docker版本1.13.1、17.03、17.06、17.09、18.06、18.09
    5. Kubernetes 1.14.5 –>Docker版本1.13.1、17.03、17.06、17.09、18.06、18.09
    6. Kubernetes 1.14.4 –>Docker版本1.13.1、17.03、17.06、17.09、18.06、18.09
    7. Kubernetes 1.14.3 –>Docker版本1.13.1、17.03、17.06、17.09、18.06、18.09
    8. Kubernetes 1.14.2 –>Docker版本1.13.1、17.03、17.06、17.09、18.06、18.09
    9. Kubernetes 1.14.1 –>Docker版本1.13.1、17.03、17.06、17.09、18.06、18.09
    10. Kubernetes 1.14.0 –>Docker版本1.13.1、17.03、17.06、17.09、18.06、18.09
    11. Kubernetes 1.13.5 –>Docker版本1.11.1、1.12.1、1.13.1、17.03、17.06、17.09、18.06
    12. Kubernetes 1.13.5 –>Docker版本1.11.1、1.12.1、1.13.1、17.03、17.06、17.09、18.06
    13. Kubernetes 1.13.4 –>Docker版本1.11.1、1.12.1、1.13.1、17.03、17.06、17.09、18.06
    14. Kubernetes 1.13.3 –>Docker版本1.11.1、1.12.1、1.13.1、17.03、17.06、17.09、18.06
    15. Kubernetes 1.13.2 –>Docker版本1.11.1、1.12.1、1.13.1、17.03、17.06、17.09、18.06
    16. Kubernetes 1.13.1 –>Docker版本1.11.1、1.12.1、1.13.1、17.03、17.06、17.09、18.06
    17. Kubernetes 1.13.0 –>Docker版本1.11.1、1.12.1、1.13.1、17.03、17.06、17.09、18.06
    18. Kubernetes 1.12.* –>Docker版本1.11.1、1.12.1、1.13.1、17.03、17.06、17.09、18.06
    19. Kubernetes 1.11.* –>Docker版本1.11.2到1.13.1、17.03
    20. Kubernetes 1.10.* –>Docker版本1.11.2到1.13.1、17.03

    查看方式:

    1)老版本

    点击链接进入到GitHub中查找对应的版本后点击  CHANGELOG-1.15.md

    点进去查找docker versions:(页面现在存在404情况)

    2)新版本:

    点击链接进入到GitHub中查找对应的版本后点击 the CHANGELOG 

    3.Kubernetes 1.24 1.25 集群使用docker作为容器

    (1)问题

    在新版本Kubernetes环境(1.24以及以上版本)下官方不在支持docker作为容器运行时了,若要继续使用docker 需要对docker进行配置一番。需要安装cri-docker作为Kubernetes容器。

    (2)解决

    查看当前容器运行时

    1. # 查看指定节点容器运行时
    2. kubectl describe node k8s-node1 | grep Container
    3. Container Runtime Version: containerd://1.6.8
    4. # 查看所有节点容器运行时
    5. kubectl describe node | grep Container
    6. Container Runtime Version: containerd://1.6.8
    7. Container Runtime Version: containerd://1.6.8
    8. Container Runtime Version: containerd://1.6.8
    9. Container Runtime Version: containerd://1.6.8
    10. Container Runtime Version: containerd://1.6.8
    11. Container Runtime Version: containerd://1.6.8
    12. Container Runtime Version: containerd://1.6.8
    13. Container Runtime Version: containerd://1.6.8

    安装docker

    1. # 更新源信息
    2. yum update
    3. # 安装必要软件
    4. yum install -y yum-utils device-mapper-persistent-data lvm2
    5. # 写入docker源信息
    6. sudo yum-config-manager \
    7. --add-repo \
    8. https://mirrors.tuna.tsinghua.edu.cn/docker-ce/linux/centos/docker-ce.repo
    9. # 更新源信息并进行安装
    10. yum update
    11. yum install docker-ce docker-ce-cli containerd.io
    12. # 配置加速器
    13. sudo mkdir -p /etc/docker
    14. sudo tee /etc/docker/daemon.json <<-'EOF'
    15. {
    16. "registry-mirrors": ["https://XXXXXXXX.mirror.aliyuncs.com"],
    17. "exec-opts": ["native.cgroupdriver=systemd"]
    18. }
    19. EOF
    20. sudo systemctl daemon-reload
    21. sudo systemctl restart docker

    安装cri-docker

    1. # 由于1.24以及更高版本不支持docker所以安装cri-docker
    2. # 下载cri-docker
    3. wget https://ghproxy.com/https://github.com/Mirantis/cri-dockerd/releases/download/v0.2.5/cri-dockerd-0.2.5.amd64.tgz
    4. # 解压cri-docker
    5. tar xvf cri-dockerd-0.2.5.amd64.tgz
    6. cp cri-dockerd/cri-dockerd /usr/bin/
    7. # 写入启动配置文件
    8. cat > /usr/lib/systemd/system/cri-docker.service <<EOF
    9. [Unit]
    10. Description=CRI Interface for Docker Application Container Engine
    11. Documentation=https://docs.mirantis.com
    12. After=network-online.target firewalld.service docker.service
    13. Wants=network-online.target
    14. Requires=cri-docker.socket
    15. [Service]
    16. Type=notify
    17. ExecStart=/usr/bin/cri-dockerd --network-plugin=cni --pod-infra-container-image=registry.aliyuncs.com/google_containers/pause:3.7
    18. ExecReload=/bin/kill -s HUP $MAINPID
    19. TimeoutSec=0
    20. RestartSec=2
    21. Restart=always
    22. StartLimitBurst=3
    23. StartLimitInterval=60s
    24. LimitNOFILE=infinity
    25. LimitNPROC=infinity
    26. LimitCORE=infinity
    27. TasksMax=infinity
    28. Delegate=yes
    29. KillMode=process
    30. [Install]
    31. WantedBy=multi-user.target
    32. EOF
    33. # 写入socket配置文件
    34. cat > /usr/lib/systemd/system/cri-docker.socket <<EOF
    35. [Unit]
    36. Description=CRI Docker Socket for the API
    37. PartOf=cri-docker.service
    38. [Socket]
    39. ListenStream=%t/cri-dockerd.sock
    40. SocketMode=0660
    41. SocketUser=root
    42. SocketGroup=docker
    43. [Install]
    44. WantedBy=sockets.target
    45. EOF
    46. # 进行启动cri-docker
    47. systemctl daemon-reload ; systemctl enable cri-docker --now

    为kubelet配置容器运行时

    1. # 1.25 版本下 所有k8s节点配置kubelet service
    2. cat > /usr/lib/systemd/system/kubelet.service << EOF
    3. [Unit]
    4. Description=Kubernetes Kubelet
    5. Documentation=https://github.com/kubernetes/kubernetes
    6. After=containerd.service
    7. Requires=containerd.service
    8. [Service]
    9. ExecStart=/usr/local/bin/kubelet \\
    10. --bootstrap-kubeconfig=/etc/kubernetes/bootstrap-kubelet.kubeconfig \\
    11. --kubeconfig=/etc/kubernetes/kubelet.kubeconfig \\
    12. --config=/etc/kubernetes/kubelet-conf.yml \\
    13. --container-runtime-endpoint=unix:///run/cri-dockerd.sock \\
    14. --node-labels=node.kubernetes.io/node=
    15. [Install]
    16. WantedBy=multi-user.target
    17. EOF
    18. # 1.24 版本下 所有k8s节点配置kubelet service
    19. cat > /usr/lib/systemd/system/kubelet.service << EOF
    20. [Unit]
    21. Description=Kubernetes Kubelet
    22. Documentation=https://github.com/kubernetes/kubernetes
    23. After=containerd.service
    24. Requires=containerd.service
    25. [Service]
    26. ExecStart=/usr/local/bin/kubelet \\
    27. --bootstrap-kubeconfig=/etc/kubernetes/bootstrap-kubelet.kubeconfig \\
    28. --kubeconfig=/etc/kubernetes/kubelet.kubeconfig \\
    29. --config=/etc/kubernetes/kubelet-conf.yml \\
    30. --container-runtime=remote \\
    31. --runtime-request-timeout=15m \\
    32. --container-runtime-endpoint=unix:///run/cri-dockerd.sock \\
    33. --cgroup-driver=systemd \\
    34. --node-labels=node.kubernetes.io/node= \\
    35. --feature-gates=IPv6DualStack=true
    36. [Install]
    37. WantedBy=multi-user.target
    38. EOF
    39. # 重启
    40. systemctl daemon-reload
    41. systemctl restart kubelet
    42. systemctl enable --now kubelet

    验证

    1. # 查看指定节点容器运行时
    2. kubectl describe node k8s-node1 | grep Container
    3. Container Runtime Version: docker://20.10.17
    4. # 查看所有节点容器运行时
    5. kubectl describe node | grep Container
    6. Container Runtime Version: containerd://1.6.8
    7. Container Runtime Version: containerd://1.6.8
    8. Container Runtime Version: containerd://1.6.8
    9. Container Runtime Version: containerd://1.6.8
    10. Container Runtime Version: containerd://1.6.8
    11. Container Runtime Version: containerd://1.6.8
    12. Container Runtime Version: containerd://1.6.8
    13. Container Runtime Version: docker://20.10.17

    4.连接拒绝

    (1)报错

    (2)原因分析

    kubectl命令需要使用kubernetes-admin来运行,需要admin.conf文件(conf文件是通过“ kubeadmin init”命令在主节点/etc/kubernetes 中创建),但是从节点没有conf文件,也没有设置 KUBECONFIG =/root/admin.conf环境变量,所以需要复制conf文件到从节点,并设置环境变量就可以了

    (3)解决方法

    主节点的admin.conf拷贝到从节点,设置环境变量

    1. mkdir -p $HOME/.kube
    2. sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
    3. sudo chown $(id -u):$(id -g) $HOME/.kube/config

    1. #拷贝admin.conf注意路径
    2. echo "export KUBECONFIG=/etc/kubernetes/admin.conf" >> ~/.bash_profile
    3. source ~/.bash_profile

    执行

    成功

    5.kubeadm join命令将node加入master时报错

    (1)报错

    节点纳入管理失败,五分钟后超时放弃连接。

    出现error execution phase preflight: couldn't validate the identity of the API Server: abort connecting to API servers after timeout of 5m0s错误

    (2)原因分析

    token 过期:

    此时需要通过kubedam重新生成token

    1. [root@master opt]# kubeadm token generate
    2. 30nu35.cqbsmgdd15xnxh1t
    3. #下面这条命令中会用到该结果,根据token输出添加命令
    4. [root@master opt]# kubeadm token create 30nu35.cqbsmgdd15xnxh1t --print-join-command --ttl=0
    5. kubeadm join 192.168.204.171:6443 --token 30nu35.cqbsmgdd15xnxh1t --discovery-token-ca-cert-hash sha256:6d851b46ccd6c61a81d3aa08eae4971bc7a5ba32dd4918f7981c482e3fdd4d52

    k8s api server不可达:

    此时需要检查和关闭所有服务器的firewalldselinux

    1. [root@master ~]#setenforce 0
    2. [root@master ~]#sed -i 's/^SELINUX=enforcing$/SELINUX=permissive/' /etc/selinux/config
    3. [root@master ~]#systemctl disable firewalld --now

    (3)解决

    6.coredns一直处于ContainerCreating

    (1)报错

    coredns一直处于ContainerCreating状态

    (2)原因分析

    查询pod状态

    kubectl describe pods -n kube-system coredns-bccdc95cf-fjskt

    最后的事件监听为:

    发现这里报错了:

    1. FailedCreatePodSandBox: Failed create pod sandbox

    执行命令查看日志:

    sudo journalctl -xe | grep cni

     发现为:

    ailed to find plugin "flannel" in path [/opt/cni/bin]

    然后去/usr/local/bin目录下,发现在master和worker节点忘记拷贝flannel命令了。

    (3)解决方法

    需要下载CNI插件:CNI plugins v0.8.6

    github下载地址:https://github.com/containernetworking/plugins/releases/tag/v0.8.6

    (在1.0.0版本后CNI Plugins中没有flannel)

    下载后通过xftp 上传到Linux /home目录解压

    tar zxvf cni-plugins-linux-amd64-v0.8.6.tgz

    1)  node1节点

    2) node2节点

    ② 复制 flannel 到 /opt/cni/bin/

    cp flannel /opt/cni/bin/

    1)node1节点

    2)node2节点

    成功

    7.flannel如何分配子网

    (1)配置--pod-network-cidr

    1. kubeadm init \
    2. --apiserver-advertise-address=0.0.0.0 \
    3. --image-repository registry.aliyuncs.com/google_containers \
    4. --kubernetes-version=v1.15.1 \
    5. --service-cidr=10.1.0.0/16 \
    6. --pod-network-cidr=10.244.0.0/16
    7. --------------------------------------------------------------------------------------------
    8. 初始化集群需使用kubeadm init命令,可以指定具体参数初始化,也可以指定配置文件初始化。
    9. 可选参数:
    10. --apiserver-advertise-address:apiserver通告给其他组件的IP地址,一般应该为Master节点的用于集群内部通信的IP地址,0.0.0.0表示节点上所有可用地址
    11. --apiserver-bind-port:apiserver的监听端口,默认是6443
    12. --cert-dir:通讯的ssl证书文件,默认/etc/kubernetes/pki
    13. --control-plane-endpoint:控制台平面的共享终端,可以是负载均衡的ip地址或者dns域名,高可用集群时需要添加
    14. --image-repository:拉取镜像的镜像仓库,默认是k8s.gcr.io
    15. --kubernetes-version:指定kubernetes版本
    16. --pod-network-cidr:pod资源的网段,需与pod网络插件的值设置一致。通常,Flannel网络插件的默认为10.244.0.0/16,Calico插件的默认值为192.168.0.0/16;

    (2)更改kube-proxy配置

    更改

    kubectl edit configmap kube-proxy -n kube-system

    找到如下部分的内容

    1. minSyncPeriod: 0s
    2. scheduler: ""
    3. syncPeriod: 30s
    4. kind: KubeProxyConfiguration
    5. metricsBindAddress: 127.0.0.1:10249
    6. mode: "ipvs" # 加上这个
    7. nodePortAddresses: null

    其中mode原来是空,默认为iptables模式,改为ipvs

    scheduler默认是空,默认负载均衡算法为轮询

    (3)查看

    1. cd /run/flannel/
    2. vim subnet.env

    master节点:

    node1节点:

     node2节点

    8.其他机器无法登陆Harbor

    (1)报错

    (2)原因分析

    配置文件错误

    (3)解决方法

    检查dockerdaemon.json是否配置了insecure-registries。配置好后,需要使用systemctl reload docker重启docker服务。

    修改前:

    少一个逗号

    修改后:

    使用docker info查看配置

    修改前:

    修改后:

    成功

    9.pod删除不了

    (1) 报错

    pod镜像拉取失败一直删除不了

    (2)原因分析

    命令缺少pod

    1. # 加pod
    2. kubectl delete pod nginx-deployment-6959f4b694-nds9n
    3. kubectl delete pod nginx-deployment-6959f4b694-qmpd6

    (3)解决

    查看rs和deployment以及pod

    1. kubectl get pods -o wide
    2. kubectl get deployment

    删除deployment

    kubectl delete deployment nginx-deployment


    再次查看deployment

    再次查看pod,发现已成功删除

    四、总结

    K8S通过kubeadm安装出来以后都是以Pod方式存在,即底层是以容器方式运行,所以kubelet必须设置开机自启。

    使用Systemd管理的Cgroup来进行资源控制与管理,因为相对Cgroupfs而言,Systemd限制CPU、内存等资源更加简单和成熟稳定。

  • 相关阅读:
    【arcgis】地图数据加载优化方法
    Deep Learning-深度学习(二)
    预提交和 Git Hooks:自动化高质量代码
    【web-渗透测试方法】(15.5)测试访问控件
    【python自动化】01.安装配置库和环境之win32gui安装失败(保姆级图文)
    【笔记】《C++性能优化指南》Ch3 测量性能
    分享一种Android端IM即时通讯智能心跳算法
    Algorithms_LSM树(Log-Structured Merge Tree)
    Dubbo3应用开发——架构的演变过程
    java多线程中的Fork和Join
  • 原文地址:https://blog.csdn.net/cronaldo91/article/details/132663084