• 监控与升级


    主要内容

    1. 部署Metrics
    2. 升级控制平面

    预备知识

    Kubernetes 在每个级别上都提供了有关应用程序资源使用情况的详细信息,此信息可用来评估应用程序的性能,以及在何处可以消除瓶颈以提高整体性能。
    在 Kubernetes 中,应用程序监控不依赖单个监控解决方案。在新集群上,可以使用资源度量完整度量管道来收集监视统计信息。
    资源指标管道提供了一组与集群组件,例如 Horizontal Pod Autoscaler 控制器以及 kubectl top 实用程序相关的有限度量。这些指标是由轻量级的、短期、内存存储的 metrics-server 收集的,并通过 metrics.k8s.io 公开。

    1. 监控是指对特定系统、网络、设备或应用程序进行实时或定期的监视和跟踪,以确保其正常运行并及时发现和解决潜在问题。监控可以包括对系统性能、资源利用率、安全性、可用性等方面的监测。

    2. 升级是指对系统、软件、硬件或设备进行更新或升级,以提高其性能、功能或安全性。升级可以包括软件或固件的更新、硬件的更换或升级、系统配置的调整等。

    3. 监控与升级的关系是,监控可以帮助发现系统或设备的性能瓶颈、安全漏洞或其他问题,从而为升级提供依据。而升级可以通过提供新功能、修复漏洞、优化性能等方式来改善系统或设备的运行状态,从而提高监控的效果。

    在实际应用中,监控和升级通常是结合使用的。例如,可以通过监控系统的性能指标来确定是否需要对系统进行升级,比如增加硬件资源、优化软件配置等;另外,也可以通过监控系统的安全事件来及时发现并修复漏洞,以提高系统的安全性。

    常见的监控与升级工具包括网络监控工具、服务器监控工具、应用程序监控工具等。这些工具可以提供实时监控、报警通知、性能分析、日志记录等功能,帮助管理员及时发现和解决问题,同时也提供了升级和优化的支持。

    总之,监控与升级是保障系统运行稳定和安全的重要手段,通过监控系统状态并及时进行升级,可以提高系统的性能、可用性和安全性。


    一.部署Metrics

    Metrics是一种用于收集、存储和展示系统或应用程序的性能指标和统计数据的工具。它可以帮助开发人员和系统管理员实时监控系统的运行状态,并提供有关系统性能、资源利用率、错误率、请求延迟等方面的数据。

    部署Metrics可以通过以下步骤进行:

    1. 选择Metrics工具:根据需求选择适合的Metrics工具,常见的工具包括Prometheus、Grafana、InfluxDB等。

    2. 安装和配置Metrics工具:根据Metrics工具的官方文档,下载并安装Metrics工具,并进行必要的配置。配置通常包括指定要监控的目标、设置数据存储和展示方式等。

    3. 定义和收集指标:Metrics工具通常提供一些默认的指标,如CPU使用率、内存使用率等,但也可以根据需求定义自定义指标。定义指标时,需要确定指标的名称、类型(如计数器、测量值等)和标签(用于标识指标的维度)等。

    4. 集成Metrics工具:将Metrics工具集成到系统或应用程序中,以便在运行时收集和发送指标数据。这通常涉及到在代码中添加Metrics库、配置指标收集和发送的逻辑等。

    5. 可视化和分析指标:使用Metrics工具提供的可视化界面或API,展示和分析收集到的指标数据。这可以帮助用户实时监控系统状态、发现潜在问题,并进行性能优化和故障排查。

    Metrics的用法包括但不限于以下几个方面:

    1. 监控系统性能:通过收集和展示系统的各项指标,如CPU、内存、磁盘、网络等的使用率,可以实时监控系统的运行状态,及时发现和解决性能问题。

    2. 资源利用率分析:通过收集和展示资源的使用情况,可以了解系统的资源利用率,优化资源分配,提高系统的效率和可扩展性。

    3. 错误率和异常监控:通过收集和展示错误率、异常情况等指标,可以及时发现和解决系统中的错误和异常,提高系统的稳定性和可靠性。

    4. 请求延迟和吞吐量分析:通过收集和展示请求的延迟和吞吐量等指标,可以了解系统的性能瓶颈,优化系统的响应时间和吞吐能力。

    总之,部署Metrics可以帮助用户实时监控系统状态、发现问题、优化性能,并提供数据支持进行决策和规划。

    1.部署

    代码如下(示例):
    kubectl apply -f https://gitee.com/cnlxh/Kubernetes/raw/master/cka-yaml/metrics-components.yaml
    
    • 1

    部署好之后,执行 kubectl top 命令就会返回结果:
    在这里插入图片描述
    在这里插入图片描述

    2.解释

    "kubectl apply -f https://gitee.com/cnlxh/Kubernetes/raw/master/cka-yaml/metrics-components.yaml" 是一个使用kubectl命令部署Metrics组件的命令。
    
    具体解释如下:
    - "kubectl" 是 Kubernetes 命令行工具,用于与 Kubernetes 集群进行交互。
    - "apply" 是 kubectl 命令的一个子命令,用于应用或更新 Kubernetes 资源。
    - "-f" 是 apply 命令的一个选项,用于指定要应用的资源文件。
    - "https://gitee.com/cnlxh/Kubernetes/raw/master/cka-yaml/metrics-components.yaml" 是一个包含 Metrics 组件配置的 YAML 文件的URL地址。
    
    所以,这条命令的作用是将指定的 Metrics 组件配置文件应用到 Kubernetes 集群中。kubectl会根据该文件中的配置信息,创建或更新相应的 Kubernetes 资源,以部署和配置 Metrics 组件。
    
    请注意,执行此命令需要确保kubectl已正确安装并与所需的Kubernetes集群连接。
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11

    二.升级控制平面

    升级控制平面是指将Kubernetes集群的控制平面组件(如API服务器、调度器、控制器管理器等)升级到新的版本。控制平面的升级通常是为了获取新功能、修复漏洞、提高性能或改进稳定性。

    升级控制平面的详细步骤如下:

    1.备份数据:在进行任何升级操作之前,务必备份Kubernetes集群的数据。这样可以在升级过程中出现问题时,恢复到之前的状态。

    2.查看当前版本:使用kubectl命令查看当前集群的Kubernetes版本。可以运行以下命令来获取版本信息:

    kubectl version
    
    • 1

    3.查看可用版本:查看可用的Kubernetes版本,以确定要升级到的目标版本。可以查看Kubernetes官方文档或相关文档,了解可用版本的特性和变化。

    4.制定升级计划:根据集群的特性和需求,制定升级计划。这包括选择升级的版本、确定升级的时间窗口、准备升级所需的资源和工具等。

    5.备份配置文件:备份当前控制平面的配置文件,以便在升级过程中重新应用配置。这些配置文件通常位于/etc/kubernetes目录下。

    6.升级控制平面组件:根据升级计划,逐个升级控制平面组件。具体步骤可能因所使用的部署工具而有所不同,但一般包括以下几个步骤:

    • 停止当前版本的控制平面组件。
    • 下载和安装新版本的控制平面组件。
    • 启动新版本的控制平面组件。

    7.验证升级:在升级完成后,使用kubectl命令验证集群的状态和功能是否正常。可以运行一些基本的命令,如获取节点、获取Pod等,来确保集群正常运行。

    8.更新客户端工具:如果升级过程中使用的kubectl命令行工具也需要升级,可以根据官方文档或相关文档的说明,下载和安装新版本的kubectl工具。

    升级控制平面的用法会因部署工具的不同而有所差异。以下是一些常见的部署工具及其升级命令的示例:

    • 使用kubeadm进行部署的集群:

      • 升级kubeadm工具本身:根据官方文档的说明,下载和安装新版本的kubeadm工具。
      • 升级控制平面组件:使用kubeadm upgrade命令来升级控制平面组件。例如:
        kubeadm upgrade apply v1.21.0
        
        • 1
      • 升级kubelet和kube-proxy:根据官方文档的说明,逐个升级集群中的节点上的kubelet和kube-proxy组件。
    • 使用kubespray进行部署的集群:

      • 根据kubespray的文档,下载和安装新版本的kubespray。
      • 使用kubespray提供的升级脚本来升级控制平面组件。例如:
        ansible-playbook -i inventory/mycluster/hosts.ini --become --become-user=root cluster.yml
        
        • 1

    总之,升级控制平面是一个重要的操作,需要仔细计划和执行。在升级之前,务必备份数据,并确保了解目标版本的特性和变化。根据所使用的部署工具,按照相应的步骤和命令来进行升级操作,并在升级完成后验证集群的状态和功能。

    1.先确定要升级的版本

    代码如下(示例):
    apt list kubeadm -a
    
    • 1

    在这里插入图片描述

    2.禁止master节点接受新调度

    代码如下(示例):
    kubectl cordon cka-master
    kubectl get nodes
    
    
    • 1
    • 2
    • 3

    在这里插入图片描述

    3.驱逐master节点上的现有任务

    代码如下(示例):
    kubectl drain cka-master --ignore-daemonsets --delete-emptydir-data
    
    • 1

    在这里插入图片描述

    4.安装目标的kubeadm,kubectl,kubelet

    代码如下(示例):
    apt-get update
    apt-get install -y kubelet=1.27.1-00 kubeadm=1.27.1-00 kubectl=1.27.1-00
    
    • 1
    • 2

    在这里插入图片描述
    在这里插入图片描述

    5.查看可升级的列表并升级

    代码如下(示例):
    kubeadm upgrade plan
    kubeadm upgrade apply v1.27.1  --etcd-upgrade=false
    
    • 1
    • 2

    在这里插入图片描述
    在这里插入图片描述

    6.恢复master节点调度的能力

    代码如下(示例):
    systemctl restart kubelet
    kubectl uncordon cka-master
    kubectl get nodes
    
    • 1
    • 2
    • 3

    在这里插入图片描述

    7.解释

    - `apt list kubeadm -a`:查看可用的kubeadm版本。这个命令会列出所有可用的kubeadm版本,包括已安装的版本和可用的版本。
    
    - `kubectl cordon cka-master`:将节点 `cka-master` 标记为不可调度状态。这个命令会阻止新的Pod被调度到该节点上,但已经运行在该节点上的Pod不受影响。
    
    - `kubectl get nodes`:获取集群中所有节点的状态。这个命令会列出集群中所有节点的名称、状态、角色等信息。
    
    - `kubectl drain cka-master --ignore-daemonsets --delete-emptydir-data`:将节点 `cka-master` 上的所有Pod迁移到其他节点,并标记为删除。这个命令会触发Pod的迁移操作,确保该节点上的所有Pod被安全地迁移到其他节点上。
    
    - `apt-get update`:更新系统的软件包列表。
    
    - `apt-get install -y kubelet=1.27.1-00 kubeadm=1.27.1-00 kubectl=1.27.1-00`:安装指定版本的kubelet、kubeadm和kubectl。这个命令会下载并安装指定版本的Kubernetes组件。
    
    - `kubeadm upgrade plan`:查看当前集群的升级计划。这个命令会列出当前集群的版本和可用的升级版本,并提供升级的建议和注意事项。
    
    - `kubeadm upgrade apply v1.27.1 --etcd-upgrade=false`:执行升级操作,将集群升级到指定的版本。这个命令会自动升级控制平面组件,并根据需要升级etcd。在这个示例中,禁用了etcd的升级。
    
    - `systemctl restart kubelet`:重启kubelet服务,使其加载新版本的kubelet配置。
    
    - `kubectl uncordon cka-master`:将节点 `cka-master` 标记为可调度状态。这个命令会允许新的Pod被调度到该节点上。
    
    - `kubectl get nodes`:再次获取集群中所有节点的状态,以确认升级操作是否成功。
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21

    总结

    ETCD备份与恢复

    以上是今天要讲的内容,学到了监控与升级,包括部署Metrics,升级控制平面。

  • 相关阅读:
    【技术干货】根据身份证获取年龄,新手也能2分钟搞定~
    Backblaze 2023 Q3硬盘故障质量报告解读
    RK3568平台开发系列讲解(视频篇)视频渲染OpenGL ES是什么
    Redisson整合springCache和Redisson ttl -1
    信息学奥赛一本通 2082:【21NOIP提高组】报数 | 洛谷 P7960 [NOIP2021] 报数
    基于Matlab求解高教社杯全国大学生数学建模竞赛(CUMCM2012A题)-葡萄酒的评价(源码+数据)
    基于混沌搜索策略的鲸鱼优化算法-附代码
    unix网络编程-select函数
    RADIUS协议基础原理
    【Java系列】JDK 1.8 新特性之 Lambda表达式
  • 原文地址:https://blog.csdn.net/weixin_59994613/article/details/134019601