• 八、K8S之HPA自动扩缩容


    HPA

    一、概念

    HPA(Horizontal Pod Autoscaler,水平 Pod 自动伸缩)是 Kubernetes 中的一种特性,其作用是根据资源使用情况自动调整 Pod 的副本数,以实现应用程序的自动扩展和收缩。

    HPA 可以根据 CPU 使用率或其他自定义指标来自动扩展或收缩 Pod。每隔30s(可以通过–horizontal-pod-autoscaler-sync-period修改)查询metrics的资源使用情况,Pod 的 CPU 使用率超过了 HPA 的目标值,那么 HPA 将创建更多的 Pod 来处理更多的工作负载。反之,如果 CPU 使用率降低,那么 HPA 将删除一些 Pod 以减少资源消耗。这使得集群可以根据负载需求动态扩展或收缩应用程序。

    HPA 常用于处理负载波动的应用程序,例如 Web 服务器、API 服务等。通过设置合适的 HPA 目标值和最小/最大 Pod 数量,可以确保集群始终保持在正确的资源使用级别,从而避免资源浪费和服务中断。通常用于 Deployment,不适用于无法扩/缩容的对象,如 DaemonSet

    在创建 HPA 时,您需要指定以下参数:

    • 目标资源:每个 Pod 根据 HPA 所监视的资源管理器对象进行计算。
    • 目标平均使用率:这是指将资源用量(如 CPU 或内存)与每个 Pod 的请求资源量相对比。HPA 根据此指标确定要在群集中启动的 Pod 的数量。
    • 最小 Pod 数量和最大 Pod 数量:根据当前的负载情况,HPA 将自动扩展或收缩 Pod 的数量,但是不能超出设置的最小和最大 Pod 数量。

    通过 HPA 功能,Kubernetes 可以轻松地管理和调整应用程序的资源使用,提高了应用程序的可用性和容错性,在高负载时提供更好的响应能力,并减少了内存和 CPU 等资源的浪费。

    二、使用

    • 创建
    kubectl  autoscale deploy nginx-deploy --cpu-percent=20 --min=2 --max=5
    
    • 1
    • 获取 HPA 信息
    kubectl get hpa 
    
    • 1

    三、测试脚本

    while true; do wget -q -O- http://192.168.31.100:30906 > /dev/null ; done
    
    • 1
  • 相关阅读:
    tag单调栈-单调栈预备知识-lt.739. 每日温度
    qemu在ARM和X86平台上的运行机制分析
    docker 集群管理实战mesos+zookeeper+marathon(一)
    应用程序转换工具Unite mac中文版软件特点
    CSS之margin塌陷
    C语言的缺陷与陷阱
    Linux离线安装插件
    Android Studio CMake 中的 aux_source_directory 有什么作用?
    获取两个字符串的最大公共子序列(LCS)
    攻防演习防御体系构建之第一篇之介绍和防守的四个阶段
  • 原文地址:https://blog.csdn.net/qq_39381892/article/details/133849079