HPA(Horizontal Pod Autoscaler,水平 Pod 自动伸缩)是 Kubernetes 中的一种特性,其作用是根据资源使用情况自动调整 Pod 的副本数,以实现应用程序的自动扩展和收缩。
HPA 可以根据 CPU 使用率或其他自定义指标来自动扩展或收缩 Pod。每隔30s(可以通过–horizontal-pod-autoscaler-sync-period修改)查询metrics的资源使用情况,Pod 的 CPU 使用率超过了 HPA 的目标值,那么 HPA 将创建更多的 Pod 来处理更多的工作负载。反之,如果 CPU 使用率降低,那么 HPA 将删除一些 Pod 以减少资源消耗。这使得集群可以根据负载需求动态扩展或收缩应用程序。
HPA 常用于处理负载波动的应用程序,例如 Web 服务器、API 服务等。通过设置合适的 HPA 目标值和最小/最大 Pod 数量,可以确保集群始终保持在正确的资源使用级别,从而避免资源浪费和服务中断。通常用于 Deployment,不适用于无法扩/缩容的对象,如 DaemonSet
在创建 HPA 时,您需要指定以下参数:
通过 HPA 功能,Kubernetes 可以轻松地管理和调整应用程序的资源使用,提高了应用程序的可用性和容错性,在高负载时提供更好的响应能力,并减少了内存和 CPU 等资源的浪费。
kubectl autoscale deploy nginx-deploy --cpu-percent=20 --min=2 --max=5
kubectl get hpa
while true; do wget -q -O- http://192.168.31.100:30906 > /dev/null ; done