Información básica sobre los HPA

El Escalador horizontal de pods (HPA) es una característica de Kubernetes que permite configurar tu clúster para escalar automáticamente los servicios que se están ejecutando hacia arriba o hacia abajo. Esta sección proporciona una explicación sobre cómo funciona el HPA con Kubernetes.

¿Por qué utilizar el Escalador horizontal de pods?

Usando el HPA, puedes escalar automáticamente el número de pods dentro de un controlador de replicación, ampliación o conjunto de réplicas hacia arriba o hacia abajo. El HPA escala automáticamente el número de pods que se están ejecutando para lograr la máxima eficiencia. Los factores que afectan el número de pods incluyen:

Un número mínimo y máximo de pods permitidos para ejecutarse, según lo definido por el usuario.
Uso de CPU/memoria observado, según lo informado en las métricas de recursos.
Métricas personalizadas proporcionadas por aplicaciones de métricas de terceros como Prometheus, Datadog, etc.

El HPA mejora tus servicios al:

Liberar recursos de hardware que de otro modo se desperdiciarían por un número excesivo de pods.
Aumentar/disminuir el rendimiento según sea necesario para cumplir con los Acuerdos de nivel de servicio.

Cómo funciona el HPA

El HPA se implementa como un bucle de control, con un período controlado por las banderas kube-controller-manager a continuación:

Indicadores Default Descripción

Indicadores	Default	Descripción
`--horizontal-pod-autoscaler-sync-period`	`30s`	Con qué frecuencia el HPA audita métricas de recursos/métricas personalizadas en un despliegue.
`--horizontal-pod-autoscaler-downscale-delay`	`5m0s`	Tras la finalización de una operación de reducción, cuánto tiempo debe esperar el HPA antes de lanzar otra operación de reducción.
`--horizontal-pod-autoscaler-upscale-delay`	`3m0s`	Tras la finalización de una operación de aumento, cuánto tiempo debe esperar el HPA antes de lanzar otra operación de aumento.

--horizontal-pod-autoscaler-sync-period

30s

Con qué frecuencia el HPA audita métricas de recursos/métricas personalizadas en un despliegue.

--horizontal-pod-autoscaler-downscale-delay

5m0s

Tras la finalización de una operación de reducción, cuánto tiempo debe esperar el HPA antes de lanzar otra operación de reducción.

--horizontal-pod-autoscaler-upscale-delay

3m0s

Tras la finalización de una operación de aumento, cuánto tiempo debe esperar el HPA antes de lanzar otra operación de aumento.

Para la documentación completa sobre el HPA, consulta la Documentación de Kubernetes.

Objetos de la API del HPA

HPA es un recurso de API en el grupo de API de Kubernetes autoscaling. La versión estable actual es autoscaling/v1, que solo incluye soporte para la autoescalación de CPU. Para obtener soporte adicional para el escalado basado en memoria y métricas personalizadas, utiliza la versión beta en su lugar: autoscaling/v2beta1.

Para más información sobre el objeto de la API HPA, consulta el Readme de HPA en GitHub.