Informações básicas sobre HPAs

O Autoscaler Horizontal de Pods (HPA) é um recurso do Kubernetes que permite configurar seu cluster para escalar automaticamente os serviços que está executando para cima ou para baixo. Esta seção fornece uma explicação sobre como o HPA funciona com o Kubernetes.

Por que usar o Autoscaler Horizontal de Pods?

Usando o HPA, você pode escalar automaticamente o número de pods dentro de um controlador de replicação, implantação ou conjunto de réplicas para cima ou para baixo. O HPA escala automaticamente o número de pods que estão em execução para máxima eficiência. Os fatores que afetam o número de pods incluem:

Um número mínimo e máximo de pods permitidos para execução, conforme definido pelo usuário.
Uso de CPU/memória observado, conforme relatado nas métricas de recursos.
Métricas personalizadas fornecidas por aplicativos de métricas de terceiros, como Prometheus, Datadog, etc.

O HPA melhora seus serviços ao:

Liberar recursos de hardware que, de outra forma, seriam desperdiçados por um número excessivo de pods.
Aumentar/diminuir o desempenho conforme necessário para cumprir os contratos de nível de serviço.

Como o HPA funciona

O HPA é implementado como um loop de controle, com um período controlado pelas flags kube-controller-manager abaixo:

Flag Default Descrição

Flag	Default	Descrição
`--horizontal-pod-autoscaler-sync-period`	`30s`	Com que frequência o HPA audita métricas de recursos/métricas personalizadas em uma implantação.
`--horizontal-pod-autoscaler-downscale-delay`	`5m0s`	Após a conclusão de uma operação de redução, quanto tempo o HPA deve esperar antes de iniciar outra operação de redução.
`--horizontal-pod-autoscaler-upscale-delay`	`3m0s`	Após a conclusão de uma operação de aumento, quanto tempo o HPA deve esperar antes de iniciar outra operação de aumento.

--horizontal-pod-autoscaler-sync-period

30s

Com que frequência o HPA audita métricas de recursos/métricas personalizadas em uma implantação.

--horizontal-pod-autoscaler-downscale-delay

5m0s

Após a conclusão de uma operação de redução, quanto tempo o HPA deve esperar antes de iniciar outra operação de redução.

--horizontal-pod-autoscaler-upscale-delay

3m0s

Após a conclusão de uma operação de aumento, quanto tempo o HPA deve esperar antes de iniciar outra operação de aumento.

Para documentação completa sobre o HPA, consulte a Documentação do Kubernetes.

Objetos da API do Autoscaler Horizontal de Pods

O HPA é um recurso da API no grupo de API do Kubernetes autoscaling. A versão estável atual é autoscaling/v1, que inclui apenas suporte para escalonamento automático de CPU. Para obter suporte adicional para escalonamento com base em memória e métricas personalizadas, use a versão beta: autoscaling/v2beta1.

Para mais informações sobre o objeto da API HPA, consulte o Readme do HPA no GitHub.