Este documento foi traduzido usando tecnologia de tradução automática de máquina. Sempre trabalhamos para apresentar traduções precisas, mas não oferecemos nenhuma garantia em relação à integridade, precisão ou confiabilidade do conteúdo traduzido. Em caso de qualquer discrepância, a versão original em inglês prevalecerá e constituirá o texto official.

Informações básicas sobre HPAs

O Autoscaler Horizontal de Pods (HPA) é um recurso do Kubernetes que permite configurar seu cluster para escalar automaticamente os serviços que está executando para cima ou para baixo. Esta seção fornece uma explicação sobre como o HPA funciona com o Kubernetes.

Por que usar o Autoscaler Horizontal de Pods?

Usando o HPA, você pode escalar automaticamente o número de pods dentro de um controlador de replicação, implantação ou conjunto de réplicas para cima ou para baixo. O HPA escala automaticamente o número de pods que estão em execução para máxima eficiência. Os fatores que afetam o número de pods incluem:

  • Um número mínimo e máximo de pods permitidos para execução, conforme definido pelo usuário.

  • Uso de CPU/memória observado, conforme relatado nas métricas de recursos.

  • Métricas personalizadas fornecidas por aplicativos de métricas de terceiros, como Prometheus, Datadog, etc.

O HPA melhora seus serviços ao:

  • Liberar recursos de hardware que, de outra forma, seriam desperdiçados por um número excessivo de pods.

  • Aumentar/diminuir o desempenho conforme necessário para cumprir os contratos de nível de serviço.

Como o HPA funciona

HPA Schema

O HPA é implementado como um loop de controle, com um período controlado pelas flags kube-controller-manager abaixo:

Flag Default Descrição

--horizontal-pod-autoscaler-sync-period

30s

Com que frequência o HPA audita métricas de recursos/métricas personalizadas em uma implantação.

--horizontal-pod-autoscaler-downscale-delay

5m0s

Após a conclusão de uma operação de redução, quanto tempo o HPA deve esperar antes de iniciar outra operação de redução.

--horizontal-pod-autoscaler-upscale-delay

3m0s

Após a conclusão de uma operação de aumento, quanto tempo o HPA deve esperar antes de iniciar outra operação de aumento.

Para documentação completa sobre o HPA, consulte a Documentação do Kubernetes.

Objetos da API do Autoscaler Horizontal de Pods

O HPA é um recurso da API no grupo de API do Kubernetes autoscaling. A versão estável atual é autoscaling/v1, que inclui apenas suporte para escalonamento automático de CPU. Para obter suporte adicional para escalonamento com base em memória e métricas personalizadas, use a versão beta: autoscaling/v2beta1.

Para mais informações sobre o objeto da API HPA, consulte o Readme do HPA no GitHub.