Informations de base sur les HPA

Le Horizontal Pod Autoscaler (HPA) est une fonctionnalité de Kubernetes qui vous permet de configurer votre cluster pour mettre à l’échelle automatiquement les services qu’il exécute. Cette section fournit une explication sur le fonctionnement de l’HPA avec Kubernetes.

Pourquoi utiliser le Horizontal Pod Autoscaler ?

En utilisant l’HPA, vous pouvez automatiquement ajuster le nombre de pods au sein d’un contrôleur de réplication, d’un déploiement ou d’un ensemble de réplicas, à la hausse ou à la baisse. L’HPA ajuste automatiquement le nombre de pods en cours d’exécution pour une efficacité maximale. Les facteurs qui affectent le nombre de pods incluent :

Un nombre minimum et maximum de pods autorisés à s’exécuter, tel que défini par l’utilisateur.
L’utilisation observée de l’UC/mémoire, telle que rapportée dans les métriques de ressources.
Des métriques personnalisées fournies par des applications de métriques tierces comme Prometheus, Datadog, etc.

L’HPA améliore vos services en :

Libérant des ressources matérielles qui seraient autrement gaspillées par un nombre excessif de pods.
Augmentant/diminuant les performances selon les besoins pour respecter les contrats de niveau de service.

Comment fonctionne l’HPA

L’HPA est mis en œuvre comme une boucle de contrôle, avec une période contrôlée par les kube-controller-manager indicateurs ci-dessous :

Indicateur Par défaut Description

Indicateur	Par défaut	Description
`--horizontal-pod-autoscaler-sync-period`	`30s`	À quelle fréquence l’HPA audite les métriques de ressources et les métriques personnalisées dans un déploiement.
`--horizontal-pod-autoscaler-downscale-delay`	`5m0s`	Après l’achèvement d’une opération de réduction, combien de temps l’HPA doit-il attendre avant de lancer une nouvelle opération de réduction.
`--horizontal-pod-autoscaler-upscale-delay`	`3m0s`	Après l’achèvement d’une opération d’augmentation, combien de temps l’HPA doit-il attendre avant de lancer une nouvelle opération d’augmentation.

--horizontal-pod-autoscaler-sync-period

30s

À quelle fréquence l’HPA audite les métriques de ressources et les métriques personnalisées dans un déploiement.

--horizontal-pod-autoscaler-downscale-delay

5m0s

Après l’achèvement d’une opération de réduction, combien de temps l’HPA doit-il attendre avant de lancer une nouvelle opération de réduction.

--horizontal-pod-autoscaler-upscale-delay

3m0s

Après l’achèvement d’une opération d’augmentation, combien de temps l’HPA doit-il attendre avant de lancer une nouvelle opération d’augmentation.

Pour une documentation complète sur l’HPA, reportez-vous à la Documentation Kubernetes.

Objets de l’API Horizontal Pod Autoscaler

HPA est une ressource API dans le groupe d’API Kubernetes autoscaling. La version stable actuelle est autoscaling/v1, qui inclut uniquement le support pour l’autoscaling de l’UC. Pour obtenir un support supplémentaire pour la mise à l’échelle basée sur la mémoire et sur des métriques personnalisées, utilisez plutôt la version bêta : autoscaling/v2beta1.

Pour plus d’informations sur l’objet API HPA, consultez le README GitHub de l’HPA.