Hintergrundinformationen zu HPAs

Der Horizontal Pod Autoscaler (HPA) ist eine Kubernetes-Funktion, die es Ihnen ermöglicht, Ihren Cluster so zu konfigurieren, dass die Dienste, die er ausführt, automatisch hoch- oder heruntergefahren werden. Dieser Abschnitt bietet eine Erklärung, wie HPA mit Kubernetes funktioniert.

Warum den Horizontal Pod Autoscaler verwenden?

Mit HPA können Sie die Anzahl der Pods innerhalb eines Replikationscontrollers, Deployments oder Replica Sets automatisch hoch- oder herunterfahren. HPA skaliert die Anzahl der laufenden Pods automatisch, um maximale Effizienz zu gewährleisten. Faktoren, die die Anzahl der Pods beeinflussen, sind:

Eine vom Benutzer festgelegte minimale und maximale Anzahl an Pods.
Beobachtete CPU- und Speicherauslastung, wie sie in den Ressourcenmetriken berichtet wird.
Benutzerdefinierte Metriken, die von Drittanbieter-Metrikanwendungen wie Prometheus, Datadog usw. bereitgestellt werden.

HPA verbessert Ihre Dienste, indem es:

Hardware-Ressourcen freigibt, die andernfalls durch eine übermäßige Anzahl von Pods verschwendet würden.
Die Leistung nach Bedarf erhöhen oder verringern, um die Service-Level-Vereinbarungen einzuhalten.

Wie HPA funktioniert

HPA wird als Regelkreis implementiert, mit einem Zeitraum, der durch die folgenden kube-controller-manager Flags gesteuert wird:

Flaggen Standard Beschreibung

Flaggen	Standard	Beschreibung
`--horizontal-pod-autoscaler-sync-period`	`30s`	Wie oft HPA die Ressourcen- bzw. benutzerdefinierten Metriken in einem Deployment überprüft.
`--horizontal-pod-autoscaler-downscale-delay`	`5m0s`	Nach Abschluss einer Herunterskalierungsoperation, wie lange HPA warten muss, bevor eine weitere Herunterskalierungsoperation gestartet wird.
`--horizontal-pod-autoscaler-upscale-delay`	`3m0s`	Nach Abschluss einer Hochskalierungsoperation, wie lange HPA warten muss, bevor eine weitere Hochskalierungsoperation gestartet wird.

--horizontal-pod-autoscaler-sync-period

30s

Wie oft HPA die Ressourcen- bzw. benutzerdefinierten Metriken in einem Deployment überprüft.

--horizontal-pod-autoscaler-downscale-delay

5m0s

Nach Abschluss einer Herunterskalierungsoperation, wie lange HPA warten muss, bevor eine weitere Herunterskalierungsoperation gestartet wird.

--horizontal-pod-autoscaler-upscale-delay

3m0s

Nach Abschluss einer Hochskalierungsoperation, wie lange HPA warten muss, bevor eine weitere Hochskalierungsoperation gestartet wird.

Für die vollständige Dokumentation zu HPA verweisen Sie auf die Kubernetes-Dokumentation.

API-Objekte des Horizontal Pod Autoscalers

HPA ist eine API-Ressource in der Kubernetes autoscaling API-Gruppe. Die aktuelle stabile Version ist autoscaling/v1, die nur Unterstützung für CPU-Autoskalierung bietet. Um zusätzliche Unterstützung für die Skalierung basierend auf Speicher und benutzerdefinierten Metriken zu erhalten, verwenden Sie stattdessen die Beta-Version: autoscaling/v2beta1.

Für weitere Informationen über das HPA-API-Objekt siehe das HPA GitHub Readme.