|
Dieses Dokument wurde mithilfe automatisierter maschineller Übersetzungstechnologie übersetzt. Wir bemühen uns um korrekte Übersetzungen, übernehmen jedoch keine Gewähr für die Vollständigkeit, Richtigkeit oder Zuverlässigkeit der übersetzten Inhalte. Im Falle von Abweichungen ist die englische Originalversion maßgebend und stellt den verbindlichen Text dar. |
Hintergrundinformationen zu HPAs
Der Horizontal Pod Autoscaler (HPA) ist eine Kubernetes-Funktion, die es Ihnen ermöglicht, Ihren Cluster so zu konfigurieren, dass die Dienste, die er ausführt, automatisch hoch- oder heruntergefahren werden. Dieser Abschnitt bietet eine Erklärung, wie HPA mit Kubernetes funktioniert.
Warum den Horizontal Pod Autoscaler verwenden?
Mit HPA können Sie die Anzahl der Pods innerhalb eines Replikationscontrollers, Deployments oder Replica Sets automatisch hoch- oder herunterfahren. HPA skaliert die Anzahl der laufenden Pods automatisch, um maximale Effizienz zu gewährleisten. Faktoren, die die Anzahl der Pods beeinflussen, sind:
-
Eine vom Benutzer festgelegte minimale und maximale Anzahl an Pods.
-
Beobachtete CPU- und Speicherauslastung, wie sie in den Ressourcenmetriken berichtet wird.
-
Benutzerdefinierte Metriken, die von Drittanbieter-Metrikanwendungen wie Prometheus, Datadog usw. bereitgestellt werden.
HPA verbessert Ihre Dienste, indem es:
-
Hardware-Ressourcen freigibt, die andernfalls durch eine übermäßige Anzahl von Pods verschwendet würden.
-
Die Leistung nach Bedarf erhöhen oder verringern, um die Service-Level-Vereinbarungen einzuhalten.
Wie HPA funktioniert
HPA wird als Regelkreis implementiert, mit einem Zeitraum, der durch die folgenden kube-controller-manager Flags gesteuert wird:
| Flaggen | Standard | Beschreibung |
|---|---|---|
|
|
Wie oft HPA die Ressourcen- bzw. benutzerdefinierten Metriken in einem Deployment überprüft. |
|
|
Nach Abschluss einer Herunterskalierungsoperation, wie lange HPA warten muss, bevor eine weitere Herunterskalierungsoperation gestartet wird. |
|
|
Nach Abschluss einer Hochskalierungsoperation, wie lange HPA warten muss, bevor eine weitere Hochskalierungsoperation gestartet wird. |
Für die vollständige Dokumentation zu HPA verweisen Sie auf die Kubernetes-Dokumentation.
API-Objekte des Horizontal Pod Autoscalers
HPA ist eine API-Ressource in der Kubernetes autoscaling API-Gruppe. Die aktuelle stabile Version ist autoscaling/v1, die nur Unterstützung für CPU-Autoskalierung bietet. Um zusätzliche Unterstützung für die Skalierung basierend auf Speicher und benutzerdefinierten Metriken zu erhalten, verwenden Sie stattdessen die Beta-Version: autoscaling/v2beta1.
Für weitere Informationen über das HPA-API-Objekt siehe das HPA GitHub Readme.