Festplattenzustandsüberwachung

Festplattenzustandsmetriken

Ab SUSE Storage v1.11.0 sind Metriken zur Festplattenzustandsüberwachung sowohl für die V1- als auch für die V2-Datenengine verfügbar. Diese Metriken bieten Einblicke in den Festplattenzustand.

  • SUSE Storage sammelt Gesundheitsdaten alle 10 Minuten.

  • Bestimmte virtualisierte oder Cloud-Umgebungen (zum Beispiel AWS EBS) geben keine vollständigen SMART-Daten preis, was zu Nullwerten für bestimmte Attribute führt.

  • Verfügbare Gesundheitsattribute variieren je nach Festplattentyp und Hardware.

  • Der vollständige Satz gesammelter Gesundheitsdaten ist in den nodes.longhorn.io benutzerdefinierten Ressourcen (CRs) verfügbar.

Datenquellen

  • V1-Datenengine: Gesundheitsdaten werden mit dem SMART-Überwachungstool (smartctl) gesammelt.

  • V2-Datenengine:

    • NVMe-Festplatten: Gesundheitsdaten werden über SPDK abgerufen.

    • AIO-Festplatten: Gesundheitsdaten werden mit dem SMART-Überwachungstool (smartctl) gesammelt.

Gesundheitsdaten werden je nach Festplattentyp unterschiedlich bezogen:

  • V1-Festplatten und V2 AIO-Festplatten: über SMART

  • V2 NVMe-Festplatten: über SPDK

Verfügbare Attribute und Formate variieren je nach Festplattentyp und Hardware. Für Details:

Gesundheitsattribute

Die longhorn_disk_health_attribute_raw-Metrik gibt rohe Attributwerte mit den folgenden Bezeichnungen aus:

  • attribute: Name des Attributs.

  • attribute_id: Attribut-ID, wenn sie von der Erfassungsmethode bereitgestellt wird.

  • disk: Longhorn-Disk-Identifikator.

  • node: Name des Knotens.

SMART-Daten sind möglicherweise nicht auf allen Plattformen verfügbar, insbesondere bei Cloud-Anbietern. Wenn SMART nicht unterstützt wird, erscheinen Gesundheitsmetriken als 0.

Hinweise

  • Verwandtes GitHub-Problem #12016.