NVIDIA-Treiber-Toolkit

Das nvidia-driver-toolkit Add-on ermöglicht es Ihnen, NVIDIA GRID KVM-Treiber außerhalb des Bandes auf Ihren bestehenden SUSE Virtualization Clustern bereitzustellen.

Das Toolkit enthält nur das korrekte SUSE Virtualization Betriebssystem-Image, Build-Utilities und Kernel-Header, die es ermöglichen, NVIDIA-Treiber aus dem Container zu kompilieren und zu laden. Sie müssen die NVIDIA KVM-Treiber mit einem gültigen NVIDIA-Abonnement herunterladen. Für Anleitungen zur Identifizierung des richtigen Treibers für Ihre NVIDIA GPU siehe die NVIDIA-Dokumentation.

Jede neue SUSE Virtualization Version wird mit dem korrekten nvidia-driver-toolkit Image veröffentlicht, um sicherzustellen, dass alle Abhängigkeiten, die zur Installation der NVIDIA vGPU KVM-Treiber erforderlich sind, im Image verfügbar sind.

Das SUSE Virtualization ISO enthält nicht das nvidia-driver-toolkit Container-Image. Aufgrund seiner Größe wird das Image standardmäßig von Docker Hub heruntergeladen. Wenn Sie eine Air-Gapped-Umgebung haben, können Sie das Image herunterladen und in Ihr privates Repository hochladen. Die Felder Image Repository und Image Tag auf dem nvidia-driver-toolkit Bildschirm bieten Informationen über das Image, das Sie herunterladen müssen.

nvidia driver toolkit

Um das Add-on zu aktivieren, müssen Sie den HTTP-Speicherort angeben, an dem sich die NVIDIA vGPU KVM-Treiberdatei befindet. Sie können auch das Image-Repository und das Image-Tag bei Bedarf aktualisieren. Sobald das Add-on aktiviert ist, wird ein nvidia-driver-toolkit DaemonSet im Cluster bereitgestellt.

Beim Start des Pods lädt das ENTRYPOINT-Skript den NVIDIA-Treiber von dem angegebenen Treiberstandort herunter. Installieren Sie den Treiber und laden Sie die Kernel-Treiber.

Das pcidevices-controller Add-on kann nun dieses Add-on nutzen, um den Lebenszyklus der vGPU-Geräte auf Knoten mit unterstützten GPU Geräten zu verwalten.

Installation verschiedener NVIDIA-Treiberversionen

Die NVIDIA-Treiberversionen können zwischen den Cluster-Knoten variieren. Wenn Sie eine bestimmte Treiberversion auf einem Knoten installieren möchten, müssen Sie den Knoten annotieren, bevor Sie das nvidia-driver-toolkit Add-on starten.

kubectl annotate nodes {node name} sriovgpu.harvesterhci.io/custom-driver=https://[driver location]

Das Add-on installiert den angegebenen Treiber beim Start.

Wenn ein NVIDIA-Treiber zuvor installiert war, müssen Sie den Pod neu starten, um den Installationsprozess erneut auszulösen.