Activer la surveillance

En tant que administrateur ou propriétaire de cluster, vous pouvez configurer Rancher pour déployer Prometheus afin de surveiller votre cluster Kubernetes.

Cette page décrit comment activer la surveillance et l’alerte au sein d’un cluster en utilisant la nouvelle application de surveillance.

Vous pouvez activer la surveillance avec ou sans SSL.

Configuration requise

Autorisez le trafic sur le port 9796 pour chacun de vos nœuds. Prometheus collecte des métriques à partir de ces ports.
- Vous devrez peut-être également autoriser le trafic sur le port 10254 pour chacun de vos nœuds, si PushProx est désactivé (ingressNginx.enabled défini sur false), ou si vous avez mis à niveau à partir d’une version précédente de Rancher qui avait déjà la surveillance v1 installée.
Assurez-vous que votre cluster respecte les exigences en matière de ressources. Le cluster doit disposer d’au moins 1950Mi de mémoire disponible, 2700m d’UC et 50Gi de stockage. Voir Configurer les limites et les demandes de ressources pour un aperçu des limites et des demandes de ressources.

Si vous souhaitez configurer Alertmanager, Grafana ou Ingress, cela doit être fait avec les paramètres du déploiement du chart Helm. Il est problématique de créer Ingress en dehors du déploiement.

Configuration des limites et des demandes de ressources

Les demandes et limites de ressources peuvent être configurées lors de l’installation de rancher-monitoring. Pour configurer les ressources de Prometheus depuis l’interface utilisateur de Rancher, cliquez sur Apps Surveillance dans le coin supérieur gauche.

Pour plus d’informations sur les limites par défaut, voir cette page.

Installer l’application de surveillance

Activer la surveillance pour une utilisation sans SSL

Cliquez sur ☰ > Gestion des clusters.
Allez au cluster que vous avez créé et cliquez sur Explorer.
Cliquez sur Outils de cluster (coin inférieur gauche).
Cliquez sur Installer associé à la surveillance.
Facultatives : Personnalisez les demandes, les limites et plus pour Alertes, Prometheus et Grafana dans l’étape Valeurs. Pour obtenir de l’aide, consultez la référence de configuration.

Résultat : L’application de surveillance est déployée dans l’espace de noms cattle-monitoring-system.

Activer la surveillance pour une utilisation avec SSL

Suivez les étapes sur cette page pour créer un secret afin que SSL puisse être utilisé pour les alertes.
- Le secret doit être créé dans l’espace de noms cattle-monitoring-system. S’il n’existe pas, créez-le d’abord.
- Ajoutez les fichiers ca, cert et key au secret.
Dans le coin supérieur gauche, cliquez sur ☰ > Gestion des clusters.
Sur la page Clusters, allez au cluster où vous souhaitez activer la surveillance pour une utilisation avec SSL et cliquez sur Explorer.
Cliquez sur Apps Charts.
Cliquez sur Surveillance.
Cliquez sur Installer ou Mettre à jour, selon que vous avez déjà installé la surveillance.
Cochez la case pour Personnaliser les options Helm avant l’installation et cliquez sur Suivant.
Cliquez sur Alertes.
Dans le champ Secrets supplémentaires, ajoutez les secrets créés précédemment.

Résultat : L’application de surveillance est déployée dans l’espace de noms cattle-monitoring-system.

Lorsque vous créez un récepteur via xref:observability/monitoring-and-dashboards/configuration/receivers.adoc#_creating_receivers_in_the_rancher_ui, les récepteurs activés par SSL, tels qu’un email ou un webhook, disposeront d’une section SSL avec des champs pour Chemin du fichier CA, Chemin du fichier Cert et Chemin du fichier Clé. Remplissez ces champs avec les chemins de chacun de ca, cert et key. Le chemin sera de la forme /etc/alertmanager/secrets/name-of-file-in-secret.

Par exemple, si vous avez créé un secret avec ces paires clé-valeur :

ca.crt=`base64-content`
cert.pem=`base64-content`
key.pfx=`base64-content`

Alors Chemin du fichier Cert serait défini sur /etc/alertmanager/secrets/cert.pem.

Tableau de bord de performance Rancher

Lorsque la surveillance est installée sur le cluster en amont (local), vous recevez des métriques de santé de base concernant les pods Rancher, telles que les données sur l’UC et la mémoire. Pour obtenir des métriques avancées pour votre serveur Rancher local, vous devez également activer le tableau de bord de performance Rancher pour Grafana.

Ce tableau de bord donne accès aux métriques avancées suivantes :

Temps d’exécution moyen des gestionnaires au cours des 5 dernières minutes
Temps de requête moyen de l’API Rancher au cours des 5 dernières minutes
Temps de requête moyen des abonnements au cours des 5 dernières minutes
Profondeur de la file de travail du contrôleur Lasso (Top 20)
Nombre de requêtes Rancher (Top 20)
Nombre de requêtes API Rancher échouées (Top 20)
Temps de requête moyen du proxy K8s Store au cours des 5 dernières minutes (Top 20)
Temps de requête moyen du client proxy K8s au cours des 5 dernières minutes (Top 20)
Objets mis en cache par GroupVersionKind (Top 20)
Exécutions des gestionnaires Lasso (Top 20)
Exécutions des gestionnaires au cours des 2 dernières minutes (Top 20)
Total des exécutions de gestionnaires avec erreur (Top 20)
Données transmises par les sessions de composeur à distance (Top 20)
Erreurs pour les sessions de composeur à distance (Top 20)
Connexions de composeur à distance supprimées (Top 20)
Connexions de composeur à distance ajoutées par le client (Top 20)

Les données de profilage (telles que l’analyse avancée de la mémoire ou de l’UC) ne sont pas présentes, car il s’agit d’une technique très dépendante du contexte, destinée au débogage et non à l’observation normale.

Activation du tableau de bord de performance Rancher

Pour activer le tableau de bord de performance Rancher :

Helm
UI

Utilisez les options suivantes avec le CLI Helm :

--set extraEnv\[0\].name="CATTLE_PROMETHEUS_METRICS" --set-string extraEnv\[0\].value=true

Vous pouvez également inclure le snippet suivant dans le fichier values.yaml de votre chart Helm Rancher :

extraEnv:
  - name: "CATTLE_PROMETHEUS_METRICS"
    value: "true"

Cliquez sur ☰ > Gestion des clusters.
Allez à la ligne du cluster local et cliquez sur Explorer.
Cliquez sur Charges de travail Déploiements.
Utilisez le menu déroulant en haut pour filtrer par Tous les espaces de noms.
Sous l’espace de noms cattle-system, allez à la ligne rancher et cliquez sur ⋮ > Modifier la configuration
Sous Variables d’environnement, cliquez sur Ajouter une variable.
Pour Type, sélectionnez Key/Value Pair.
Pour Nom de la variable, entrez CATTLE_PROMETHEUS_METRICS.
Pour Valeur, entrez true.
Cliquez sur Enregistrer pour appliquer le changement.

Accéder au tableau de bord de performance Rancher

Cliquez sur ☰ > Gestion des clusters.
Allez à la ligne du cluster local et cliquez sur Explorer.
Cliquez sur Surveillance
Sélectionnez le tableau de bord Grafana.
Dans la barre latérale, cliquez sur Rechercher des tableaux de bord.
Entrez Rancher Performance Debugging et sélectionnez-le.