Surveillance et Tableaux de Bord

L’application rancher-monitoring peut déployer rapidement des solutions de surveillance et d’alerte Open Source de premier plan sur votre cluster.

Introduite dans Rancher v2.5, l’application est alimentée par Prometheus, Grafana, Alertmanager, le Prometheus Operator, et le Prometheus adapter.

Pour des informations sur la surveillance et l’alerte V1, disponibles dans Rancher v2.2 jusqu’à v2.4, veuillez consulter la documentation Rancher v2.0—v2.4 sur xref:[la surveillance des clusters], xref:[l’alerte], xref:[les notificateurs] et d’autres xref:[outils].

En utilisant l’application rancher-monitoring, vous pouvez rapidement déployer des solutions de surveillance et d’alerte Open Source de premier plan sur votre cluster.

Fonctions

Prometheus vous permet de visualiser des métriques provenant de vos objets Rancher et Kubernetes. En utilisant des horodatages, Prometheus vous permet d’interroger et de visualiser ces métriques dans des graphiques et des visuels faciles à lire, soit via l’interface utilisateur de Rancher, soit via Grafana, qui est une plateforme d’analyse déployée avec Prometheus.

En visualisant les données que Prometheus collecte depuis votre plan de contrôle de cluster, vos nœuds et vos déploiements, vous pouvez rester informé de tout ce qui se passe dans votre cluster. Vous pouvez ensuite utiliser ces analyses pour mieux gérer votre organisation : interrompre les urgences système avant qu’elles ne commencent, développer des stratégies de maintenance, ou restaurer des serveurs en panne.

L’application de surveillance :

Surveille l’état et les processus de vos nœuds de cluster, des composants Kubernetes et des déploiements logiciels.
Définit des alertes basées sur des métriques collectées via Prometheus.
Crée des tableaux de bord Grafana personnalisés.
Configure des notifications basées sur des alertes par e-mail, Slack, PagerDuty, etc. en utilisant Prometheus Alertmanager.
Définit des expressions pré-calculées, fréquemment nécessaires ou coûteuses en calcul comme de nouvelles séries temporelles basées sur des métriques collectées via Prometheus.
Expose les métriques collectées de Prometheus à l’API des métriques personnalisées Kubernetes via l’adaptateur Prometheus pour une utilisation dans HPA.

Voir Comment fonctionne la surveillance pour une explication de la façon dont les composants de surveillance fonctionnent ensemble.

Composants et déploiements par défaut

Tableaux de bord intégrés

Par défaut, l’application de surveillance déploie des tableaux de bord Grafana (curés par le projet kube-prometheus) sur un cluster.

Elle déploie également une interface utilisateur Alertmanager et une interface utilisateur Prometheus. Pour plus d’informations sur ces outils, voir Tableaux de bord intégrés.

Exportateurs de métriques par défaut

Par défaut, Rancher Monitoring déploie des exportateurs (tels que node-exporter et kube-state-metrics).

Ces exportateurs par défaut récupèrent automatiquement les métriques pour l’UC et la mémoire de tous les composants de votre cluster Kubernetes, y compris vos charges de travail.

Alertes par défaut

L’application de surveillance déploie certaines alertes par défaut. Pour voir les alertes par défaut, allez à l’interface utilisateur Alertmanager et cliquez sur Développer tous les groupes.

Composants exposés dans l’interface utilisateur Rancher

Pour une liste des composants de surveillance exposés dans l’interface utilisateur Rancher, ainsi que des cas d’utilisation courants pour les modifier, voir cette section.

Contrôle d’accès en fonction du rôle

Pour plus d’informations sur la configuration de l’accès à la surveillance, voir cette page.

Les permissions de lecture de Rancher et de projet ne s’appliquent pas nécessairement aux ressources de surveillance. Voir monitoring-ui-view pour plus de détails.

Guides

Configuration

Configuration des ressources de surveillance dans Rancher

La référence de configuration suppose une familiarité avec le fonctionnement des composants de surveillance ensemble. Pour plus d’informations, voir Comment fonctionne la surveillance.

Configuration des options du graphique Helm

Pour plus d’informations sur les options de rancher-monitoring graphique, y compris les options pour définir les limites et les demandes de ressources, voir Options du graphique Helm.

Prise en charge des grappes Windows

Pour pouvoir déployer complètement la surveillance V2 pour Windows, tous vos hôtes Windows doivent avoir une version minimale de wins v0.1.0.

Pour plus de détails sur la façon de mettre à niveau wins sur les hôtes Windows existants, voir Prise en charge des grappes Windows pour la surveillance V2.

Problèmes connus

Il existe un problème connu selon lequel les grappes K3s nécessitent plus de mémoire que celle allouée par défaut. Si vous activez la surveillance sur une grappe K3s, définissez prometheus.prometheusSpec.resources.memory.limit à 2500 Mi et prometheus.prometheusSpec.resources.memory.request à 1750 Mi.

Voir Débogage de l’utilisation élevée de la mémoire pour des conseils et des recommandations.