本文档采用自动化机器翻译技术翻译。 尽管我们力求提供准确的译文,但不对翻译内容的完整性、准确性或可靠性作出任何保证。 若出现任何内容不一致情况,请以原始 英文 版本为准,且原始英文版本为权威文本。

为工作负载设置监控

如果您只需要工作负载的 CPU 和内存时间序列,则无需部署 ServiceMonitor 或 PodMonitor,因为监控应用程序默认已收集资源使用的指标数据。

为工作负载设置监控的步骤取决于您是否希望获取基本指标(如 CPU 和内存),或者您是否希望从工作负载中抓取自定义指标。

如果您只需要工作负载的 CPU 和内存时间序列,则无需部署 ServiceMonitor 或 PodMonitor,因为监控应用程序默认已收集资源使用的指标数据。资源使用时间序列数据存储在 Prometheus 的本地时间序列数据库中。

Grafana 以汇总的方式显示数据,但您可以使用 PromQL 查询查看特定工作负载的数据。一旦您有了 PromQL 查询,您可以在 Prometheus UI 中单独执行该查询,并查看可视化的时间序列,或者您可以使用该查询自定义 Grafana 仪表板以显示工作负载指标。有关工作负载指标的 PromQL 查询示例,请参见 本节

要为您的工作负载设置自定义指标,您需要设置一个导出器并创建一个新的 ServiceMonitor 自定义资源,以配置 Prometheus 从您的导出器抓取指标。

显示工作负载的 CPU 和内存指标

默认情况下,监控应用程序已经抓取了 CPU 和内存。

要获取特定工作负载的详细信息,您可以自定义 Grafana 仪表板以显示特定工作负载的指标。

设置除 CPU 和内存之外的指标

对于自定义指标,您需要以 Prometheus 支持的格式在您的应用程序中公开指标。

然后我们建议您创建一个新的 ServiceMonitor 自定义资源。当创建此资源时,Prometheus 自定义资源将自动更新,以便其抓取配置包括新的自定义指标端点。然后 Prometheus 将开始从该端点抓取指标。

您还可以创建一个 PodMonitor 来公开自定义指标端点,但 ServiceMonitor 更适合大多数用例。