网站首页 > 厂商资讯 > deepflow >

Prometheus 的监控指标有哪些常用指标？

在当今数字化时代，企业对IT系统的稳定性和性能要求越来越高。为了确保系统健康运行，监控系统成为了不可或缺的一部分。Prometheus 作为一款开源的监控解决方案，因其高效、灵活的特点被广泛使用。本文将详细介绍 Prometheus 的常用监控指标，帮助您更好地了解和使用 Prometheus。

一、Prometheus 简介

Prometheus 是一款开源监控系统，由 SoundCloud 开发，并于 2012 年开源。它以 Go 语言编写，具有高效、灵活、易于扩展等特点。Prometheus 的核心组件包括：Prometheus Server、Pushgateway、Prometheus Alertmanager 和 Grafana 等。

二、Prometheus 的常用监控指标

系统指标
- CPU 使用率：衡量 CPU 资源的使用情况，通常使用 cpu_usage 指标。
- 内存使用率：衡量内存资源的使用情况，通常使用 memory_usage 指标。
- 磁盘使用率：衡量磁盘资源的使用情况，通常使用 disk_usage 指标。
- 网络流量：衡量网络带宽的使用情况，通常使用 network_bytes_sent 和 network_bytes_received 指标。
应用指标
- HTTP 请求：衡量 HTTP 服务的请求量，通常使用 http_requests_total 指标。
- 数据库连接数：衡量数据库连接数的变化，通常使用 db_connections 指标。
- 服务状态：衡量服务的健康状态，通常使用 service_status 指标。
自定义指标
- 自定义指标：根据业务需求，自定义监控指标，例如 user_count、order_count 等。

三、案例分析

以下是一个简单的 Prometheus 监控案例：

假设我们有一个电商平台，需要监控以下指标：

CPU 使用率
内存使用率
磁盘使用率
HTTP 请求量
数据库连接数

首先，我们需要配置 Prometheus 的 scrape 配置文件，使其能够从目标服务器上采集指标数据。以下是一个示例配置：

scrape_configs:

  - job_name: 'my_platform'

    static_configs:

      - targets: ['192.168.1.1:9090']

其中，192.168.1.1 是目标服务器的 IP 地址，9090 是 Prometheus Server 的端口。

接下来，我们需要在目标服务器上安装 Prometheus Agent，并配置相应的指标。以下是一个简单的示例：

exporters:

  - job_name: 'node_exporter'

    static_configs:

      - targets: ['192.168.1.1:9100']



scrape_configs:

  - job_name: 'my_platform'

    static_configs:

      - targets: ['192.168.1.1:9090']

其中，node_exporter 是一个用于采集系统指标的 Agent，192.168.1.1:9100 是其端口。

最后，我们可以使用 Grafana 来可视化这些指标。以下是一个 Grafana 配置示例：

apiVersion: monitoring.coreos.com/v1

kind: PrometheusRule

metadata:

  name: my_platform_rules

  namespace: monitoring

spec:

  groups:

    - name: my_platform_rules

      rules:

        - record: 'cpu_usage'

          expr: '100 - (100 * (1 - (sum(rate(container_cpu_usage_seconds_total{image!="", cluster="my_platform"}[5m])) by (cluster))) * 100)'

        - record: 'memory_usage'

          expr: '100 - (100 * (1 - (sum(rate(container_memory_usage_bytes{image!="", cluster="my_platform"}[5m])) by (cluster))) * 100)'

        - record: 'disk_usage'

          expr: '100 - (100 * (1 - (sum(rate(container_fs_usage_bytes{image!="", cluster="my_platform"}[5m])) by (cluster))) * 100)'

        - record: 'http_requests_total'

          expr: 'sum(rate(http_requests_total{cluster="my_platform"}[5m]))'

        - record: 'db_connections'

          expr: 'sum(container_db_connections{cluster="my_platform"}[5m])'

通过以上配置，我们可以监控到 CPU 使用率、内存使用率、磁盘使用率、HTTP 请求量和数据库连接数等指标，并在 Grafana 中进行可视化展示。

四、总结

Prometheus 作为一款优秀的开源监控系统，具有丰富的监控指标和灵活的配置方式。通过本文的介绍，相信您已经对 Prometheus 的常用监控指标有了更深入的了解。在实际应用中，可以根据业务需求自定义监控指标，确保系统健康稳定运行。