Prometheus系列:Prometheus 配置文件详解(告警规则)

目录

# 告警规则

配置alertmanager


 

 

# 配置告警规则

rules一般在单独的文件中定义,然后在prometheus.yml中引用,可以在prometheus.yml文件中看到如下内容:

Prometheus系列:Prometheus 配置文件详解(告警规则)_第1张图片

 默认first_rules.yml和second_rules.yml都是注释状态,需要去掉前面的“#”,新建first_rules.yml,rules文件格式如下:

groups:
- name: example
  rules:
  - alert:  InstanceDown
    expr: up == 0
    for: 1m
    labels:
      severity: critical
    annotations:
      summary: Instance has been down for more than 5 minutes

 Prometheus系列:Prometheus 配置文件详解(告警规则)_第2张图片

在告警规则文件中,我们可以将一组相关的规则设置定义在一个group下。在每一个group中我们可以定义多个告警规则(rule)。一条告警规则主要由以下几部分组成:

 alert:告警规则的名称。
 expr:基于PromQL表达式告警触发条件,用于计算是否有时间序列满足该条件。
 for:评估等待时间,可选参数。用于表示只有当触发条件持续一段时间后才发送告警。在等待期间新产生告警的状态为pending。
 labels:自定义标签,允许用户指定要附加到告警上的一组附加标签。
 annotations:用于指定一组附加信息,比如用于描述告警详细信息的文字等,annotations的内容在告警产生时会一同作为参数发送到Alertmanager。summary描述告警的概要信息,description用于描述告警的详细信息。同时Alertmanager的UI也会根据这两个标签值,显示告警信息。

 

 

检查是否生效

  Prometheus系列:Prometheus 配置文件详解(告警规则)_第3张图片

 

Prometheus系列:Prometheus 配置文件详解(告警规则)_第4张图片

 

 

 

配置alertmanager

告警规则配置完成后,需要注意,还要在prometheus.yml中配置alertmanager的地址:

Prometheus系列:Prometheus 配置文件详解(告警规则)_第5张图片

 

# 告警确认

当产生告警时,下面页面就会出现哪些告警已经发送给AlertManager了

Prometheus系列:Prometheus 配置文件详解(告警规则)_第6张图片

 

 

Prometheus系列:Prometheus 配置文件详解(告警规则)_第7张图片

Prometheus系列:Prometheus 配置文件详解(告警规则)_第8张图片

你可能感兴趣的:(Prometheus,AlertManager)