阿里云Prometheus监控服务

什么是Prometheus?

Prometheus是一个开源系统监控和警报工具包

原生Prometheus:Overview | Prometheus

工作原理:prometheus原理简介_袁胜的博客的博客-CSDN博客_prometheus原理

框架:

阿里云Prometheus监控服务_第1张图片

阿里云Prometheus

1.简介:

阿里云Prometheus监控全面对接开源Prometheus生态,支持类型丰富的组件监控,提供多种开箱即用的预置监控大盘,且提供全面托管的Prometheus服务。

名词解释请参考阿里云Prometheus官方文档说明。

说明 Prometheus是一套开源的监控报警系统。主要特点包括多维数据模型、灵活查询语句PromQL以及数据可视化展示等。更多信息,请参见Prometheus官方文档。

2.使用:应用实时监控服务ARMS

1)创建Prometheusf实例

for云服务:

1.适合通过Prometheus监控来统一采集、存储和显示阿里云各种云服务的监控数据的场景。支持的云服务包括ECS、RDS、消息服务RocketMQ、消息服务Kafka等

2.目前我们公司服务都部署ecs ,阿里云Prometheus直接接入即可。

阿里云Prometheus监控服务_第2张图片

for VPC:

1.适合需要在阿里云VPC内(通常为ECS集群)进行Prometheus监控的场景。可通过集成中心添加VPC内的应用和组件的监控。

2.目前我们公司的redis,mq等组件虽然是部署在ecs但是为独立搭建,不是阿里云集成组件,所以用vpc实例去监控

阿里云Prometheus监控服务_第3张图片

创建好之后就可以看到实例列表。

2)组件接入

进入接入中心,选择需要接入的组件,这里选择我们公司的三个组件,数据库用的RDS直接接入了云服务,这里无需监控

阿里云Prometheus监控服务_第4张图片

对接入的组件进行配置:输入对应的地址及端口密码

阿里云Prometheus监控服务_第5张图片

3)配置相关安全组,使数据得以监控

如下图提示,在添加对应组件后,需看对应的端口是否在安全组白名单里

阿里云Prometheus监控服务_第6张图片

安全组链接,如已经在范围内则无需再添加

阿里云Prometheus监控服务_第7张图片

4)查看大盘列表

接入后在vpc实例里即可看见监控的组件列表

阿里云Prometheus监控服务_第8张图片

在云服务实例列表查看监控的ecs服务及rds

阿里云Prometheus监控服务_第9张图片

进入云服务ecs监控界面,选择需要查看的服务,即可查看实时的服务情况

阿里云Prometheus监控服务_第10张图片

5)监控告警及通知

设置联系人

可设置真人和机器人 真人直接添加即可 机器人如下:

1.选择群聊创建机器人

阿里云Prometheus监控服务_第11张图片

2.将机器人地址复制到这 进行添加

阿里云Prometheus监控服务_第12张图片

设置告警规则

阿里云Prometheus监控服务_第13张图片

1.自定义PromQL 针对阿里云产品,静态阈值针对k8s pod的内存

2.我们选择自定义PromQL即可,以及选好监控的实例

3.选择参考指标,或者自己写PromQL

4.告警内容可以编辑,为了区分是哪个服务发出的,可以打印实例名称 {{ $labels.instanceName }} 系统原来是打印id一眼看不出是哪个服务。

5.可以选择对应的通知策略,或不指定。

注意: 因为告警规则监控目标只能精确到 实例 以及哪个云产品上不能区分到具体哪个服务上,所以不能针对具体服务去创建告警规则,也不能针对哪个环境去创建,只能通过创建和分配不同的通知策略去区分 不同环境和服务。请见通知策略

阿里云Prometheus监控服务_第14张图片

设置通知策略

1.针对具体需要监控的服务,或者具体的环境去创建通知策略

2.可将该策略分配给具体的告警规则。

3.创建好后保存启用即可

阿里云Prometheus监控服务_第15张图片

告警处理

1.Prometheus将会把创建好的告警通过通知策略发送给对应的联系人

2.收到报警后,可对报警进行处理,如未处理在设置好的时间后持续发出告警,直到报警恢复

阿里云Prometheus监控服务_第16张图片

你可能感兴趣的:(后端,云原生,cloud,native)