目前主流的监控系统prometheus,相比zabbix确实,prometheus确实很轻量级,很多功能都帮你做好,直接配置启动使用就好了。我写这个目的就是让你快速学会prometheus,两个小时,大家可以去腾讯课堂、网易云课堂搜索-《Prometheus运维监控》。

下面开始介绍你应该学的重点,整个是围绕prometheus架构来的,每个部分都会讲解,并且还有些延伸,涉及的地址、程序都给你准备好,多么的贴心。来看看架构吧。
prometheus快速实现监控系统_第1张图片

1. 架构介绍

整体讲解架构以及各个涉及的组件,让你快速了解各个组件的用途。优劣势介绍,以及适用场景

2. server端安装

2.1 prometheus server端安装

讲解server安装方法,如何进行配置,利用grafana进行数据浏览,想要很绚丽的浏览,可以看看《grafana运维监控》

3. Jobs/exporter

3.1 node_exporter安装 - 实现系统指标获取

讲解如何抓取系统监控指标,聚合展示,grafana的dashboard也已经给大家准备好了,直接用。

3.2 mysqld_exporter安装 - 实现MySQL指标获取

讲解如何抓取数据库监控指标,聚合展示,grafana的dashboard也已经给大家准备好了,直接用。

3.3 prometheus pushgateway - 解决跨网段问题

讲解了pushgateway方式获取数据,解决跨网段问题,间接讲解自定义job采集端

3.4 prometheus自定义exporter - 实现指标自定义

讲解自定义exporter程序,因为有些指标官方写的exporter程序中没有,利用这个知识就可以了。

4. PromQL

这部分也是prometheus的核心部分,它存储的数据是其他关系型数据库所不能比拟的,给我们节省了很多计算。

4.1 PromQL基本概念

讲解了指标的数据格式、类型。Histogram与Summary存在价值

4.2 PromQL基本查询

讲解了基本的查询方法,正则,时间位移,内置简单聚合操作

4.3 PromQL操作符

讲解了数学运算,布尔类型,匹配模式处理

4.4 PromQL聚合操作

讲解了内置的聚合运算,增长率问题,预测,分位数。动态标签替换

4.5 PromQL HTTP查询

基于http方式进行固定查询以及范围查询

5. 告警机制

5.1 prometheus告警规则设置

讲解了告警规则配置,如何让prometheus server触发告警

5.2 prometheus关联alertmanager、实现邮件告警

将prometheus server告警关联altermanager,实现邮件告警

5.3 prometheus路由route详解

讲解了分组机制,路由特性,这块认真学习,是告警的核心,能实现将多个告警合并成一个,以及将告警发给指定的组织。

5.4 prometheus抑制规则inhibit与临时静默

讲解了抑制特性与临时静默,实现告警进一步处理。也很重要,比如系统宕机了,只会发一个宕机的告警,其他就被抑制了,想想看这个功能是不是给你排查问题节约了不少时间。

5.5 prometheus钉钉告警

讲解了如何进行webhook-dingding编译,实现钉钉告警。编译是难点,我已经编译好了,你可以直接用我的。

6. 自动发现

6.1 prometheus基于文件的自动发现

讲解了如何利用文件的方式实现服务的自动发现。每次新增服务手动修改文件,就可以了,无需重启server。

6.2 prometheus基于consul的自动发现

讲解了如何利用http方式实现服务的自动发现。修改文件也很烦人,可以利用接口方式。

OK,欢迎评论区交流,或者去我的课程中进一步学习。