一个菜鸟的prometheus学习日志(一)

人生的第一个CSDN博客,说起来还有些紧张。

第一天正式的看Prometheus,由于对youtube视频理解有些吃力,所以今天选择了看官方的文档和博客上的一些教程。

总的来说看了两部分内容。入门介绍以及概念。

入门介绍:

首先,Promethues是一款开源的基于时间序列数据库的监控报警系统。似乎是还比较容易理解的一句话,可以根据公司的需求对当前网络负载等的目标时间序列数据进行监控,然后超过某个特定的阈值进行报警并结合其他算法给出决策。而应用时间序列分析的相关知识又对时间序列进行建模预测,从而提前应对一些不良状况,为公司避免损失。当然这只是自己的一些想法,还没有看到具体的实例应用。

接着又介绍了Prometheus的一些优点,像查询灵活,无分布式存储依赖之类的,未具体应用,了解甚少。

下载

下载安装在官网很容易就完成了,然后需要我们对yml文件进行配置,这里配置的部分需要掌握。

配置

配置分为三个部分,分别是global,rule-file 和 scrape-configs。

global中有两个需要配置的变量,scrape interval:用来控制prometheus抓取数据的频率,也可以说是采样频率,默认15s; evaluation interval : 评估规则的间隔,默认15s。有了这两个变量就有了生成时间序列的基本规则。

rulefile暂时还没有用到。

scrapecofigs用来配置我们要监控的资源,也就是提供了数据抓取的地址。有点设置工作路径的意味。然后可以通过添加该项配置来添加监控对象。格式如下

  - job_name: node  #工作名称
    static_configs:

      - targets: ['localhost:9100'] #工作所指向的地址

prometheus里自己有一个监控自己的scrapefigs的配置,因此再不更改任何配置的情况下就可以先尝试运行prometheus了!

试运行

./prometheus --config.file=prometheus.yml

在控制台输入这样一行程序就可以运行了,然后在localhost:9090这个地址下就可以看到prometheus的控制台。

一个菜鸟的prometheus学习日志(一)_第1张图片

还可以通过地址后加/metric来查看指标,比如localhost:9090/metric。结果如下:

一个菜鸟的prometheus学习日志(一)_第2张图片

可以在console控制台输入对应的语句来查询满足对应规则的时间序列数据,这里具体的语法和函数还不太熟悉,举个简单的例子

count(http_requests_total)

用该函数可以查询时间序列数据的计数,也就是个数,不放图了。

然后就是graph的可视化功能,依然是选择你想要查看的标签,就能得到满足条件的可视化图像,很方便。比如

一个菜鸟的prometheus学习日志(一)_第3张图片

note:另外学到了一个up函数,up可以查询是否成功读取,感觉很有用。

这之后又试着添加了node exporter的配置,在执行键附近的下拉选项找到了node的时间序列数据,说明配置成功。

接着还看了一些概念,今晚要睡觉了,明天再写。

你可能感兴趣的:(Prometheus)