Prometheus 系统监控方案 二 安装与配置

下载Prometheus

下载最新安装包,本文说的都是在Linux x64下面内容,其它平台没尝试过,请选择合适的下载。

  • Prometheus 主程序,主要是负责存储、抓取、聚合、查询方面。
  • Alertmanager 程序,主要是负责实现报警功能。
  • Pushgateway 程序,主要是实现接收由Client push过来的指标数据,在指定的时间间隔,由主程序来抓取。
  • *_exporter 这类是不同系统已经实现了的集成。

下载解压,一般默认的配置就可以运行。

tar xvfz prometheus-*.tar.gz
cd prometheus-*

go写的东西,直接打包成二进制包了,其本上没有别的依赖。

下面我们主要来了解一下他的配置文件,这是一个非常重要的步聚。

配置Prometheus监控自已

Prometheus 通过默认 http://localhost:9090/metrics HTTP接口暴露了自己的性能指标数据,当然也就可以配置抓取目标 targets 为自己了。Prometheus 采集自身性能数据就是一个十分好的例子了,打开解压目录下面的prometheus.yml文件。

# 全局配置
global:
  scrape_interval:     15s # 默认 15秒到目标处抓取数据

  # 这个标签是在本机上每一条时间序列上都会默认产生的,主要可以用于 联合查询、远程存储、Alertmanger时使用。
  external_labels:
    monitor: 'codelab-monitor'

# 这里就表示抓取对象的配置
# 设置抓取自身数据
scrape_configs:
  #  job name 这个配置是表示在这个配置内的时间序例,每一条都会自动添加上这个{job_name:"prometheus"}的标签。
  - job_name: 'prometheus'

    # 重写了全局抓取间隔时间,由15秒重写成5秒。
    scrape_interval: 5s

    static_configs:
      - targets: ['localhost:9090']

启动Prometheus

使用刚才的配置文件启动Prometheus。

./prometheus -config.file=prometheus.yml

这时候Prometheus应该正确启动了,如果报错,请检查配置文件。(注意:yml格式是对缩进有要求的。) 使用浏览器打开该机器的 http://部署机器:9090 ,或者 http://localhost:9090/ 即可以看到Prometheus的graph页面了。一般等几秒抓取,就会有数据写进Prometheus里面了。

如果相验证Prometheus自己输出了什么性能数据,可以打开 http://localhost:9090/metrics 这个页面看看。

Prometheus默认是有多少个CPU内核就使用多少OS线程,主要是由GOMAXPROCS 这个环境变量控制的,开发GO的应该都清楚。一般默认就好了,太高的话可能会带来意想不到的后果。
Prometheus默认大概会占用3G左右的内存,如果想调小一点,得修改配置文件,或者添加启动参数。

使用Prometheus 自带的表达式浏览器

如果想查看Prometheus都抓了些什么数据,可以使用它内置的一个浏览页面。打开 http://localhost:9090/graph ,默认是在graph的页面。
试试在表达式 expression 输入框:

prometheus_target_interval_length_seconds

查询Promethues目标抓取间隔时间长度。执行后会返回很多条时间序列,Console 内列出的是最后一次抓到的数值。不同的标签表示不同的时间间隔和耗时%。

如果想查询99%的抓取耗时,可以这样:

prometheus_target_interval_length_seconds{quantile="0.99"}

如果想查询返回的时间序列有多少条,可以这样:

count(prometheus_target_interval_length_seconds)

暂时写到这了。

你可能感兴趣的:(IT-运维)