prometheus+grafana搭建监控系统

prometheus是一套系统和服务监控系统。它以给定的时间间隔从已配置的目标收集指标,评估规则表达式,显示结果,并在发现某些情况为真时触发警报。[prometheus官网]
grafana 是一款采用 go 语言编写的开源应用,主要用于大规模指标数据的可视化展现,是网络架构和应用分析中最流行的时序数据展示工具。[grafana官网]

下面我们将使用prometheus强大的数据采集分析功能,grafana优秀的前端展示能力,搭建一套监控系统。

准备工作

在每台机器上都需要先安装并启动docker。

  1. 安装docker
yum install docker
  1. 启动docker
service docker start

安装prometheus

1. 安装采集器

采集器有多种类型,比如采集系统数据,采集nginx数据,采集mysql数据等等。可以根据需要在目标主机上安装需要的采集器。可以根据自己的需要安装一个或多个。

安装linux指标采集器

docker run -d -p 9100:9100 -v "/proc:/host/proc:ro" -v "/sys:/host/sys:ro" -v "/:/rootfs:ro" prom/node-exporter

安装nginx指标采集器

docker run -d -p 9113:9113 --net="host" nginx/nginx-prometheus-exporter -nginx.scrape-uri http://localhost:8080/nginx_status

注意:nginx.scrape-uri后面的地址,可以通过curl 访问并返回指标数据。
如果不能正常访问则需要在nginx.conf配置文件中增加以下一段内容。

server {
    listen 8080
    location = /nginx_status {
        stub_status on;
                allow 127.0.0.1;
                deny all;
    }
}

安装cadvisor指标采集器
cadvisor可以监控docker容器的各种指标。

docker run   --volume=/:/rootfs:ro   --volume=/var/run:/var/run:ro   --volume=/sys:/sys:ro   --volume=/var/lib/docker/:/var/lib/docker:ro   --volume=/dev/disk/:/dev/disk:ro   --publish=8090:8080   --detach=true   --name=cadvisor   google/cadvisor

如果出现重名错误则执行以下语句后重新启动docker。

docker rm $(docker ps -a -q)

可能有些机器上会出现/sys/fs/cgroup/cpuacct,cpu: no such file or directory报错,执行以下语句后,重新启动docker。

ln -s /sys/fs/cgroup/cpu,cpuacct /sys/fs/cgroup/cpuacct,cpu

然后在prometheus.yml文件中进行相应配置即可。

使用docker-compose安装采集器

version: "2"
services:
  node_export:
    image: prom/node-exporter
    ports:
    - 8091:9100
    volumes:
    - /:/rootfs:ro

  cadvisor:
    image: google/cadvisor
    ports:
    - 8090:8080
    volumes:
    - /:/rootfs:ro
    - /var/run:/var/run:ro
    - /sys:/sys:ro
    - /var/lib/docker/:/var/lib/docker:ro

使用以下命令启动

docker-compose -f monitor-metrics.yaml up -d

2. 安装prometheus

创建prometheus配置文件。

mkdir /opt/prometheus
cd /opt/prometheus/
vi /opt/prometheus/prometheus.yml

文件内容如下,需要根据自己的实际情况进行修改

# Prometheus全局配置项
global:
  scrape_interval:     15s # 设定抓取数据的周期,默认为1min
  evaluation_interval: 15s # 设定更新rules文件的周期,默认为1min
  scrape_timeout: 15s # 设定抓取数据的超时时间,默认为10s
  external_labels: # 额外的属性,会添加到拉取得数据并存到数据库中
    monitor: 'codelab_monitor'


# Alertmanager配置
alerting:
  alertmanagers:
  - static_configs:
    - targets: ["localhost:9093"] # 设定alertmanager和prometheus交互的接口,即alertmanager监听的ip地址和端口
     
# rule配置,首次读取默认加载,之后根据evaluation_interval设定的周期加载
rule_files:
  - "alertmanager_rules.yml"
  - "prometheus_rules.yml"

# scape配置
scrape_configs:
- job_name: 'prometheus' # job_name默认写入timeseries的labels中,可以用于查询使用
  scrape_interval: 15s # 抓取周期,默认采用global配置
  static_configs: # 静态配置
  - targets: ['localhost:9100'] # prometheus所要抓取数据的地址,即instance实例项

- job_name: 'example-random' #个人测试用接口
  static_configs:
  - targets: ['localhost:8080']

主要是 scrape_configs 的配置,根据每一台要监控的机器,添加一组描述,targets里面填写采集器的ip和端口。job_name每个都不能相同。

这是一个配置的例子

global:
  scrape_interval:     60s
  evaluation_interval: 60s
 
scrape_configs:
  - job_name: prometheus
    static_configs:
      - targets: ['localhost:9090']
        labels:
          instance: prometheus
 
  - job_name: linux2
    static_configs:
      - targets: ['123.45.2.34:9100']
        labels:
          instance: order
          
  - job_name: linux3
    static_configs:
      - targets: ['123.45.2.39:9113']
        labels:
          instance: login

启动prometheus

docker run -d -p 9090:9090 --net=host -v /opt/prometheus/prometheus.yml:/etc/prometheus/prometheus.yml prom/prometheus

安装grafana

准备本地保存数据的目录。

mkdir /opt/grafana-storage
chmod 777 -R /opt/grafana-storage

启动grafana

docker run -d -p 3000:3000 --name=grafana --net=host -v /opt/grafana-storage:/var/lib/grafana grafana/grafana

接下来打开 http://localhost:3000
输入用户名 admin 密码 admin

配置prometheus数据源后,可以开始使用了。

使用docker-compose安装

准备本地保存数据的目录。

mkdir /opt/grafana-storage
chmod 777 -R /opt/grafana-storage
mkdir /opt/prometheus/storage
chmod 777 -R /opt/prometheus/storage

准备promethues.yaml文件

version: '2'
services:
  prometheus:
    image: prom/prometheus
    ports:
    - '9090:9090'
    volumes:
    - /opt/prometheus/prometheus.yml:/etc/prometheus/prometheus.yml
    - /opt/prometheus/storage:/prometheus
    - /usr/share/zoneinfo/Asia/Shanghai:/etc/localtime
    network_mode: "host"

  grafana:
    image: grafana/grafana
    ports:
    - '3000:3000'
    volumes:
    - /opt/grafana-storage:/var/lib/grafana
    - /usr/share/zoneinfo/Asia/Shanghai:/etc/localtime
    network_mode: "host"

启动prometheus

docker-compose -f promethues.yaml up -d

参考资料

https://prometheus.io/docs/prometheus/latest/querying/basics/
https://grafana.com/grafana/dashboards
https://www.cnblogs.com/Leslieblog/p/11157958.html
https://www.cnblogs.com/xiao987334176/p/9930517.html
Grafana 的一些使用技巧

你可能感兴趣的:(prometheus+grafana搭建监控系统)