1、Prometheus简介
Prometheus是一套开源的系统监控和报警框架,灵感源自Google的Borgmon监控系统。2012年SoundCloud的Google员工创造了Prometheus,并作为社区开源项目进行开发。2015年该项目正式发布。2016年Prometheus加入云原生计算基金会(Cloud Native Computing Foundation),成为受欢迎度仅次于Kubernetes的项目。
Prometheus具有以下特性:
多维的数据模型(基于时间序列的Key、Value键值对)
灵活的查询和聚合语言PromQL
提供本地存储和分布式存储
通过基于HTTP的Pull模型采集时间序列数据
可利用Pushgateway(Prometheus的可选中间件)实现Push模式
可通过动态服务发现或静态配置发现目标机器
支持多种图表和数据大盘
2、部署Prometheus
1、系统环境
CentOS Linux release 7.5.1804 (Core)
IP地址 | 端口 | 版本 |
---|---|---|
10.10.35.130 | 9090 | Centos7.5 |
2、下载安装包
promethus两个官方下载路径:
https://prometheus.io
https://github.com/prometheus
根据实际情况到官网或者github下载安装包。
Prometheus的基本架构如下图:
从上图可以看到,整个 Prometheus 可以分为四大部分,分别是:
Prometheus 服务器
Prometheus Server 是 Prometheus组件中的核心部分,负责实现对监控数据的获取,存储以及查询。
NodeExporter 业务数据源
业务数据源通过 Pull/Push 两种方式推送数据到 Prometheus Server。
AlertManager 报警管理器
Prometheus 通过配置报警规则,如果符合报警规则,那么就将报警推送到 AlertManager,由其进行报警处理。
可视化监控界面
Prometheus 收集到数据之后,由 WebUI 界面进行可视化图标展示。可以通过自定义的 API 客户端进行调用数据展示,也可以直接使用 Grafana 解决方案来展示。
3、安装Prometheus
开始安装
1.解压安装包到指定目录,并设置软链接,查看版本
tar -zxvf prometheus-2.25.0.linux-amd64.tar.gz -C /data
ln -sv /data/prometheus-2.25.0.linux-amd64 /usr/local/prometheus
cd /usr/local/prometheus/
./prometheus --version
2.prometheus.yml配置文件注释
# my global config
global:
# 设置抓取数据的时间间隔,间隔设置为每15秒一次。
scrape_interval: 15s
# 设定抓取数据的超时时间
scrape_timeout: 15s
# 设置规则刷新,每15秒刷新一次规则。
evaluation_interval: 15s
# 监控报警配置(需要额外安装 alertmanager组件
alerting:
alertmanagers:
- static_configs:
# 设定alertmanager和prometheus交互的接口,即alertmanager监听的ip地址和端口,后续再配置
#- targets: ["xxx.xxx.xxx.xxx:9093"]
# 报警规则文件
rule_files:
# - "first_rules.yml"
#Prometheus与抓取模块交互的接口配置
scrape_configs:
# job一定要全局唯一, 采集 Prometheus 自身的 metrics
- job_name: 'prometheus'
static_configs:
- targets: ['10.10.35.130:9090']
#后续可配置文件自动发现功能,初次安装可以修改localhost为实际服务器IP地址
3.添加用户,后期用此账号启动服务
groupadd prometheus
useradd -g prometheus -s /sbin/nologin prometheus
4.建立数据目录,存放Prometheus数据,并授权
mkdir /usr/local/prometheus/data
chown -Rf prometheus:prometheus /data/prometheus-2.25.0.linux-amd64
5.设置启动服务
cat > /usr/lib/systemd/system/prometheus.service << 'EOF'
[Unit]
Description=Prometheus
Documentation=https://prometheus.io/
After=network.target
[Service]
# Type设置为notify时,服务会不断重启
Type=simple
User=prometheus
# --storage.tsdb.path是可选项,默认数据目录在运行目录的./dada目录中
ExecStart=/usr/local/prometheus/prometheus --config.file=/usr/local/prometheus/prometheus.yml --storage.tsdb.path=/usr/local/prometheus/data
Restart=on-failure
[Install]
WantedBy=multi-user.target
EOF
6.启动prometheus
systemctl daemon-reload
systemctl enable prometheus --now
Prometheus启动参数说明
--config.file -- 指明prometheus的配置文件路径
--web.enable-lifecycle -- 指明prometheus配置更改后可以进行热加载
--storage.tsdb.path -- 指明监控数据存储路径
--storage.tsdb.retention --指明数据保留时间
7.浏览器访问Prometheus自带的url
浏览器打开 IP:9090/targets 访问Prometheus,查看监控的节点
点击Endpoint中的地址,会显示当前服务器获取监控的信息。
Prometheus部署完成
4、安装Node_exporter
Node_exporter收集机器的系统数据,这里采用prometheus官方提供的exporter,除node_exporter外,官方还提供consul,memcached,haproxy,mysqld等exporter,具体可查看官网。所有被监控节点都需要安装Node_exporter,默认端口 9100
wget https://github.com/prometheus/node_exporter/releases/download/v1.0.1/node_exporter-1.0.1.linux-amd64.tar.gz
tar -zxvf node_exporter-1.0.1.linux-amd64.tar.gz -C /usr/local/
cd /usr/local/
mv node_exporter-1.0.1.linux-amd64 node_exporter
当然如果是用户节点也需要创建prometheus用户
groupadd prometheus
useradd -g prometheus -s /sbin/nologin prometheus
chown -Rf prometheus:prometheus /usr/local/node_exporter
设置node_exporter systemd启动单元
cat > /usr/lib/systemd/system/node_exporter.service << 'EOF'
[Unit]
Description=node_exporter
Documentation=https://prometheus.io/
After=network.target
[Service]
Type=simple
User=prometheus
ExecStart=/usr/local/node_exporter/node_exporter
Restart=on-failure
[Install]
WantedBy=multi-user.target
EOF
systemctl enable node_exporter --now
修改prometheus配置文件添加节点
vim /usr/local/prometheus/prometheus.yml
在文件尾部新增对其它节点的监控配置
- job_name: 'manager'
static_configs:
- targets: ['192.168.3.55:9100']
重启服务
systemctl restart prometheus.service
浏览器打开 IP:9090/targets 访问Prometheus,即能看见添加的节点。
5、基于文件的服务自动发现
Prometheus也提供了服务发现功能,可以从consul,dns,kubernetes,file等等多种来源发现新的目标。其中最容易配置的是从文件自动发现服务。配置了基于file_sd_configs的文件自动发现,添加完服务之后并不需要重启prometheus服务。所以当监控主机数量很多的时候,可以帮助我们解决很多棘手的问题。
1、修改prometheus.yml 配置文件,设置文件自动发现
vi /usr/local/prometheus/prometheus.yml
- job_name: 'nodes'
file_sd_configs:
- refresh_interval: 10s
files:
- "/usr/local/prometheus/config/*.yml"
2、创建服务发现文件
mkdir /usr/local/prometheus/config
vi /usr/local/prometheus/test.yml
- targets:
- 10.10.35.16:9100
labels:
app: "Apache-Tomcat"
instance: "10.10.35.170"
service: node_exporter
保存即可,prometheus会自动去读取config/目录下的yml文件。
3、浏览器打开 IP:9090/targets 访问Prometheus,选择Targets,即能看见基于文件自动发现的节点。