pushgateway 是一种采用被动推送的方式(而不是 exporter主动获取)获取监控数据的 prometheus 插件
官网地址:https://prometheus.io/download/#pushgateway
github地址:https://github.com/prometheus/pushgateway
daemonize 后台运行
daemonize -c /root/pushgateway-1.2.0.linux-amd64 /root/pushgateway-1.2.0.linux-amd64/pushgateway
配置文件: /usr/local/prometheus/prometheus.yml
放行数据端口:
firewall-cmd --add-port=9090/tcp
firewall-cmd --add-port=9100/tcp
firewall-cmd --add-port=9091/tcp
firewall-cmd --add-port=9092/tcp
访问 Pushgateway: 正常 Metrics 里面是没有数据的,下图是两个节点提交过 数据之后的显示结果
选用一个 新的Key 来做讲解
count_netstat_wait_connections (TCP 等待连接数)
自行编写的脚本 + pushgateway的方法,推送到 prometheus server 采集。是一个 guage 类型的数据。
gauge 类型的数据只输入 key 键名,就会直接形成人性化监控图。
gauge 类型的数据,相对于counter类型的数据,使用起来相对容器的多。需要很多函数来进行修饰,如:rate()、increase() 进行计算之后,才能获取人性化监控图。
如图所示,{ } 当中的部分属于: "标签"
exported_instance="log"
指定被监控主机名为 “log”。count_netstat_wait_connections{exported_instance="log"}
标签精确过滤 =
例:匹配 log 主机名 exported_instance='log'
标签模糊过滤 =~
例:匹配 web. 开头的主机名 exported_instance=~"web."
想要找出 wait_connection 数量 大于400
count_netstat_wait_connections{exported_instance=~"web.*"} > 400
pushgateway 本身是没有任何抓取监控数据的功能的,它只是被动的等待推送。
实例:抓取 TCP waiting_connection 等待连接数量
vim /usr/local/pushgateway/shell/waiting_connection.sh
#!/bin/bash
instance_name=`hostname -f` # instance_name 取出主机名
if [ $instance_name == "localhost" ]; #要求主机名不能是 localhost,没法区分
then
echo "Mush FQDN hostname"
exit 1
fi
#For waitting connections
label="count_netstat_wait_connections" # 定义 prometheus 命令行标签
count_netstat_wait_connections=`netstat -anpt | grep -i wait | wc -l` #定义一个新的数值,统计 TCP_WAIT 的连接数
echo "$label:$count_netstat_wait_connections" # 输出格式:key/value(标签:取出的数值)
echo "$label $count_netstat_wait_connections" | curl --data-binary @- http://192.168.168.11:9091/metrics/job/pushgateway/instance/$instance_name
#最后把 key/value 推送给 pushgateway
#curl --data-binary : 将 HTTP POST请求中的数据发送给 pushgateway 服务器,与用户提交HTML表单时浏览的行为完全一样。
#HTTP POST 请求中的数据为纯 二进制数据。
以上脚本中最重要的是:
1、count_netstat_wait_connections=`netstat -anpt | grep -i wait | wc -l`
提取通过 linux 命令行获取到的 监控 TCP_WAIT 的数据
2、curl --data-binary @- http://192.168.168.11:9091/metrics/job/pushgateway/instance/$instance_name
重点:重启 prometheus 服务,能够在 prometheus:9090/targets 当中看到 pushgateway
测试提交数据,查看是否成功
[root@node1 ~]# sh waiting_connection.sh
count_netstat_wait_connections:2 只显示结果,不出现报错为 真
结合 Crontab -e ,每分钟执行一次检测,并将结果提交到 pushgateway。
crontab -e
* * * * * sh /usr/local/pushgateway/waiting_connection.sh #每分钟执行一次
#如果想要按照秒钟来执行,按照以下来写
* * * * * sh /usr/local/pushgateway/waiting_connection.sh
* * * * * sleep 10;sh /usr/local/pushgateway/waiting_connection.sh
* * * * * sleep 20;sh /usr/local/pushgateway/waiting_connection.sh
* * * * * sleep 30;sh /usr/local/pushgateway/waiting_connection.sh
* * * * * sleep 40;sh /usr/local/pushgateway/waiting_connection.sh
* * * * * sleep 50;sh /usr/local/pushgateway/waiting_connection.sh