---------------nginx自动监控报警-------------------
在/etc/nginx/conf.d/default.conf 文件内添加
location /nginx_status {
stub_status on;
access_log off;
allow 127.0.0.1;
deny all;
}
curl -s http://127.0.0.1/nginx_status
curl -s http://127.0.0.1/nginx_status | awk '/Active/ {print $3}' #获取第一行的Active connections值(或者$NF表示最后一个字段)
vim zabbix_nginx.sh
#!/bin/bash
nginx_active () {
/usr/bin/curl -s http://127.0.0.1/nginx_status | awk '/Active/ {print $NF}'
}
nginx_reading() {
/usr/bin/curl -s http://127.0.0.1/nginx_status | awk '/Reading/ {print $2}'
}
nginx_writing () {
/usr/bin/curl -s http://127.0.0.1/nginx_status | awk '/Writing/ {print $4}'
}
nginx_waiting () {
/usr/bin/curl -s http://127.0.0.1/nginx_status | awk '/Waiting/ {print $6}'
}
nginx_accepts () {
/usr/bin/curl -s http://127.0.0.1/nginx_status | awk 'NR==3 {print $1}'
}
nginx_handled () {
/usr/bin/curl -s http://127.0.0.1/nginx_status | awk 'NR==3 {print $2}'
}
nginx_requests () {
/usr/bin/curl -s http://127.0.0.1/nginx_status | awk 'NR==3 {print $3}'
}
nginx_check() {
pro_num=$(ps aux | grep -v grep | grep -c "nginx:")
if [ $pro_num -le 0 ] ;then
echo 0
else
echo $pro_num
fi
} #判断进程数
######main###########
cmd=$1
case $cmd in
check)
nginx_check
;;
active)
nginx_active
;;
reading)
nginx_reading
;;
writing)
nginx_writing
;;
waiting)
nginx_waiting
;;
accepts)
nginx_accepts
;;
handld)
nginx_handle
;;
requests)
nginx_requests
;;
*)
echo "$USAGE:$0 {check | active | reading | writing | waiting | accepts| handle|requests}"
esac
vim /etc/zabbix/zabbix_agnet2.d/userparameter_nginx.conf
UserParameter=nginx.status[*],/opt/zbx_nginx.sh $1
systemctl restart zabbix-agent2.service
zabbix_get -s '127.0.0.1' -p 10050 -k 'nginx.status[check]'
127.0.0.1因为agent2的配置文件中server为127.0.0.1
配置------模版----监控项
名称:number of nginx process
键值:nginx.status[check]
更新间隔:10s
名称:number of nginx active connections
键值:nginx.status[active]
更新间隔:10s
触发器:
名称:nginx down on {HOST.NAME}
表达式 :监控项:number of nginx process
last()-最后(最近)的T值
结果:=0
名称:too high number of active connections in nginx
表达式:监控项:nginx active conections
last()-最后(最近)的T值
结果:>10000
图形:
名称:nginx status connction
宽:默认
长:默认
监控项:number of nginx active connections 功能:平均
配置:动作:trigger action:选择动作名称:添加需要报警的监控项 然后更新 更新邮件监控
修改告警邮件格式:
告警主机:{HOSTNAME1}
告警时间:{EVENT.DATE} {EVENT.TIME}
告警等级:{TRIGGER.SEVERITY}
告警信息:{TRIGGER.NAME}
告警项目:{TRIGGER.KEY1}
问题详情:{ITEM.NAME}:{ITEM.VALUE}
当前状态:{TRIGGER.STATUS}:{ITEM.VALUE1}
事件ID:{EVENT.ID}
对于agent2是被动模式
zabbix server主动地去发现所有的客户端,然后将客户端的信息登记在服务端上
缺点是如果定义的网段中主机数量多,zabbix server登记耗时久
21端客户端 修改agent配置文件:
#80行 Server=192.168.179.25
#133行 ServerActive=192.168.179.25
#144行 Hostname=zbx-agent02
zabbix网站配置:
自动发现:
名称:mynetwork
ip范围:192.168.179.1-192.168.179.254
更新间隔:30s
检查:添加: zabbix客户端 端口范围:10050 键值:system uname
主机名称:DNS
可见的名称:主机名称
已启用
配置:动作
选择 auto discovery.Linux servers
点击:启用
tail -f /var/log/zabbix_server.log
192.168.179.21已添加进
-------------------自动注册------------------------
abbix agent2 会主动上报自己的信息,发给 zabbix server。
缺点是可能因为配置文件配置错误或者网络不通等原因导致 zabbix agent2 可能找不到 zabbix server。
1.环境准备
点击左边菜单栏【配置】中的【发现动作】,勾选发现规则,点击 禁用
点击左边菜单栏【配置】中的【主机】,勾选原有的客户端主机,点击 删除
vim /etc/hosts
192.168.179.25 zbx-server
192.168.179.20 zbx-agent01
192.168.179.21 zbx-agent02
2.修改 zabbix-agent2 配置文件
vim /etc/zabbix/zabbix_agent2.conf
......
HostnameItem=system.hostname #152行,取消注释
egrep -v "^#|^$" /etc/zabbix/zabbix_agent2.conf
systemctl restart zabbix-agent2
3.在 Web 页面配置自动注册
点击左边菜单栏【配置】中的【动作】,上方菜单选择 【自动注册动作】,点击【创建动作】
【名称】设置成 Auto registration
点击 【添加】,【类型】选择 主机名称,【操作者】选择 包含,【值】设置成 zbx-agent
点击上方菜单栏【操作】,点击【添加】,【操作类型】选择 添加主机,点击 【Add】
再点击【添加】,【操作类型】选择 添加到主机群组,【主机群组】选择 Linux servers,点击 【Add】
再点击【添加】,【操作类型】选择 与模板关联,【模板】搜索 Linux,选择 Linux by Zabbix agent,点击 【Add】
点击下方的【添加】
等待一段时间后,点击左边菜单栏【配置】中的【主机】刷新,即可刷新出自动发现的客户端主机
在服务端查看 zabbix 日志
tail -f /var/log/zabbix_server.log
官方的高可用仅仅针对Zabbix server部分,数据库(MMM、MHA)部分和前端(Keepalive、haproxy)部分需要自行采用各自领域的高可用解决方案
1、下载 Windows 客户端 Zabbix agent 2
https://cdn.zabbix.com/zabbix/binaries/stable/6.0/6.0.13/zabbix_agent2-6.0.13-windows-amd64-openssl.msi
2、安装客户端,配置
双击客户端软件包开始安装
【Host name】:WIN10-SERVER
【Zabbix server IP/DNS】:192.168.80.20
【Agent listen port】:10050
【Server or Proxy for active checks】:192.168.80.20
勾选 【Add agent location to the PATH】
3、在服务端 Web 页面添加主机,关联模板
点击左边菜单栏【配置】中的【主机】,点击【创建主机】
【主机名称】输入 win10-agent01
【可见的名称】输入 win10-agent01-192.168.80.5
【模板】搜索 windows ,选择 Windows by Zabbix agent
【群组】输入 windows ,选择 windows(新)
【Interfaces】点击添加 客户端,【IP地址】输入 192.168.80.5,【端口】输入 10050
-------------------- Zabbix 监控 java 应用 --------------------
1、客户端开启 java jmxremote 远程监控功能
上传 tomcat 软件包到 /opt 目录中
cd /opt
tar zxvf apache-tomcat-9.0.16.tar.gz
mv apache-tomcat-9.0.16 /usr/local/tomcat
#配置 java jmxremote 远程监控功能
vim /usr/local/tomcat/bin/catalina.sh
...... #位置在 cygwin=false 前
CATALINA_OPTS="$CATALINA_OPTS \
-Dcom.sun.management.jmxremote \
-Dcom.sun.management.jmxremote.port=12345 \
-Dcom.sun.management.jmxremote.authenticate=false \
-Dcom.sun.management.jmxremote.ssl=false \
-Djava.rmi.server.hostname=192.168.80.30" #tomcat服务器地址
cygwin=false
#启动服务,查看端口
/usr/local/tomcat/bin/startup.sh
netstat -lntp | grep 12345
2、服务端安装 zabbix-java-gateway
yum install -y zabbix-java-gateway
systemctl enable --now zabbix-java-gateway.service
netstat -lntp | grep 10052 #zabbix-java-gateway 默认监听 10052 端口
3、修改服务端 zabbix-server 配置
vim /etc/zabbix/zabbix_server.conf
......
JavaGateway=127.0.0.1 # 317行,指定 zabbix-java-gateway 的 IP 地址
StartJavaPollers=5 # 333行,开启用来收集java数据的poller进程的数量
systemctl restart zabbix-server
ps -ef | grep zabbix_server | grep java
4、在服务端 Web 页面添加主机,关联模板
点击左边菜单栏【配置】中的【主机】,点击 zbx-agent01
【模板】搜索 JMX ,选择 Generic Java JMX
【Interfaces】点击添加 JMX,【IP地址】输入 192.168.80.30,【端口】输入 12345
点击 【更新】
等待一段时间后 Zabbix server 的可用性增加了 JXM 监控方式
看到 became available 就是找到了!
#监控其它 java 应用
java -Dcom.sun.management.jmxremote \
-Dcom.sun.management.jmxremote.port=12345 \
-Dcom.sun.management.jmxremote.authenticate=false \
-Dcom.sun.management.jmxremote.ssl=false \
-Djava.rmi.server.hostname=192.168.179.20" \
-jar XXX.jar
SNMP,简单网络管理协议,常用于监控网络设备,也能监控支持开启SNMP功能的设备(windows、linux、打印机等)。
1.服务端安装 snmp 监控程序
yum install -y net-snmp net-snmp-utils
2.修改 snmp 的配置文件,并启动服务
vim /etc/snmp/snmpd.conf
......
view systemview included .1 #57行,添加此配置
systemctl start snmpd
3.使用 snmpwalk 命令测试
snmpwalk -v 2c -c public 127.0.0.1 sysname
SNMPv2-MIB::sysName.0 = STRING: zbx-server
-------------------------------------------------------
–v 1|2c|3:指定SNMP协议版本,v2c通过团体名作为认证,v3通过用户名和密码认证
–c:指定团体名(设备间的暗号)
sysname:为 snmp 的 key,用于查看系统名称;SysDesc 用于查看系统信息
-------------------------------------------------------
4.在 Web 页面配置 snmp 方式监控
点击左边菜单栏【配置】中的【主机】,点击 Zabbix server
【模板】取消链接并清理 现有模板 Linux by Zabbix agent
搜索 Generic,选择 Generic by SNMP
【群组】搜索 net,选择 net(新)
【Interfaces】点击【添加】选择 SNMP ,【IP地址】输入 127.0.0.1,【端口】输入 161
【SNMP version】选择 SNMPv2
【SNMP community】输入 {$SNMP_COMMUNITY}
点击上方菜单栏【宏】
选择【主机宏】
【宏】输入 {$SNMP_COMMUNITY},【值】 输入 public(要与网络设备设置的团体名一致),【描述】输入 网络设备snmp的团队名
点击 【更新】
等待一段时间后 Zabbix server 的可用性就变成了 SNMP 监控方式
分布式监控的作用:
●分担 server 的集中式压力
●解决多机房之间的网络延时问题
agent --> proxy --> server
systemctl disable --now firewalld
setenforce 0
hostnamectl set-hostname zbx-proxy
//设置 zabbix 的下载源,安装 zabbix-proxy
rpm -ivh https://repo.zabbix.com/zabbix/6.0/rhel/7/x86_64/zabbix-release-6.0-4.el7.noarch.rpm
sed -i 's#https://repo.zabbix.com#https://mirrors.aliyun.com/zabbix#' /etc/yum.repos.d/zabbix.repo
yum install -y zabbix-proxy-mysql zabbix-sql-scripts zabbix-selinux-policy
//部署数据库,要求 MySQL 5.7 或 Mariadb 10.5 及以上版本
#配置 Mariadb yum源
cat > /etc/yum.repos.d/mariadb.repo << EOF
[mariadb]
name = MariaDB
baseurl = http://mirrors.aliyun.com/mariadb/yum/10.5/centos7-amd64/
gpgkey = http://mirrors.aliyun.com/mariadb/yum/RPM-GPG-KEY-MariaDB
gpgcheck = 1
enabled=1
EOF
yum install -y mariadb-server mariadb
systemctl enable --now mariadb
#初始化数据库
mysql_secure_installation
分别输入 回车 -> n -> Y (设置root密码,如abc123) -> 后面一路 Y
mysql -u root -pabc123
#创建数据库并指定字符集
CREATE DATABASE zabbix_proxy character set utf8 collate utf8_bin;
#创建 zabbix 数据库用户并授权
GRANT all ON zabbix_proxy.* TO 'zabbix'@'localhost' IDENTIFIED BY 'zabbix';
GRANT all ON zabbix_proxy.* TO 'zabbix'@'%' IDENTIFIED BY 'zabbix';
FLUSH PRIVILEGES;
//导入数据库信息
rpm -ql zabbix-sql-scripts #查询 sql 文件的位置
cat /usr/share/zabbix-sql-scripts/mysql/proxy.sql | mysql -uroot -pabc123 zabbix_proxy
//修改 zabbix-proxy 配置文件
vim /etc/zabbix/zabbix_proxy.conf
Server=192.168.80.20 #32行,指定 zabbix 服务端的 IP 地址
Hostname=zbx-proxy #42行,指定当前 zabbix 代理服务器的主机名
DBPassword=zabbix #194行,指定当前数据库 zabbix 用户的密码
//启动 zabbix-proxy
systemctl start zabbix-proxy
systemctl enable zabbix-proxy
//在所有主机上配置 hosts 解析
vim /etc/hosts
192.168.80.20 zbx-server
192.168.80.30 zbx-agent01
192.168.80.13 zbx-proxy
//在 Web 页面配置 agent 代理
点击左边菜单栏【配置】中的【动作】,勾选自动注册规则,点击 禁用
点击左边菜单栏【配置】中的【主机】,勾选原有的客户端主机,点击 删除
点击左边菜单栏【管理】中的【agent代理程序】,点击【创建代理】
【agent代理程序名称】输入 zbx-proxy
【系统代理程序模式】选择 主动式
【代理地址】输入 192.168.80.13
点击 【添加】
//配置 agent 使用 proxy
1.在客户端修改 agent2 配置文件
vim /etc/zabbix/zabbix_agent2.conf
......
Server=192.168.80.13 #80行,指定 zabbix 代理服务器的 IP 地址
ServerActive=192.168.80.13 #120行,指定 zabbix 代理服务器的 IP 地址
2.在 Web 页面配置
点击左边菜单栏【配置】中的【主机】,点击【创建主机】
【主机名称】输入 zbx-agent01
【可见的名称】输入 zbx-agent01
【模板】搜索 Linux ,选择 Linux by Zabbix agent
【群组】选择 Linux server
【Interfaces】选择 客户端,【IP地址】输入 192.168.80.30,【端口】输入 10050
【由agent代理程序监测】选择 zbx-proxy
点击 【添加】
3.分别在客户端和代理服务器上重启服务
systemctl restart zabbix-agent2
systemctl restart zabbix-proxy
等待一段时间后,点击左边菜单栏【配置】中的【主机】刷新,查看客户端主机监控状态正常
在服务端查看日志
tail -f /var/log/zabbix/zabbix_proxy.log
官方的高可用仅仅针对 Zabbix Server 部分,数据库部分和前端部分需要自行采用各自领域的高可用解决方案。
//服务端配置
默认情况下,HA 是关闭的。HA 部分的配置在配置文件的最下面:High availability cluster parameters 部分。
#主节点 Zabbix Server 配置
vim /etc/zabbix/zabbix_server.conf
......
DBHost=192.168.80.20
DBName=zabbix
DBUser=zabbix
DBPassword=zabbix
......
HANodeName=zbx-server01 #设置为当前节点主机名
NodeAddress=192.168.80.20:10051 #设置为节点IP
systemctl restart zabbix-server
#主节点给数据库授权远程登录权限
mysql -uroot -pabc123
GRANT all ON zabbix.* TO 'zabbix'@'%' IDENTIFIED BY 'zabbix';
FLUSH PRIVILEGES;
#备节点 Zabbix Server 配置
vim /etc/zabbix/zabbix_server.conf
......
DBHost=192.168.80.20
DBName=zabbix
DBUser=zabbix
DBPassword=zabbix
......
HANodeName=zbx-server02
NodeAddress=192.168.80.20:10051
systemctl restart zabbix-server
//客户端配置
vim /etc/zabbix/zabbix_agentd.conf
......
Server=192.168.80.20,192.168.80.30
ServerActive=192.168.80.20;192.168.80.30 #注意,ServerActive 的连接符是‘;’ ,而不是‘,’