作为一个运维,需要会使用监控系统查看服务器状态以及网站流量指标,利用监控系统的数据去了解上线发布的结果,和网站的健康状态。
利用一个优秀的监控软件,我们可以:
●通过一个友好的界面进行浏览整个网站所有的服务器状态
●可以在 Web 前端方便的查看监控数据
●可以回溯寻找事故发生时系统的问题和报警情况
zabbix 监控原理:
zabbix agent安装在被监控的主机上,zabbix agent负责定期收集客户端本地各项数据,并发送至 zabbix server 端,zabbix server 收到数据后,将数据存储到数据库中,用户基于 Zabbix WEB 可以看到数据在前端展现图像。当 zabbix 监控某个具体的项目, 该项目会设置一个触发器阈值,当被监控的指标超过该触发器设定的阈值,会进行一些必要的动作,动作包括:发送信息(邮件、微信、短信)、发送命令(shell 命令、reboot、restart、install 等)。
zabbix 监控部署在系统中,包含常见的五个程序: zabbix_server、zabbix_agent、zabbix_proxy、zabbix_get、zabbix_sender 等。
●zabbix server:zabbix 服务端守护进程,其中 zabbix_agent、zabbix_get、zabbix_sender、zabbix_proxy 的数据最终都提交给 zabbix server;
●zabbix agent:客户端守护进程,负责收集客户端数据,例如:收集 CPU 负载、内存、硬盘使用情况等;
●zabbix proxy:zabbix 分布式代理守护进程,通常大于 500 台主机,需要进行分布式监控架构部署;
●zabbix get:zabbix 数据接收工具,单独使用的命令,通常在 server 或者 proxy 端执行获取远程客户端信息的命令;
●zabbix sender:zabbix 数据发送工具,用户发送数据给 server 或 proxy 端,通常用户耗时比较长的检查。
关闭防火墙
修改主机名:hostnamectl set-hostname zbx-server
获取zabbix的下载源: rpm -ivh https://mirrors.aliyun.com/zabbix/zabbix/5.0/rhel/7/x86_64/zabbix-release-5.0-1.el7.noarch.rpm
将zabbix.repo替换为阿里源
sed -i ‘s#http://repo.zabbix.com#https://mirrors.aliyun.com/zabbix#’ zabbix.repo
yum install -y zabbix-server-mysql zabbix-agent
安装SLC
yum install -y centos-release-scl
修改yum仓库配置安装web前端:将[zabbix-frontend]下的enable=0改成1让仓库默认打开
yum install -y zabbix-web-mysql-scl zabbix-apache-conf-scl
yum install -y centos-release-scl
安装一个数据库,为了方便安装一个mariadb
yum install -y mariadb-server mariadb
开启服务:systemctl start mariadb.service
用mysql_secure_installation命令初始化mariadb设置密码
进入数据库添加数据库用户以及zabbix所需的数据库信息
CREATE DATABASE zabbix character set utf8 collate utf8_bin;
GRANT all ON zabbix.* TO ‘zabbix’@‘%’ IDENTIFIED BY ‘zabbix’;
flush privileges;
退出数据库
用rpm -ql zabbix-server-mysql查看zabbix的安装情况
其中/usr/share/doc/zabbix-server-mysql-5.0.24/create.sql.gz文件要导入到数据库中
用zcat create.sql.gz | mysql -uroot -pabc123 zabbix将表导入
修改zabbix配置
vim /etc/zabbix/zabbix_server.conf
116 DBUser=zabbix
124 DBPassword=zabbix
修改php的配置
vim /etc/opt/rh/rh-php72/php-fpm.d/zabbix.conf
修改时区 25 php_value[date.timezone] = Asia/Shanghai
启动rabbix服务
systemctl start zabbix-server.service zabbix-agent.service httpd rh-php72-php-fpm.service
systemctl enable zabbix-server.service zabbix-agent.service httpd rh-php72-php-fpm.service
访问web http://192.168.30.34/zabbix
管理员Admin登录密码为zabbix
切换中文,然后解决乱码问题
首先安装软件包
yum install -y wqy-microhei-fonts
生成的文件在/usr/share/fonts/wqy-microhei/wqy-microhei.ttc
复制文件:cp wqy-microhei.ttc /usr/share/fonts/dejavu/DejaVuSans.ttf
关闭防火墙
修改主机名hostnamectl set-hostname zbx-agent01
服务端和客户端分别同步时间
yum install -y ntpdate
ntpdate -u ntp.aliyun.com
客户端配置时区,与服务端保持一致
移走时区文件:mv /etc/localtime {,.bak}
ln -s /usr/share/zoneinfo/Asia/Shanghai /etc/localtime
查看时区
[root@zbx-server etc]# ll localtime
lrwxrwxrwx. 1 root root 33 6月 18 22:51 localtime -> /usr/share/zoneinfo/Asia/Shanghai
获取zabbix的下载源: rpm -ivh https://mirrors.aliyun.com/zabbix/zabbix/5.0/rhel/7/x86_64/zabbix-release-5.0-1.el7.noarch.rpm
将zabbix.repo替换为阿里源
sed -i ‘s#http://repo.zabbix.com#https://mirrors.aliyun.com/zabbix#’ zabbix.repo
yum install -y zabbix-agent2
修改配置文件
vim /etc/zabbix/zabbix_agent2.conf
80 Server=192.168.30.34
120 ServerActive=192.168.30.34
131 Hostname=zbx-agent01
开启服务
systemctl start zabbix-agent2.service
systemctl enable zabbix-agent2.service
在服务端上安装获取工具测试客户端是否开启成功
yum install -y zabbix-get.x86_64
指定源地址
zabbix_get -s ‘192.168.30.33’ -p 10050 -k ‘agent.ping’
执行结果为1则说明客户端与服务端连通。
换一个键名测试,结果为客户端主机名,说明连接成功。
[root@zbx-server etc]# zabbix_get -s ‘192.168.30.33’ -p 10050 -k ‘system.hostname’
zbx-agent01
进入web端操作
除了zabbix自带模板,我们还可以到
https://www.zabbix.com/integrations?cat=official_templates上去下载更多的模板。
假设需求:监控当前服务器登录的人数 当人数超过4个事报警并发送邮件告知。
首先想到用 who | grep wc -l 命令来统计登录人数
然后自定义键名
vim /etc/zabbix/zabbix_agent2.conf
268 Include=/etc/zabbix/zabbix_agent2.d/*.conf 得知监控项配置文件的路径
vim /etc/zabbix/zabbix_agent2.conf
291 # Format: UserParameter=, 找到了自定义监控项的格式
cd /etc/zabbix/zabbix_agent2.d/*.conf 发现文件为控需要我们添加新配置文件
vim user_login.conf
内容为 UserParameter=login.user,who | wc -l
重启服务
systemctl restart zabbix-agent2.service
到服务端测试客户端配置是否正确
[root@zbx-server ~]# zabbix_get -s ‘192.168.30.33’ -p 10050 -k ‘login.user’
3
得到结果为3,登陆人数为3.
再次来到web页面
创建模板
添加应用集
添加监控项
添加触发器
添加图形
添加完成后,讲监控模板和主机关联起来(一台主机可以使用多个模板)
监测发现有告警
发现登录数为6个
我们减少3个登录人数之后再看
此时告警消失
图形显示也减少三个
发送测试邮件到自己邮箱
收到邮件
接下来测试邮件报警
启用成功以后,在服务器上增加登录人数到7个。
此时仪表盘显示报警信息
邮箱也收到报警邮件
那么这个小的监控需求我们就实现了
zabbix 自动发现(对于 agent2 是被动模式)
zabbix server 主动的去发现所有的客户端,然后将客户端的信息登记在服务端上。
缺点是如果定义的网段中的主机数量多,zabbix server 登记耗时较久,且压力会较大。
1.确保客户端上的 zabbix-agent2 服务状态正常
systemctl is-active zabbix-agent2.service
active
2.在 Web 页面删除原有的客户端主机
点击左边菜单栏【配置】中的【主机】,勾选原有的客户端主机,点击 删除
3.在服务端和客户端上配置 hosts 解析
vim /etc/hosts
192.168.80.20 zbx-server
192.168.80.30 zbx-agent01
4.在 Web 页面配置自动发现
点击左边菜单栏【配置】中的【自动发现】,点击【创建发现规则】
【名称】设置成 mynetwork
【IP范围】设置成 192.168.80.1-254
【更新间隔】设置成 30s
【检查】点击【添加】,【检查类型】选择 Zabbix 客户端,【端口范围】设置成 10050,【键值】设置成 system.uname
【设备唯一性准则】选择 IP地址
【主机名称】选择 DNS名称
【可见的名称】选择 主机名称
勾选 【已启用】,点击 【更新】
点击左边菜单栏【配置】中的【动作】,上方菜单选择 【Discovery actions】
勾选 【Auto discovery. Linux servers.】,点击 【启用】
点击左边菜单栏【配置】中的【主机】刷新,等待一段时间后即可刷新出自动发现的客户端主机
可在服务端查看 zabbix 日志
tail -f /var/log/zabbix/zabbix_server.log
zabbix agent2 会主动上报自己的信息,发给 zabbix server。
缺点是可能因为配置文件配置错误或者网络不通等原因导致 zabbix agent2 可能找不到 zabbix server。
1.环境准备
点击左边菜单栏【配置】中的【自动发现】,勾选发现规则,点击 禁用
点击左边菜单栏【配置】中的【主机】,勾选原有的客户端主机,点击 删除
vim /etc/hosts
192.168.80.20 zbx-server
192.168.80.30 zbx-agent01
2.修改 zabbix-agent2 配置文件
vim /etc/zabbix/zabbix_agent2.conf
HostnameItem=system.hostname #139行,取消注释
egrep -v “#|$” /etc/zabbix/zabbix_agent2.conf 查看有效配置
3.在 Web 页面配置自动注册
点击左边菜单栏【配置】中的【动作】,上方菜单选择 【Autoregistration actions】,点击【创建动作】
【名称】设置成 Auto registration
点击 【添加】,【类型】选择 主机名称,【操作者】选择 包含,【值】设置成 zbx-agent01
点击上方菜单栏【操作】,点击【添加】,【操作类型】选择 添加主机,点击 【add】
再点击【添加】,【操作类型】选择 添加到主机群组,【主机群组】选择 Linux servers,点击 【add】
再点击【添加】,【操作类型】选择 与模板关联,【模板】搜索 Linux,选择 Template OS Linux by Zabbix agent,点击 【add】
点击左边菜单栏【配置】中的【主机】刷新,等待一段时间后即可刷新出自动发现的客户端主机
在服务端查看 zabbix 日志
tail -f /var/log/zabbix/zabbix_server.log
分布式监控的作用:
●分担 server 的集中式压力
●解决多机房之间的网络延时问题
agent --> proxy --> server
systemctl disable --now firewalld
setenforce 0
hostnamectl set-hostname zbx-proxy
//设置 zabbix 的下载源,安装 zabbix-proxy
rpm -ivh https://mirrors.aliyun.com/zabbix/zabbix/5.0/rhel/7/x86_64/zabbix-release-5.0-1.el7.noarch.rpm
cd /etc/yum.repos.d
sed -i ‘s#http://repo.zabbix.com#https://mirrors.aliyun.com/zabbix#’ /etc/yum.repos.d/zabbix.repo
yum install -y zabbix-proxy-mysql zabbix-get
//安装 zabbix 所需的数据库
yum install -y mariadb-server mariadb
systemctl enable --now mariadb
mysql_secure_installation #初始化数据库,并设置密码,如 abc123
//添加数据库用户,以及 zabbix 所需的数据库信息
mysql -u root -pabc123
CREATE DATABASE zabbix_proxy character set utf8 collate utf8_bin;
GRANT all ON zabbix_proxy.* TO ‘zabbix’@‘%’ IDENTIFIED BY ‘zabbix’;
flush privileges;
//导入数据库信息
rpm -ql zabbix-proxy-mysql #查询 sql 文件的位置
zcat /usr/share/doc/zabbix-proxy-mysql-5.0.15/schema.sql.gz | mysql -uroot -pabc123 zabbix_proxy
//修改 zabbix-proxy 配置文件
vim /etc/zabbix/zabbix_proxy.conf
Server=192.168.30.34 #30行,指定 zabbix 服务端的 IP 地址
Hostname=zbx-proxy #49行,指定当前 zabbix 代理服务器的主机名
DBPassword=zabbix #196行,指定当前数据库 zabbix 用户的密码
//启动 zabbix-proxy
systemctl start zabbix-proxy
systemctl enable zabbix-proxy
//在所有主机上配置 hosts 解析
vim /etc/hosts
192.168.30.34 zbx-server
192.168.30.33 zbx-agent01
192.168.30.36 zbx-proxy
//在 Web 页面配置 agent 代理
点击左边菜单栏【配置】中的【动作】,勾选自动注册规则,点击 禁用
点击左边菜单栏【配置】中的【主机】,勾选原有的客户端主机,点击 删除
点击左边菜单栏【管理】中的【agent代理程序】,点击【创建代理】
【agent代理程序名称】设置为 zbx-proxy
【系统代理程序模式】选择 主动式
【代理地址】设置为 192.168.30.36
点击 【添加】
配置 agent 使用 proxy
1.在客户端修改 agent2 配置文件
vim /etc/zabbix/zabbix_agent2.conf
…
Server=192.168.80.36 #80行,指定 zabbix 代理服务器的 IP 地址
ServerActive=192.168.80.36 #120行,指定 zabbix 代理服务器的 IP 地址
2.在 Web 页面配置
点击左边菜单栏【配置】中的【主机】,点击【创建主机】
【主机名称】设置成 zbx-agent01
【可见的名称】设置成 zbx-agent01
【群组】选择 Linux server
【Interfaces】的【IP地址】设置成 192.168.30.33
【由agent代理程序监测】选择 zbx-proxy
再点击上方菜单栏【模板】
【Link new tamplates】搜索 Linux ,选择 Template OS Linux by Zabbix agent
点击 【添加】
3.分别在客户端和代理服务器上重启服务
systemctl restart zabbix-agent2
systemctl restart zabbix-proxy
点击左边菜单栏【配置】中的【主机】刷新,查看客户端主机监控状态正常
在服务端查看日志
tail -f /var/log/zabbix/zabbix_proxy.log
---------- 设置 zabbix-snmp 监控 ----------
SNMP,简单网络管理协议
1.服务端安装 snmp 监控程序
yum install -y net-snmp net-snmp-utils
2.修改 snmp 的配置文件,并启动服务
vim /etc/snmp/snmpd.conf
…
view systemview included .1 #57行,添加此配置
systemctl start snmpd
3.使用 snmp 命令测试
snmpwalk -v 2c -c public 127.0.0.1 sysname
SNMPv2-MIB::sysName.0 = STRING: zbx-server
–v 1|2c|3:指定SNMP协议版本
–c:指定共同体字符串
sysname:为 snmp 的 key
4.在 Web 页面配置 snmp 方式监控
点击左边菜单栏【配置】中的【主机】,点击 Zabbix server
【Interfaces】点击【添加】选择 SNMP ,端口设置成 161
点击上方菜单栏【模板】,【链接的模板】中的所有 agent 模板选择取消链接并清理
再在【Link new templates】中搜索 Linux SNMP,选择 Template OS Linux SNMP
网络管理协议
1.服务端安装 snmp 监控程序
yum install -y net-snmp net-snmp-utils
2.修改 snmp 的配置文件,并启动服务
vim /etc/snmp/snmpd.conf
…
view systemview included .1 #57行,添加此配置
systemctl start snmpd
3.使用 snmp 命令测试
snmpwalk -v 2c -c public 127.0.0.1 sysname
SNMPv2-MIB::sysName.0 = STRING: zbx-server
–v 1|2c|3:指定SNMP协议版本
–c:指定共同体字符串
sysname:为 snmp 的 key
4.在 Web 页面配置 snmp 方式监控
点击左边菜单栏【配置】中的【主机】,点击 Zabbix server
【Interfaces】点击【添加】选择 SNMP ,端口设置成 161
点击上方菜单栏【模板】,【链接的模板】中的所有 agent 模板选择取消链接并清理
再在【Link new templates】中搜索 Linux SNMP,选择 Template OS Linux SNMP
点击 【更新】,等待一段时间后 Zabbix server 的可用性就变成了 SNMP 监控方式。