1 Zabbix使用场景及系统概述
Zabbix是一个企业级解决方案,支持实时监控数千台服务器,虚拟机和网络设备,采集百万级监控指标,适用于任何IT基础架构、服务、应用程序和资源的解决方案
1.1 Zabbix使用场景
1.2 Zabbix系统概述
1.2.1 数据采集
周期性时序数据
主机/对象:服务器、路由器、交换机、存储、防火墙、IP、PORT、URL、自定义监控对象...
采集目标:监控项(k:v),指标数据(metrics data)
比如: load average: 0.00, 0.02, 0.00, 一般超过5就会很慢了, 需要定义阈值5
1.2.2 数据存储
监控数据存储系统
SQL: MySQL/MariaDB(Zabbix)
NoSQL:Redis(Open-falcon)
rrd: Round Robin Database(Cacti)
1.2.3 数据类型
历史数据: 每个监控项采集到的每个监控值
趋势数据: 趋势表里主要保留某个监控项一个小时内历史数据的最大值、最小值和平均值以及该监控项一个小时内所采集到的数据个数。
1.2.4 阈值
可按照预定义的阈值等级实现分层报警
1.2.5 告警机制
邮件,短信,微信,语音
故障自治愈: 比如java内存溢出, 可以自动重启java服务
如果日志文件导致磁盘空间占满, 不能直接rm, 因为无法立即释放空间, 需要用echo > 或者 >, 或者cat /dev/null将文件内容清空, 然后再删除
1.3 Zabbix核心任务
1.3.1 数据采集
数据采集方式:zabbix-server,zabbix-proxy,zabbix-agent
Agentless:SNMP,Telnet,ssh, IPMI, JMX
Agent:zabbix agent
1.3.2 数据存储
zabbix database
1.3.3 数据展示
zabbix web
graph -> screen -> slideshow(将多个screen以幻灯片的方式进行轮流展示)
案例: 如果需要查看大量的历史数据, 可以考虑再装一个zabbix web, 并且安装mysql从库, 之后, 如果需要查看大量的历史数据, 可以从单独的web去查看, 此时会从从库去调数据, 因为从库都是从主库同步的数据, 所以数据是没问题的. 这样会缓解主库的压力
grafana
以zabbix为数据源展示更绚丽的界面
grafana会通过zabbix web获取配置信息, 监控项, 然后去数据库拿取监控数据, 显示在界面
1.3.4 告警通知
host (host groups) <- templates #从模板继承告警配置
host -> items -> triggers -> action (条件-conditions, 操作-operations) #自定义告警配置
1.4 集中式监控 vs 分布式监控
- 集中式监控: 所有工作都由同一个服务器做完成, 包括信息收集和展示. 无法支持规模较大的架构
- 分布式监控: 服务器端负责系统配置, 数据写入和展示, agent负责在被监控服务器上收集数据, 将数据发给proxy代理, 由proxy再把数据再发给server. 通过代理去监控服务器, 代理把数据上传到server, server把监控数据写入MySQL.
运维人员通过访问web界面连接到server,如果要查看某个服务器的监控项有哪些, server会去查MySQL拿到被监控的数据项, 然后web再连接到MySQL根据监控项去查数据
zabbix server和zabbix agent之间通信靠的是zabbix协议, 默认是明文
2 Zabbix规划及部署
部署环境:
Ubuntu 1804
Zabbix-Server 10.0.0.19
Zabbix-主动代理 10.0.0.29
Zabbix-被动代理 10.0.0.39
MySQL-Master 10.0.0.49
MySQL-Slave 10.0.0.59
WebSrv-1 10.0.0.69
WebSrv-2 10.0.0.79
最小化系统, 安装常用包
apt update
apt -y install iproute2 ntpdate tcpdump telnet traceroute nfs-kernel-server nfs-common lrzsz tree openssl libssl-dev libpcre3 libpcre3-dev zlib1g-dev gcc openssh-server iotop unzip zip
2.1 apt 安装 Zabbix v4.0
zabbix-主动代理主机上安装zabbix, 10.0.0.29
mysql-slave主机上安装mysql, 10.0.0.59
主动代理上, apt安装zabbix
wget https://repo.zabbix.com/zabbix/4.0/ubuntu/pool/main/z/zabbix-release/zabbix-release_4.0-3+bionic_all.deb
dpkg -c zabbix-release_4.0-3+bionic_all.deb
drwxr-xr-x root/root 0 2019-07-31 00:34 ./
drwxr-xr-x root/root 0 2019-07-31 00:34 ./etc/
drwxr-xr-x root/root 0 2019-07-31 00:34 ./etc/apt/
drwxr-xr-x root/root 0 2019-07-31 00:34 ./etc/apt/sources.list.d/
-rw-r--r-- root/root 118 2019-07-31 00:34 ./etc/apt/sources.list.d/zabbix.list #把源修改为阿里云
dpkg -i zabbix-release_4.0-3+bionic_all.deb
vim /etc/apt/sources.list.d/zabbix.list
deb https://mirrors.aliyun.com/zabbix/zabbix/4.0/ubuntu bionic main
deb-src https://mirrors.aliyun.com/zabbix/zabbix/4.0/ubuntu bionic main
apt update
apt install zabbix-server-mysql zabbix-frontend-php zabbix-agent -y
# server安装时需要指定数据库类型, 我们使用mysql
mysql-slave上部署mysql
apt update
root@mysql-slave:~# apt -y install mysql-server
默认Ubuntu的MySQL监听在127地址, 如果Zabbix-Server和MySQL在同一个主机可以, 如果是不同主机, 那么要修改MySQL监听端口
root@mysql-slave:~# ss -ntl
State Recv-Q Send-Q Local Address:Port Peer Address:Port
LISTEN 0 80 127.0.0.1:3306 0.0.0.0:*
root@mysql-slave:~# vim /etc/mysql/mysql.conf.d/mysqld.cnf
bind-address = 127.0.0.1 --> 0.0.0.0
root@mysql-slave:~# systemctl restart mysql
root@mysql-slave:~# systemctl enable --now mysql
Synchronizing state of mysql.service with SysV service script with /lib/systemd/systemd-sysv-install.
Executing: /lib/systemd/systemd-sysv-install enable mysql
root@mysql-slave:~# ss -ntl
State Recv-Q Send-Q Local Address:Port Peer Address:Port
LISTEN 0 80 0.0.0.0:3306 0.0.0.0:*
创建zabbix数据库并授权
root@mysql-slave:~# mysql
mysql> create database zabbix_server_apt character set utf8 collate utf8_bin;
Query OK, 1 row affected (0.00 sec) #zabbix_server_apt表示用apt安装的zabbix
mysql> grant all on zabbix_server_apt.* to zabbix@"10.0.0.%" identified by 'zabbix';
Query OK, 0 rows affected, 1 warning (0.00 sec)
在主动代理上测试MySQL连接
root@zabbix-proxy-active:~# mysql -uzabbix -h10.0.0.59 -p
Enter password:
Welcome to the MariaDB monitor. Commands end with ; or \g.
Your MySQL connection id is 3
Server version: 5.7.34-0ubuntu0.18.04.1 (Ubuntu)
Copyright (c) 2000, 2018, Oracle, MariaDB Corporation Ab and others.
Type 'help;' or '\h' for help. Type '\c' to clear the current input statement.
MySQL [(none)]>
mysql> show databases;
+--------------------+
| Database |
+--------------------+
| information_schema |
| zabbix_server_apt |
+--------------------+
2 rows in set (0.01 sec)
编辑zabbix-server端配置文件
root@zabbix-proxy-active:~# vim /etc/zabbix/zabbix_server.conf
# DBHost=localhost --> DBHost=10.0.0.59
DBName=zabbix --> DBName=zabbix_server_apt
DBUser=zabbix #默认用户zabbix, 可以根据数据库授权时的配置自定义修改
# DBPassword= --> DBPassword=zabbix #默认为空, 可以根据数据库授权时的配置自定义修改
为Zabbix前端配置PHP, 编辑配置文件 /etc/zabbix/apache.conf
php_value date.timezone Asia/Shanghai
php_value date.timezone Asia/Shanghai
导入初始架构和数据, 需要先导入sql文件, 再启动zabbix
root@zabbix-proxy-active:~# zcat /usr/share/doc/zabbix-server-mysql/create.sql.gz | mysql -uzabbix -pzabbix -h10.0.0.59 zabbix_server_apt (zabbix库名)
# yum/apt和源码安装zabbix, 使用的代入脚本不同
启动Zabbix server和agent进程,并为它们设置开机自启
root@zabbix-proxy-active:~# systemctl restart zabbix-server zabbix-agent apache2
root@zabbix-proxy-active:~# systemctl enable --now zabbix-server zabbix-agent apache2
Synchronizing state of zabbix-server.service with SysV service script with /lib/systemd/systemd-sysv-install.
Executing: /lib/systemd/systemd-sysv-install enable zabbix-server
Synchronizing state of zabbix-agent.service with SysV service script with /lib/systemd/systemd-sysv-install.
Executing: /lib/systemd/systemd-sysv-install enable zabbix-agent
Synchronizing state of apache2.service with SysV service script with /lib/systemd/systemd-sysv-install.
Executing: /lib/systemd/systemd-sysv-install enable apache2
验证监听端口
初始化zabbix
访问:zabbix_ip/zabbix
检查php配置
yum和apt安装的zabbix, 会自动配置php, 如果是源码安装, 还要单独配置php
给zabbix-web配置数据库
在zabbix-web添加配置后, web会把配置写到数据库, 因此要告诉web, 数据库的信息
给zabbix-web配置zabbix服务器信息
zabbix-web可以和server配置在不同主机, 因此需要指定server的地址
之后验证配置, 完成, 登录即可
初始化zabbix-web后, 会生成配置文件, 保存配置信息, 如果初始化时信息填错, 后期可以修改配置文件即可
root@zabbix-proxy-active:~# vim /usr/share/zabbix/conf/zabbix.conf.php
zabbix默认用户是Admin, 默认密码zabbix
验证Zabbix Server is running
默认zabbix会监控自己, 因此, 可以看到本地产生的监控信息
2.2 源码安装 zabbix v4.0
Zabbix源码包可以用来装server,agent和proxy, 具体编译参数不同
zabbix-server主机上安装zabbix server, 10.0.0.19
mysql-master主机上安装mysql, 10.0.0.49
- 两台主机分别安装最小化依赖包
apt update
apt -y install iproute2 ntpdate tcpdump telnet traceroute nfs-kernel-server nfs-common lrzsz tree openssl libssl-dev libpcre3 libpcre3-dev zlib1g-dev gcc openssh-server iotop unzip zip
- mysql-master上安装mysql
apt -y install mysql-server
vim /etc/mysql/mysql.conf.d/mysqld.cnf
bind-address = 127.0.0.1 --> 0.0.0.0
systemctl restart mysql
systemctl enable --now mysql
- zabbix-server主机上, 将zabbix源码包解压
tar xvf zabbix-4.0.27.tar.gz -C /usr/local/src
- zabbix-server创建zabbix用户
useradd zabbix
- mysql-master上准备zabbix数据库
create database zabbix_server character set utf8 collate utf8_bin;
grant all privileges on zabbix_server.* to zabbix@"10.0.0.%" identified by 'zabbix';
zabbix-server上测试数据库连接
root@zabbix-server:~# apt -y install mysql-client
root@zabbix-server:~# mysql -uzabbix -pzabbix -h 10.0.0.49
mysql: [Warning] Using a password on the command line interface can be insecure.
Welcome to the MySQL monitor. Commands end with ; or \g.
Your MySQL connection id is 3
Server version: 5.7.34-0ubuntu0.18.04.1 (Ubuntu)
Copyright (c) 2000, 2021, Oracle and/or its affiliates.
Oracle is a registered trademark of Oracle Corporation and/or its
affiliates. Other names may be trademarks of their respective
owners.
Type 'help;' or '\h' for help. Type '\c' to clear the current input statement.
mysql> show databases;
+--------------------+
| Database |
+--------------------+
| information_schema |
| zabbix_server |
+--------------------+
2 rows in set (0.00 sec)
- 编译zabbix server和zabbix agent
apt-get install apache2 apache2-bin apache2-data apache2-utils fontconfig-config fonts-dejavu-core fping libapache2-mod-php libapache2-mod-php7.2 libapr1 libaprutil1 libaprutil1-dbd-sqlite3 libaprutil1-ldap libfontconfig1 libgd3 libiksemel3 libjbig0 libjpeg-turbo8 libjpeg8 liblua5.2-0 libodbc1 libopenipmi0 libsensors4 libsnmp-base libsnmp30 libsodium23 libssh2-1 libtiff5 libwebp6 libxpm4 php-bcmath php-common php-gd php-ldap php-mbstring php-mysql php-xml php7.2-bcmath php7.2-cli php7.2-common php7.2-gd php7.2-json php7.2-ldap php7.2-mbstring php7.2-mysql php7.2-opcache php7.2-readline php7.2-xml snmpd ssl-cert ttf-dejavu-core libmysqlclient-dev libxml2-dev libxml2 snmp libsnmp-dev libevent-dev openjdk-8-jdk curl libcurl4-openssl-dev -y
# 这里使用openjdk-8, 并且apt安装apache2, 因为zabbix 4.0要依赖于apache
cd /usr/local/src/zabbix-4.0.27/
./configure --prefix=/apps/zabbix_server --enable-server --enable-agent --with-mysql --with-net-snmp --with-libcurl --with-libxml2 --enable-java
# --enable-server: 安装zabbix server
# --enable-agent: server上也要安装agent, 来监控server自身
make install
root@zabbix-server:/usr/local/src/zabbix-4.0.27# ll /apps/zabbix_server/
total 28
drwxr-xr-x 7 root root 4096 Dec 8 17:17 ./
drwxr-xr-x 3 root root 4096 Dec 8 17:16 ../
drwxr-xr-x 2 root root 4096 Dec 8 17:16 bin/
drwxr-xr-x 4 root root 4096 Dec 8 17:17 etc/
drwxr-xr-x 3 root root 4096 Dec 8 17:16 lib/
drwxr-xr-x 3 root root 4096 Dec 8 17:17 sbin/
drwxr-xr-x 4 root root 4096 Dec 8 17:17 share/
root@zabbix-server:/usr/local/src/zabbix-4.0.27# ls database/mysql/
data.sql images.sql Makefile Makefile.am Makefile.in schema.sql
- 从zabbix-server主机上导入数据库
root@zabbix-server:/usr/local/src/zabbix-4.0.27# mysql -uzabbix -pzabbix -h10.0.0.49 zabbix_server < database/mysql/schema.sql #如果是部署zabbix-proxy, 那么只需要导入schema.sql, 剩下的两个文件无需导入
root@zabbix-server:/usr/local/src/zabbix-4.0.27# mysql -uzabbix -pzabbix -h10.0.0.49 zabbix_server < database/mysql/images.sql
root@zabbix-server:/usr/local/src/zabbix-4.0.27# mysql -uzabbix -pzabbix -h10.0.0.49 zabbix_server < database/mysql/data.sql
- 编辑zabbix server配置文件
vim /apps/zabbix_server/etc/zabbix_server.conf
DBHost=10.0.0.49
DBName=zabbix_server
DBPassword=zabbix
- 配置zabbix web界面
root@zabbix-server:/usr/local/src/zabbix-4.0.27# mkdir /var/www/html/zabbix
root@zabbix-server:/usr/local/src/zabbix-4.0.27# cd frontends/php/
root@zabbix-server:/usr/local/src/zabbix-4.0.27/frontends/php# cp -a . /var/www/html/zabbix
-
测试zabbix访问
- 解决报错
vim /etc/php/7.2/apache2/php.ini
post_max_size = 16M
vim /etc/php/7.2/apache2/php.ini
max_execution_time = 300
vim /etc/php/7.2/apache2/php.ini
max_input_time = 300
vim /etc/php/7.2/apache2/php.ini
date.timezone = Asia/Shanghai
systemctl restart apache2
刷新页面, 验证报错消失
-
配置zabbix
- 准备php配置文件
apt安装的zabbix, 会在配置zabbix后, 生成php配置文件, 并且保存到zabbix目录里, 编译安装需要手动添加, 或者修改源码包提供的模板文件
点击Download the configuration file, 下载php配置文件, 并保存的指定路径
root@zabbix-server:/var/www/html/zabbix/conf# cat zabbix.conf.php
刷新页面, 即可显示成功
- 启动zabbix server 端口10051
登录到zabbix后, 会显示zabbix server未启动, 因为编译安装的zabbix是不会自动启动zabbix server的
启动方法1: 直接使用zabbix命令
缺点: 后期关闭只能通过kill进程实现
/apps/zabbix_server/sbin/zabbix_server -c /apps/zabbix_server/etc/zabbix_server.conf
root@zabbix-server:/var/www/html/zabbix/conf# ss -ntl
State Recv-Q Send-Q Local Address:Port Peer Address:Port
LISTEN 0 128 0.0.0.0:10051 #验证10051端口开启 0.0.0.0:*
刷新页面, 验证启动成功
启动方法2: 利用service文件
先把二进制启动的zabbix server进程关闭
pkill zabbix_server
ps aux | grep zabbix
root 39195 0.0 0.1 14436 1048 pts/0 S+ 18:31 0:00 grep --color=auto zabbix
准备service文件
root@zabbix-server:~# vim /lib/systemd/system/zabbix-server.service
[Unit]
Description=Zabbix Server After=syslog.target After=network.target
[Service]
Environment="CONFFILE=/apps/zabbix_server/etc/zabbix_server.conf"
EnvironmentFile=-/etc/default/zabbix-server
Type=forking
Restart=on-failure
PIDFile=/tmp/zabbix_server.pid
KillMode=control-group
ExecStart=/apps/zabbix_server/sbin/zabbix_server -c $CONFFILE
ExecStop=/bin/kill -SIGTERM $MAINPID
RestartSec=10s
TimeoutSec=infinity
[Install]
WantedBy=multi-user.target
chown -R zabbix.zabbix /apps/zabbix_server/
启动zabbix server
systemctl daemon-reload
systemctl restart zabbix-server
systemctl enable zabbix-server
验证zabbix server启动成功
LISTEN 0 128 0.0.0.0:10051 0.0.0.0:*
- 启动zabbix agent端口10050
此时, 查看zabbix Host, 可以看到ZMX是连接失败的, 因为还没有启动agent
准备agent service文件
vim /etc/systemd/system/zabbix-agent.service
[Unit]
Description=Zabbix Agent
After=syslog.target
After=network.target
[Unit]
Description=Zabbix Agent
After=syslog.target
After=network.target
[Service]
Environment="CONFFILE=apps/zabbix_server/etc/zabbix_agentd.conf"
EnvironmentFile=-/etc/default/zabbix-agent
Type=forking
Restart=on-failure
PIDFile=/tmp/zabbix_agentd.pid
KillMode=control-group
ExecStart=/apps/zabbix_server/sbin/zabbix_agentd -c $CONFFILE
ExecStop=/bin/kill -SIGTERM $MAINPID
RestartSec=10s
User=zabbix
Group=zabbix
[Install]
WantedBy=multi-user.target
root@zabbix-server:~# systemctl daemon-reload
root@zabbix-server:~# systemctl restart zabbix-agent
root@zabbix-server:~# systemctl enable zabbix-agent
root@zabbix-server:~# ss -ntl
State Recv-Q Send-Q Local Address:Port Peer Address:Port
LISTEN 0 64 0.0.0.0:2049 0.0.0.0:*
LISTEN 0 128 0.0.0.0:10050 #10050端口启动成功 0.0.0.0:*
LISTEN 0 128 0.0.0.0:10051 0.0.0.0:*
刷新页面, 验证
2.3 配置中文界面
安装并设置中文简体语言环境
apt-get install language-pack-zh*
vim /etc/environment
PATH="/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games"
LANG="zh_CN.UTF-8"
重新设备本地配置
dpkg-reconfigure locales
重启apache2
systemctl restart apache2
刷新页面, 设置中文
2.4 监控项与乱码
2.4.1图形乱码
配置了中文界面后, web会显示为中文, 但是Ubuntu系统本身是没有相关字体支持的, 因此需要相关字体支持才能显示
2.4.2 上传字体文件
在Windows的C:\Windows\Fonts下, 找一个自己喜欢的中文字体, 拷贝的Ubuntu上
如果是编译安装的Zabbix, 需要把字体上传到/var/www/html/zabbix/assets/fonts目录下
如果是apt/yum安装的Zabbix, 需要把字体上传到/usr/share/zabbix/assets/fonts
具体上传的目录, 是在配置文件中定义
apt/yum查看: /usr/share/zabbix/include/defines.inc.php
源码编译查看: /var/www/html/zabbix/include/defines.inc.php
这里演示在apt安装Zabbix下的操作
- 将字体文件拷贝到/usr/share/zabbix/assets/fonts
ls /usr/share/zabbix/assets/fonts
graphfont.ttf simkai.ttf
# graphfront.ttf是默认的字体文件
- 修改/usr/share/zabbix/include/defines.inc.php文件的72和113行, 修改字体文件名为simkai
vim /usr/share/zabbix/include/defines.inc.php
# 72行 define('ZBX_GRAPH_FONT_NAME', 'simkai'); // font file name
# 113行 define('ZBX_FONT_NAME', 'simkai');
- 保存文件, 直接刷新页面
2.5 Zabbix配置文件详解
监听端口
# ListenPort=10051
# zabbix server监听端口, 默认10051, zabbix agent监听端口默认10050, java gateway端口默认10052
zabbix服务器与远端服务器通信的源地址
# SourceIP= #多IP地址情况下,与其他服务器通信使用的源IP地址; 只适用于zabbix server有多个网卡情况下, 单网卡时不用指定
Zabbix日志类型
# system - syslog #使用syslog, /var/log/syslog
# file - file specified with LogFile parameter #编译安装的日志存放在LogFile=/tmp/zabbix_server.log, 如果是apt安装的zabbix server, 日志存放在/var/log/zabbix目录里
# console - standard output #容器中可以使用标准输出, 把日志显示到标准输出上
指定日志文件大小
# LogFileSize=1 #指定日志滚动写入大小,当达到指定大小时,会删除旧日志重新从头写入新日志, 以M为单位, 默认无限制. Zabbix本地磁盘空间不大时, 可以设置
日志显示级别
# Specifies debug level:
# 0 - basic information about starting and stopping of Zabbix processes
# 1 - critical information
# 2 - error information
# 3 - warnings #默认warnings
# 4 - for debugging (produces lots of information) #排错时可以用4, 但是会占用大量磁盘空间
# 5 - extended debugging (produces even more information)
pid路径
# PidFile=/tmp/zabbix_server.pid
保留历史数据
# HistoryStorageURL= #配合elasticsearch服务,保存zabbix历史数据到ES里面,优化zabbix性能,新版本zabbix才支持, zabbix查历史数据时可以在ES查, 效率比使用MySQL高
zabbix server预启动实例数量, pollers就是zabbix监控数据的收集器; zabbix默认工作在被动模式下, zabbix server会通过pollers进程与被监控节点建立连接收集数据, 因此根据被管理节点的数量不同, 要调整pollers进程数量, 一般是每个pollers进程会平均收集若干个被管理节点的数据; 在主动模式下, 无需pollers
# StartPollers=5 #预启动多少个实例数量, zabbix中, 一个实例就是一个zabbix server进程, 默认5, zabbix主进程只有一个, 其余都是主进程的子进程
# 这里修改pollers为10
StartPollers=10
zabbix 39970 0.0 0.9 223008 9728 ? S 18:54 0:02 /apps/zabbix_server/sbin/zabbix_server: poller #1 [got 0 values in 0.000011 sec, idle 1 sec]
zabbix 39971 0.0 0.9 223008 9728 ? S 18:54 0:02 /apps/zabbix_server/sbin/zabbix_server: poller #2 [got 0 values in 0.000011 sec, idle 1 sec]
zabbix 39972 0.0 0.9 223012 9728 ? S 18:54 0:02 /apps/zabbix_server/sbin/zabbix_server: poller #3 [got 2 values in 0.000097 sec, idle 1 sec]
zabbix 39973 0.0 1.0 223132 10592 ? S 18:54 0:02 /apps/zabbix_server/sbin/zabbix_server: poller #4 [got 0 values in 0.000038 sec, idle 1 sec]
zabbix 39974 0.0 0.9 223156 9728 ? S 18:54 0:02 /apps/zabbix_server/sbin/zabbix_server: poller #5 [got 0 values in 0.000009 sec, idle 1 sec]
预启动进程, 处理zabbix agent数据, 根据agent节点数量进行调整
# StartPreprocessors=3 #预启动多少个进程用于处理zabbix agent数据, 默认为3个. 一般要躲开
# 这里开5个
不可达主机的轮询进程的初始实例启动数量, 被管理节宕机后, 由该进程对主机进行探测, 观察主机是否恢复. 这些进程就是StartPollersUnreachable
# StartPollersUnreachable=1 #不可达主机的轮询进程的初始实例启动数量, 一般开启2-3个即可. 如果不可达主机过多, 就说明网络或者服务出问题了
触发器进程
# StartTrappers=5 #预启动的Trappers进程数量, 用于做报警, 如果报警过多需要调多
# StartPingers=1 #ICMP ping进程的初始实例数量, 监控网络设备时, 用ping
# StartDiscoverers=1 #自动发现主机的进程数量; 配置zabbix server对某个网段进行自动发现, 如果主机安装了agent, 那么会自动把主机加入到监控列表
# StartHTTPPollers=1 #http 进程数量, 根据访问zabbix页面的人数进行调整
计时器进程数量
# StartTimers=1 #计时器实例数量,计时器用于计算问题的发生时间和步骤同步等; zabbix内部有很多和时间相关的设置, 比如发送报警. 报警一旦触发, 会按照设置的间隔时间去发送报警信息, 间隔时间的计算由zabbix计时器进程去计算处理
# StartEscalators=1 #escalators进程的初始实例数量,用于处理动作中的自动步骤的进程的数量; 发送告警前, 会先执行预定义动作, 比如连续三次探测失败, 才会触发报警; 或者定义告警发送几次后如果问题还存在, 那么就把告警信息发送给其他人
java网关相关配置
JavaGateway= #javagateway服务器地址,java pollers必须设置
JavaGatewayPort=10052 #javagateway端口
StartJavaPollers=20 #java轮训实例预启动数量, 根据监控的java服务器数量进行调整
监控vmware
# StartVMwareCollectors=0 #用于设置监控VMWARE Esxi主机实例时使用,若为0则不启用,若要监控ESXI主机,此值最少为1,根据监控ESXI数量设置对应数值
zabbix server监听地址
# ListenIP=0.0.0.0 #监听地址, 默认0.0.0.0
agent的历史数据删除
# HousekeepingFrequency=1 #zabbix对于agent的每个监控项都会保存历史数据, 并且可以自定义保存时长, 到期会自动删除, 该频率默认为1小时, 也就是zabbix会每隔一个小时查看有没有过期的历史数据, 有就删除, 一般可以每天清理一次, 防止历史数据过多, 占用磁盘空间
# MaxHousekeeperDelete=5000 #每次最多删除历史数据的行数, 默认是删除5000行, 但是由于监控项很多, 可以设置为最大值1000000行
# CacheSize=8M #配置信息缓存大小, 保存zabbix配置信息, 所有加入到zabbix的监控项都属于配置信息, 因此该选项值要调大, 根据监控项数量调整, 比如2G,4G
# 这里改为128M
CacheSize=128M
# CacheUpdateFrequency=60 #Zabbix更新缓存数据的频率,单位为秒,范围是1-3600, zabbix每间隔多久, 更新一次配置信息, 可以配置为3,或5分钟更新一次
# StartDBSyncers=4 #zabbix和数据库同步数据的进程数量, zabbix agent和proxy发给zabbix server的数据, 最终都是通过zabbix server写入到数据库, 因此, 启用多少个DB同步进程, 就会影响数据同步, 建议调大, 8|16等
# 这里改为8
StartDBSyncers=8
# HistoryCacheSize=16M #历史数据的缓存大小, 具体根据服务器的内存进行调整
# 这里改为128M
HistoryCacheSize=128M
# HistoryIndexCacheSize=4M #历史数据索引缓存的大小, 根据zabbix server服务器的内存大小进行调整; 查看zabbix web的图形信息时, 会使用历史或者趋势数据, 可以将这些数据放入缓存, 尽快效率, 可以设为2G
# 这里改为32M
HistoryIndexCacheSize=32M
# TrendCacheSize=4M #用于设置划分多少系统共享内存用于存储计算出来的趋势数据,此参数值从一定程度上可影响数据库读压力,范围是128K-2G. 这个就是趋势数据的缓存大小
# 这里改为32M
# ValueCacheSize=8M #历史值缓存的大小,就是监控数据的值, 用于缓存历史数据请求的共享内存大小
# 这里改为32M
ValueCacheSize=32M
Timeout=4 #agent采集数据, 返回数据等待超时时间, 默认4秒, 也就是说zabbix server给agent下发收集数据指令后, 会等待4秒, 如果agent在4秒内没有返回数据, zabbix server会尝试一定次数后,认为服务器宕机, 一般建议调大, 设为最长30秒, 避免由于网络延迟或者服务本身响应的问题, 导致服务本身没问题, 但是agent响应超时, 被zabbix server误认为服务不可用
# TrapperTimeout=300 #触发器处理新数据的最长时间,单位是秒, 可以指定为1分钟, 触发器超时时间不宜过长
# UnreachablePeriod=45 #当主机不可达多少秒后,设置为主机不可用,单位是秒,范围是1-3600, 建议时间调大, 比如60秒
# UnavailableDelay=60 #当主机不可用了,多久检查一次该主机的可用性,单位为秒,范围是1-3600, 时间不要太短, 否则导致检查频率过大, zabbix负载增高
# AlertScriptsPath=${datadir}/zabbix/alertscripts #监控报警脚本路径,取决于编译时候的datadir参数. 也可以自定义, 只要修改路径即可
# ExternalScripts=${datadir}/zabbix/externalscripts #自定义脚本存储路径, 执行操作, 一般很少用
# FpingLocation=/usr/sbin/fping #fping命令的位置, 需要手动确定fping位置
ping和fping都可以使用, 不过ping默认会持续ping ,fping会直接返回对方是否可达, 返回alive或者unreachable. 一般对于网络设备, 可以使用fping
# LogSlowQueries=0 慢日志时间(以毫秒为单位),仅当DebugLevel设置为3,4或5时才可用,0 - 不记录慢查询,范围是1-3600000. 用于记录zabbix查数据时, 如果返回时间过长, 可以记录下来
# StartProxyPollers=1 #启用多少子进程与proxy代理端通信,若代理较多可考虑加大此数值,范围是0-250, 进程数要大于等于代理数量的值; 用于被动模式
如果进程数量, 少于代理数量, 那么server需要依次从proxy申请数据, 会有等待排队现象
# ProxyConfigFrequency=3600 #proxy被动模式下,server多少秒同步配置文件至proxy,该参数仅用于被动模式下的代理,范围是1-3600*24*7;
# ProxyDataFrequency=1 #被动模式下,zabbix server间隔多少秒向proxy请求历史数据
该频率就是zabbix server每隔多少秒向proxy收集一次数据, 如果想迅速获取数据, 那么间隔时间不宜过长, 防止添加服务器前, zabbix刚从proxy获取了一次数据, 那么要等一个周期才能获取到新添加节点的数据; 获取数据和同步配置信息的间隔一般设定为一样, 比如都是60秒一次
# Include=/usr/local/etc/zabbix_server.general.conf #导入其他目录的配置文件, 一般是自定义监控项, 通过自定义脚本去获取监控数据
# Include=/usr/local/etc/zabbix_server.conf.d/
# Include=/usr/local/etc/zabbix_server.conf.d/*.conf
修改配置后, 重启zabbix-server
systemctl restart zabbix-server
- 补充:
监控查询很慢时, 可以查看是否增加了历史数据和趋势数据缓存大小
自动发现一般也不要用, 因为会增加zabbix的负载, 导致数据延迟, 可以通过api进行添加