监控zabbix面试题

目录

1.我们可以用zabbix监控哪些

2.zabbix的主动监控与被动监控

3.Zabbix监控做过哪些

4.zabbix监控mysql的四大性能指标:

5.配置zabbix自定义监控流程

6.安全组是什么,限制了3306的入规则,客户端还能访问吗

7.Nagio监控?

8.服务器一般需要监控哪些项目? 凭借这些项目如何判断服务器的瓶颈?

9.zabbix监控mysql的io情况是否正常的流程

10.监控MySQL主从同步是否异常,如果异常,则发送短信或者邮件给管理员。

11.zabbix如何修改其中监控的一台服务器中内存阈值信息,比如正常内存使用到了 80%报**警,我想修改为 60%报警?

12.报警类型和故障处理:

13.告警屏蔽:


1.我们可以用zabbix监控哪些

1. 硬件监控。 通过 SNMP 来进行路由器交换机的监控
2. 系统监控。 如 CPU 的负载,上下文切换、内存使用率、磁盘读写、磁盘使用率、磁盘 inode 节点。
3. 服务监控。 比如公司用 LNMP nginx 自带 Status 模块、 PHP 也有相关的 Status MySQL 的话可以通过 percona 来进行监控。 4. 网络监控。 如果是云主机又不是跨机房,那么可以选择不监控网络。
5. 安全监控。 如果是云主机可以考虑使用自带的安全防护。当然也可以使用 iptables 。 如果是硬件,那么推荐使用硬件防火墙。
6.Web 监控。 web 监控的话题其实还是很多。比如可以使用自带的 web 监控来监控页面相关的延迟、 js 响应时间、下载时间、等等。
7. 日志监控。 如果是 web 的话可以使用监控 Nginx 500x 日志。 PHP ERROR 日志。
8. 流量分析。 平时我们分析日志都是拿 awk sed xxx 一堆工具来实现。 这样对我们统计 ip pv uv 不是很方便。那么可以使用百度统计、 google 统计、商业,让开发嵌入代码即可
9. 可视化。 通过 screen 以及引入一 些第三方的库来美化界面,同时我们也需要知道、订单量突然增加、 突然减少。或者说突然来了一大波流量,这流量从哪儿来,是不是推广了,
还是被攻击了。可以结合监控平来来梳理各个系统之间的业务关系。
10. 自动化监控。 如上我们做了那么多的工作,当然不能是一台一台的来加 key 实现。 可以通过Zabbix 的主动模式以及被动模式来实现。当然最好还是通过 API 来实现。

2.zabbix的主动监控与被动监控

主动监控和被动监控都是相对于被监控端主机而言的
默认 zabbix 采用被动监控
当监控主机达到一定量级后 ,zabbix 服务器会越来越慢 , 此时可以考虑使用主动监控 , 释放服务器的压力 zabbix 也支持分布式监控
被动监控 :server Agent 发起连接 , 发送监控 key,Agent 接受请求 , 响应监控数据
主动监控 :Agent server 发起连接 ,Agent 请求需要检测监控项目列表 ,server 相应 Agent 发送一个 items 列表 ,Agent 确认收到监控列表 ,TCP 连接完成 , 会话关闭 ,Agent 开始周期性收集数据
区别 :
server 不用每次需要数据都连接 Agent,Agent 会自己收集数据并处理数据 ,Server 仅需要保存数据 即可

3.Zabbix监控做过哪些

zabbix监控mysql集群:1)创建并编辑监控mysql的脚本(通常有脚本模板),添加执行权限

         2)修改zabbix-agent配置文件,默认有一个MySQL的子配置文件,直接编辑该文件即可,数据库添加授权用户

         3)重启zabbix-agent

       4)Web界面配置、点击需要监控的主机,进去添加监控模板,自带的Template DB MySQL

         5)配置完成后等一会儿就可以查看到监控主机的MySQL监控信息

如果发现监控没有数据,请排查如下问题

\1. zabbix客户端是否重启

\2. 脚本是否有执行权限

\3. 数据库是否有用户授权

\4. 环境变量是否有问题

4.zabbix监控mysql的四大性能指标:

        查询吞吐量  

        查询执行性能  

        连接情况

        缓冲池使用情况

5.配置zabbix自定义监控流程

①被监控端修改 Agent 配置文件 ( 修改是否允许自定义 key, 加载配置文件目录 )
②被监控端创建存放自定义 key 文件 ( zabbix_agentd.conf 文件中定义 ), 书写自定义 key ③重起客户端 agentd
④测试自定义 key 是否生效
⑤在 zabbix 页面创建监控模板 , 创建应用 , 创建监控项 , 关联主机

6.安全组是什么,限制了3306的入规则,客户端还能访问吗

因为安全组的默认规则是在出方向上的数据报文全部放行,同一个安全组内的弹性云服务器和华 为云关系型数据库实例可互相访问。
默认情况下,一个租户可以创建 500 条安全组规则。
为一个安全组设置过多的安全组规则会增加首包延时,因此,建议一个安全组内的安全组规则不超过 50 条。
当需要从安全组外访问安全组内的华为云关系型数据库实例时,需要为安全组添加相应的入方向 规则。
限制了 3306 的入规则,客户端就没有办法访问了,就好像 ping 一样

7.Nagio监控?

不用存储历史数据,注重服务或者监控项的状态
Nagios 是一款开源的免费网络监视工具,能有效监控 Windows Linux Unix 的主机状态,交换机路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网 站运维人员,在状态恢复后发出正常的邮件或短信通知。;
Nagios 可以监控的功能有:
监控网络服务( SMTP POP3 HTTP NNTP PING 等);
监控主机资源(处理器负荷、磁盘利用率等);
简单地插件设计使得用户可以方便地扩展自己服务的检测方法;
并行服务检查机制;
具备定义网络分层结构的能力,用 "parent" 主机定义来表达网络主机间的关系,这种关系可被用来发现和明晰主机宕机或不可达状态;
当服务或主机问题产生与解决时将告警发送给联系人(通过 EMail 、短信、用户定义方式);
可以定义一些处理程序,使之能够在服务或者主机发生故障时起到预防作用;
自动的日志滚动功能;
可以支持并实现对主机的冗余监控;
可选的 WEB 界面用于查看当前的网络状态、通知和故障历史、日志文件等;

8.服务器一般需要监控哪些项目? 凭借这些项目如何判断服务器的瓶颈?

1)比如网站故障监控、服务器性能监控、网站安全监控、用户访问速度监控等;内存,IO,

CPU,网络,这个四个模块是必须的;

2)不能单一指标衡量性能瓶颈,比如说是IO出现在性能瓶颈:

第一种是调整缓冲区的大小、调整缓冲区中的数据同步的磁盘中的时间

第二种是修改磁盘调度算法,查看的路径cat /sys/bock/sda/queue/scheduler

9.zabbix监控mysqlio情况是否正常的流程

zabbix 的配置文件中开启自定义监控
编写监控脚本,过滤出 mysql IO 线程是否为 yes
编写自定义监控文件,监控脚本
测试定义的监控命令是否成功
zabbix 网页中自定义监控项,添加监控文件中的 UserParameter

10.监控MySQL主从同步是否异常,如果异常,则发送短信或者邮件给管理员。

a. 开发一个守护进程脚本每 30 秒实现检测一次。
b. 如果同步出现如下错误号( 1158,1159,1008,1007,1062 ),则跳过错误。
c. 请使用数组技术实现上述脚本(获取主从判断及错误号部分)。
#!/bin/bash
mysqlbin=/usr/bin/mysql
mysqlhost=127.0.0.1
mysqluser=root
mysqlpwd=root
skiperrors=(1158 1159 1008 1007 1062)
admin=' [email protected] '
check() {
LASTNO= mysqlbin -h
mysqluser -p$mysqlpwd -e "show slave
status\G"|grep Last_Errno|awk -F: '{print $2}')
}
skip() {
for errorno in  skiperrors[@];doif[errorno == LASTNO] ;thrnnotify errorno
break
fi
done
}
notify() {
text="mysql slave monitor error: I "echotext|mail -s 'mysql error'
}
main() {
while :;do
check && skip || notify "mysql connected failed!"
sleep 30
done
}
main

11.zabbix如何修改其中监控的一台服务器中内存阈值信息,比如正常内存使用到了 80%**,我想修改为 60%报警?

正常来说 , 一般会把监控的服务器统一加入到一个模板中 , 修改模板的其是某一项的监控项
参数和告警阈值后 , 加入模板中的所有主机都会同步。如果单独想修改其中某一台服务器内
存告警阈值 , 需要进入这台主机 , 单独创建一个告警 Triggers, 关联这台主机监控内存的项 ,
配置好告警的阈值为 60% 即可实现。

12.报警类型和故障处理:

1.E-mail 邮件 2.微信报警等

故障:如监控服务器down机不报警

解决:1.先定位问题:zabbix服务器采用轮询的方式从监控目标机的agent获取数据。但如果目标机down了,目标机的agent通常也无法工作,所以检查被监控的主机服务

2.增加一个目标主机进行是否存活的检测。

告警收敛:

        1)所有产生告警均由zabbix调用脚本推入缓存redis当中。

        2)分析系统将在规定时间(1分钟)内去redis中拉取数据,根据定义好的一系列规则进行,合并、分析或直接丢弃,并存入分析平台数据库,以便供历史查询。

        3)根据预先定义好的规则将报警通过定义好的方式发送给相关人员。

13.告警屏蔽:

1、处于维护中的主机,告警信息还是会报出来,但是不会触发动作;

2、对于可预知的临时维护或紧急维护,可以提前设置告警屏蔽;

3、可针对组、单台或多台主机,进行一次性、每日定时、每月定时、每周定时屏蔽;

4、前端可以将维护中的主机不进行显示,Dashboard右上角有个图标可以进行筛选是否显示维护中的主机;

5、告警屏蔽时,可以设置采集数据或不采集数据两种方式;

至此,zabbix的告警屏蔽介绍完成。

你可能感兴趣的:(面试题,zabbix)