Zabbix“专家坐诊”第195期问答汇总

问题一
Q:麻烦请教一下zabbix服务器总是上报这几个告警,需要处理嘛?怎么处理?
Zabbix“专家坐诊”第195期问答汇总_第1张图片
A:同步历史数据进程负载过高的话会影响到server的性能,建议增加服务器硬件配置。

Q:是需要增加哪方面的配置,内存嘛还是CPU也要增加,还有以我现在的监控量大概需要什么配置?
Zabbix“专家坐诊”第195期问答汇总_第2张图片
A:这个得结合监控项的采集间隔、历史数据保留时间等因素。

问题二
Q:怎么改这个实现触发告警无延迟?
Zabbix“专家坐诊”第195期问答汇总_第3张图片
A:采集间隔越低告警触发延迟越低,更改如下。
Zabbix“专家坐诊”第195期问答汇总_第4张图片
Q:目前更新间隔是30S不长啊。

A:那监控项达到触发器阈值最快会在30秒触发

Q:不是啊,测试是3分钟啊,是要测试的主机 IP 地址,5 是 ping 测试的超时时间,2000 是 ping 测试的间隔时间,68 是 ping 测试的数据包大小,1000 是 ping 测试的重试次数。另外,好像达到告警阈值就是3分钟,而且不能手功改,一改就报错。

A:触发器表达式吗?

Q:是的。

A:跳转到模板那边能改。

Q:这模板没有啊。
Zabbix“专家坐诊”第195期问答汇总_第5张图片
A:找到icmp对应的触发器。

Q:触发器就是我发的,找不到啊。
Zabbix“专家坐诊”第195期问答汇总_第6张图片
A:那这个触发器引用的哪个监控项?

Q:没有引用啊,貌似是监控项里边自己手工加的。

A:那这个触发器哪来的。

Q:我也不知道。

A:先看看有没有icmp的监控项,再创建触发器引用这个监控项。

问题三
Q:各位大佬,这个里面的叫【最后一个】的这一项是啥意思呀?不同版本的zabbix的触发器表达式是不是不一样呀?我网上查到的格式和这不一样。

A:需求是啥?在多长时间内cpu空闲时就告警?

Q:需求是cpu使用率超过85%告警

A:min(/Linux by Zabbix agent/system.cpu.util,5m)>85,获取过去5分钟内 Linux 主机的 CPU 利用率的最小值,如果这个最小值大于85%,则触发告警。

Q:好的,我试试。

问题四
Q:alert->media type 配置了一个webhook类型的媒体,媒体中的java script脚本实现向企业微信推送消息,推送的内容是item采集到的值,如何将Item的值在media type中引用?也就是如何把item的值通过script推送出去?

A:webhook用于推送告警信息,获取监控项的值的话建议用api。

Q:不是,我的Item值不是告警信息,是文本;还有一个情况,我配置的Hosts下午还在看,怎么突然数据都丢失了?能恢复吗?

A:webhook就是用来推送告警的,最新数据那里应该有历史数据。
Zabbix“专家坐诊”第195期问答汇总_第7张图片
Q:然后呢,怎么恢复?

A:是主机丢失了还是监控项的值丢失了

Q:hosts都没了

A:那恢复不了。

问题五
Q:大神们,这个alert message命令行参数数据格式是啥啊?可以在哪里查到这个参数具体数据?


A:如下:
Zabbix“专家坐诊”第195期问答汇总_第8张图片
更多zabbix技术资料,请持续关注乐维社区

你可能感兴趣的:(zabbix有问有答,zabbix,服务器,网络)