场景模拟:

  1. 企业需要对某台执行一个清理系统垃圾的脚本
  2. 企业需要对某台数据库执行一个查询数据库的脚本
  3. 企业需要对某台监控设备进行一系列动作的脚本

现象分析
使用过zabbix调用脚本的运维人员都知道的一个现象,就是如果脚本运行的时间超过30s秒,就会获取该脚本执行的结果。
上述原因是zabbix的内部源码造成的,它限制了脚本执行的时间最多不超过30s

现象重现
我们在/usr/local/zabbix/scripts/目录下创建一个test目录,并创建一个test.py脚本,(shell脚本也行)
我们在脚本中加一个time.sleep(35),模拟脚本调用超时现象
企业真实案例:zabbix调用脚本超时解决方案_第1张图片
执行改脚本。Time python test.py
企业真实案例:zabbix调用脚本超时解决方案_第2张图片
从上图可以看出。手动执行改脚本是可以输出结果的。
接着在zabbix创建脚本,执行调用该脚本的操作
企业真实案例:zabbix调用脚本超时解决方案_第3张图片

调用脚本
企业真实案例:zabbix调用脚本超时解决方案_第4张图片
企业真实案例:zabbix调用脚本超时解决方案_第5张图片
企业真实案例:zabbix调用脚本超时解决方案_第6张图片
上图证明zabbix调用脚本有超时限制
解决方案
通过agent的内置键system.run+zabbix_sender结合实现,调用脚本并返回结果

第一步:
采用zabbix_agent内置键调用test.py脚本
System.run[command,nowait]
Command:要执行的命令或者脚本
Nowait:不等待用户返回的结果,永远返回1
企业真实案例:zabbix调用脚本超时解决方案_第7张图片

图中的{HOST.IP}zabbix的内置宏,他的作用是自动获取该脚本的主机ip
注意:最好写绝对路径,否则可能出现报错
图中如果system.run的command参数中间有空格请加单引号或者双引号

第二步:
再次调用该脚本看一下
企业真实案例:zabbix调用脚本超时解决方案_第8张图片
企业真实案例:zabbix调用脚本超时解决方案_第9张图片
企业真实案例:zabbix调用脚本超时解决方案_第10张图片
如果,此时脚本其实已经调用成功了,不会再出现超时提示。

第三步:
接收超时脚本的结果
创建一个zabbix采集器的监控项,命名为test
企业真实案例:zabbix调用脚本超时解决方案_第11张图片
调整test.py脚本结合zabbix_sender使用

总的过程就是通过system.run[command,nowait]内置键,触发该脚本,然后test.py脚本执行完成后,把结果发送到监控主机上。
再次调用该脚本,永远返回1.
检查zabbix-server上的名称为test这个zabbix采集器的监控项有没有clean finish的字符串,有则说明,zabbix调用脚本成功。
企业真实案例:zabbix调用脚本超时解决方案_第12张图片
验证成功。上述方法已经解决了脚本超时无法执行的问题。