像MIUI一样做Zabbix二次开发(7)——问答

Q:用Zabbix怎么去监控IBM的power服务器(硬件方面的)

A:硬件监控,ipmi  和SNMP,带外管理口集成


Q:ipmi获取数据有时候回拉不到

A:ipmi的监控zabbix低版本的的确轮训会很差,有这个问题,Zabbix在升级版本中也一直对这块做了优化,尽量用高版本的Zabbix


Q:ipmi 监控IBM服务器硬件的时候经常获取不到数据,监控效果很差

A:是的,Zabbix的每个版本都有所优化,ipmi也有相应的配置参数,相对调整也可以加快轮训


Q:业务监控怎么做的

A:我们是分两层做的,一个业务本身可用性监控,一个是依赖监控,然后建立关系


Q:有用容器做Zabbix-server进程的案例吗?

A:有,做过


Q:业务数据怎么做

A:业务数据需要单独做,我们通常是独立做一个应用再与我们的平台集成,集成主要在显示层


Q:Oracle的监控,能详细说说吗

A:我们让DBA独立写的监控脚本,放弃了orabbix


Q:zabbix案例中最多监控多少设备?实施

A:看item


Q:你们代码开源了吗?

A:我们研发了很久,投入很大,代码暂时不开源,计划明年开放一部分功能


Q:老师你好,能讲讲Zabbix对docker容器的监控方案吗?

A:基本:运行状态数量、统计数量、版本、暂停状态数量、停止状态数量

自动发现:IO读写操作字节数、容器状态、CPU使用率百分比、磁盘使用、内存限制值、内存使用率、网络收发字节、总缓存、交换分区、运行时间等等


Q:Zabbix Server作为监控处理中心,怎么做高可用?

A:WEB层,DB层,Proxy,层层实现,建议做一层冷备


Q:请问,如何做预警?

A:3.0以上就已经有这个功能了,通过类似Forecast这样的函数实现,Forecast


Q:这两个函数效果一般,有没有更好的办法?

A:原生的只要这两个,可以结合多种表达式做优化。


Q:监控触发报警的阀值,能根据历史采样数据做到动态设置吗

A:现在还不行,trigger还是静态的,需要做二次开发


Q:您好!如何把不同的磁盘分区报警发给不同的人,如WebLogic分区告警发给中间件管理员,oracle分区报警发给数据库管理员,有什么好办法吗?

A:通过告警和报表订阅实现,Zabbix原生还没有


Q:容器上跑Zabbix-server的坑能讲讲吗?

A:我们2015年用docker跑过,发现了一些问题,比如说JDBC当时没有提供,监控不了数据库,最近的版本还没有尝试。


Q:Zabbix-server的高可用,一般用什么组件实现?zookeeper?keepalive?还是其他的?

A:我们用keepalive


Q:刚才你提到的IBM的小机的带外管理口是指HMC管理口吗

A:是的,拿Zabbix监控硬件需要掌握原厂的MIB库


Q:请介绍下如何做告警收敛的?

A:我们做了管理上的收敛,Zabbix原生可以配置告警依赖,另外触发器事件模式配置单重等,计划未来在实践不尝试去做告警的智能收敛,这个步骤我们会相对谨慎,宁可适当多发,也不漏发,避免影响监控的覆盖率和准确率


Q:监控触发报警的阀值,能根据历史采样数据做到动态设置吗,有结合一些数据挖掘算法的案例吗

A:需要二开


Q:Zabbix和自动化部署工具,如salt集成有这方面的经验吗?

A:做过一些测试,使用salt自动部署需要解决的问题

1.     rpm包的打包(这个问题不大,官方有提供)

2.    rpm 安装(pkg模块)

3.     配置文件调整(file模块)

4.    服务自启动(service)

5.     配置文件的适配(使用salt的pillar实现)

基本上涉及salt的pkg(包管理模块)、file(文件管理模块)、service(服务管理模块)、pillar模块这四个模块。


Q:Zabbix的版本升级有没有坑?

A:按官方提示操作,逐渐升级版本

1.     不建议跨版本升级,因为版本间可能有表字段的变更,版本跨越太大可能导致系统无法运行

2.     如果非要跨版本升级的话,建议将主机和模板导出,部署完再做导入

3.     如果不是研究的话,版本升级不建议太激进

你可能感兴趣的:(像MIUI一样做Zabbix二次开发(7)——问答)