成果展示:
一个项目单独拎出来:
说明:
后续可以考虑扩展:
2.2新架构技术特点
netdata特性:
1、效率高,资源开销低
2、可扩展性强,社区活跃,github 50k start
3、自带web界面,信息全,可替代dstat等linux工具
4、支持到秒级甚至实时监控
5、自带120+常用组件采集脚本,减轻工作负担
Prometheus特性:
1、基于时序数据库,存储效率高
2、支持集群模式,组合thanos扩展性强
3、云原生,容器化场景最热门方案
netdata+Prometheus对比zabbix架构
优点:
1、时效性从分钟级提高到秒级
2、存储、查询效率高
3、每个客户端提供一个漂亮的web界面、信息全,可大量减少登录服务器查询的次数
4、支持集群模式,扩展性强
5、直接支持一部分暴露jmx、metric信息的服务,减少监控脚本配置工作量
6、云计算、容器化场景更适合
7、数据持久化,原则支持无限长时间数据
8、支持降采样,极大提高长时间跨度查询效率
9、云原生项目,可容器化
缺点:
1、指标众多,需进行适当裁剪
2、自定义数据类型,有误差(最大误差0.0001%)
3、自定义采集脚本需要脚本开发能力(go、python),相比zabbix(shell)学习成本高
总结:
通过对比、了解业务各种报警监控采集方案,采用netdata + Prometheus + consul + thanos方案,效率更高、功能更强大、可扩展性强,较为符合云原生业务发展和需求。