论产品的需求与实现系列之监控系统

         产品的需求与实现系列:

         论产品的需求与实现系列之日志系统

         论产品的需求与实现系列之监控系统

         论产品的需求与实现系列之数据平台

         论产品的需求与实现系列之ci持续集成

 

        说到监控,这是一个老生常谈的话题,常见的nagios,zabbix,openfalcon,zenoss,hyperic HQ, cacti,graphite ,grafana,oneapm........大家都会列举一堆出来。这期是就我做过的监控需求项,做一个汇总。

       常见的安例:

               六大工业级开源监控软件介绍 

               基于Zabbix + Docker开发的监控系统

               使用ganglia监控hadoop及hbase集群

               Bosun监控告警系统

               curl方式实现zabbix以微信形式报警

              报警监控平台之设计url回调webhook管理系统

              zabbix监控多JMX端口

              日志系统与监控系统分阶段计划与演示

              Graphite的百万Metrics实践之路

              influxDB+graphite+grafana+stats+collect+elasticserach+zabbix

              使用StatsD, Graphite, Grafana, Kamon搭建可用于JVM项目的可视化性能监控系统

              基于jmx_api采集jvm遇到坑

              创业型公司如何做好监控报警

              论客户端埋点

               基于Lua+Kafka+Heka的Nginx Log实时监控系统

 

          可见监控方案如此之多,没有最优,只有更适合的场景。

 

           需求一:监控web或api的健康度。

           解决需求一: zabbix+mail+微信+短信(这个不太好搞,毕竟要收费)

           
论产品的需求与实现系列之监控系统_第1张图片
 

            需求二:监控网站的qbs,zookeeper

            解决需求二:zabbix+nginx的stub_status,nc

            

            location /ns {

                 stub_status on;

                  allow xx;

                  deny all;

              }

            count=`echo stat|nc $IP $PORT |grep Received |awk -F ":" '{print $2}'`

论产品的需求与实现系列之监控系统_第2张图片
 

  

          需求三:监控应用的jvm

          解决需求三:zabbix+jmx

          

 

           需求四:api,socket,ws,线程池等数扰

           解决需求四:kamon+statsd+graphite+grafana+zabbix(alert)

 

          
论产品的需求与实现系列之监控系统_第3张图片
 

            报警系列还没做起来,目前是先有规划。

 

          总结:做到需求四的时候是最累的,研究了statsd五种发送原理及摸拟测试,graphite参数优化及摸拟测试,到最后grafana报表展示。在这过程如何去核对采集过来数据的有效性,还是很折磨人。

           成功的产品是要产生价值的。

            

 

你可能感兴趣的:(Monitor)