对与ganglia这里只介绍它的起源,这里没写太多关于ganglia的安装和使用,有兴趣的去google,共同讨论。

       Ganglia 项目是由加州大学发起的,现在已经成为一个应用非常广泛集群监控软件。可以监视和显示集群中的节点的各种状态信息,比如:cpu 、mem、硬盘利用率, I/O负载、网络流量情况等,同时可以将历史数据以曲线方式通过php页面呈现。同时具有很好的扩展性,允许用户加入自己所要监控的状态信息。

       ganglia是分布式监控的首选工具,配合nagios的监控更是让服务有一个可靠的保障,随着监控的需求越来越大,各种变更也就复杂起来,就监控来说,技术们可以在其长时间的监控数据当中观察出自家网站的发展,服务器的健康状态,但中间不免会有各种各样的网络变动,那我们的监控数据就是最宝贵的资源。那我们要怎么保证我们变更后的监控能够读取以前的监控数据呢?

      首先我们需要了解ganglia监控的原理,这里不做过多解释,详见官网解说www.ganglia.info,我们了解到ganglia的server端采集到的agent端的数据,经过处理存放在/var/lib/ganglia/rrd目录下,目录下数据的存放会按照我们定义的gmetad的data_source分组来存放,我们的所有监控数据就在这里,当我们的分组需要更改新的data_source名称或者原被监控服务器更改ip等身份信息时,那我们的监控数据会重新生成,在web端就不会展示以前的监控数据,这时想要恢复以前的监控数据的方法十分简单只需要把你想恢复的数据拷贝到现在监控的主机对应的目录下即可,但有一点要注意,这个过程是覆盖,那你在新一轮的监控开始到被覆盖的这段期间的监控数据便会丢失,所以建议有计划的去变更,已减少最少的数据丢失。