ganglia的体系结构=gmetad + gmond, gmetad作为整个系统的调度和展示的控制中心,gmond则分布在每台受监控机器上定期运行各种监控度量(metric) 并将结果送到gmetad.
插件需要写成python module的方式,放置在/usr/lib64/ganglia/python_modules 下面, 简单实例模板如
import random def get_foo_count(name): '''可定制业务方法,返回一个整数值''' return random.randrange(5, 100) + 10 def metric_init(params): '''metric''' global descriptors d1 = { 'name': 'foo_count', 'call_back': get_foo_count, # 名字同业务方法一致 'time_max': 90, # 最大调度间隔时间 'value_type': 'uint', 'units': 'C', 'slope': 'both', 'format': '%u', 'description': 'Number of Foo', 'groups': 'foo_group' } descriptors = [d1] return descriptors def metric_cleanup(): "清除metric" if __name__ == '__main__': metric_init({}) for d in descriptors: v = d['call_back'](d['name']) print 'value for %s is %u' % (d['name'], v)
metric_init 是初始化方法,返回本plugin要写的metric描述的列表, 在这只返回一个metric.
写完可以在命令行直接测试,如果输出 value for foo_count is 82 这样的结果就表示基本没有问题了。
接下来的工作是让gmond知道这里有ganglia插件,在/etc/ganglia/conf.d 目录下写个foo.pyconf 就可以
modules { module { name = "foo" language = "python" } } collection_group { collect_every = 60 time_threshold = 60 metric { name = "foo_count" title = "Foo Count" value_threshold = 1.0 } }
详细资料可以看 http://sourceforge.net/apps/trac/ganglia/wiki/ganglia_gmond_python_modules