本文纯抛砖引玉,如有高见请多指教

目前还没完成,暂时以今天看的一些资料整理开始
一是wiki上推荐的几种优化途径
http://en.doc.centreon.com/Optimizations
简单来讲
1 针对MySQL数据库单独优化其参数
2 修改默认的ndoutils模块
3 启用各poller的ssh压缩,适用分布式环境中
4 建立索引来降低poller的重启时间
 
我自己只试了第3条,目前来说效果不大
 
再就是参考某高人专门针对mysql入库的一些优化 
http://www.centreonchina.com/blog/?p=96
这里比较详细,我只做的修改ndomod.cfg来减少不必要的入库,短时间看貌似也没太多效果
再就是更换为底层nagios为centreon自己的引擎
http://documentation.centreon.com/01-centreon/centreon_engine/documentation/configuration/advanced/tuning_centengine_for_maximum_performance?s[]=optimize
 
我的架构及负载情况
一个核心,6个poller,共监控1000多台机器,10000多服务
核心为Dell R410机器,单盘
全部监控后核心负载也不算太高,但是iowait值一度达到20以上
 
最新进展(实际真有效果):
mysql占用率一度达到300%cpu,centreon基本不能用,巨卡
后是通过把centreon nagios库里面的所有表改成innodB引擎优化到20%以内
详细步骤:
centreon优化--更改MyISAM为InnoDB引擎减少表锁的状态
 
mysqladmin process|grep -v Sleep
再查看慢查询日志(mysql默认是不开慢查询的),发现一些sql执行时长40多秒,涉及到的表也是nagios库里的表
发现nagios库有大量lock状态,(十几个吧,貌似也算很多了)
 
mysqldump nagios >nagios.sql
 
sed 's/MyISAM/InnoDB/g' nagios.sql
mysql nagios