cacti不能获取数据或者显示图经常碰到的问题

一、snmp和网络是否正常

    通过在cacti服务器上运行snmpwalk   -c    public    -v  2c    ip,能够正常返回数据,排除snmp和网络的问题。

 注意:-c    后跟共同体名   public为community名,此处可变,需根据自己环境设置进行更改!

       -v    snmp版本

       ip    为被监控端的IP

       

 

二、查看cacti全局参数设置

    经查看cacti全局参数设置中的路径,采集器等均没有问题。

 

三、检查cacti服务器上rra和log的目录权限

    查看rra和log目录属主均是web程序运行用户,有对rra和log目录的读写权限,没有问题。进入rra目录,发现所有图像文件的修改日期均是前几天的,也就是说最近都没有获取到数据,更新到rra文件;进入log目录,发现cacti.log文件达到2G,log不记录东西了,mv cacti.log cacti.log.old,重新生成cacti.log,故障依旧。

 

四、检查cacti.log

    snmp能够获取到数据,rra和log权限也均没有问题,为什么还不能获取到数据呢?

    开启cacti全局设置中的详细日志,tail -f cacti.log查看日志,发现有很多类似日志:

    WARNING: Result from CMD not valid.  Partial Result:

    这是cacti采集器没有获取到相关主机的返回数据。同时发现有如下日志:

    Maximum runtime of 292 seconds exceeded. Exiting.

    是说在一个循环周期内(5min),cacti没有获取完所有的数据,自动退出,执行下一循环,

    应该是有太多主机了,同时有很多主机无法连接上超时,导致最终采集器时间超过292s自动退出。

    决定采用cactid来代替cmd.php采集,同时清理数据库中poller_item中的无效,无法连接上,配置错误的记录(重要,可根据cacti.log中得知哪些主机或记录有问题)。

 

五、配置cactid

    新版的叫spine。安装配置cactid:

    tar -zxvf cacti-cactid-0.8.6j.tar.gz

    cd cacti-cactid-0.8.6j

    ./configure (mysql另外安装的需要指安mysql路径)

    make

    mkdir /usr/local/cactid

    cp cactid cactid.conf /usr/local/cactid/

    vi /usr/local/cactid/cactid.conf修改为相应的数据库的用户名和密码。

    全局配置中设置采集器为cactid,并设置好cactid的路径:/usr/local/cactid/cactid

 

    能够正常获取到数据了,查看cacti.log:

    02/12/2011 11:31:03 AM – CACTID: Poller[0] Time: 55.2049 s, Threads: 1, Hosts: 25

    …

    02/12/2011 11:32:04 AM – CACTID: Poller[0] Time: 113.7014 s, Threads: 1, Hosts: 25

    二分钟即能获取到所有的主机数据了,效率提升不少。故障解决。

 

六、如以上还不能解决故障,可通过手动运行:php /var/www/html/cacti/poller.php 查看输出来找到问题所在。



=======================================

cacti安装测试过程中不能显示图形:(2011-09-13)

cd /var/www/html/cacti/log

tail -f  cacti.log

显示如下:

09/13/2011 01:10:03 PM - SYSTEM STATS: Time:1.4293 Method:cmd.php Processes:1 Threads:N/A Hosts:3 HostsPerProcess:3 DataSources:17 RRDsProcessed:11

09/13/2011 01:14:01 PM - CMDPHP: Poller[0] Host[1] DS[11] WARNING: Result from CMD not valid.  Partial Result: U

09/13/2011 01:14:01 PM - CMDPHP: Poller[0] Host[1] DS[11] WARNING: Result from CMD not valid.  Partial Result: U

处理过程如下示:

最後的解法是將 cmd.php 做 chmod a+x 就可以了。

後記:那時感覺很奇怪,poller.php已經指定用php去run,後來想想,可能poller.php內又直接呼叫cmd.php,並未只名為php script。

=================================cacti的排错经验=========================


cacti出不了数据,一般从以下几个方面入手解决问题

1。确认你的cacti主机上能否得到目标机器上的snmp数据
cacti得到目标机器上的统计数据分为两种方法,一种是远程通过snmp协议获取、一种是本地机器通过shell脚本获取。

2。确认你的crontab计划任务有在正常运作
cacti是通过crontab的定时作业每隔一段时间获取数据的,如果定时作业没有运作,肯定也是读取不到数据的

3。确认你的crontab定时作业所执行的作业能获取信息
cacti获取信息用的是poller.php定时运作,然后根据你设置的是用php脚本来执行snmp获取还是cactid来获取,所以,你必须确认你的php能支持php的snmp扩展、或者确认你有正确设置cactid。推荐使用cactid,效率比通过php高10~20倍。

4。确认你的rrdtool的版本
rrdtool1.0.x版本和1.2.x版本有着比较大的差别,在cacti里面要正确设置你的rrdtool的版本。比较容易出现的错误就是你的rrdtool是1.2.x版本,而cacti默认的rrdtool版本为1.0.x版本,如果是这样的话,你的数据收集是正常的,不过由于rrdtool的版本变化导致的命令处理格式的一点差别,cacti的缩微图会画不出来的,而具体的图片时可以画出来,这个,大家要留神一下。

5。当然了,要保证cacti收集的数据能被储藏在你的机器上,要保证收集的数据能被httpd服务读取

以上是我个人对cacti的trouble shooting的一些认识,请各位补充指正。

  将cacti安装好按例子进行配置,想到得到第一个hellow world这样的例子时,常常也会遇到不少的问题,最可能的就是无图,或者有图无数据。
  先说无图吧,主要是检查先确定你的IP地址、snmp comunite、snmp version等信息配置没有错误,如果都没有错误,那么你确定才一个采集周期(一般默认采集周期300秒)以后去检查rra目录,看是否有相应的rra文件生成,如果是新安装,本来rra目录只有一个.placeholder文件。你只要关注以rra为文件后缀的文件即可。如果没有那么一是rra文件权限,windows是ntfs和linux等下有这个问题,其它就检查snmp的设置。


解决cacti中无图或无数据的问题

snmpwalk -v 2c -c public yourIP if


 如果有数据返回,则snmp的数据没有问题。如果出现“Timeout: No Response from ...”之类的错误信息则是snmp设置的问题。

  再说有图无数据吧,一般这样的情况就是snmp采集的结果有问题。这种情况下,一般也会出现新建的device的Data Query里面的状态总是“ Success [0 Items, 0 Rows]”。通过执行snmp命令来检查:

snmpwalk -c community -v 2c hostIP if


  通过结果可以看到是否允许cacti取这些OID的数据。
eg:

snmpwalk -c public -v1 192.168.0.221 .1.3.6.1.2.1.2.2.1.16.2

当cacti 有图没有数据时,而且状态为nan错误解决办法

解决办法:

   1.
[root@codfei rra]# pwd
/usr/local/apache2/htdocs/cacti/rra
[root@codfei rra]# rrdtool fetch fxd-mdl11_traffic_in_365.rrd AVERAGE
按照以上命令执行如果结果输出为:
1197990600:   nan   nan
1197990900:   nan   nan
1197991200:   nan   nan
1197991500:   nan   nan
1197991800:   nan   nan
1197992100:   nan   nan

则表示snmp获取
数据有问题,经过仔细检查发现不能获取流量的主机都是64位系统,
用以下命令检查:
[root@codfei rra]# snmpwalk -c public -v 2c 192.168.1.2 IF-MIB::ifHCInOctets
输出内容如下,表明不支持64位MIB库,终于找到原因了。
IF-MIB::ifHCInOctets = No Such Object available on this agent at this OID

2,需要重新安装snmpd支持64位MIB库,不过正常用源码包安装时在make的时候会出现error,无法继续,
解决方法:
在源码包下config后,先不要make,请先修改以下两个文件。

[root@codfei net-snmp-5.3.1]# vi apps/Makefile
TRAPDWITHAGENT   = $(USETRAPLIBS) -ldl -lrpm -lrpmio -lpopt   -lz -lcrypto -lm
替换成:
TRAPDWITHAGENT   = $(USETRAPLIBS) -ldl -lrpm -lrpmio /usr/lib64/libpopt.so   -lz -lcrypto -lm

[root@codfei net-snmp-5.3.1]# vi agent/Makefile
LIBS          = ../snmplib/libnetsnmp.$(LIB_EXTENSION)$(LIB_VERSION) -ldl -lrpm -lrpmio -lpopt   -lz -lcrypto -lm   $(PERLLDOPTS)
替换成:
LIBS          = ../snmplib/libnetsnmp.$(LIB_EXTENSION)$(LIB_VERSION) -ldl -lrpm -lrpmio /usr/lib64/libpopt.so   -lz -lcrypto -lm 
然后在进行make && make install

3,停止当前linux自带的snmpd,通过daemoonls启动新安装的snmpd就能了。
   这时在用snmpwalk检测,支持64位MIB库了,过一会流量监视的图片也出来了!
[root@codfei rra]# snmpwalk -c public -v 2c 192.168.1.2 IF-MIB::ifHCInOctets
IF-MIB::ifHCInOctets.1 = Counter64: 2400309170
IF-MIB::ifHCInOctets.2 = Counter64: 256326257624
IF-MIB::ifHCInOctets.3 = Counter64: 0
IF-MIB::ifHCInOctets.4 = Counter64: 624808037429
IF-MIB::ifHCInOctets.5 = Counter64: 0
IF-MIB::ifHCInOctets.6 = Counter64: 0
IF-MIB::ifHCInOctets.7 = Counter64: 0
IF-MIB::ifHCInOctets.8 = Counter64: 0

   Cacti监控远程服务器问题解决

使用模板ucd/net - Memory Usage,检测局域网内别的机器发现有图,但是无数据,都是nan,
cacti log有如下错误 
04/22/2009 02:10:08 AM - CMDPHP: Poller[0] Host[7] DS[44] WARNING: Result from SNMP not valid.   Partial Result: U
04/22/2009 02:10:08 AM - CMDPHP: Poller[0] Host[7] DS[43] WARNING: Result from SNMP not valid.   Partial Result: U
04/22/2009 02:10:08 AM - CMDPHP: Poller[0] Host[7] DS[42] WARNING: Result from SNMP not valid.   Partial Result: U
04/22/2009 02:10:08 AM - CMDPHP: Poller[0] Host[7] DS[41] WARNING: Result from SNMP not valid.   Partial Result: U
04/22/2009 02:10:08 AM - CMDPHP: Poller[0] Host[7] DS[40] WARNING: Result from SNMP not valid.   Partial Result: U
04/22/2009 02:10:08 AM - CMDPHP: Poller[0] Host[7] DS[39] WARNING: Result from SNMP not valid.   Partial Result: U

于是
wget ftp://mirror.switch.ch/pool/1/mirror/scientificlinux/5rolling/i386/SL/net-snmp-utils-5.3.1-24.el5_2.1.i386.rpm
安装获得snmpget snmpwalk snmpbulkwakl snmpgetnext

snmpwalk -v 2c -c public your_remote_ip if 
错误: 
Timeout: No Response from your_remote_ip 

于是修改snmpd配置 并启动snmpd
com2sec notConfigUser   default   public--->com2sec notConfigUser   your_snmpd_server_ip public 
#view all     included   .1   80---->view all     included   .1   80 

snmpwalk -v 2c -c public your_remote_ip system ok
但 
snmpwalk -v 2c -c public your_remote_ip if 
错误: 
IF-MIB::ifTable = No Such Object available on this agent at this OID

于是再次修改snmpd.conf,并重启snmpd
access   notConfigGroup ""       any       noauth     exact   systemview none none-->
access   notConfigGroup ""       any       noauth     exact   all     none none

再次snmpwalk -v 2c -c public your_remote_ip if
ok

再访问页面终于图和数据出来了


你可能感兴趣的:(服务器)