hadoop集群中ganglia安装遇到的一些问题-解决方案-05

1、异常背景(gmond dead but subsys locked)

在安装配置ganglia时,开始自己编译安装,最后没成功。后来改用yum安装。具体安装参见以下资料:

http://yhz.me/blog/Install-Ganglia-On-CentOS.html

http://blog.javachen.com/2014/01/25/how-to-install-ganglia-on-centos6.html

http://heipark.iteye.com/blog/1183270

http://boendev.iteye.com/blog/1750615

最终,经过一番折腾,稀里糊涂的还是没安装成功,启动gmond时显示以下错误信息:

[root@master ~]# service gmond start
Starting GANGLIA gmond: s                                  [  OK  ]
[root@master ~]# service gmond status
gmond dead but subsys locked

解决方案:

修改/etc/ganglia/gmond.conf文件:

hadoop集群中ganglia安装遇到的一些问题-解决方案-05_第1张图片

在这儿指定服务器的hostname。

重新启动gmond、gmetad:

[root@master ~]# service gmetad restart
Shutting down GANGLIA gmetad:                              [  OK  ]
Starting GANGLIA gmetad:                                   [  OK  ]
[root@master ~]# 
[root@master ~]# service gmond restart
Shutting down GANGLIA gmond:                               [  OK  ]
Starting GANGLIA gmond:                                    [  OK  ]
[root@master ~]# service gmetad status
gmetad (pid 4260) is running...
[root@master ~]# service gmond status
gmond (pid 4293) is running...
[root@master ~]#

以上方法,成功解决问题。

2、异常背景(Errors were detected in your configuration.

在安装部署完成后,访问“http://master/ganglia/”,报错信息如下:

Fatal error:Errors were detected in your configuration.
Unable to create overlay events file: /var/lib/ganglia/conf/events.json
Unable to create event color map file: /var/lib/ganglia/conf/event_color.json
in /usr/share/ganglia/eval_conf.php on line 126

解决方案:

1)、查看"/var/lib/ganglia/conf"目录,发现目录下没有配置文件。

这个问题很有可能是之前安装的时候配置问题。正好,在"/var/lib/"目录下有两个ganglia相关文件:“ganglia和ganglia-web”(一定和之前配置有关)。

查找ganglia-web文件下的conf目录发现,此目录中有文件存在,如下:

hadoop集群中ganglia安装遇到的一些问题-解决方案-05_第2张图片

2)、所以,尝试着直接重命名ganglia文件为ganglia_bak,并修改ganglia-web文件名为ganglia。

3)、重启gmetad、gmond、httpd

hadoop集群中ganglia安装遇到的一些问题-解决方案-05_第3张图片

可看到,gmetad启动失败,报错信息如下:

[root@master ganglia]# service gmetad restart
Shutting down GANGLIA gmetad:                              [FAILED]
Starting GANGLIA gmetad:                                   [  OK  ]
[root@master ganglia]# service gmetad status
gmetad dead but subsys locked

解决方案:

1)、从/var/lib/ganglia_bak中拷贝rrds文件夹到/var/lib/ganglia目录中。

2)、修改/var/lib/ganglia文件夹中所有文件所有者和组为nobody:nobody

3)、修改/var/lib/ganglia/dwoo文件中所有文件权限为777

4)、重启gmetad

问题解决。

4)、重启gmetad、gmond、httpd,访问http://master/ganglia/

成功搭建完毕。

hadoop集群中ganglia安装遇到的一些问题-解决方案-05_第4张图片

你可能感兴趣的:(hadoop集群中ganglia安装遇到的一些问题-解决方案-05)