ganglia3.1.7 tarball安装笔记 (Cent5.5 64bit)

前言

    安装ganglia过程还是很麻烦的,之前我写过一篇文章通过yum安装ganglia3.0,但是yum库中没有找到ganglia3.1和3.2的rpm包,为了尝鲜我首先安装了ganglia3.2版本,服务配置都正常就是找不到client机器,万分无奈切换到3.1.7版本,最后很顺利使用单播方式安装成功(我的服务器是双网卡,使用多播配置总是找不到client机器,配置了route还是不行,最后放弃)

安装依赖库

#添加rpmforge库到yum
wget http://packages.sw.be/rpmforge-release/rpmforge-release-0.5.2-2.el5.rf.i386.rpm
rpm -ivh rpmforge-release-0.5.2-2.el5.rf.i386.rpm

 

# 安装依赖, 32位的安装自己通过"yum list name"找到下面几个库就可以
yum install rrdtool.x86_64 rrdtool-devel.x86_64 expat.x86_64 expat-devel.x86_64 apr.x86_64 apr-devel.x86_64 apr-util.x86_64 apr-util-devel.x86_64 *confuse*

安装ganglia

 

#安装
tar -zxf ganglia-3.1.7.tar.gz && cd ganglia-3.1.7

./configure --with-gmetad --sysconfdir=/etc/ganglia --enable-gexec --with-python=/usr/local/bin/python2.7
make && make install

*****************

这里我在make的时候,发生错误“/usr/local/lib/libpython2.7.a: could not read symbols: Bad value”

解决办法:需要重装python 带上 --enable-shared 参数,如下:

./configure --enable-shared && make && make install

ganglia配置

# 准备目录
mkdir -p /var/lib/ganglia/rrds
mkdir -p /var/lib/ganglia/dwoo
mkdir -p /var/www/html/ganglia

# 确保当前目录为“ganglia-3.1.7”

# ganglia3.2在64位下要拷贝下面两个启动文件(3.1.7版本不需要),否则 service 命令找不到程序
# cp /usr/local/sbin/gmetad /usr/sbin
# cp /usr/local/sbin/gmond /usr/sbin

cp gmond/gmond.init /etc/rc.d/init.d/gmond #添加gmond到service
cp gmetad/gmetad.init /etc/rc.d/init.d/gmetad #添加gmetad到service
chkconfig --add gmond # gmond开机启动
chkconfig --add gmetad # gmetad 开机启动
cp -r web/* /var/www/html/ganglia # copy ganglia web文件倒apache
chown -R apache:apache /var/lib/ganglia/dwoo/
chown -R nobody:nobody /var/lib/ganglia/rrds/

gmond -t |tee /etc/ganglia/gmond.conf #生成gmond默认配置文件,tee的作用类似重定向符“>>”

*****************
# 几个重要的文件路径(3.2和3.1.7存放路径不一样,大家自己which和find查找吧)
/usr/local/bin/gstat #测试工具,我在多播模式下,不能使用,单播可以,奇怪....
 
/usr/local/sbin/gmetad #中央服务程序,通过"gmetad -d1"打印启动日志(3.17在/usr/sbin/gmetad)
/usr/local/sbin/gmond # 监控数据采集程序,通过"gmond -d1"打印启动日志(3.17在/usr/sbin/gmond)

/etc/ganglia/gmetad.conf
/etc/ganglia/gmond.conf

 

#配置gmeta
vi /etc/ganglia/gmetad.conf
data_source "hadoop" 192.168.1.10 # 集群名称,这里我配置为“hadoop”, 192.168.1.10 为集群中央机器 

 

#配置gmond(单播)
vi /etc/ganglia/gmond.conf

cluster {
name = "hadoop" #与gmetad.conf 相同的名称
....
}

udp_send_channel {
  #mcast_join = 239.2.11.71 #这行被注释
  host = 192.168.1.10 #中央机器的IP # 添加改行
  port = 8649
  ttl = 1
}

udp_recv_channel {
  # mcast_join = 239.2.11.71 #这行被注释
  port = 8649
  # bind = 239.2.11.71 #这行被注释
}

启动和测试

service gmetad start
service gmond start
service httpd start 

telnet localhost 8649 # 检查gmond进程,如果出现XML就对了
telnet localhost 8651 # 检查gmetad进程,如果出现XML就对了

打开浏览器,访问 http://{you_ip}/ganglia/就可以看到Web界面了

*****************
gmetad启动后执行“service gmetad status”,报错“ gmetad dead but subsys locked
解决:chown -R nobody:nobody /var/lib/ganglia

httpd启动时报错“Could not reliably determine the server's fully qualified domain name”
解决:vi /etc/httpd/conf/httpd.conf,设置

ServerName localhost:80

 

如果出图有问题,如出现"localhost"而没有显示机器名,则可能因为/etc/hosts没有正确配置IP与机器名映射关系。

添加Web访问密码

htpasswd -c /etc/httpd/conf.d/passwords ganglia #创建用户名密码,我这里用户名为“ganglia”

 

vi /var/www/html/ganglia/.htaccess #要指定刚才创建的用户名
AuthType Basic
AuthName "Restricted Files"
AuthUserFile /etc/httpd/conf.d/passwords
Require user ganglia

 

vi /etc/httpd/conf/httpd.conf  #添加目录

<Directory "/var/www/html/ganglia/">
    AllowOverride AuthConfig
    Options Indexes MultiViews
    Order allow,deny
    Allow from all
    AuthType Basic
    AuthName "Restricted Files"
    AuthUserFile /etc/httpd/conf.d/passwords
    Require user ganglia
</Directory>

客户端部署

为了方便在服务端想客户端执行命令,我使用了批量工具“pdsh”,具体安装参考我博客文章。安装rpmforce库后,可以通过“yum install pdsh”安装。

 

配置好Server到client无密码SSH访问

 

#在Server端执行,这个脚本在不同OS,不同ganglia版本会区别
pdsh -w exec:192.168.1.[50-100,120-150] scp /usr/sbin/gmond %h:/usr/sbin/gmond
pdsh -w ssh:192.168.1.[50-100,120-150] mkdir -p /etc/ganglia/
pdsh -w exec:192.168.1.[50-100,120-150] scp /etc/ganglia/gmond.conf %h:/etc/ganglia/
pdsh -w exec:192.168.1.[50-100,120-150] scp /etc/init.d/gmond %h:/etc/init.d/
pdsh -w exec:192.168.1.[50-100,120-150] scp /usr/lib64/libganglia-3.1.7.so.0 %h:/usr/lib64/
pdsh -w exec:192.168.1.[50-100,120-150] scp /lib64/libexpat.so.0 %h:/lib64
pdsh -w exec:192.168.1.[50-100,120-150] scp /usr/lib64/libconfuse.so.0 %h:/usr/lib64/
pdsh -w exec:192.168.1.[50-100,120-150] scp /usr/lib64/libapr-1.so.0 %h:/usr/lib64/
pdsh -w exec:192.168.1.[50-100,120-150] scp -r /usr/lib64/ganglia %h:/usr/lib64/
pdsh -w ssh:192.168.1.[50-100,120-150] service gmond start
pdsh -w ssh:192.168.1.[50-100,120-150] chkconfig --add gmond

 

参考:

http://www.blogjava.net/xylz/archive/2011/07/21/354744.html

http://yifangyou.blog.51cto.com/900206/633002

 

-- end --

 

 

 

 

 

 

 

你可能感兴趣的:(ganglia3.1.7 tarball安装笔记 (Cent5.5 64bit))