最近工作比较忙,也没有时间写博客,看到好友芮峰云最近一直在写博客,所以也手痒了,就先把之前的一些积累下来的文章分享给大家。
本文是介绍如何的使用smokeping来监控idc机房的网络质量情况,从监控图上的延时与丢包能分辨出你机房的网络是否稳定,是否为多线,是否为BGP机房,到各城市的3个运行商网络各是什么情况,如果出现问题,如果有针对的解决。而且如果选择新机房的时候,你可以根据smokeping的监控结果来判断这个机房是否适合。
1、安装其他源
rpm -Uvh http://apt.sw.be/redhat/el6/en/x86_64/rpmforge/RPMS/rpmforge-release-0.5.3-1.el6.rf.x86_64.rpm
2、安装rrdtool与依赖库
yum -y install perl perl-Net-Telnet perl-Net-DNS perl-LDAP perl-libwww-perl perl-RadiusPerl perl-IO-Socket-SSL perl-Socket6 perl-CGI-SpeedyCGI perl-FCGI perl-CGI-SpeedCGI perl-Time-HiRes perl-ExtUtils-MakeMaker perl-RRD-Simple rrdtool rrdtool-perl curl fping echoping httpd httpd-devel gcc make wget libxml2-devel libpng-devel glib pango pango-devel freetype freetype-devel fontconfig cairo cairo-devel libart_lgpl libart_lgpl-devel mod_fastcgi
3、下载与安装smokeping
wget http://oss.oetiker.ch/smokeping/pub/smokeping-2.6.8.tar.gz tar zxvf smokeping-2.6.8.tar.gz cd smokeping-2.6.8 ./configure --prefix=/usr/local/smokeping 出现问题是因为需要安装perl的模块,所以运行下面内容即可 ./setup/build-perl-modules.sh /usr/local/smokeping/thirdparty ./configure --prefix=/usr/local/smokeping /usr/bin/gmake install
现在smokeping安装完成
4、配置smokeping
a.创建cache、data、var目录
cd /usr/local/smokeping mkdir cache data var
b.在创建日志
touch /var/log/smokeping.log
c.授权
chown apache:apache cache data var chown apache:apache /var/log/smokeping.log
d.修改配置文件
cd /usr/local/smokeping/htdocs/ mv smokeping.fcgi.dist smokeping.fcgi cd /usr/local/smokeping/etc mv config.dist config vim config cgiurl = http://some.url/smokeping.cgi
主要是修改这行,把some.url修改为你的ip或者域名
*** Database *** step = 300
然后修改step,从300改为60,这是检测的时间。
e.配置完成之后修改密码文件权限
chmod 600 /usr/local/smokeping/etc/smokeping_secrets.dist
f.修改apache的配置
vim /etc/httpd/conf/httpd.conf
添加如下
Alias /cache "/usr/local/smokeping/cache/" Alias /cropper "/usr/local/smokeping/htdocs/cropper/" Alias /smokeping "/usr/local/smokeping/htdocs/smokeping.fcgi"AllowOverride None Options All AddHandler cgi-script .fcgi .cgi Order allow,deny Allow from all DirectoryIndex smokeping.fcgi
f.设置开机启动
echo "/usr/local/smokeping/bin/smokeping --logfile=/var/log/smokeping.log 2>&1 &" >> /etc/rc.local
g.启动http与smokeping
/etc/init.d/httpd start /usr/local/smokeping/bin/smokeping --logfile=/var/log/smokeping.log 2>&1 &
然后访问你在config里设置的cgiurl= http://some.url/smokeping
注意如果出现500错误就是因为你没有关闭selinux的问题,关闭了就能正常打开。
剩下就该你自己修改你要监控的内容了
注意+是第一层,++是第二层
+ Test menu= monitor #parents = owner:/Test/James location:/ title=monitor all ++ localhost menu = localhost title =localhost alerts = someloss slaves = boomer slave2 host = 192.168.56.102
如果各位就这样放到网上的话,是十分的不安全,所以需要加入访问控制。
h.修改httpd.conf里的内容
AllowOverride None Options All AddHandler cgi-script .fcgi .cgi AllowOverride AuthConfig Order allow,deny Allow from all AuthName "Smokeping" AuthType Basic AuthUserFile /usr/local/smokeping/htdocs/htpasswd Require valid-user DirectoryIndex smokeping.fcgi
把之前修改的httpd.conf里的这一段直接覆盖就行
然后进入cd /usr/local/smokeping/htdocs目录
设置登录账户与密码
htpasswd -c /usr/local/smokeping/htdocs/htpasswd admin
这个是设置登录账户为admin,密码在后面输入
然后重启httpd就可以实现密码验证登录
需要注意,一定要同步好时间,可以使用cp /usr/share/zoneinfo/Asia/Shanghai /etc/localtime或者ntpdate 210.72.145.44。
如果需要在网页里展示中文,修改/usr/local/smokeping/etc的config文件
*** Presentation *** charset = utf-8 //注:在这里添加
然后在menu与titile里修改中文,重启即可
有一个要注意的地方就是,你输入的中文必须在utf-8的字符编码下输入的中文字符,不然会出现乱码。
如果在xshel下,选择file-properities-terminal
如果还是不显示就看看你系统里是否安装了中文字体,或者在安装一个
debian上可以先apt-cache search wqy(文泉译), centos可以yum search wqy试试。
然后yum install后在重启smokeping
如果想监控本机到电信、联通、移动、教育网的网络情况监控,可以使用下面内容
+ Other menu = 其他网络监控 title = 其他所有网络监控列表 ++ dianxin menu = 电信网络监控 title = 电信网络监控列表 host = /Other/dianxin/dianxin-hlj /Other/dianxin/dianxin-gd /Other/dianxin/dianxin-gs /Other/dianxin/dianxin-sh +++ dianxin-hlj menu = 黑龙江电信 title = 黑龙江电信 alerts = someloss #slaves = boomer slave2 host = 219.150.32.132 +++ dianxin-gd menu = 广东电信 title = 广东电信 alerts = someloss #slaves = boomer slave2 host = 113.111.211.22 +++ dianxin-gs menu = 甘肃电信 title = 甘肃电信 alerts = someloss #slaves = boomer slave2 host = 202.100.64.68 +++ dianxin-sh menu = 上海电信 title = 上海电信 alerts = someloss #slaves = boomer slave2 host = 202.96.209.5 #+++ dianxin-multi #menu = 多个电信网络监控列表 #title = 多个电信网络监控列表 #alerts = someloss #slaves = boomer slave2 #host = /Other/dianxin/dianxin-hlj /Other/dianxin/dianxin-gd /Other/dianxin/dianxin-gs /Other/dianxin/dianxin-sh # ++ liantong menu = 联通网络监控 title = 联通网络监控列表 host = /Other/liantong/liantong-hlj /Other/liantong/liantong-gd /Other/liantong/liantong-gs /Other/liantong/liantong-sh +++ liantong-hlj menu = 黑龙江联通 title = 黑龙江联通 alerts = someloss #slaves = boomer slave2 host = 202.97.224.68 +++ liantong-gd menu = 广东联通 title = 广东联通 alerts = someloss #slaves = boomer slave2 host = 221.4.66.66 +++ liantong-gs menu = 甘肃联通 title = 甘肃联通 alerts = someloss #slaves = boomer slave2 host = 221.7.34.10 +++ liantong-sh menu = 上海联通 title = 上海联通 alerts = someloss #slaves = boomer slave2 host = 210.22.70.3 #+++ liantong-multi #menu = 多个联通网络监控列表 #title = 多个联通网络监控列表 #alerts = someloss #slaves = boomer slave2 #host = /Other/liantong/liantong-hlj /Other/liantong/liantong-gd /Other/liantong/liantong-gs /Other/liantong/liantong-sh ++ yidong menu = 移动网络监控 title = 移动网络监控列表 host = /Other/yidong/yidong-hlj /Other/yidong/yidong-gd /Other/yidong/yidong-gs /Other/yidong/yidong-sh +++ yidong-hlj menu = 黑龙江移动 title = 黑龙江移动 alerts = someloss #slaves = boomer slave2 host = 211.137.241.34 +++ yidong-gd menu = 广东移动 title = 广东移动 alerts = someloss #slaves = boomer slave2 host = 211.137.241.34 +++ yidong-gs menu = 甘肃移动 title = 甘肃移动 alerts = someloss #slaves = boomer slave2 host = 218.203.160.194 +++ yidong-sh menu = 上海移动 title = 上海移动 alerts = someloss #slaves = boomer slave2 host = 117.131.0.22 #+++ yidong-multi #menu = 多个移动网络监控列表 #title = 多个移动网络监控列表 #alerts = someloss #slaves = boomer slave2 #host = /Other/yidong/yidong-hlj /Other/yidong/yidong-gd /Other/yidong/yidong-gs /Other/yidong/yidong-sh ++ jiaoyu menu = 教育网络监控 title = 教育网络监控列表 host = /Other/jiaoyu/jiaoyu-qh /Other/jiaoyu/jiaoyu-sh /Other/jiaoyu/jiaoyu-wh /Other/jiaoyu/jiaoyu-hn +++ jiaoyu-qh menu = 清华大学 title = 清华大学 alerts = someloss #slaves = boomer slave2 host = 166.111.8.28 +++ jiaoyu-sh menu = 上海交大 title = 上海交大 alerts = someloss #slaves = boomer slave2 host = 202.112.26.34 +++ jiaoyu-wh menu = 武汉科技大学 title = 武汉科技大学 alerts = someloss #slaves = boomer slave2 host = 202.114.240.6 +++ jiaoyu-hn menu = 华南农业大学 title = 华南农业大学 alerts = someloss #slaves = boomer slave2 host = 202.116.160.33 #+++ jiaoyu-multi #menu = 多个教育网络监控列表 #title = 多个教育网络监控列表 #alerts = someloss #slaves = boomer slave2 #host = /Other/jiaoyu/jiaoyu-qh /Other/jiaoyu/jiaoyu-sh /Other/jiaoyu/jiaoyu-wh /Other/jiaoyu/jiaoyu-hn
展示效果为
5、关于smokeping的master与slave配置
slave主机会自己去检查监测点的情况(loss and rtt),并将数值提交给master主机(通过smokeping.cgi)。
值得注意的是,slave并不需要config文件,每次slave提交完数据以后,会询问master它自己的配置文件是否有修改,如果有修改的话slave会进行更新。
配置
在master的config里修改
*** Slaves *** secrets=/usr/local/smokeping/etc/smokeping_secrets.dist #密码文件 +slave1#名称 display_name=slave1
要注意的是"slave1"这个名字需要设置为slave主机的hostname,并且写在"slavesecrets.con"文件里面,如果不想用slave主机的hostname,那么在slave主机启动smokeping服务的时候需要使用"--slave-name"来指定自己的名字。在section
*** Targets ***
中指定那个host需要使用哪个slave帮忙进行检测。下层会继承上层的配置,如果下层不像继承的话,可以配置"slaves ="来避免使用slave。
具体安装与配置不介绍。
master/slave模式中,master和slave的图片都会显示在同一个页面中,如果不希望显示master的图片,可以使用
nomasterpoll=yes
参数。
另外要注意的一点是,master上面启动"smokeping"进程和apache进程的用户必须要一致。因为rrd文件是由"smokeping"进程创建的,而数据的update却是由"smokeping.cgi"进行的,也就是apache用户。如果不一致的话会出现rrd文件无法被更新的情况,这个情况即使在slave主机上面进行debug也是看不出来的。具体的现象是在页面上面看到master的图像出现数据,但是slave的图像一直是空白的,数据显示是"nan"。
如果大家还想细化的监控,比如按照3大运行商(电信、联通、移动)到1、2、3线城市的网络延时与丢包情况,如下图显示
1、本机房到电信运行商的1线城市网络监控情况
2、本机房到联通运行商的1线城市网络监控情况3、本机房到移动运行商的1线城市网络监控情况
如果达到这样的监控效果,你就能很清楚的了解你当前idc机房的网络情况,从图上的延时与丢包能分辨出你机房的网络是否稳定,是否为多线,是否为BGP机房,到各城市的3个运行商网络各是什么情况,如果出现问题,如果有针对的解决。而且如果选择新机房的时候,你可以根据smokeping的监控结果来判断这个机房是否适合。
下面是上面监控里ip的信息(如果大家想实现上面监控,可以使用下面的ip)