在日常运营工作当中,观察数据的变化趋势有利于了解我们的服务质量,比如在系统监控方面,网络流量趋势图直接展现了当前网络的吞吐。 CPU、内存、磁盘空间利用率趋势则反映了服务器运行健康状态。通过这些数据图表管理员可以提前做好应急预案,对可能存在的风险点做好防范。本次实践通过rrdtool模块实现服务器网卡流量趋势图的绘制,即先通过create方法创建一个rrd数据库,再通过update方法实现数据的写入,最后可以通过graph方法实现图表的绘制,以及提供last、first、info、fetch方法的查询
第一步 采用create方法创建rrd数据库,参数指定了一个rrd文件、更新频率setp、起始时间--start、数据源DS、数据源类型DST、数据周期定义RRA等。
具体代码create.py如下:
# -*- coding: utf-8 -*-
#!/usr/bin/python
import rrdtool
import time
cur_time=str(int(time.time())) #获取当前Linux时间戳作为rrd起始时间
#数据写频率--step为300秒(即5分钟一个数据点)
rrd=rrdtool.create('Flow.rrd','--step','300','--start',cur_time,
#定义数据源eth0_in(入流量)、eth0_out(出流量);类型都为COUNTER(递增);600秒为心跳值,
#其含义是600秒没有收到值,则会用UNKNOWN代替;0为最小值;最大值用U代替,表示不确定
'DS:eth0_in:COUNTER:600:0:U',
'DS:eth0_out:COUNTER:600:0:U',
#RRA定义格式为[RRA:CF:xff:steps:rows],CF定义了AVERAGE、MAX、MIN三种数据合并方式
#xff定义为0.5,表示一个CDP中的PDP值如超过一半值为UNKNOWN,则该CDP的值就被标为UNKNOWN
#下列前4个RRA的定义说明如下,其他定义与AVERAGE方式相似,区别是存最大值与最小值
# 每隔5分钟(1*300秒)存一次数据的平均值,存600笔,即2.08天
# 每隔30分钟(6*300秒)存一次数据的平均值,存700笔,即14.58天(2周)
# 每隔2小时(24*300秒)存一次数据的平均值,存775笔,即64.58天(2个月)
# 每隔24小时(288*300秒)存一次数据的平均值,存797笔,即797天(2年)
'RRA:AVERAGE:0.5:1:600',
'RRA:AVERAGE:0.5:6:700',
'RRA:AVERAGE:0.5:24:775',
'RRA:AVERAGE:0.5:288:797',
'RRA:MAX:0.5:1:600',
'RRA:MAX:0.5:6:700',
'RRA:MAX:0.5:24:775',
'RRA:MAX:0.5:444:797',
'RRA:MIN:0.5:1:600',
'RRA:MIN:0.5:6:700',
'RRA:MIN:0.5:24:775',
'RRA:MIN:0.5:444:797')
if rrd:
print rrdtool.error()
第二步 采用updatev方法更新rrd数据库,参数指定了当前的Linux时间戳,以及指定eth0_in、eth0_out值(当前网卡的出入流量),网卡流量我们通过psutil模块来获取,如psutil.net_io_counters()[1]为入流量
具体代码update.py
# -*- coding: utf-8 -*-
#!/usr/bin/python
import rrdtool
import time,psutil
total_input_traffic = psutil.net_io_counters()[1] #获取网卡入流量
total_output_traffic = psutil.net_io_counters()[0] #获取网卡出流量
starttime=int(time.time()) #获取当前Linux时间戳
#将获取到的三个数据作为updatev的参数,返回{'return_value': 0L}则说明更新成功,反之失败
update=rrdtool.updatev('/home/test/rrdtool/Flow.rrd','%s:%s:%s' % (str(starttime),str(total_input_traffic),str(total_output_traffic)))
print update
将代码加入crontab,并配置5分钟作为采集频率,crontab配置如下:
*/5 * * * * /usr/bin/python /home/test/rrdtool/update.py > /dev/null 2>&1
采用graph方法绘制图表,此示例中关键参数使用了--x-grid定义X轴网格刻度;DEF指定数据源;使用CDEF合并数据;HRULE绘制水平线(告警线);GPRINT输出最大值、最小值、平均值等。
具体代码graph.py如下:
# -*- coding: utf-8 -*-
#!/usr/bin/python
import rrdtool
import time
#定义图表上方大标题
title="Server network traffic flow ("+time.strftime('%Y-%m-%d', \
time.localtime(time.time()))+")"
#重点解释"--x-grid","MINUTE:12:HOUR:1:HOUR:1:0:%H"参数的作用(从左往右进行分解)
“MINUTE:12”表示控制每隔12分钟放置一根次要格线
“HOUR:1”表示控制每隔1小时放置一根主要格线
“HOUR:1”表示控制1个小时输出一个label标签
“0:%H”0表示数字对齐格线,%H表示标签以小时显示
rrdtool.graph( "Flow.png", "--start", "-1d","--vertical-label=Bytes/s",\
"--x-grid","MINUTE:12:HOUR:1:HOUR:1:0:%H",\
"--width","650","--height","230","--title",title,
"DEF:inoctets=Flow.rrd:eth0_in:AVERAGE", #指定网卡入流量数据源DS及CF
"DEF:outoctets=Flow.rrd:eth0_out:AVERAGE", #指定网卡出流量数据源DS及CF
"CDEF:total=inoctets,outoctets,+", #通过CDEF合并网卡出入流量,得出总流量total
"LINE1:total#FF8833:Total traffic", #以线条方式绘制总流量
"AREA:inoctets#00FF00:In traffic", #以面积方式绘制入流量
"LINE1:outoctets#0000FF:Out traffic", #以线条方式绘制出流量
"HRULE:6144#FF0000:Alarm value\\r", #绘制水平线,作为告警线,阈值为6.1k
"CDEF:inbits=inoctets,8,*", #将入流量换算成bit,即*8,计算结果给inbits
"CDEF:outbits=outoctets,8,*", #将出流量换算成bit,即*8,计算结果给outbits
"COMMENT:\\r", #在网格下方输出一个换行符
"COMMENT:\\r",
"GPRINT:inbits:AVERAGE:Avg In traffic\: %6.2lf %Sbps", #绘制入流量平均值
"COMMENT: ",
"GPRINT:inbits:MAX:Max In traffic\: %6.2lf %Sbps", #绘制入流量最大值
"COMMENT: ",
"GPRINT:inbits:MIN:MIN In traffic\: %6.2lf %Sbps\\r", #绘制入流量最小值
"COMMENT: ",
"GPRINT:outbits:AVERAGE:Avg Out traffic\: %6.2lf %Sbps", #绘制出流量平均值
"COMMENT: ",
"GPRINT:outbits:MAX:Max Out traffic\: %6.2lf %Sbps", #绘制出流量最大值
"COMMENT: ",
"GPRINT:outbits:MIN:MIN Out traffic\: %6.2lf %Sbps\\r") #绘制出流量最小值
以上代码将生成一个Flow.png文件,这个文件我们的网卡流量图表。