squid日志分析软件sarg的安装和使用


 

1、SARG介绍



 

SARG的全称是:Squid Analysis Report Generator


 

SARG作为一款Squid日志分析工具,它采用html格式,详细列出了每一位用户访问internet的站点信息,时间占用信息,排名,连接次数,访问量,访问量等。


 

软件的主页:http://www.sarg-squid.org/



 

2、安装



 

下载了sarg的最新安装包以后,进入下载的目录,执行以下的操作进行安装:


 

解压缩安装软件包


 

#tar zxvf sarg-2.0.2.tar.gz


 

进入解压后的目录,


 

#cd sarg-2.0.2


 

#./configure


 

在这里,也可以用./configure --help看看可以使用的configure可以使用的参数,一般来说,使用默认的选项就可以了。


 

#make


 

#make install


 

这样,就完成了sarg的安装,如果安装过程中出现错误,可以看看有没有安装gcc,或者在安装系统是没有安装相应的开发库。如果使用默认的选项,可执行 文件是/usr/bin/sarg,配置文件是/usr/local/sarg/sarg.conf,在 /usr/local/sarg目录下还有一些其他的文件和目录。



 

3、配置



 

安装成功后,在/usr/local/sarg/目录中,有一个配置文件为sarg.conf,我们通过修改配置文件的参数,来达到对日志进行有规则的分析。也可以通过命令行参数实现。


 

sarg配置文件的方法和squid配置文件的配置方法类似,只要修改带有关键字的行:


 

"language english"


 

指定网页报告文件的语言类型,很可惜不支持中文网页。


 

"access_log /usr/local/squid/logs/access.log"


 

指定squid日志文件绝对路径。


 

"title "squid user access reports"


 

指定网页标题,可以写中文网页,内核支持先。


 

"temporary_dir /var/tmp"


 

指定临时文件目录,请确认该目录所在的分区足够大先,1g以上。


 

"output_dir /var/www/html/squid-reports"


 

指定网页报告文件输出路径,推荐使用webmaster或其他非admin用户运行sarg。


 

"topuser_sort_field connect reverse bytes reverse"


 

在top排序中,指定连接次数(connect),访问字节数(bytes)采用降序排列,升序请使用normal替代reverse


 

"user_sort_field connect reverse"


 

对于每个用户的访问纪录,连接次数按降序排列


 

"exclude_hosts /usr/local/sarg/norecords"


 

指定不计入排序的站点列表文件名为/usr/local/sarg/norecords,对于客户端 访问的这些站点,将不会被top排序中,norecords文件样本:


 

google.com


 

csdn.net


 

microsoft.com


 

"date_format e"


 

启动sarg进程是如果使用日期参数-d时,请使用和配置文件一致的日期格:


 

e (europe=dd/mm/yy),


 

u (usa=mm/dd/yy),


 

w (weekly=yy.ww)


 

"topuser_fields num date_time userid connect bytes %bytes in-cache-out used_time milisec %time total average"


 

指定top排序的域,可以取掉一些不关紧要的域:in-cache-out used_time等


 

"weekdays 1-5"


 

指定top排序星期周期为星期一到星期五,0表示星期天


 

"hours 9-11,13-16"


 

指定top排序的时间周期为9:00-11:59,13:00-16:59,哈哈,差不多为上班时间



 

至此,sarg.conf文件的配置基本上over了,还有些不是太重要的配置一看就明白,在此就不耽误大家的时间了。



 

sarg的命令行解释如下:


 

# sarg -h


 

sarg: usage [options...]


 

-a hostname or ip address


 

指定不计入排序的主机名称或地址


 

-b useragent log


 

用户代理日志文件输出


 

-c exclude file


 

指定不计入排序的站点列表文件名为/usr/local/sarg/norecords,对于客户端访问的这


 

些站点,将不会被top排序中


 

-d date from-until dd/mm/yyyy-dd/mm/yyyy


 

指定日期范围


 

-e email address to send reports (stdout for console)


 

指定报告接收者邮件


 

-f config file (/usr/local/sarg/sarg.conf)


 

指定配置文件


 

-g date format [e=europe -> dd/mm/yy, u=usa -> mm/dd/yy]


 

指定输入的日期格式


 

-h help (this...)


 

列帮助信息


 

-i reports by user and ip address


 

指定客户端排序采用用户名或者ip地址


 

-l input log


 

指定squid日志文件绝对路径。


 

-o output dir


 

指定网页报告文件输出路径,推荐使用webmaster或其他非admin用户运行


 

sarg。


 

-p use ip address instead userid (reports)


 

使用ip地址作为userid域


 

-w temporary dir


 

指定临时文件目录,请确认该目录所在的分区足够大先,1g以上。



 

4、运行


 

一般来说,我们希望系统可以自动生成日志分析以后的结果。在这里,我们利用cron来实现,把以下的相应脚本放到cron里面去执行即可



crontab -l
# m h  dom mon dow   command
59 23 * * * /etc/squid/daliy.sh
59 23 * * 0 /etc/squid/weekly.sh   
59 23 * * * 1 * /etc/squid/monthly.sh




::::::::::::::
日报daliy.sh
::::::::::::::
#!/bin/bash
#Get current date
TODAY=$(date +%d/%m/%Y)
#Get one week ago today
YESTERDAY=$(date --date "1 day ago" +%d/%m/%Y)
/usr/bin/sarg -l /var/log/squid3/access.log -o /var/www/daily -z -d $YESTERDAY-$TODAY
exit 0
::::::::::::::
月报monthly.sh
::::::::::::::
#!/bin/bash
#Get current date
TODAY=$(date +%d/%m/%Y)
#Get one week ago today
LASTMONTH=$(date --date "1 month ago" +%d/%m/%Y)
/usr/bin/sarg -l /var/log/squid3/access.log -o /var/www/monthly -z -d $LASTMONTH-$TODAY
exit 0
::::::::::::::
周报weekly.sh
::::::::::::::
#!/bin/bash
#Get current date
TODAY=$(date +%d/%m/%Y)
#Get one week ago today
LASTWEEK=$(date --date "1 week ago" +%d/%m/%Y)
/usr/bin/sarg -l /var/log/squid3/access.log.* -o /var/www/weekly -z -d $LASTWEEK-$TODAY
exit 0


通过邮件发送报告:
#!/bin/bash
#Get current date
TODAY=$(date +%d/%m/%Y)
#Get one week ago today
YESTERDAY=$(date --date "1 day ago" +%d/%m/%Y)
/usr/bin/sarg -l /var/log/squid3/access.log -e [email protected] -z -d $YESTERDAY-$TODAY
exit 0