11.22 访问日志不记录静态文件

11.23 访问日志切割

11.24 静态元素过期时间

扩展 
apache日志记录代理IP以及真实客户端IP  http://ask.apelearn.com/question/960
apache只记录指定URI的日志  http://ask.apelearn.com/question/981
apache日志记录客户端请求的域名  http://ask.apelearn.com/question/1037
apache 日志切割问题  http://ask.apelearn.com/question/566


11.22 访问日志不记录静态文件

一个网站会有很多元素,尤其是图片、js、css等静态文件非常多,用户每请求一个页面就会访问诸多的图片,js等静态元素,这些元素的请求都会被记录在日志中。

如果一个站点访问量很大,那访问日志文件会慢慢的变大很大,从而影响服务器的的磁盘空间,甚至还会影响磁盘的读写速度。

这些静态元素记录在日志文件里意义不大,所以可以限制这些静态元素去记录日志,并且需要把日志按天归档,一天一个日志,这样也可以防止单个日志文件过大。


配置如下,在Customlog上面定义如下参数:

    SetEnvIf Request_URI ".*\.gif$" img
    SetEnvIf Request_URI ".*\.jpg$" img
    SetEnvIf Request_URI ".*\.png$" img
    SetEnvIf Request_URI ".*\.bmp$" img
    SetEnvIf Request_URI ".*\.swf$" img
    SetEnvIf Request_URI ".*\.js$" img
    SetEnvIf Request_URI ".*\.css$" img 
  CustomLog "logs/111.com-access_log" combined env=!img


SetEnvIf Request_URI ".*\.gif$" img 

".*"\.gif 这种是正则表达式的表示方法,他们都是代指img文件。

解释:

先定义了一个img环境变量,把gif,jpg,png等等格式的文件归类到image里

env=!img 意思是把img以外的类型文件记录在日志里。


接着,

重新加载配置文件 -t, graceful

curl -x访问测试
#curl -x127.0.0.1:80 111.com/222 -I
#curl -x127.0.0.1:80 111.com/11.jpg -I
#curl -x127.0.0.1:80 111.com/111 -I
查看日志,jpg格式没被记录
#tail /usr/local/apache2.4/logs/111.com-access_log 
127.0.0.1 - - [16/Apr/2018:17:51:08 +0800] "HEAD HTTP://111.com/222 HTTP/1.1" 404 - "-" "curl/7.29.0"
127.0.0.1 - - [16/Apr/2018:17:51:09 +0800] "HEAD HTTP://111.com/222 HTTP/1.1" 404 - "-" "curl/7.29.0"
127.0.0.1 - - [16/Apr/2018:17:51:41 +0800] "HEAD HTTP://111.com/111 HTTP/1.1" 404 - "-" "curl/7.29.0"

模拟图片测试

在本机上存图片

[root@AliKvn 111.com]# rz
[root@AliKvn 111.com]# ls
123.php  baidu.png  index.php

curl -x请求访问图片

[root@AliKvn 111.com]# curl -x127.0.0.1:80 111.com/baidu.png -I
HTTP/1.1 200 OK
Date: Mon, 16 Apr 2018 10:04:32 GMT
Server: Apache/2.4.33 (Unix) PHP/5.6.30
Last-Modified: Wed, 21 Jun 2017 01:14:24 GMT
ETag: "38bc-5526e16aefc00"
Accept-Ranges: bytes
Content-Length: 14524
Content-Type: image/png

浏览器访问图片

查看访问日志文件,发现访问日志文件没有将baidu.png被记录在内。

生效成功。

把参数env=!img去掉,发现访问baidu.png,会将被记录在内。


11.23 访问日志切割


日志一直记录总有一天会把整个磁盘占满,所以有必要让它自动切割,并删除老的日志文件 

 把虚拟主机配置文件改成如下: 

 
     SetEnvIf Request_URI ".*\.gif$" img
    SetEnvIf Request_URI ".*\.jpg$" img
    SetEnvIf Request_URI ".*\.png$" img
    SetEnvIf Request_URI ".*\.bmp$" img
    SetEnvIf Request_URI ".*\.swf$" img
    SetEnvIf Request_URI ".*\.js$" img
    SetEnvIf Request_URI ".*\.css$" img 
    CustomLog "|/usr/local/apache2.4/bin/rotatelogs -l logs/123.com-access_%Y%m%d.log 86400" combined env=!img
    
/usr/local/apache2.4/bin/rotatelogs

如果不指定-l 会指定utc,

但在中国默认是cst,所以这里需要-l

%Y%m%d 

%Y 年

%m 月

%d 日

86400 是表示秒

重新加载配置文件 -t, graceful


访问页面,让其生成日志文件。

#ls /usr/local/apache2.4/logs 
[root@AliKvn logs]# ls
111.com-access_20180416.log  abc.com-access_log  error_log
111.com-access_log           abc.com-error_log   httpd.pid
111.com-error_log            access_log
[root@AliKvn logs]# curl -x127.0.0.1:80 111.com/123.php
[root@AliKvn logs]# !cat
cat /usr/local/apache2.4/logs/111.com-access_20180416.log 
127.0.0.1 - - [16/Apr/2018:22:57:10 +0800] "HEAD HTTP://111.com/123.php1 HTTP/1.1" 404 - "-" "curl/7.29.0"
127.0.0.1 - - [16/Apr/2018:23:02:08 +0800] "HEAD HTTP://111.com/123.jjj HTTP/1.1" 404 - "-" "curl/7.29.0"
127.0.0.1 - - [16/Apr/2018:23:02:26 +0800] "HEAD HTTP://111.com/123.php HTTP/1.1" 200 - "-" "curl/7.29.0"


11.24 静态元素过期时间


浏览器访问网站的图片时会把静态的文件缓存在本地电脑里,这样下次再访问时就不用去远程下载了

在http-vhost增加以下配置,


    ExpiresActive on  //打开该功能的开关
    ExpiresByType image/gif  "access plus 1 days"
    ExpiresByType image/jpeg "access plus 24 hours"
    ExpiresByType image/png "access plus 24 hours"
    ExpiresByType text/css "now plus 2 hour"
    ExpiresByType application/x-javascript "now plus 2 hours"
    ExpiresByType application/javascript "now plus 2 hours"
    ExpiresByType application/x-shockwave-flash "now plus 2 hours"
    ExpiresDefault "now plus 0 min"

需要到httpd.conf开通expires_module模块

#LoadModule expires_module modules/mod_expires.so

把#去掉开通模块。


检查是否加载模块,

[root@AliKvn ~]# /usr/local/apache2.4/bin/apachectl -M |grep expires
 expires_module (shared)

加载模块成功后,-t和graceful检查状态并重新加载。

[root@AliKvn ~]# /usr/local/apache2.4/bin/apachectl -t
Syntax OK
[root@AliKvn ~]# /usr/local/apache2.4/bin/apachectl graceful

curl测试,

看cache-control: max-age=86400(86400秒=1天)

Data与Expires刚好差了24小时,

200状态码