提高 Varnish 的效率:去除不需要的 Cookies 和 QueryStrings

在使用了 Varnish 后发现,Cache hits for pass 的数量比较高,好像是不能缓存的对象请求太多,应该是应用发送了 Set-Cookie 的 HTTP Header,或者使用某些统计代码使用了 Cookie,从而浏览器发送 Cookie 的 Header,导致 Varnish 认为这些请求不应该缓存。如果确实不需要 Cookies 就能正确运行的应用页面,可以修改 VCL :

sub vcl_recv {
    # 去除 Cookies (静态文件通常不需要处理 Cookies)
    if (req.url ~ "^/[^?]+\.(jpeg|jpg|png|gif|ico|js|css|txt|zip|html|htm)(\?.*|)$") {
       unset req.http.cookie;
    }
    # 去除首页的 Cookies
    if (req.url ~ "^/$") {
       unset req.http.cookie;
    }
}

sub vcl_fetch {
        if (req.url ~ "^/$") {
                unset beresp.http.set-cookie;
        }
}

另一个可能的原因是,由于不同的浏览器发送的 Accept-Encoding 不同,需要缓存不同版本的内容,造成不必要的缓存空间,可以设置规范一下: 

sub vcl_recv {
    # 修改 Accept-Encoding 只保留必要的内容
    if (req.http.Accept-Encoding) {
        if (req.url ~ "\.(jpg|png|gif|jpeg)(\?.*|)$") {
            remove req.http.Accept-Encoding;
        } elsif (req.http.Accept-Encoding ~ "gzip") {
            set req.http.Accept-Encoding = "gzip";
        } elsif (req.http.Accept-Encoding ~ "deflate") {
            set req.http.Accept-Encoding = "deflate";
        } else {
            remove req.http.Accept-Encoding;
        }
    }
}

另一个不容忽视的是 URL 里的 Query Stings,就是问号后的查询字符串。如果对于每个 URL 都保留一份缓存内容,可能会造成缓存重复,浪费空间,一些 URL 可能根本不需要处理 Query String,比如图片,CSS 等,可以在 Varnish 的 VCL 里去掉 Request URL 里问号后面的部分:

sub vcl_recv {
    # 去除查询字符串
    if (req.url ~ "^/[^?]+\.(jpeg|jpg|png|gif|ico|js|css|txt|zip|html|htm)(\?.*|)$") {
       set req.url = regsub(req.url, "\?.*$", "");
    }
}

把这几个部分写在一起(不想看上面内容却又想优化一下 Varnish 的直接看这个):

sub vcl_recv {
    # 修改 Accept-Encoding 只保留必要的内容
    if (req.http.Accept-Encoding) {
        if (req.url ~ "\.(jpg|png|gif|jpeg)(\?.*|)$") {
            remove req.http.Accept-Encoding;
        } elsif (req.http.Accept-Encoding ~ "gzip") {
            set req.http.Accept-Encoding = "gzip";
        } elsif (req.http.Accept-Encoding ~ "deflate") {
            set req.http.Accept-Encoding = "deflate";
        } else {
            remove req.http.Accept-Encoding;
        }
    }


    # 去除 Cookies 和查询字符串 (静态文件通常不需要处理 Cookies 和 QueryStrings)
    if (req.url ~ "^/[^?]+\.(jpeg|jpg|png|gif|ico|js|css|txt|zip|html|htm)(\?.*|)$") {
       unset req.http.cookie;
       set req.url = regsub(req.url, "\?.*$", "");
    }


    # 去除首页的 Cookies
    if (req.url ~ "^/$") {
       unset req.http.cookie;
    }
}

sub vcl_fetch {
        if (req.url ~ "^/$") {
                unset beresp.http.set-cookie;
        }
}

这里只匹配了首页和常见的静态文件,如果要匹配其它的 URL,修改一下就可以了。

你可能感兴趣的:(提高 Varnish 的效率:去除不需要的 Cookies 和 QueryStrings)