Varnish解决带参数的URL可能造成多份缓存的问题


        if (req.url ~ ".(jpg|gif|png)\?.*") {
            set req.url = regsub(req.url, "\?.*", "");
        }

但当实际设置了以后仍然会出现URL参数变化后Varnish返回miss,这说明Varnish实际上还是以全部req.url作为hash进行缓存的。有兴趣的同学可以自己试试:)

我想了很久,最后终于发现这个重置了以后的req.url并没有作为sub_hash中hash key进行缓存,于是做了如下变通终于实现了按照不带参数的URL进行缓存以达到提高缓存命中率和避免多份缓存的目的。

其实配置的方法很简单,即

sub_hash {
    if (req.url ~ ".(jpg|gif|png)\?.*") {
        set req.hash += regsub(req.url, "\?.*", "");
    }
    else {
        set req.hash += req.url;
    }
    hash;
}

Varnish 2.0.2和2.0.3版本都有这个问题,我已在官方网站报了bug,见http://varnish.projects.linpro.no/ticket/465 各位有兴趣的也可关注一下:)

更新: 在sub_recv中set req.url = regsub(req.url, "\?.*", "");即可,不用再在hash中添加

在header中添加cache的命中状态的方法(在sub_deliver中添加)

        if (obj.hits > 0) {
                set resp.http.X-Cache = "Server-6-HIT";
        } else {
                set resp.http.X-Cache = "Server-6-MISS";
        }

替换到后端的URL请求

sub vcl_miss {
        if (req.request == "PURGE") {
                error 404 "Not in cache.";
        }
        set bereq.url = regsub(req.url, "\?.*", ""); 
        fetch;
}

你可能感兴趣的:(Varnish解决带参数的URL可能造成多份缓存的问题)