原文地址:http://www.phppan.com/2012/12/http-cache-algorithm/
推荐pan的博客:http://www.phppan.com
HTTP协议缓存的目标是去除许多情况下对于发送请求的需求和去除许多情况下发送完整请求的需求。以不发送请求或减少请求传输的数据量来优化整个HTTP架构,此目标的实现可以产生如下好处:
缓存基本处理过程包括七个步骤。
这里的缓存可以是本地客户端缓存,也可以是代理缓存之类的公共缓存。
HTTP缓存可以在不依赖服务器记住有哪些缓存拥有文档副本,而实现文档的一致。这些机制称为文档过期(document expiration)和服务器再验证(server revalidation),也可以称它们为截止模型和证实模型。
截止模型是HTTP请求中带上标记文档的过期时间,HTTP协议中使用如下两个字段标记过期时间:
仅仅使用截止模型还不够,即使文档过期了,也并不意味着当前文档和原始服务器的文档不一致了。此时就到证实模型大显身手的时候了。证实模型需要询问原始服务器文档是否发生了变化。其依赖于HTTP协议的如下字段:
如果服务器应答中包括一个ETag,又包括一个Last-Mofidied值,则客户端在发送请求时使用两种证实机制,并且只有当两种证实机制都满足时才会返回304 Not Modified。
缓存在新鲜度检测时,只需要计算两个值:已缓存副本的使用期和已缓存副本的新鲜生存期。
响应的使用期是服务器发布响应(或通过证实模型再验证)之后经过的总时间。使用期包括了因特网中传输的时间,在中间节点缓存的时间,以及在本地缓存中的停留时间。
/* * age_value 当代理服务器用自己的头部去响应请求时,Age标明实体产生到现在多长时间了。 * date_value HTTP 服务器应答中的Date字段 原始服务器 * request_time 缓存的请求时间 * response_time 缓存获取应答的时间 * now 当前时间 */ apparent_age = max(0, response_time - date_value); //缓存收到响应时响应的年龄 处理时钟偏差存在时,可能为负的情况 corrected_received_age = max(apparent_age, age_value); // 容忍Age首部的错误 response_delay = response_time - request_time; // 处理网络时延,导致结果保守 corrected_initial_age = corrected_received_age + response_delay; resident_time = now - response_time; // 本地的停留时间,即收到响应到现在的时间间隔 current_age = corrected_initial_age + resident_time;
因此,完整的使用期计算算法是通过查看Date首部和Age首部来判断响应已使用的时间,再记录其在本地缓存中的停留时间就是总的使用期。除此之外,HTTP协议对时钟偏差和网络时延进行了一补偿,特别是其对网络时延的补偿,可能会重复计算已使用的时间,从而使整个算法产生保守的结果。这种保守的效果时,如果出错了,算法只会使文档看起来比实际使用期要老,并引发再验证。
通过已缓存文档的使用期,根据服务器和客户端限制来计算新鲜生存期,就可以确定已缓存的文档是否新鲜。已缓存文档的使用期在前面已经介绍过了,这小节我们来看看新鲜生存期的计算。
为了确定一条响应是保鲜的(fresh)还是陈旧的(stale),我们需要将其保鲜寿命(freshness lifetime)和年龄(age)进行比较。年龄的计算见13.2.3节,本节讲解怎样计算保鲜寿命,以及判定一个响应是否已经过期。在下面的讨论中,数值可以用任何适于算术操作的形式表示。
与此相关的首部字段包括(按优先级从高到低): Cache-Control字段中“max-age”控制指令的值、Expires、Last-Modified、默认最小的生存期。用PHP代码体现如下:
/** * $heuristic 启发式过期值应不大于从那个时间开始到现在这段时间间隔的某个分数 * $Max_Age_value_set 是否存在Max_Age值 Cache-Control字段中“max-age”控制指令的值 * $Max_Age_value Max_Age值 * $Expires_value_set 是否存在Expires值 * $Expires_value Expires值 * $Date_value Date头部 * $default_cache_min_lifetime * $default_cache_max_lifetime */ function server_freshness_limit() { global $Max_Age_value_set, $Max_Age_value; global $Expires_value_set, $Expires_value; global $Date_value, $default_cache_min_lifetime, $default_cache_max_lifetime; $factor = 0.1; //典型设置为10% $heuristic = 0; // 启发式 默认为0 if ($Max_Age_value_set) { // 优先级一为 Max_Age $freshness_lifetime = $Max_Age_value; }elseif($Expires_value_set) { // 优先级二为Expires $freshness_lifetime = $Expires_value - $Date_value; }elseif($Last_Modified_value_set) { // 优先级三为Last_Modified $freshness_lifetime = (int)($factor * max(0, $Last_Modified_value - $Date_value)); $heuristic = 1; // 启发式 }else{ $freshness_lifetime = $default_cache_min_lifetime; $heuristic = 1; // 启发式 } if ($heuristic) { $freshness_lifetime = $freshness_lifetime > $default_cache_max_lifetime ? $default_cache_max_lifetime : $freshness_lifetime; $freshness_lifetime = $freshness_lifetime < $default_cache_min_lifetime ? $default_cache_min_lifetime : $freshness_lifetime; } return $freshness_lifetime; }
计算响应是否过期非常简单: response_is_fresh = (server_freshness_limit() > current_age)
以此为《HTTP权威指南》第七章读书笔记。