真正搞懂浏览器HTTP缓存

先来看一下“缓存”这一家子:

所有的缓存.jpg

今日主题是:http缓存(强缓存,协商缓存)
1566279057(1).jpg

一、http缓存是什么?

http缓存是根据http报文的缓存标识进行的,这些标识写在http报文的首部字段。

  • 浏览器每次发起请求,都会先在浏览器缓存中查找该请求的结果以及缓存标识
  • 浏览器每次拿到返回的请求结果都会将该结果和缓存标识存入浏览器缓存中

根据是否需要向服务器重新发起HTTP请求将缓存过程分为两个部分,分别是强制缓存协商缓存

请求原理:

  1. 浏览器加载资源的时候首先检查请求头的expires和cache-control来判断有没有强缓存,有的话直接使用强缓存。
  2. 如果没有命中强缓存,则向服务器发送请求,根据last-modified和etag来检查是否有协商缓存,有的话服务器会将这个请求返回,但是不会返回这个资源的实体,而是通知客户端可以从缓存中加载这个资源(304 not modified)。
  3. 未命中协商缓存的话则直接从服务器上拉取资源。
1566277987(1).jpg

缓存的优先级:强缓存>协商缓存
强/协商缓存只要命中,都是从浏览器拉取资源。

二、强缓存

2.1 强缓存的缓存规则:

当浏览器向服务器发起请求时,服务器会将缓存规则放入HTTP响应报文的HTTP头中和请求结果一起返回给浏览器,控制强制缓存的字段分别是Expires(存放绝对时间值)和Cache-Control(存放相对时间值),

优先级:Cache-Control>Expires。

2.1.1 Expires:

Expires是HTTP/1.0控制网页缓存的字段,其值为服务器返回该请求结果缓存的到期时间,即再次发起该请求时,如果客户端的时间小于Expires的值时,直接使用缓存结果。

Expires是HTTP/1.0的字段,但是现在浏览器默认使用的是HTTP/1.1,那么在HTTP/1.1中网页缓存还是否由Expires控制?

在HTTP/1.1,Expire被Cache-Control替代。
因为Expires控制缓存的原理是使用客户端的时间与服务端返回的时间做对比,那么如果客户端与服务端的时间因为某些原因(例如时区不同;客户端和服务端有一方的时间不准确)发生误差,那么强制缓存则会直接失效,这样的话强制缓存的存在则毫无意义.

2.1.2 Cache-control

在HTTP/1.1中,Cache-Control是最重要的规则,主要用于控制网页缓存,主要取值为:

  • public:所有内容都将被缓存(客户端和代理服务器都可缓存)
  • private:所有内容只有客户端可以缓存,Cache-Control的默认取值
  • no-cache:客户端缓存内容,但是是否使用缓存则需要经过协商缓存来验证决定
  • no-store:所有内容都不会被缓存,即不使用强制缓存,也不使用协商缓存
  • max-age=xxx (xxx is numeric):缓存内容将在xxx秒后失效

实践过程中,我们会遇到from disk cache和from memory cache。

在浏览器中,浏览器会在js和图片等文件解析执行后直接存入内存缓存中,那么当刷新页面时只需直接从内存缓存中读取(from memory cache);而css文件则会存入硬盘文件中,所以每次渲染页面都需要从硬盘读取缓存(from disk cache)。

1566277234(1).jpg

2.2 强缓存可被分为三种情况:

  1. 不存在该缓存结果和缓存标识,强制缓存失效,则直接向服务器发起请求(跟第一次发起请求一致),


    1566275252(1).jpg
  2. 存在该缓存结果和缓存标识,但该结果已失效,强制缓存失效,则使用协商缓存


    1566275303(1).jpg
  3. 存在该缓存结果和缓存标识,且该结果尚未失效,强制缓存生效,直接返回该结果


    1566275373(1).jpg

三、协商缓存

3.1 协商缓存的缓存规则:

协商缓存就是强制缓存失效后,浏览器携带缓存标识向服务器发起请求,由服务器根据缓存标识决定是否使用缓存的过程。
协商缓存的标识也是在响应报文的HTTP头中和请求结果一起返回给浏览器的。
控制协商缓存的字段分别有:Last-Modified / If-Modified-Since和Etag / If-None-Match。

优先级:Etag / If-None-Match>Last-Modified / If-Modified-Since

3.1.1 Last-Modified / If-Modified-Since:

Last-Modified是服务器响应请求时,返回该资源文件在服务器最后被修改的时间。

If-Modified-Since则是客户端再次发起该请求时,携带上次请求返回的Last-Modified值,通过此字段值告诉服务器该资源上次请求返回的最后被修改时间。服务器收到该请求,发现请求头含有If-Modified-Since字段,则会根据If-Modified-Since的字段值与该资源在服务器的最后被修改时间做对比,若服务器的资源最后被修改时间大于If-Modified-Since的字段值,则重新返回资源,状态码为200;否则则返回304,代表资源无更新,可继续使用缓存文件。

3.1.2 Etag / If-None-Match

Etag是服务器响应请求时,返回当前资源文件的一个唯一标识(由服务器生成)。

If-None-Match是客户端再次发起该请求时,携带上次请求返回的唯一标识Etag值,通过此字段值告诉服务器该资源上次请求返回的唯一标识值。服务器收到该请求后,发现该请求头中含有If-None-Match,则会根据If-None-Match的字段值与该资源在服务器的Etag值做对比,一致则返回304,代表资源无更新,继续使用缓存文件;不一致则重新返回资源文件,状态码为200。

3.2 协商缓存可被分为二种情况:

  1. 协商缓存生效,返回304


    1566277776(1).jpg
  2. 协商缓存失效,返回200和请求结果


    1566277819(1).jpg

参考资料:
https://juejin.im/entry/5ad86c16f265da505a77dca4
https://juejin.im/post/5cb587f3e51d456e7079f20c

你可能感兴趣的:(真正搞懂浏览器HTTP缓存)