不诗意的女程序媛不是好厨师~
转载请注明出处,From李诗雨---https://blog.csdn.net/cjm2484836553/article/details/104136511
1. Http的协议简介
1.1什么是Http?
HTTP即:Hyper Text Transfer Protocol(超文本传输协议)的缩写。
它是用于从万维网(WWW:World
Wide Web )服务器传输超文本到本地浏览器的传送协议。
HTTP是一个基于TCP/IP通信协议来传递数据(HTML 文件, 图片文件, 查询结果等)。
1.2 Http的三个特点
HTTP三点注意事项:
- HTTP是无连接:无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后,即断开连接。采用这种方式可以节省传输时间。
- HTTP是媒体独立的:这意味着,只要客户端和服务器知道如何处理的数据内容,任何类型的数据都可以通过HTTP发送。客户端以及服务器指定使用适合的MIME-type内容类型。
- HTTP是无状态:HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。另一方面,在服务器不需要先前信息时它的应答就较快。
1.3 Http的历史
- 1991年 Http/0.9 只有Get命令,只能获取文本信息。
- 1996年 Http/1.0 标准版本 丰富了命令,可以发送任何格式内容(文字、图像、视频、二进制文件等)。
- 1997年Http/1.1 一直比较流行的版本 引入持久连接,TCP默认不关闭,可被多个请求复用。
- 2015年Http/2.0 采用二进制格式而非文本格式,允许服务器主动推送。
2.Http的报文格式
2.1 Http请求报文
一个HTTP请求报文由四个部分组成:请求行、请求头部、空行、请求数据。
请求行由请求方法字段、URL字段和HTTP协议版本字段3个字段组成,它们用空格分隔。
-
请求头部:Http客户程序(例如浏览器),向服务器发送请求的时候必须指明请求类型(一般是GET或者 POST)。
如有必要,客户程序还可以选择发送其他的请求头。大多数请求头并不是必需的,但
Content-Length
除外。对于
POST
请求来说Content-Length
必须出现。还有下文说的缓存机制的相关信息也放在请求头中。
空行: 它的作用是通过一个空行,告诉服务器请求头部到此为止。
-
请求数据: 若方法字段是GET,则此项为空,没有数据
若方法字段是POST,则通常来说此处放置的就是要提交的数据
比如要使用POST方法提交一个表单,其中有user字段中数据为“admin”, password字段为123abc,那么这里的请求数据就是 user=admin&password=123abc,使用&来连接各个字段。
概括点来说,HTTP请求报文格式如下:
2.2 Http响应报文
同样的,HTTP响应报文也由四部分组成:响应行、响应头、空行、响应体
- 响应行: 一般由协议版本、状态码及其描述组成 如 HTTP/1.1 200 OK
- 响应头: 用于描述服务器的基本信息,以及数据的描述,服务器通过这些数据的描述信息,可以通知客户端如何处理等一会儿它回送的数据。如下文要说的一些缓存信息。
- 空行: 它的作用是通过一个空行,告诉服务器请求头部到此为止。
- 响应体: 就是响应的消息体,如果是纯数据就是返回纯数据,如果请求的是HTML页面,那么返回的就是HTML代码,如果是js就是JS代码,如此之类。
3.Http请求的传输过程
像穿衣服一样,早上起床是:由里向外的一层一层穿上;
睡觉时,再从外到里的一层一层脱下。
或者说像洋葱~~~总之你理解就好。
4.一次完整Http请求的过程(面试点▲▲▲)
面试时经常会被问到,“请说一下一次完整的Http请求过程是怎样的”?
那么到底是怎样的呢?请看下文:
-
① 域名解析
这个是由于,socket只认识ip地址,不认识域名,所以要先进行域名解析。
-
② 建立TCP连接
HTTP 是比 TCP 更高层次的应用层协议,根据规则,只有低层协议建立之后才能进行更高层协议的连接,因此,首先要建立 TCP 连接。TCP通过三次握手建立连接,在前一篇文章中说过。
-
③ 浏览器向服务器发送请求命令
一旦建立了 TCP 连接,Web 浏览器就会向 Web 服务器发送请求命令。
例如:GET/hello/index.jsp HTTP/1.1。浏览器发送其请求命令之后,还要以头信息的形式向Web服务器发送一些别的信息(例:Accept ,User-Agent 等),之后浏览器发送了一空白行来通知服务器,它已经结束了该头信息的发送。
-
④ Web服务器应答
客户端向服务器发出请求后,服务器会进行应答。
-
⑤ Web服务器关闭TCP连接
一般情况下,一旦 Web 服务器向浏览器发送了请求的数据,它就要关闭 TCP 连接。
但是如果浏览器或者服务器在其头信息加入了这行代码:Connection:keep-alive,TCP连接在发送后将仍然保持打开状态,于是,浏览器可以继续通过相同的连接发送请求。保持连接节省了为每个请求建立新连接所需的时间,还节约了网络带宽。
-
⑥ 浏览器接受到服务器响应的数据
浏览器接受服务器应答回来的 html 代码和css,和js代码再进行页面的渲染或者接受到应答的文件进行保存等操作。
概括一下流程就是:
浏览器发起请求 → 解析域名得到ip→进行TCP连接 →浏览器发送HTTP请求和头信息发送→服务器对浏览器进行应答,响应头信息和浏览器所需的内容→ 关闭TCP连接或保持→浏览器得到数据数据进行操作
5.Http的缓存机制及原理(面试点▲▲▲)
关于缓存机制和原理这部分内容,我看到了一篇写得极好的文章:https://www.cnblogs.com/chenqf/p/6386163.html ,所以这一部分的内容我就直接转载了。
5.1 先来大概了解一下两种缓存规则
HTTP缓存有多种规则,根据是否需要重新向服务器发起请求来分类,我将其分为两大类(强制缓存,对比缓存)
下面我们通过时序图的方式来学习两种缓存规则:
为方便大家理解,我们认为浏览器存在一个缓存数据库,用于存储缓存信息。
在客户端第一次请求数据时,此时缓存数据库中没有对应的缓存数据,需要请求服务器,服务器返回后,将数据存储至缓存数据库中。
然后,我们再分别来看看强制缓存和对比缓存的时序图~
已存在缓存数据时,仅基于强制缓存,请求数据的流程如下:
已存在缓存数据时,仅基于对比缓存,请求数据的流程如下:
我们可以看到两类缓存规则的不同,强制缓存如果生效,不需要再和服务器发生交互,而对比缓存不管是否生效,都需要与服务端发生交互。
两类缓存规则可以同时存在,强制缓存优先级高于对比缓存,也就是说,当执行强制缓存的规则时,如果缓存生效,直接使用缓存,不再执行对比缓存规则。
问题: 基于对比缓存的流程下,不管是否使用缓存,都需要向服务器发送请求,那么还用缓存干什么?
答案是: 服务端在进行标识比较后,只返回header部分,通过状态码通知客户端使用缓存,不再需要将报文主体部分返回给客户端。所以,在对比缓存生效时,状态码为304,报文大小和请求时间都会大大减少。
5.2 强制缓存
从上文我们知道,强制缓存,在缓存数据未失效的情况下,可以直接使用缓存数据,那么浏览器是如何判断缓存数据是否失效呢?
我们知道,在没有缓存数据的时候,浏览器向服务器请求数据时,服务器会将数据和缓存规则一并返回,缓存规则信息包含在响应header中。
对于强制缓存来说,响应header中会有两个字段来标明失效规则 Expires/Cache-Control
使用chrome的开发者工具,可以很明显的看到对于强制缓存生效时,网络请求的情况
Expires
Expires的值为服务端返回的到期时间,即下一次请求时,请求时间小于服务端返回的到期时间,直接使用缓存数据。
不过Expires 是HTTP 1.0的东西,现在默认浏览器均默认使用HTTP 1.1,所以它的作用基本忽略。
另一个问题是,到期时间是由服务端生成的,但是客户端时间可能跟服务端时间有误差,这就会导致缓存命中的误差。
所以HTTP 1.1 的版本,使用Cache-Control替代。
Cache-Control
Cache-Control 是最重要的规则。常见的取值有private、public、no-cache、max-age,no-store,默认为private。
private: 客户端可以缓存
public: 客户端和代理服务器都可缓存(前端的同学,可以认为public和private是一样的)
max-age=xxx: 缓存的内容将在 xxx 秒后失效
no-cache: 需要使用对比缓存来验证缓存数据(后面介绍)
no-store: 所有内容都不会缓存,强制缓存,对比缓存都不会触发(对于前端开发来说,缓存越多越好,so...基本上和它说886)
5.3 对比缓存
对比缓存,顾名思义,需要进行比较判断是否可以使用缓存。
浏览器第一次请求数据时,服务器会将缓存标识与数据一起返回给客户端,客户端将二者备份至缓存数据库中。
再次请求数据时,客户端将备份的缓存标识发送给服务器,服务器根据缓存标识进行判断,判断成功后,返回304状态码,通知客户端比较成功,可以使用缓存数据。
第一次访问的截图:
再次访问的截图:
通过两图的对比,我们可以很清楚的发现,在对比缓存生效时,状态码为304,并且报文大小和请求时间大大减少。
原因是,服务端在进行标识比较后,只返回header部分,通过状态码通知客户端使用缓存,不再需要将报文主体部分返回给客户端。
对于对比缓存来说,缓存标识的传递是我们着重需要理解的,它在请求header和响应header间进行传递,
一共分为两种标识传递,接下来,我们分开介绍。
Last-Modified / If-Modified-Since
Last-Modified:
服务器在响应请求时,告诉浏览器资源的最后修改时间。
If-Modified-Since:
再次请求服务器时,通过此字段通知服务器上次请求时,服务器返回的资源最后修改时间。
服务器收到请求后发现有头If-Modified-Since 则与被请求资源的最后修改时间进行比对。
若资源的最后修改时间大于If-Modified-Since,说明资源又被改动过,则响应整片资源内容,返回状态码200;
若资源的最后修改时间小于或等于If-Modified-Since,说明资源无新修改,则响应HTTP 304,告知浏览器继续使用所保存的cache。
Etag / If-None-Match
优先级高于Last-Modified / If-Modified-Since
Etag:
服务器响应请求时,告诉浏览器当前资源在服务器的唯一标识(生成规则由服务器决定)。
If-None-Match:
再次请求服务器时,通过此字段通知服务器客户段缓存数据的唯一标识。
服务器收到请求后发现有头If-None-Match 则与被请求资源的唯一标识进行比对,
不同,说明资源又被改动过,则响应整片资源内容,返回状态码200;
相同,说明资源无新修改,则响应HTTP 304,告知浏览器继续使用所保存的cache。
总结
对于强制缓存,服务器通知浏览器一个缓存时间,在缓存时间内,下次请求,直接用缓存,不在时间内,执行比较缓存策略。对于比较缓存,将缓存信息中的Etag和Last-Modified通过请求发送给服务器,由服务器校验,返回304状态码时,浏览器直接使用缓存。
浏览器第一次请求:
浏览器再次请求: