HTTP - HTTP报文首部

HTTP请求报文与响应报文格式
请求报文包含四部分：
a、请求行：包含请求方法、URI、HTTP版本信息 b、请求首部字段 c、请求内容实体 d、空行
响应报文包含四部分：
a、状态行：包含HTTP版本、状态码、状态码的原因短语 b、响应首部字段 c、响应内容实体 d、空行

一. 请求报文

image

二. 响应报文

image

三. HTTP1.1下4种首部字段

1. 请求首部字段

字段名	描述
Accept	用户代理可处理的媒体类型
Accept-Charset	优先的字符集
Accept-Encoding	优先的内容编码
Accept-Language	优先的语言
Authorization	Web认证信息
Proxy-Authorization	代理服务器要求的认证信息
Expect	期待服务器的特定行为
From	用户的电子邮箱地址
Host	请求资源所在服务器
Referer	对请求中 URI 的原始获取方
If-Match	比较实体标记（ETag）
If-None-Match	与 If-Match 相反
If-Modified-Since	比较资源的更新时间
If-Unmodified-Since	与If-Modified-Since相反
If-Range	资源未更新时发送实体 Byte 的范围请求
Range	实体的字节范围请求
Max-Forwards	最大传输逐跳数
TE	传输编码的优先级
User-Agent	HTTP 客户端程序的信息

2. 响应首部字段

字段名	描述
Accept-Ranges	是否接受字节范围请求
Age	推算资源创建经过时间
ETag	资源标志
Location	令客户端重定向至指定URI
Proxy-Authenticate	代理服务器对客户端的认证信息
Retry-After	对再次发起请求的时机要求
Server	HTTP服务器的安装信息
Vary	代理服务器缓存的管理信息
WWW-Authenticate	服务器对客户端的认证信息

3. 通用首部字段

字段名	描述
Cache-Control	控制缓存
Connection	逐跳首部、连接的管理
Date	创建报文的日期时间
Pragma	报文指令
Trailer	报文末端的首部一览
Transfer-Encoding	指定报文主体的传输编码方式
Upgrade	升级为其他协议
Via	代理服务器的相关信息
Warning	错误通知

4. 实体首部字段

字段名	描述
Allow	支持的HTTP方法
Content-Encoding	实体主体适用的编码方式
Content-Language	实体主体的自然语言
Content-Length	实体主体的大小（单位：字节）
Content-Location	替代对应资源的URI
Content-MD5	实体主体的报文摘要
Content-Range	实体主体的位置范围
Content-Type	实体主体的媒体类型
Expires	资源有效时间
Last-Modified	资源的最后修改日期时间

5. 其他字段（非HTTP1.1定义）

字段名	描述
Cookie	请求首部
Set-Cookie	响应首部
Access-Control-Allow-Origin	响应首部
Access-Control-Allow-Headers	响应首部
Access-Control-Allow-Methods	响应首部

一、HTTP协议的主要特点

简单快速：每个资源URI都是固定的
灵活：头部有数据类型，可以完成不同类型传输
无连接：传输完成即断开
无状态：建立连接完成传输下一次客户端传输是不知道两次连接者的身份的
应用层协议

其他协议：SOAP是一种简单基于XML的轻量协议

二、HTTP报文的组成部分

请求报文
- 请求行（首行）：HTTP方法、页面地址（/表示首页）、HTTP协议/版本
- 请求头：HTTP协议告诉服务端要哪些内容（key/value值）
- 空行：告诉服务端，请求头部分结束
- 请求体
响应报文
- 状态行：HTTP协议、状态码
- 响应头
- 空行
- 响应体

2.1 浏览器输入一个url后关于HTTP请求发生了什么

image

2.3 数据协商 - HTTP请求头

Header	解释	示例
Accept	指定客户端能够接收的内容类型	Accept: text/plain, text/html
Accept-Charset	浏览器可以接受的字符编码集。	Accept-Charset: iso-8859-5
Accept-Encoding	指定浏览器可以支持的web服务器返回数据压缩编码类型。	Accept-Encoding: compress, gzip
Accept-Language	浏览器可接受的语言	Accept-Language: en,zh
Accept-Ranges	可以请求网页实体的一个或者多个子范围字段	Accept-Ranges: bytes
Authorization	HTTP授权的授权证书	Authorization: Basic QWxhZGRpbjpvcGVuIHNlc2FtZQ==
Cache-Control	指定请求和响应遵循的缓存机制	Cache-Control: no-cache
Connection	表示是否需要持久连接。（HTTP 1.1默认进行持久连接）	Connection: keep-alive
Cookie	HTTP请求发送时，会把保存在该请求域名下的所有cookie值一起发送给web服务器。	Cookie: $Version=1; Skin=new;
Content-Length	请求的内容长度	Content-Length: 348
Content-Type	请求的与实体对应的MIME信息	Content-Type: application/x-www-form-urlencoded
Date	请求发送的日期和时间	Date: Tue, 15 Nov 2010 08:12:31 GMT
Expect	请求的特定的服务器行为	Expect: 100-continue
From	发出请求的用户的Email	From: [email protected]
Host	指定请求的服务器的域名和端口号	Host: www.baidu.com
If-Match	只有请求内容与实体相匹配才有效	If-Match: “737060cd8c284d8af7ad3082f209582d”
If-Modified-Since	如果请求的部分在指定时间之后被修改则请求成功，未被修改则返回304代码	If-Modified-Since: Wed, 31 Oct 2018 05:10:43 GMT
If-None-Match	如果内容未改变返回304代码，参数为服务器先前发送的Etag，与服务器回应的Etag比较判断是否改变	If-None-Match: “737060cd8c284d8af7ad3082f209582d”
If-Range	如果实体未改变，服务器发送客户端丢失的部分，否则发送整个实体。参数也为Etag	If-Range: “737060cd8c284d8af7ad3082f209582d”
If-Unmodified-Since	只在实体在指定时间之后未被修改才请求成功	If-Unmodified-Since: Wed, 31 Oct 2018 05:10:43 GMT
Max-Forwards	限制信息通过代理和网关传送的时间	Max-Forwards: 10
Pragma	用来包含实现特定的指令	Pragma: no-cache
Proxy-Authorization	连接到代理的授权证书	Proxy-Authorization: Basic QWxhZGRpbjpvcGVuIHNlc2FtZQ==
Range	只请求实体的一部分，指定范围	Range: bytes=500-999
Referer	先前网页的地址，当前请求网页紧随其后,即来路	Referer: https://www.baidu.com/
TE	客户端愿意接受的传输编码，并通知服务器接受接受尾加头信息	TE: trailers,deflate;q=0.5
Upgrade	向服务器指定某种传输协议以便服务器进行转换（如果支持）	Upgrade: HTTP/2.0, SHTTP/1.3, IRC/6.9, RTA/x11
User-Agent	User-Agent的内容包含发出请求的用户信息（判断返回PC端的页面还是移动端的页面）	User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36
Via	通知中间网关或代理服务器地址，通信协议	Via: 1.0 fred, 1.1 nowhere.com (Apache/1.1)
Warning	关于消息实体的警告信息	Warn: 199 Miscellaneous warning

2.4 数据协商 - HTTP响应头

Header	解释	示例
Accept-Ranges	表明服务器是否支持指定范围请求及哪种类型的分段请求	Accept-Ranges: bytes
Age	从原始服务器到代理缓存形成的估算时间（以秒计，非负）	Age: 12
Allow	对某网络资源的有效的请求行为，不允许则返回405	Allow: GET, HEAD
Cache-Control	告诉所有的缓存机制是否可以缓存及哪种类型	Cache-Control: private
Content-Encoding	web服务器支持的返回内容压缩编码类型。	Content-Encoding: gzip
Content-Language	响应体的语言	Content-Language: en,zh
Content-Length	响应体的长度	Content-Length: 348
Content-MD5	返回资源的MD5校验值	Content-MD5: Q2hlY2sgSW50ZWdyaXR5IQ==
Content-Range	在整个返回体中本部分的字节位置	Content-Range: bytes 21010-47021/47022
Content-Type	返回内容的MIME类型	Content-Type: application/x-www-form-urlencoded; charset=utf-8
Date	原始服务器消息发出的时间	Date: Wed, 31 Oct 2018 05:10:43 GMT
etag	请求变量的实体标签的当前值	etag: W/"847a3c5130b6c83cd331dee376e0d0a3"
Expires	响应过期的日期和时间	Expires: Wed, 31 Oct 2018 05:10:43 GMT
Last-Modified	请求资源的最后修改时间	Last-Modified: Wed, 31 Oct 2018 05:10:43 GMT
Location	用来重定向接收方到非请求URL的位置来完成请求或标识新的资源（301/302）	Location: https://www.hao123.com/
Pragma	包括实现特定的指令，它可应用到响应链上的任何接收方	Pragma: no-cache
Proxy-Authenticate	它指出认证方案和可应用到代理的该URL上的参数	Proxy-Authenticate: Basic
refresh	应用于重定向或一个新的资源被创造，在5秒之后重定向（由网景提出，被大部分浏览器支持）	Refresh: 5; url=https://www.hao123.com/
Retry-After	如果实体暂时不可取，通知客户端在指定时间之后再次尝试	Retry-After: 120
Server	web服务器软件名称	Server: BWS/1.0
Set-Cookie	设置Http Cookie	Set-Cookie: UserID=JohnDoe; Max-Age=3600; Version=1
Trailer	指出头域在分块传输编码的尾部存在	Trailer: Max-Forwards
Transfer-Encoding	文件传输编码	Transfer-Encoding:chunked
Vary	告诉下游代理是使用缓存响应还是从原始服务器请求	Vary: *
Via	告知代理客户端响应是通过哪里发送的	Via: 1.0 fred, 1.1 nowhere.com (Apache/1.1)
Warning	警告实体可能存在的问题	Warning: 199 Miscellaneous warning
WWW-Authenticate	表明客户端请求实体应该使用的授权方案	WWW-Authenticate: Basic

三、HTTP协议的发展历史

HTTP/0.9：

只有一个命令GET
没有 header 等描述数据的信息
服务器发送完毕，就关闭TCP连接

HTTP/1.0：

增加了很多命令
增加了status code 和 header
多字符集支持、多部分发送、权限和缓存等

HTTP/1.1：

持久连接
pipeline
增加 host （可以在一个集群上同时跑多个web服务，通过host字段来判断使用node还是Java服务，提高物理服务的使用效率）和其他一些命令

HTTP/2.0：

分帧传输：所有数据以二进制（帧）传输，之前都是用字符串
多路复用(信道复用)：同一个连接中发送多个请求，不再需要按照顺序来
头信息压缩（之前都是完整发送和返回，占用带宽的量比较大）以及推送（支持server push，即服务端可以主动发送数据传输）等提高效率的功能

场景：web页面有html、css等文件，有根据请求的url才能解析出html等文件的路径。这里就会包含执行顺序的问题，使用HTTP/2.0之前的协议首先要先请求、解析之后才能获取html、css、js，而且浏览器的并发请求数目是一定的，即对同一域名下的请求有一定数量限制（一般为6-10个），超过限制数目的请求会被阻塞。而HTTP/2.0 中只创建一个HTTP连接，数据传输和请求的发送是并行的，会改善效率、减少握手开销。

四、TCP 三次握手和四次挥手

4.1 三次握手

类比：
客户：在吗？我想跟你聊天。（发送SYN请求同步报文）
服务：好的，我听着呢。（发送SYN请求同步报文，确认同步）你说吧。（发送ACK确认报文，即可以开始吐槽了）
客户：好的。（发送ACK确认报文）今天...（开始吐槽）
图例：

image

第一次握手(SYN=1, seq=J):

客户端发送一个 TCP 的 SYN 标志位置1的包，指明客户端打算连接的服务器的端口，以及初始序号 J，保存在包头的序列号(Sequence Number)字段里。

发送完毕后，客户端进入 SYN_SEND 状态。
第二次握手(SYN=1, ACK=1, seq=K, ACKnum=J+1):

服务器发回确认包(ACK)应答。即 SYN 标志位和 ACK 标志位均为1。服务器端选择自己 ISN 序列号，放到 Seq 域里，同时将确认序号(Acknowledgement Number)设置为客户的 ISN 加1，即J+1。发送完毕后，服务器端进入 SYN_RCVD 状态。
第三次握手(ACK=1，ACKnum=K+1)

客户端再次发送确认包(ACK)，SYN 标志位为0，ACK 标志位为1，并且把服务器发来 ACK 的序号字段+1，放在确定字段中发送给对方，并且在数据段放写ISN的+1

发送完毕后，客户端进入 ESTABLISHED 状态，当服务器端接收到这个包时，也进入 ESTABLISHED 状态，TCP 握手结束。

为什么要三次握手：防止无用连接，规避网络延迟等原因造成的网络开销浪费的问题。

4.2 四次挥手

类比：
客户：我有事儿要挂电话了。（发送FIN结束报文，1次挥手）
服务：好吧（发送ACK确认报文，2次挥手），对了，还有个事儿要跟你说。
......
服务：说完了，挂了吧。（发送FIN结束报文，3次挥手）
客户：好的，拜拜。（发送ACK确认报文，4次挥手）
服务挂断电话.....
2MSL后......
客户：我知道了。
啪！（这才断开连接）
图例：

image

第一次挥手(FIN=1，seq=M)

假设客户端想要关闭连接，客户端发送一个 FIN 标志位置为1的包，表示自己已经没有数据可以发送了，但是仍然可以接受数据。发送完毕后，客户端进入 FIN_WAIT_1 状态。

第二次挥手(ACK=1，ACKnum=M+1)

服务器端确认客户端的 FIN 包，发送一个确认包，表明自己接受到了客户端关闭连接的请求，但还没有准备好关闭连接。发送完毕后，服务器端进入 CLOSE_WAIT 状态，客户端接收到这个确认包之后，进入 FIN_WAIT_2 状态，等待服务器端关闭连接。

第三次挥手(FIN=1，seq=K)

服务器端准备好关闭连接时，向客户端发送结束连接请求，FIN 置为1。发送完毕后，服务器端进入 LAST_ACK 状态，等待来自客户端的最后一个ACK。

第四次挥手(ACK=1，ACKnum=K+1)

客户端接收到来自服务器端的关闭请求，发送一个确认包，并进入 TIME_WAIT状态，等待可能出现的要求重传的 ACK 包。服务器端接收到这个确认包之后，关闭连接，进入 CLOSED 状态。客户端等待了某个固定时间（两个最大段生命周期，2MSL，2 Maximum Segment Lifetime）之后，没有收到服务器端的 ACK ，认为服务器端已经正常关闭连接，于是自己也关闭连接，进入 CLOSED 状态。

五、TCP、UDP对比

	TCP	UDP
可靠性	可靠	不可靠
连接性	面向连接	无连接
报文	面向字节流	面向报文
效率	传输效率低	传输效率高
双工性	全双工	一对一、一对多、多对一、多对多
流量控制	有(滑动窗口)	无
拥塞控制	有(慢开始、拥塞避免、快重传、快恢复)	无

六、HTTP方法

HTTP1.0定义了三种请求方法： GET, POST 和 HEAD方法。
HTTP1.1新增了五种请求方法：OPTIONS, PUT, DELETE, TRACE 和 CONNECT 方法。

HTTP方法名	作用
GET	获取资源
POST	传输资源
PUT	更新/修改资源
DELETE	删除资源
HEAD	获得报文首部
CONNECT	HTTP/1.1协议中预留给能够将连接改为管道方式的代理服务器
OPTIONS	返回服务器针对特定资源所支持的HTTP请求方法，允许客户端发送`'*'`查看服务器的性能
TRACE	回显服务器收到的请求，主要用于测试或诊断

推荐：同一个url通过不同的方法来实现，设计符合RESTful风格的接口。

七、POST和GET区别

场景	GET	POST
浏览器回退	无害的	会重复提交请求
产生的URL地址	可以被收藏	不可以
浏览器缓存	主动缓存	不会自动缓存，除非手动设置
编码方式	只能进行URL编码	支持多种编码方式
浏览器历史记录中的请求参数	完整保留	不会保留
URL中传递的参数长度	2KB左右，不同浏览器限制不同。故参数不要太长，容易被浏览器截断。	没有限制
参数的数据类型	ASCII字符	没有限制
安全性	参数直接暴露在URL上，还可能造成CSRF攻击（以?分割URL和传输数据，多个参数用&连接）	可以传递敏感信息
参数传递	URL传递	Request body中

八、HTTP CODE

一个好的HTTP服务可以通过CODE判断结果

1XX：指示信息 - 表示请求已接收，继续处理

2XX：成功 - 表示请求已被成功接收

200 OK：客户端请求成功
201 Created：请求成功并且服务器创建了新的资源
202 Accepted：服务器已接受请求，但尚未处理
206 Partial Content：客户端发送了一个带有Range头的GET请求，服务器完成了它
场景：video播放视频地址/audio播放音频地址，如果文件过大，则一般会返回206

3XX：重定向 - 要完成请求必须进行更进一步的操作

301 Moved Permanently：所请求的页面已经永久转移至新的URL（永久重定向）
302 Found：所请求的页面已经临时转移至新的URL（临时重定向）
303 See Other：临时性重定向，且总是使用 GET 请求新的 URI
304 Not Modified：客户端有缓冲的文档并发出一个条件性的请求，服务器告诉客户原来缓存的文档还可以继续使用
307 Temporary Redirect：临时性重定向，除GET、HEAD方法外，其他的请求方法必须等客户确认才能跳转

4XX：客户端错误 - 请求有语法错误或请求无法实现

400 Bad Request：客户端有语法错误，不能被服务器所理解
401 Unauthorized：请求未经授权，这个状态码必须和WWW-Authenticate报头域一起使用
403 Forbidden：对被请求页面的访问被禁止
404 Not Found：请求资源不存在

5XX：服务器错误 - 服务器未能实现合法的请求

500 Internal Server Error：服务器发生不可预期的错误原来缓冲的文档还可以继续使用。一般来说，这个问题都会在服务器端的源代码出现错误时出现
502 Bad Gateway：从上游服务器接收到无效的响应
503 Server Unavailable：请求未完成，服务器临时过载或宕机（可能是过载或正在维护），一段时间后可能恢复正常。看Retry-After头，可以预计延迟时间，如果没给出Retry-After头，那么客户端应当以处理500响应的方式处理它
504 Gateway Timeout：网页请求超时
场景：访问大流量或者内容数据量较多的网站。根据我们掌握的服务器性能状况及网络流量情况，合理的对nginx.conf中的字句进行合理正确的设置。

九、持久连接 - TCP connection

HTTP1.0：采用“请求-应答”模式，每个请求/应答客户和服务器都要新建一个连接，完成后立即断开连接。
HTTP1.1：

当使用普通模式，即非Keep-Alive模式时，同HTTP1.0.
当使用Keep-Alive模式（又称持久连接、连接重用）时，Keep-Alive功能使客户端到服务器端的连接持续有效，当出现对服务器的后继请求时，Keep-Alive功能避免了建立或重新建立连接(减少三次握手的开销)。

HTTP2.0：支持信道复用，即HTTP请求支持并发。同一个用户对同一个服务器发起网页请求的时候（同域），只需要一个HTTP连接。

十、管线化

在使用持久连接的情况下，某个连接上消息的传递类似于：
请求1 -> 响应1-> 请求2 -> 响应2 - > 请求3 -> 响应3

管线化之后，某个连接上的消息变成了类似这样：
请求1 -> 请求2 -> 请求3 -> 响应1 -> 响应2 -> 响应3

管线化的特点

管线化机制通过持久连接完成，仅HTTP/1.1支持此技术
只有GET和HEAD请求可以进行管线化，而POST则有所限制
初次创建连接时不建议启动管线机制，因为服务器不一定支持HTTP/1.1版本的协议
管线化不会影响响应到来的顺序，响应返回的顺序并未改变
HTTP/1.1要求服务端必须支持管线化，但并不是要求服务器也对响应进行管线化处理，只是要求对于管线化的请求不失败即可
由于上面提到的服务器端问题，开启管线化很可能并不会带来大幅度的性能提升，而且很多服务器端和代理程序对管线化的支持并不好，因此现代浏览器如Chrome和Firefox默认并未开启管线化支持。

十一、创建一个web服务（基于node.js）

const http = require('http')
http.createServer(function (request, response) {
    console.log('request come', request.url)
    response.end('OK')
}).listen(8888)
console.log('server is listening... ')

十二、跨域通信

浏览器有同源策略。协议、域名、端口有一个不同就算跨域。跨域请求，虽然会成功，但是由于同源安全策略限制不会返回相应的资源。

主要限制以下几个方面：

Cookie、LocalStorage 和 IndexDB 无法读取
DOM 无法获得
AJAX 请求不能发送

同源策略：限制从一个源加载的文档或脚本和来自另一个源的资源进行交互。这是用于隔离潜在的恶意文件的关键的安全机制。

前后端如何通信：

AJAX
WebSocket
CORS
...

跨域通信几种解决方案

JSONP
CORS（可以理解成支持跨域通信的AJAX）
Hash
window.name/window.postMessage（HTML5）
WebSocket
Proxy

12.1 JSONP

JSONP：由于同源策略的限制，XMLHttpRequest只允许请求当前源的资源。而，，标签没有同源限制，所以JSONP通过声明动态

HTTP - HTTP报文首部

一. 请求报文

二. 响应报文

三. HTTP1.1下4种首部字段

一、HTTP协议的主要特点

二、HTTP报文的组成部分

2.1 浏览器输入一个url后关于HTTP请求发生了什么

2.3 数据协商 - HTTP请求头

2.4 数据协商 - HTTP响应头

三、HTTP协议的发展历史

四、TCP 三次握手和四次挥手

4.1 三次握手

4.2 四次挥手

五、TCP、UDP对比

六、HTTP方法

七、POST和GET区别

八、HTTP CODE

九、持久连接 - TCP connection

十、管线化

十一、创建一个web服务（基于node.js）

十二、跨域通信

跨域通信几种解决方案

12.1 JSONP

你可能感兴趣的:(HTTP - HTTP报文首部)