http深度剖析

HTTP协议

又称 超文本传输协议,英文名 :HTTP-Hypertext transfer protoco,这是一种规定了浏览器与服务器互相通信的规则,通过因特网传输万维网文档的数据传输协议。它是工作在TCP/IP的基础上的。

抓包分析

通过apache搭建本地的服务器
访问 http://localhost/test.html
附上我的代码



    ceshi 


    This is ceshi


通过浏览器的调试抓包查看,如下


http深度剖析_第1张图片
Paste_Image.png
可以看到上面的 图片中的Headers中的内容,分析如下:

General

Request URL:           这个是当前请求的地址                   
Request Method:     请求类型,有 get、post、put、delete等
Status Code:           响应状态码,有400、404、200等
Remote Address:[::1]:80   域名对应的ip地址和端口号

Request Headers

Accept:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8  
 客户端/发送端能够接收的数据类型 有text/html,application/xhtml+xml,application/xml,image/webp, 
*/*则表示可以接收任何数据
Accept-Encoding:gzip, deflate, sdch 浏览器可支持的web服务器返回的压缩编码类型 gzip,deflate,sdch
Accept-Language:zh-CN,zh;q=0.8  可以接收的语言 zh-CN,q=0.8
Cache-Control:max-age=0

请求和响应遵循的缓存机制,当前请求的Cache-Control不会影响另一个请求的缓存处理。private(默认)、no-cache、must-revalidate、max-age。这个参数有几种不同的使用场景: 
打开一个新的窗口。private、no-cache、must-revalidate会重新请求服务器; max-age在超过时间年龄值时才会重新请求。
地址栏回车。private、must-revalidate只有第一次时会请求服务器; no-cache每次都会请求;max-age在超过时间年龄值时才会重新请求。
后退按钮。只有no-cache每次都重新请求服务器。
刷新。全部重新请求服务器

Connection:keep-alive   
 是否保持与服务器的TCP长连接  keep-alive(默认)、close   
keep-alive 保持当前请求一段时间被其他请求重复使用,close表示关闭连接

Host:localhost    请求的服务器域名
If-Modified-Since:Tue, 28 Mar 2017 13:27:45 GMT

在发送HTTP请求时,把浏览器端缓存页面的最后修改时间一起发到服务器去,服务器会把这个时间与服务器上实际文件的最后修改时间进行比较。
  如果时间一致,那么返回HTTP状态码304(不返回文件内容),客户端接到之后,就直接把本地缓存文件显示到浏览器中。
  如果时间不一致,就返回HTTP状态码200和新的文件内容,客户端接到之后,会丢弃旧文件,把新文件缓存起来,并显示到浏览器中。

If-None-Match:"5a-54bca6cdd8a4c"  

ETags和If-None-Match是一种常用的判断资源是否改变的方法。
类似于Last-Modified和HTTP-IF-MODIFIED-SINCE。
但是有所不同的是Last-Modified和HTTP-IF-MODIFIED-SINCE只判断资源的最后修改时间
而ETags和If-None-Match可以是资源任何的任何属性,不如资源的MD5等。

ETags和If-None-Match的工作原理是在HTTP Response中添加ETags信息。
当客户端再次请求该资源时,将在HTTP Request中加入If-None-Match信息(ETags的值)。
如果服务器验证资源的ETags没有改变(该资源没有改变),将返回一个304状态;
否则,服务器将返回200状态,并返回该资源和新的ETags。

Upgrade-Insecure-Requests:1
则是告诉服务器,自己支持这种操作,也就是我能读懂你服务器发过来的上面这条信息,并且在以后发请求的时候不用http而用https

User-Agent:Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.106 Safari/537.36

发出请求的客户端信息

Response Headers

Accept-Ranges:bytes         表明服务器是否支持指定范围请求及哪种类型的分段请求
Connection:Keep-Alive     表示不要立即断掉我们的请求
Content-Length:90             响应内容的长度
Content-Type:text/html      响应内容的格式/类型
Date:Tue, 28 Mar 2017 13:27:47 GMT  这个大家应该知道了,就是时间了,不过这个不是北京时间,而是格林尼治时间
ETag:"5a-54bca6cdd8a4c"     

Keep-Alive:timeout=5, max=100     这表示过期时间是5秒,max到100秒后强制断掉连接
Last-Modified:Tue, 28 Mar 2017 13:27:45 GMT  上次页面的修改时间,即这个test.html的修改时间,这个是由服务器告知到客户端的
Server:Apache/2.4.10 (Win32) OpenSSL/0.9.8zb PHP/5.3.29 这个是当前的服务器的一些信息和php的版本号

以上的这些信息可以通过PHP的预定于变量 $_SERVER来获得,如下所示

http深度剖析_第2张图片
Paste_Image.png

响应状态码

第一个数字是定义响应的类别

1xx 指示信息 — 表示请求已接收,继续处理
2xx 成功 — 表示请求已成功被接收、理解、接受
3xx 重定向 — 要请求之前需做进一步的操作
4xx 客户端错误 — 当前请求存在语法错误或无法发送请求
5xx 服务器错误 — 服务器未能实现合法的请求

400 bad request 客户端有语法错误,不能被服务器理解
401 unauthorized 请求未经授权 ,
403 forbiddon 服务器收到请求,但拒绝提供服务
404 not found 请求资源不存在, 例如:错误的url
500 internal server error 服务器发生了不可预期的错误
503 server unavailable 服务器当前不能处理客户端的请求,可能恢复

100 Continue

初始的请求已经接受,客户应当继续发送请求的其余部分

101 Switching Protocols

服务器将遵从客户的请求转换到另外一种协议

200 OK //请求成功
201 Created

服务器已经创建了文档,Location头给出了它的URL。

202 Accepted

已经接受请求,但处理尚未完成。

203 Non-Authoritative Information

文档已经正常地返回,但一些应答头可能不正确,因为使用的是文档的拷贝

204 No Content

没有新文档,浏览器应该继续显示原来的文档。如果用户定期地刷新页面,而Servlet可以确定用户文档足够新,这个状态代码是很有用的

205 Reset Content

没有新的内容,但浏览器应该重置它所显示的内容。用来强制浏览器清除表单输入内容

206 Partial Content

客户发送了一个带有Range头的GET请求,服务器完成了它

300 Multiple Choices

客户请求的文档可以在多个位置找到,这些位置已经在返回的文档内列出。如果服务器要提出优先选择,则应该在Location应答头指明。

301 Moved Permanently

客户请求的文档在其他地方,新的URL在Location头中给出,浏览器应该自动地访问新的URL。

302 Found

类似于301,但新的URL应该被视为临时性的替代,而不是永久性的。

303 See Other

类似于301/302,不同之处在于,如果原来的请求是POST,Location头指定的重定向目标文档应该通过GET提取

304 Not Modified

客户端有缓冲的文档并发出了一个条件性的请求(一般是提供If-Modified-Since头表示客户只想比指定日期更新的文档)。服务器告诉客户,原来缓冲的文档还可以继续使用。

305 Use Proxy

客户请求的文档应该通过Location头所指明的代理服务器提取

307 Temporary Redirect

和302(Found)相同。许多浏览器会错误地响应302应答进行重定向,即使原来的请求是 POST,即使它实际上只能在POST请求的应答是303时才能重定向。由于这个原因,HTTP 1.1新增了307,以便更加清除地区分几个状态代码: 当出现303应答时,浏览器可以跟随重定向的GET和POST请求;如果是307应答,则浏览器只能跟随对GET请求的重定向。

400 Bad Request

请求出现语法错误。

401 Unauthorized

客户试图未经授权访问受密码保护的页面。应答中会包含一个WWW-Authenticate头,浏览器据此显示用户名字/密码对话框,然后在填写合适的Authorization头后再次发出请求。

403 Forbidden

资源不可用。

404 Not Found

无法找到指定位置的资源

405 Method Not Allowed

请求方法(GET、POST、HEAD、Delete、PUT、TRACE等)对指定的资源不适用。

406 Not Acceptable

指定的资源已经找到,但它的MIME类型和客户在Accpet头中所指定的不兼容

407 Proxy Authentication Required

类似于401,表示客户必须先经过代理服务器的授权。

408 Request Timeout

在服务器许可的等待时间内,客户一直没有发出任何请求。客户可以在以后重复同一请求。

409 Conflict

通常和PUT请求有关。由于请求和资源的当前状态相冲突,因此请求不能成功。

410 Gone

所请求的文档已经不再可用,而且服务器不知道应该重定向到哪一个地址。它和######404的不同在于,返回407表示文档永久地离开了指定的位置,而404表示由于未知的原因文档不可用。

411 Length Required

服务器不能处理请求,除非客户发送一个Content-Length头。

412 Precondition Failed

请求头中指定的一些前提条件失败

413 Request Entity Too Large

目标文档的大小超过服务器当前愿意处理的大小。如果服务器认为自己能够稍后再处理该请求,则应该提供一个Retry-After头

414 Request URI Too Long

URI太长

416 Requested Range Not Satisfiable

服务器不能满足客户在请求中指定的Range头

500 Internal Server Error

服务器遇到了意料不到的情况,不能完成客户的请求

501 Not Implemented

服务器不支持实现请求所需要的功能。例如,客户发出了一个服务器不支持的PUT请求

502 Bad Gateway

服务器作为网关或者代理时,为了完成请求访问下一个服务器,但该服务器返回了非法的应答

503 Service Unavailable

服务器由于维护或者负载过重未能应答。例如,Servlet可能在数据库连接池已满的情况下返回503。服务器返回503时可以提供一个Retry-After头

504 Gateway Timeout

由作为代理或网关的服务器使用,表示不能及时地从远程服务器获得应答

505 HTTP Version Not Supported

服务器不支持请求中所指明的HTTP版本

以上就是对HTTP的一些总结,如有错误,还望指正

你可能感兴趣的:(http深度剖析)