HTTP协议
又称 超文本传输协议,英文名 :HTTP-Hypertext transfer protoco,这是一种规定了浏览器与服务器互相通信的规则,通过因特网传输万维网文档的数据传输协议。它是工作在TCP/IP的基础上的。
抓包分析
通过apache搭建本地的服务器
访问 http://localhost/test.html
附上我的代码
ceshi
This is ceshi
通过浏览器的调试抓包查看,如下
可以看到上面的 图片中的Headers中的内容,分析如下:
General
Request URL: 这个是当前请求的地址
Request Method: 请求类型,有 get、post、put、delete等
Status Code: 响应状态码,有400、404、200等
Remote Address:[::1]:80 域名对应的ip地址和端口号
Request Headers
Accept:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8
客户端/发送端能够接收的数据类型 有text/html,application/xhtml+xml,application/xml,image/webp,
*/*则表示可以接收任何数据
Accept-Encoding:gzip, deflate, sdch 浏览器可支持的web服务器返回的压缩编码类型 gzip,deflate,sdch
Accept-Language:zh-CN,zh;q=0.8 可以接收的语言 zh-CN,q=0.8
Cache-Control:max-age=0
请求和响应遵循的缓存机制,当前请求的Cache-Control不会影响另一个请求的缓存处理。private(默认)、no-cache、must-revalidate、max-age。这个参数有几种不同的使用场景:
打开一个新的窗口。private、no-cache、must-revalidate会重新请求服务器; max-age在超过时间年龄值时才会重新请求。
地址栏回车。private、must-revalidate只有第一次时会请求服务器; no-cache每次都会请求;max-age在超过时间年龄值时才会重新请求。
后退按钮。只有no-cache每次都重新请求服务器。
刷新。全部重新请求服务器
Connection:keep-alive
是否保持与服务器的TCP长连接 keep-alive(默认)、close
keep-alive 保持当前请求一段时间被其他请求重复使用,close表示关闭连接
Host:localhost 请求的服务器域名
If-Modified-Since:Tue, 28 Mar 2017 13:27:45 GMT
在发送HTTP请求时,把浏览器端缓存页面的最后修改时间一起发到服务器去,服务器会把这个时间与服务器上实际文件的最后修改时间进行比较。
如果时间一致,那么返回HTTP状态码304(不返回文件内容),客户端接到之后,就直接把本地缓存文件显示到浏览器中。
如果时间不一致,就返回HTTP状态码200和新的文件内容,客户端接到之后,会丢弃旧文件,把新文件缓存起来,并显示到浏览器中。
If-None-Match:"5a-54bca6cdd8a4c"
ETags和If-None-Match是一种常用的判断资源是否改变的方法。
类似于Last-Modified和HTTP-IF-MODIFIED-SINCE。
但是有所不同的是Last-Modified和HTTP-IF-MODIFIED-SINCE只判断资源的最后修改时间
而ETags和If-None-Match可以是资源任何的任何属性,不如资源的MD5等。
ETags和If-None-Match的工作原理是在HTTP Response中添加ETags信息。
当客户端再次请求该资源时,将在HTTP Request中加入If-None-Match信息(ETags的值)。
如果服务器验证资源的ETags没有改变(该资源没有改变),将返回一个304状态;
否则,服务器将返回200状态,并返回该资源和新的ETags。
Upgrade-Insecure-Requests:1
则是告诉服务器,自己支持这种操作,也就是我能读懂你服务器发过来的上面这条信息,并且在以后发请求的时候不用http而用https
User-Agent:Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.106 Safari/537.36
发出请求的客户端信息
Response Headers
Accept-Ranges:bytes 表明服务器是否支持指定范围请求及哪种类型的分段请求
Connection:Keep-Alive 表示不要立即断掉我们的请求
Content-Length:90 响应内容的长度
Content-Type:text/html 响应内容的格式/类型
Date:Tue, 28 Mar 2017 13:27:47 GMT 这个大家应该知道了,就是时间了,不过这个不是北京时间,而是格林尼治时间
ETag:"5a-54bca6cdd8a4c"
Keep-Alive:timeout=5, max=100 这表示过期时间是5秒,max到100秒后强制断掉连接
Last-Modified:Tue, 28 Mar 2017 13:27:45 GMT 上次页面的修改时间,即这个test.html的修改时间,这个是由服务器告知到客户端的
Server:Apache/2.4.10 (Win32) OpenSSL/0.9.8zb PHP/5.3.29 这个是当前的服务器的一些信息和php的版本号
以上的这些信息可以通过PHP的预定于变量 $_SERVER来获得,如下所示
响应状态码
第一个数字是定义响应的类别
1xx 指示信息 — 表示请求已接收,继续处理
2xx 成功 — 表示请求已成功被接收、理解、接受
3xx 重定向 — 要请求之前需做进一步的操作
4xx 客户端错误 — 当前请求存在语法错误或无法发送请求
5xx 服务器错误 — 服务器未能实现合法的请求
400 bad request 客户端有语法错误,不能被服务器理解
401 unauthorized 请求未经授权 ,
403 forbiddon 服务器收到请求,但拒绝提供服务
404 not found 请求资源不存在, 例如:错误的url
500 internal server error 服务器发生了不可预期的错误
503 server unavailable 服务器当前不能处理客户端的请求,可能恢复
100 Continue
初始的请求已经接受,客户应当继续发送请求的其余部分
101 Switching Protocols
服务器将遵从客户的请求转换到另外一种协议
200 OK //请求成功
201 Created
服务器已经创建了文档,Location头给出了它的URL。
202 Accepted
已经接受请求,但处理尚未完成。
203 Non-Authoritative Information
文档已经正常地返回,但一些应答头可能不正确,因为使用的是文档的拷贝
204 No Content
没有新文档,浏览器应该继续显示原来的文档。如果用户定期地刷新页面,而Servlet可以确定用户文档足够新,这个状态代码是很有用的
205 Reset Content
没有新的内容,但浏览器应该重置它所显示的内容。用来强制浏览器清除表单输入内容
206 Partial Content
客户发送了一个带有Range头的GET请求,服务器完成了它
300 Multiple Choices
客户请求的文档可以在多个位置找到,这些位置已经在返回的文档内列出。如果服务器要提出优先选择,则应该在Location应答头指明。
301 Moved Permanently
客户请求的文档在其他地方,新的URL在Location头中给出,浏览器应该自动地访问新的URL。
302 Found
类似于301,但新的URL应该被视为临时性的替代,而不是永久性的。
303 See Other
类似于301/302,不同之处在于,如果原来的请求是POST,Location头指定的重定向目标文档应该通过GET提取
304 Not Modified
客户端有缓冲的文档并发出了一个条件性的请求(一般是提供If-Modified-Since头表示客户只想比指定日期更新的文档)。服务器告诉客户,原来缓冲的文档还可以继续使用。
305 Use Proxy
客户请求的文档应该通过Location头所指明的代理服务器提取
307 Temporary Redirect
和302(Found)相同。许多浏览器会错误地响应302应答进行重定向,即使原来的请求是 POST,即使它实际上只能在POST请求的应答是303时才能重定向。由于这个原因,HTTP 1.1新增了307,以便更加清除地区分几个状态代码: 当出现303应答时,浏览器可以跟随重定向的GET和POST请求;如果是307应答,则浏览器只能跟随对GET请求的重定向。
400 Bad Request
请求出现语法错误。
401 Unauthorized
客户试图未经授权访问受密码保护的页面。应答中会包含一个WWW-Authenticate头,浏览器据此显示用户名字/密码对话框,然后在填写合适的Authorization头后再次发出请求。
403 Forbidden
资源不可用。
404 Not Found
无法找到指定位置的资源
405 Method Not Allowed
请求方法(GET、POST、HEAD、Delete、PUT、TRACE等)对指定的资源不适用。
406 Not Acceptable
指定的资源已经找到,但它的MIME类型和客户在Accpet头中所指定的不兼容
407 Proxy Authentication Required
类似于401,表示客户必须先经过代理服务器的授权。
408 Request Timeout
在服务器许可的等待时间内,客户一直没有发出任何请求。客户可以在以后重复同一请求。
409 Conflict
通常和PUT请求有关。由于请求和资源的当前状态相冲突,因此请求不能成功。
410 Gone
所请求的文档已经不再可用,而且服务器不知道应该重定向到哪一个地址。它和######404的不同在于,返回407表示文档永久地离开了指定的位置,而404表示由于未知的原因文档不可用。
411 Length Required
服务器不能处理请求,除非客户发送一个Content-Length头。
412 Precondition Failed
请求头中指定的一些前提条件失败
413 Request Entity Too Large
目标文档的大小超过服务器当前愿意处理的大小。如果服务器认为自己能够稍后再处理该请求,则应该提供一个Retry-After头
414 Request URI Too Long
URI太长
416 Requested Range Not Satisfiable
服务器不能满足客户在请求中指定的Range头
500 Internal Server Error
服务器遇到了意料不到的情况,不能完成客户的请求
501 Not Implemented
服务器不支持实现请求所需要的功能。例如,客户发出了一个服务器不支持的PUT请求
502 Bad Gateway
服务器作为网关或者代理时,为了完成请求访问下一个服务器,但该服务器返回了非法的应答
503 Service Unavailable
服务器由于维护或者负载过重未能应答。例如,Servlet可能在数据库连接池已满的情况下返回503。服务器返回503时可以提供一个Retry-After头
504 Gateway Timeout
由作为代理或网关的服务器使用,表示不能及时地从远程服务器获得应答
505 HTTP Version Not Supported
服务器不支持请求中所指明的HTTP版本
以上就是对HTTP的一些总结,如有错误,还望指正