1.什么是HTTP协议
客户端连上web服务器后,若想获得web服务器中的某个web资源,需遵守一定的通讯格式,HTTP协议用于定义客户端与web服务器通迅的格式。
2.HTTP协议简介
HTTP是hypertext transfer protocol(超文本传输协议)的简写,它是TCP/IP协议的一个应用层协议(应用层,传输层,网络层,数据链路层),用于定义WEB浏览器与WEB服务器之间交换数据的过程。
3.HTTP协议版本:HTTP/1.0,HTTP/1.1,HTTP/2.0
HTTP/1.0与HTTP/1.1的区别:在HTTP1.0协议中,客户端与web服务器建立连接后,只能获得一个web资源;HTTP1.1协议,允许客户端与web服务器建立连接后,在一个连接上获取多个web资源。
HTTP/2.0:HTTP 2.0在2013年8月进行首次合作共事性测试。在开放互联网上HTTP 2.0将只用于https://网址,而 http://网址将继续使用HTTP/1,目的是在开放互联网上增加使用加密技术,以提供强有力的保护去遏制主动攻击。DANE RFC6698允许域名管理员不通过第三方CA自行发行证书。
4.HTTP协议的无状态和无连接特点:
无连接:无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后,即断开连接。采用这种方式可以节省传输时间。
无状态:HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。另一方面,在服务器不需要先前信息时它的应答就较快。
5.URL和URI
URL(Uniform Resource Locator 统一资源定位符),互联网上标准资源的地址。结构:协议+服务器名称(或IP地址)+路径+文件名,
例如:http://www.emokit.com/index.html或者http:192.168.0.116:8080/index.html。
URI(Uniform Resource Identifier 统一资源标识符),用于标识某一互联网资源名称的字符串。结构:[scheme:] scheme-specific-part,URL是URI的子集。
6.HTTP请求
客户端连上服务器后,向服务器请求某个web资源,称之为客户端向服务器发送一个HTTP请求。一个完整的HTTP请求包括如下内容:一个请求行、若干请求头、以及实体内容,其中的一些请求头和实体内容都是可选的,请求头和实体内容之间要用空行隔开。如下所示:
GET /books/java.html HTTP/1.1 ---->请求行:用于描述客户端的请求方式、请求的资源名称,以及使用的HTTP协议版本号
Accept: */*
Accept-Language: en-us
Connection: Keep-Alive
Host: localhost ---->请求头:用于描述客户端请求的哪台主机,以及客户端的一些环境信息等
Referer: http://localhost/links.asp
User-Agent: Mozilla/4.0
Accept-Encoding: gzip, deflate
(空行) ---->一个空行
6.1 请求方式:POST,GET,HEAD,OPTIONS,DELETE,TRACE,PUT,常用的有:POST,GET
GET与POST请求方式的区别:
GET方式:可以在请求的URL地址后以?的形式带上交给服务器的数据,多个数据之间以&进行分割,
例如:/mail/1.html?name=adb&password=123
GET方式特点:在URL地址后附带的参数是有限制的,其数据容量不能超过1K。
POST方式:可以在请求的实体内容中向服务器发送数据,例如:
POST /servlet/LoginServlet HTTP/1.1
Host:
Content-Type:application/x-www-form-urlencoded
Content-Length-Length:28
(空行)
name=abc&password=xyz
POST方式的特点:传输的数据无限制
6.2 HTTP请求中常用的消息头:
Accept: text/html,image/* 客户端可接受的MIME类型
Accept-Charset: ISO-8859-1 客户端采用的编码
Accept-Encoding: gzip,compress 客户端支持的数据压缩格式
Accept-Language: en-us,zh-cn 客户端所希望的语言种类,当服务器能够提供一种以上的语言版本时要用到
Host: www.emokit.com:80 访问的主机和端口号
If-Modified-Since: Tue, 11 Jul 2000 18:23:51 GMT 告诉服务器,资源的缓存时间
Referer: http://www.emokit.com/index.html 告诉服务器,它是从哪个资源来访问服务器的(防盗链)
User-Agent: Mozilla/4.0 (compatible; MSIE 5.5; Windows NT 5.0) 标识客户端软件环境,如浏览器类型和版本、操作系统,使用语言等
Cookie 向服务器带数据
Connection: close/Keep-Alive 这个请求完了,是保存连接还是关闭连接
Date: Tue, 11 Jul 2000 18:23:51 GMT 发送时间
7.HTTP 响应
一个HTTP响应代表服务器向客户端回送的数据,它包括:一个状态行、若干消息头、以及实体内容,其中的一些消息头和实体内容都是可选的,消息头和实体内容之间要用空行隔开。
HTTP/1.1 200 OK ---->状态行:用于描述服务器对请求的处理结果
Server: Microsoft-IIS/5.0
Date: Thu, 13 Jul 2000 05:46:53 GMT
Content-Length: 2291 ---->多个消息头:用于描述服务器的基本信息,以及数据的描述,服务器通过这些数据的描述,可以通知客户端如何处理等一会儿它回送的数据
Content-Type: text/html
Cache-control: private
(空行) ---->一个空行
<HTML> ---->实体内容:代表服务器向客户端回送的数据
<BODY>
……
7.1 状态行
格式:HTTP版本号 状态码 原因叙述 例如:HTTP/1.1 200 OK
状态码用于表示服务器对请求的处理结果,它是一个三位的十进制数。响应状态码分为5类,如下所示:
状态码 含义
100~199 表示成功接收请求,要求客户端继续提交下一次请求才能完成整个处理过程
200~299 表示成功接收请求并已完成整个处理过程,常用200
300~399 为完成请求,客户需进一步细化请求。例如,请求的资源已经移动一个新地址,常用302、307和304
400~499 客户端的请求有错误,常用404
500~599 服务器端出现错误,常用 500
常用的状态码:
200: 请求已成功,请求所希望的响应头和数据体将随此响应返回
202:服务器已接受请求,但尚未处理。正如它可能被拒绝一样,最终该请求可能会也可能不会执行。
301:永久重定向,被请求的资源已永久移动到新位置,并且将来任何对此资源的引用都应该使用本响应返回的若干个 URI 之一。如果可能,拥有链接编辑功能的客户端应当自动把请求的地址修改为从服务器反馈回来的地址。除非额外指定,否则这个响应也是可缓存的。
302:临时重定向,请求的资源临时从不同的 URI响应请求。由于这样的重定向是临时的,客户端应当继续向原有地址发送以后的请求。只有在Cache-Control或Expires中进行了指定的情况下,这个响应才是可缓存的。
403: 没有权限。
404: 请求失败,请求所希望得到的资源未被在服务器上发现。
500:服务器遇到了一个未曾预料的状况,导致了它无法完成对请求的处理。一般来说,这个问题都会在服务器端的源代码出现错误时出现。
更多的状态码:HTTP状态码
7.2 响应码
Location: http://www.emokit.com/index.html 配合302状态码使用,用于告诉浏览器找谁
Server:apache tomcat 服务器的类型
Content-Encoding: gzip 数据的压缩格式
Content-Length: 80 数据回送的长度
Content-Language: zh-cn 内容的语言环境
Content-Type: text/html; charset=GB2312 内容类型
Last-Modified: Tue, 11 Jul 2000 18:23:51 GMT 当前资源的缓存时间
Refresh: 1;url=http://www.it315.org 隔多久刷新一次
Content-Disposition: attachment; filename=aaa.zip 告诉浏览器,以下载方式打开数据
Transfer-Encoding: chunked 数据的编码格式
Set-Cookie:SS=Q0=5Lb_nQ; path=/search
Expires: -1 数据缓存多久的时间,-1或0,则是不缓存
Cache-Control: no-cache 是否缓存
Pragma: no-cache 是否缓存
Connection: close/Keep-Alive 是否保持连接
Date: Tue, 11 Jul 2000 18:23:51 GMT 时间
Range: bytes=0-499 用于多线程,请求实体的一个或者多个子范围,例如:
表示头500个字节:bytes=0-499
表示第二个500字节:bytes=500-999
表示最后500个字节:bytes=-500
表示500字节以后的范围:bytes=500-
第一个和最后一个字节:bytes=0-0,-1
同时指定几个范围:bytes=500-600,601-999
另外:Cache-Control指定请求和响应遵循的缓存机制。在请求消息或响应消息中设置 Cache-Control并不会修改另一个消息处理过程中的缓存处理过程。请求时的缓存指令包括no-cache、no-store、max-age、 max-stale、min-fresh、only-if-cached,响应消息中的指令包括public、private、no-cache、no- store、no-transform、must-revalidate、proxy-revalidate、max-age。各个消息中的指令含义如下:
Public 指示响应可被任何缓存区缓存。
Private 指示对于单个用户的整个或部分响应消息,不能被共享缓存处理。这允许服务器仅仅描述当用户的部分响应消息,此响应消息对于其他用户的请求无效。
no-cache 指示请求或响应消息不能缓存
no-store 用于防止重要的信息被无意的发布。在请求消息中发送将使得请求和响应消息都不使用缓存。
max-age 指示客户断可以接收生存期不大于指定时间(以秒为单位)的响应。
min-fresh 指示客户断可以接收响应时间小于当前时间加上指定时间的响应。
max-stale 指示客户断可以接收超出超时期间的响应消息。如果指定max-stale消息的值,那么客户机可以接收超出超时期指定值之内的响应消息。
8.通用信息头指既能用于请求,又能用于响应的一些消息头:
Cache-Control: no-cache
Pragma: no-cache
Connection: close/Keep-Alive
Date: Tue, 11 Jul 2000 18:23:51 GMT