一、http简介
http协议Hyper Text Transfer Protocol(超文本传输协议)的缩写,是基于TCP的应用层网络通信协议,定义了一系列客服端和服务器通信的过程以及数据本身的格式等通信的规则。现有Http1.0和Http1.1两个版本。其特点如下:
1. 采用B/S模式,客服端采用浏览器,使得项目部署简单。
2. 无状态,http协议时无状态的协议,也就是说它对事务处理没有记忆能力,这意味着如果后面的事务如果需要前面的信息,则必须重传。同一个客户端的这次请求和上次请求是没有对应关系,这可能导致每次连接重传的信息量增大,也让服务器在不需要先前信息时响应较快。
3.事务处理上采用“请求-----响应”模式。非AJAX模式下,服务器被动响应客户端请求,没有请求,就不会有响应,即使服务器端的内容已经发生了改变。
4.默认HTTP的端口号为80
二、Http1.0和Http1.1会话方式的比较
1.Http1.0 会话方式特点:一次连接只能有一次请求响应,响应结束TCP连接关闭,对每一个页面的访问都要重新建立一次单独的连接。浏览器和服务器之间的所有通讯都是完全独立分开的请求响应。
2.Http1.1 会话方式特点:在一次连接上可以传送多个请求和响应,多个请求和响应过程可以重叠进行。浏览器不必等待服务器的响应结果,可以直接发送下一个请求,但是服务器必须按照客户端请求的顺序处理请求,不然客户端分不清响应结果对应哪一次请求。此外Http1.1比Http1.0增加了更多的响应头。
三、HTTP协议的工作流程:
1.首先客户端和服务器建立TCP连接。
2.连接建立成功后,客户端发送一个HTTP请求
3.服务器端接到求情后,给与处理,返回响应信息
4.客户端接收响应信息,浏览器渲染形成界面。最后断开连接。
三、 HTTP协议的请求
http请求分为三部分:一个请求行、若干消息头、实体内容。消息头要和实体内容用空行隔开
请求行
格式:请求方式 资源路径 Http版本号
四中常用的请求方式有:GET,POST,PUT,DELETE. 一个URL地址用于描述一个网络上的资源,而HTTP中的GET, POST, PUT, DELETE就对应着对这个资源的查,改,增,删4个操作。一般情况下采用get和post提交请求。
GET提交的数据会放在URL之后,以?分割URL和传输数据,参数之间以&相连,但其传送的数据量是有限的,一般限制在1KB以下,,而且存在安全问题。
POST提交的数据放在请求消息的正文部分,也就是消息头的后面。提交的数据量大小没有限制
‚请求消息头
请求报头允许客户端向服务器端传递请求的附加信息以及客户端自身的信息。
常用的请求报头
Accept
Accept请求报头域用于指定客户端接受哪些类型的信息。eg:Accept:image/gif,表明客户端希望接受GIF图象格式的资源;Accept:text/html,表明客户端希望接受html文本。
Accept-Charset
Accept-Charset请求报头域用于指定客户端接受的字符集。eg:Accept-Charset:iso-8859-1,gb2312.如果在请求消息中没有设置这个域,缺省是任何字符集都可以接受。
Accept-Encoding
Accept-Encoding请求报头域类似于Accept,但是它是用于指定可接受的内容编码。eg:Accept-Encoding:gzip.deflate.如果请求消息中没有设置这个域服务器假定客户端对各种内容编码都可以接受。
Accept-Language
Accept-Language请求报头域类似于Accept,但是它是用于指定一种自然语言。eg:Accept-Language:zh-cn.如果请求消息中没有设置这个报头域,服务器假定客户端对各种语言都可以接受。
Authorization
Authorization请求报头域主要用于证明客户端有权查看某个资源。当浏览器访问一个页面时,如果收到服务器的响应代码为401(未授权),可以发送一个包含Authorization请求报头域的请求,要求服务器对其进行验证。
Host(发送请求时,该报头域是必需的)
Host请求报头域主要用于指定被请求资源的Internet主机和端口号,它通常从HTTP URL中提取出来的,eg:
我们在浏览器中输入:http://www.guet.edu.cn/index.html
浏览器发送的请求消息中,就会包含Host请求报头域,如下:
Host:www.guet.edu.cn
此处使用缺省端口号80,若指定了端口号,则变成:Host:www.guet.edu.cn:指定端口号
User-Agent
我们上网登陆论坛的时候,往往会看到一些欢迎信息,其中列出了你的操作系统的名称和版本,你所使用的浏览器的名称和版本,这往往让很多人感到很神奇,实际上,服务器应用程序就是从User-Agent这个请求报头域中获取到这些信息。User-Agent请求报头域允许客户端将它的操作系统、浏览器和其它属性告诉服务器。不过,这个报头域不是必需的,如果我们自己编写一个浏览器,不使用User-Agent请求报头域,那么服务器端就无法得知我们的信息了。
四、HTTP协议的响应
响应消息的结构:一个状态行、若干消息头、实体内容,消息头和实体内容之间要用空行。实体内容实际上就是一个网页。
响应报头允许服务器传递不能放在状态行中的附加响应信息,以及关于服务器的信息和对Request-URI所标识的资源进行下一步访问的信息。
常用的响应报头
Location
Location响应报头域用于重定向接受者到一个新的位置。Location响应报头域常用在更换域名的时候。
Server
Server响应报头域包含了服务器用来处理请求的软件信息。与User-Agent请求报头域是相对应的。下面是
Server响应报头域的一个例子:
Server:Apache-Coyote/1.1
WWW-Authenticate
WWW-Authenticate响应报头域必须被包含在401(未授权的)响应消息中,客户端收到401响应消息时候,并发送Authorization报头域请求服务器对其进行验证时,服务端响应报头就包含该报头域。
eg:WWW-Authenticate:Basic realm="Basic Auth Test!" //可以看出服务器对请求资源采用的是基本验证机制
四、实体报头
请求和响应消息都可以传送一个实体。一个实体由实体报头域和实体正文组成,但并不是说实体报头域和实体正文要在一起发送,可以只发送实体报头域。实体报头定义了关于实体正文(eg:有无实体正文)和请求所标识的资源的元信息。
常用的实体报头
Content-Encoding
Content-Encoding实体报头域被用作媒体类型的修饰符,它的值指示了已经被应用到实体正文的附加内容的编码,因而要获得Content-Type报头域中所引用的媒体类型,必须采用相应的解码机制。Content-Encoding这样用于记录文档的压缩方法,eg:Content-Encoding:gzip
Content-Language
Content-Language实体报头域描述了资源所用的自然语言。没有设置该域则认为实体内容将提供给所有的语言阅读
者。eg:Content-Language:da
Content-Length
Content-Length实体报头域用于指明实体正文的长度,以字节方式存储的十进制数字来表示。
Content-Type
Content-Type实体报头域用语指明发送给接收者的实体正文的媒体类型。eg:
Content-Type:text/html;charset=ISO-8859-1
Content-Type:text/html;charset=GB2312
Last-Modified
Last-Modified实体报头域用于指示资源的最后修改日期和时间。
Expires
Expires实体报头域给出响应过期的日期和时间。为了让代理服务器或浏览器在一段时间以后更新缓存中(再次访问曾访问过的页面时,直接从缓存中加载,缩短响应时间和降低服务器负载)的页面,我们可以使用Expires实体报头域指定页面过期的时间。eg:Expires:Thu,15 Sep 2006
六、通用消息头
七:响应码
响应状态码表示服务器对请求的各种不同处理结果和状态,是一个三位的十进制数,可分为五类:
A. 100~199 :表示成功接收请求,要求客户端继续提交下一次请求才能完成整个处理过程。
B. 200 ~ 299 : 表示成功接受请求并已经完成整个处理过程。比如:200表示一切正常,返回的是正常请求结果。206表示客户端发送了一个带有Range头的get请求,要求服务器只返回文档中的部分内容,服务器按要求完成了这个请求。
C. 300 ~ 399 :表示为完成请求,客户需要进一步细化请求。例如304表示客户端缓存的版本是最新的,客户端应该继续使用它。
D. 400 ~ 499 : 表示客户端的请求有误。例如404表示服务器上不存在客户端所请求的资源。401表示客户端访问的是一个受口令和密码保护的页面,结合使用一个WWW-Authenticate响应头提示客户端应重新发出一个带有Authorization头的请求记录。
500 ~ 599 : 服务器端出现错误。例如500表示服务器的CGI\ASP\JSP等程序发生错误。