1. Http简介
客户端连上web服务器后,若想获得web服务器中的某个web资源,需遵守一定的通讯格式,HTTP协议用于定义客户端与web服务器通迅的格式。WEB浏览器与WEB服务器之间的一问一答的交互过程必须遵循一定的规则,这个规则就是HTTP协议。
HTTP是hypertext transfer protocol(超文本传输协议)的简写,它是TCP/IP协议集中的一个应用层协议,用于定义WEB浏览器与WEB服务器之间交换数据的过程以及数据本身的格式。HTTP协议的版本:HTTP/1.0、HTTP/1.1。HTTP协议是学习JavaWEB开发的基石,不深入了解HTTP协议,就不能说掌握了WEB开发,更无法管理和维护一些复杂的WEB站点。深入理解HTTP协议,对管理和维护复杂的WEB站点、开发具有特殊用途的WEB服务器程序具有直接影响。
2. Http的版本区别
HTTP 1.0的会话方式
四个步骤:
浏览器与WEB服务器的连接过程是短暂的,每次连接只处理一个请求和响应。对每一个页面的访问,浏览器与WEB服务器都要建立一次单独的连接。浏览器到WEB服务器之间的所有通讯都是完全独立分开的请求和响应对。
HTTP 1.1的特点
在一个TCP连接上可以传送多个HTTP请求和响应
多个请求和响应过程可以重叠进行
增加了更多的请求头和响应头
HTTP1.0和HTTP1.1的区别
l 在HTTP1.0协议中,客户端与web服务器建立连接后,只能获得一个web资源。
l HTTP1.1协议,允许客户端与web服务器建立连接后,在一个连接上获取多个web资源。
3. HttpWatch工具的使用(一种IE浏览器插件,测试xml代码的工具,相当于命令telnet,XP下有的命令,wein7没有)
l 功能:监听和截获本地机器每次向服务器发送的http请求数据和服务器向本地机器返回的http响应数据。
l 下载:http://www.httpwatch.com/
l 下载后,直接双击下载文件安装即可。之后打开IE浏览器,选择“工具”→“浏览器栏”→“HttpWatchProfessional”。
l 这样操作之后,就可以打开HttpWatch工具了。
一个web页面中,使用img标签引用了三幅图片,当客户端访问服务器中的这个web页面时,客户端总共会访问几次服务器,即向服务器发送了几次HTTP请求。
4.HTTP请求消息
客户端连上服务器后,向服务器请求某个web资源,称之为客户端向服务器发送了一个HTTP请求。一个完整的HTTP请求包括如下内容:一个请求行、若干消息头、以及实体内容。
l 请求消息的结构:
一个请求行、若干消息头、以及实体内容,其中的一些消息头和实体内容都是可选的,消息头和实体内容之间要用空行隔开。
l 举例:
GET /books/java.htmlHTTP/1.1(请求行用于描述客户端的请
求方式、请求的资源名称,以及使用的HTTP协议版本号)
Accept: */*
Accept-Language: en-us
Connection: Keep-Alive
Host: localhost
Referer:http://localhost/links.asp
User-Agent: Mozilla/4.0
Accept-Encoding: gzip,deflate
(消息头用于描述客户端请求哪台主机,以及客户端的一些环境信息等)
(消息头下有空白行)
5.HTTP请求的细节——请求行
l 请求行中的GET称之为请求方式,请求方式有:
• POST、GET、HEAD、OPTIONS、DELETE、TRACE、PUT
• 常用的有: GET、 POST
• 用户如没有设置,默认情况下浏览器向服务器发送的都是get请求,例如在浏览器直接输地址访问,点超链接访问等都是get,用户如想把请求方式改为post,可通过更改表单的提交方式实现。
l 不管POST或GET,都用于向服务器请求某个WEB资源,这两种方式的区别主要表现在数据传递上:
• 如请求方式为GET方式,则可以在请求的URL地址后以?的形式带上交给服务器的数据,多个数据之间以&进行分隔,例如:
• GET /mail/1.html?name=abc&password=xyz HTTP/1.1
• GET方式的特点:在URL地址后附带的参数是有限制的,其数据容量通常不能超过1K。
• 如请求方式为POST方式,则可以在请求的实体内容中向服务器发送数据,Post方式的特点:传送的数据量无限制,适合有密码的时候用。
6.HTTP请求的细节——消息头
l 用于HTTP请求中的常用头
• Accept: text/html,image/* (设置网页允许的类型格式)
• Accept-Charset: ISO-8859-1 (设置字符集)
• Accept-Encoding: gzip,compress (设置压缩格式)
• Accept-Language: en-us,zh-cn (设置语言)
• Host: www.it315.org:80 (设置主机)
• If-Modified-Since: Tue, 11 Jul 2000 18:23:51GMT (提示最后一次修改的时间,即缓冲时间)
• Referer: http://www.it315.org/index.jsp (防盗链)
• User-Agent: Mozilla/4.0(compatible; MSIE 5.5; Windows NT 5.0) (用户代理,说明客户机操作系统信息,以及浏览器信息)
• Cookie (客户机通过这个头,可以带点数据给服务器)
• Connection: close/Keep-Alive (设置连接状态)
• Date: Tue, 11 Jul 2000 18:23:51 GMT (设置访问日期)
注: 详细解说参考博客:(http消息头详解):http://blog.csdn.net/tianyazaiheruan/article/details/8082129
7. HTTP响应(与4相对应着看)
l 一个HTTP响应代表服务器向客户端回送的数据,它包括:
一个状态行、若干消息头、以及实体内容 。
l 举例:
HTTP/1.1200 OK (状态行用于描述服务器对请求的处理结果。)
Server:Microsoft-IIS/5.0
Date:Thu, 13 Jul 2000 05:46:53 GMT
Content-Length:2291
Content-Type:text/html
Cache-control:private
(消息头用于描述服务器的基本信息,以及数据的描述,服务器通过这些数据的描述信息,可以通知客户端如何处理等一会儿它回送的数据。)
<HTML>
<BODY>
……(代表服务器向客户端回送的数据)
8. HTTP响应的细节——状态行
l 状态行
格式: HTTP版本号 状态码 原因叙述<CRLF>
举例:HTTP/1.1 200 OK
l 状态码用于表示服务器对请求的处理结果,它是一个三位的十进制数。响应状态码分为5类,如下所示:
状态码 |
含义 |
100~199 |
表示成功接收请求,要求客户端继续提交下一次请求才能完成整个处理过程 |
200~299 |
表示成功接收请求并已完成整个处理过程,常用200 |
300~399 |
为完成请求,客户需进一步细化请求。例如,请求的资源已经移动一个新地址,常用302、307和304 |
400~499 |
客户端的请求有错误,常用404 |
500~599 |
服务器端出现错误,常用 500 |
9.响应状态码 —》 典型情况
l 200(正常)
表示一切正常,返回的是正常请求结果。
l 302/307(临时重定向)
指出被请求的文档已被临时移动到别处,此文档的新的URL在Location响应头中给出。
l 304(未修改)
表示客户机缓存的版本是最新的,客户机应该继续使用它。
l 403(禁止)
服务器理解客户端请求,但拒绝处理它。通常由于服务器上文件或目录的权限设置所致。
l 404(找不到)
服务器上不存在客户机所请求的资源。
l 500(内部服务器错误)
服务器端的CGI、ASP、JSP等程序发生错误。
10.HTTP请求中的常用响应头
• Location:http://www.it315.org/index.jsp
• Server:apache tomcat
• Content-Encoding: gzip
• Content-Length: 80
• Content-Language: zh-cn
• Content-Type: text/html;charset=GB2312
• Last-Modified: Tue, 11 Jul2000 18:23:51 GMT
• Refresh: 1;url=http://www.it315.org
• Content-Disposition:attachment; filename=aaa.zip
• Transfer-Encoding:chunked
• Set-Cookie:SS=Q0=5Lb_nQ; path=/search
• ETag:W/"7777-1242234904000"
• Expires: -1
• Cache-Control: no-cache
• Pragma: no-cache
• Connection: close/Keep-Alive
• Date: Tue, 11 Jul 2000 18:23:51GMT
注: 详细解说参考博客:(http消息头详解):http://blog.csdn.net/tianyazaiheruan/article/details/8082129
11. 扩展头(自定义的HTTP头)
l 在HTTP消息中,也可以使用一些在HTTP 1.1正式规范里没有定义的头字段,这些头字段统称为自定义的HTTP头或扩展头,它们通常被当作是一种实体头处理。
l 现在流行的浏览器实际上都支持Cookie、Set-Cookie、Refresh和Content-Disposition等几个常用的扩展头字段。
l Refresh头字段
ü Refresh: 1
ü Refresh:1;url=http://www.it315.org
l Content-Disposition头字段
Content-Type: application/octet-stream
Content-Disposition: attachment;filename=aaa.zip