HTTP协议
一、HTTP简介
1、客户端连上web服务器后,若想获得web服务器中的某个web资源,需遵守一定的通讯格式,HTTP协议用于定义客户端与web服务器通迅的格式。
2、WEB浏览器与WEB服务器之间的一问一答的交互过程必须遵循一定的规则,这个规则就是HTTP协议。
3、HTTP是hypertext transfer protocol(超文本传输协议)的简写,它是TCP/IP协议集中的一个应用层协议,用于定义WEB浏览器与WEB服务器之间交换数据的过程以及数据本身的格式。
4、HTTP协议的版本
HTTP/1.0、HTTP/1.1
HTTP/1.0和HTTP/1.1的区别:在HTTP1.0协议中,客户端与web服务器建立连接后,只能获得一个web资源。
HTTP1.1协议,允许客户端与web服务器建立连接后,在一个连接上获取多个web资源。
5、HTTP协议是学习JavaWEB开发的基石,不深入了解HTTP协议,就不能说掌握了WEB开发,更无法管理和维护一些复杂的WEB站点。深入理解HTTP协议,对管理和维护复杂的WEB站点、开发具有特殊用途的WEB服务器程序具有直接影响。
二、HTTP请求消息
1、客户端连上服务器后,向服务器请求某个web资源,称之为客户端向服务器发送了一个HTTP请求。一个完整的HTTP请求包括如下内容:一个请求行、若干消息头、空行、请求数据
举例:举例:
GET /books/java.html HTTP/1.1————————请求行
Accept: */* } Accept-Language: en-us }
Connection: Keep-Alive }
Host: localhost(客户机通过这个头,告诉服务器,想访问服务器哪台主机}——————多个消息头
Referer: http://localhost/links.asp(客户机通过这个头,告诉服务器,客户机是从哪个页面来的(防盗链)}
User-Agent: Mozilla/4.0 (说明客户机操作系统信息,以及浏览器信息) }
Accept-Encoding: gzip, deflate(客户机通过这个头,告诉服务器,支持哪种数据压缩格式) }
———————————一个空行
三、HTTP请求细节——请求行
1、用户如没有设置,默认情况下浏览器向服务器发送的都是get请求,例如在浏览器直接输地址访问,点超链接访问等都是get,用户如想把请求方式改为post,可通过更改表单的提交方式实现。
2、不管POST或GET,都用于向服务器请求某个WEB资源,这两种方式的区别主要表现在数据传递上:GET方式的特点:在URL地址后附带的参数是有限制的,其数据容量通常不能超过1K。
如请求方式为POST方式,则可以在请求的实体内容中向服务器发送数据,Post方式的特点:传送的数据量无限制。
四、HTTP请求细节——消息头
用于HTTP请求中的常用头:
1、Accept: text/html,image/* :客户端可以接收的数据类型
2、Accept-Charset: ISO-8859-1:可以接收的字符编码
3、Accept-Encoding: gzip,compress:客户端支持的压缩格式
4、Accept-Language: en-us,zh-cn :客户端支持的语言
5、Host: www.it315.org:80:告诉服务器要访问的主机
6、If-Modified-Since: Tue, 11 Jul 2000 18:23:51 GMT:客户端通过这个消息头,显示数据缓存的时间,最后修改的时间。
7、Referer: http://www.it315.org/index.jsp:客户端通过消息头,告诉服务器请求是从哪个页面来的,防盗页
8、User-Agent: Mozilla/4.0 (compatible; MSIE 5.5; Windows NT 5.0):用户的操作系统情况
9、Cookie:客户端可以带一些信息给服务器端
10、Connection: close/Keep-Alive :告诉服务器完成这次请求之后,和服务器是否保持连接
11、Date: Tue, 11 Jul 2000 18:23:51 GMT
五、HTTP响应
1、一个HTTP响应代表服务器向客户端回送的数据,它包括:
一个状态行、若干消息头、以及实体内容 。
2、举例:举例:
HTTP/1.1 200 OK————————————————状态行
Server: Microsoft-IIS/5.0 }
Date: Thu, 13 Jul 2000 05:46:53 GMT }——————多个消息头
Content-Length: 2291 Content-Type: text/html(服务器通过这个头告诉浏览器,回送的数据的大小) }
Cache-control: private }
——————————————————————一个空行
<HTML> }
<BODY> }————实体内容
……
}
六、HTTP响应的细节——状态行
1、状态行
格式: HTTP版本号 状态码 原因叙述<CRLF>
举例:HTTP/1.1 200 OK
2、响应状态码à典型情况
a、200(正常)
表示一切正常,返回的是正常请求结果。
b、302/307(临时重定向)
指出被请求的文档已被临时移动到别处,此文档的新的URL在Location响应头中给出。
c、304(未修改)
表示客户机缓存的版本是最新的,客户机应该继续使用它。
d、403(禁止)
服务器理解客户端请求,但拒绝处理它。通常由于服务器上文件或目录的权限设置所致。
e、404(找不到)
服务器上不存在客户机所请求的资源。
f、500(内部服务器错误)
服务器端的CGI、ASP、JSP等程序发生错误。
七、HTTP响应细节——常用响应头
HTTP请求中的常用响应头:
1、Location: http://www.it315.org/index.jsp :服务器告诉客户端去哪里找资源
2、Server:apache tomcat:服务器用的是tomcat
3、Content-Encoding: gzip :服务器的压缩格式
4、Content-Length: 80 :服务器回送的长度
5、Content-Language: zh-cn :服务器回送的数据类型的语言格式
6、Content-Type: text/html; charset=GB2312 :服务器回送的类型
7、Last-Modified: Tue, 11 Jul 2000 18:23:51 GMT内容最后更改的时间
8、Refresh: 1;url=http://www.it315.org:刷新,多长时间用哪个页面刷新
9、Content-Disposition: attachment; filename=aaa.zip:浏览器是用下载方式打开的
10、Transfer-Encoding: chunked
11、Set-Cookie:SS=Q0=5Lb_nQ; path=/search
12、ETag: W/"7777-1242234904000"
13、Expires: -1
14、Cache-Control: no-cache
15、Pragma: no-cache
16、Connection: close/Keep-Alive
17、Date: Tue, 11 Jul 2000 18:23:51 GMT
八、扩展头
1、在HTTP消息中,也可以使用一些在HTTP 1.1正式规范里没有定义的头字段,这些头字段统称为自定义的HTTP头或扩展头,它们通常被当作是一种实体头处理。
2、现在流行的浏览器实际上都支持Cookie、Set-Cookie、Refresh和Content-Disposition等几个常用的扩展头字段。
3、Refresh头字段
Refresh: 1
Refresh: 1;url=http://www.it315.org
4、Content-Disposition头字段
Content-Type: application/octet-stream
Content-Disposition: attachment; filename=aaa.zip