前言
HTTP 消息由客户端到服务器的请求和服务器到客户端的响应组成。请求消息和响应消息都是由开始行(对于请求消息,开始行就是请求行,对于响应消息,开始行就是状态行),消息报头,空行(只有 CRLF 的行),消息正文(可选)组成。
HTTP 消息报头包括通用报头、请求报头、响应报头、实体报头。每一个报头域都是由名字 +“ : ”+ 空格 + 值组成,消息报头域的名字是大小写无关的。 1 请求消息格式
HTTP 请求内容由三部分组成:请求行、消息头(报头)、可选的请求正文(信息体)
请求行必须是放在所有内容的最前面,并且必须以换行回车符结束,格式如下:
Method< 空格 >Request-URI< 空格 >HTTP/Version< 换行回车符 >
表示对于 Request-URI 完成的方法,这个字段是大小写敏感的,有 OPTIONS 、 GET 、 HEAD 、 POST 、 PUT 、 DELETE 、 TRACE 。方法 GET 和 HEAD 应该被所有的通用 WEB 服务器支持,其他所有方法的实现是可选的。 GET 方法取回由 Request-URI 标识的信息。 HEAD 方法也是取回由 Request-URI 标识的信息,只是可以在响应时,不返回消息体。 POST 方法可以请求服务器接收包含在请求中的实体信息,可以用于提交表单,发送消息等
遵循 URI 格式,在此字段为星号( * )时,说明请求并不用于某个特定的资源地址,而是用于服务器本身
表示支持的 HTTP 版本,例如为 HTTP/1.1 。 CRLF 表示换行回车符。
HTTP 响应内容也是由三个部分组成:响应 ( 状态 ) 行、消息报头、响应正文,响应行必须是放在所有内容的最前面,并且必须以换行回车符结束
HTTP/Version< 空格 >Status-Code< 空格 >Reason-Phrase< 换行回车符 >
表示支持的 HTTP 版本,例如为 HTTP/1.1 。
是一个三位数字组成的结果代码(状态码)。 Status-Code 的第一个数字定义响应的类别,后两个数字没有分类的作用。第一个数字可能取 5 个不同的值:
1xx :信息响应类,表示接收到请求并且继续处理
2xx :处理成功响应类,表示动作被成功接收、理解和接受
3xx :重定向响应类,为了完成指定的动作,必须接受进一步处理
4xx :客户端错误,客户请求包含语法错误或者是不能正确执行
5xx :服务端错误,服务器不能正确执行一个正常的请求
常见状态代码、状态描述、说明:
200 OK // 客户端请求成功
400 Bad Request // 客户端请求有语法错误,不能被服务器所理解
401 Unauthorized // 请求未经授权,这个状态代码必须和 WWW-Authenticate 报 头域一起使用
403 Forbidden // 服务器收到请求,但是拒绝提供服务
404 Not Found // 请求资源不存在, eg :输入了错误的 URL
500 Internal Server Error // 服务器发生不可预期的错误
503 Server Unavailable // 服务器当前不能处理客户端的请求,一段时间后,可能恢复正常
状态描述,主要用于帮助用户理解。
通用头域包含请求和响应消息都支持的头域,通用头域包含 Cache-Control 、 Connection 、 Date 、 Pragma 、 Transfer-Encoding 、 Upgrade 、 Via 。对通用头域的扩展要求通讯双方都支持此扩展,如果存在不支持的通用头域,一般将会作为实体头域处理。
Cache -Control 指定请求和响应 遵循的 缓存 机制。在请求消息或响应消息中设置 Cache-Control 并不会修改另一个消息处理过程中的缓存处理过程。请求时的缓存指令 ( 值 ) 包括 no-cache 、 no-store 、 max-age 、 max-stale 、 min-fresh 、 only-if-cached ,响应消息中的指令包括 public 、 private 、 no-cache 、 no- store 、 no-transform 、 must-revalidate 、 proxy-revalidate 、 max-age 。各个消息中的指令含义如下:
Public :指示响应可被任何缓存区缓存。
Private :指示对于单个用户的整个或部分响应消息,不能被共享缓存处理。这允许服务器仅仅描述当用户的部分响应消息,此响应消息对于其他用户的请求无效。
no-cache :指示请求或响应消息不能缓存
no-store :用于防止重要的信息被无意的发布。在请求消息中发送将使得请求和响应消息都不使用缓存。
max-age :指示客户机可以接收生存期不大于指定时间(以秒为单位)的响应。
min-fresh :指示客户机可以接收响应时间小于当前时间加上指定时间的响应。
max-stale :指示客户机可以接收超出超时期间的响应消息。如果指定 max-stale 消息的值,那么客户机可以接收超出超时期指定值之内的响应消息。
Date 头域表示消息发送的时间,时间的描述格式由 rfc822 定义。例如, Date:Mon,31Dec200104:25:57GMT 。 Date 描述的时间表示世界标准时,如果换算成本地时间,需要知道用户所在的时区。
Pragma 头域用来包含实现特定的指令,最常用的是 Pragma:no-cache 。在 HTTP/1.1 协议中,它的含义和 Cache- Control:no-cache 相同。
Range 头域可以请求实体的一个或者多个子范围。例如:
表示头 500 个字节: bytes=0-499
表示第二个 500 字节: bytes=500-999
表示最后 500 个字节: bytes= -500
表示 500 字节以后的范围: bytes=500-
第一个和最后一个字节: bytes=0-0,-1
同时指定几个范围: bytes=500-600,601-999
但是服务器可以忽略此请求头,如果无条件 GET 包含 Range 请求头,响应会以状态码 206 ( PartialContent )返回而不是以 200 ( OK )。
允许客户端向服务器传递关于请求或者关于客户机的附加。请求头域可能包含下列字段 Accept 、 Accept-Charset 、 Accept- Encoding 、 Accept-Language 、 Authorization 、 From 、 Host 、 If-Modified-Since 、 If- Match 、 If-None-Match 、 If-Range 、 If-Range 、 If-Unmodified-Since 、 Max-Forwards 、 Proxy-Authorization 、 Range 、 Referer 、 User-Agent 。对请求头域的扩展,要求通讯双方都支持,如果存在不支持的请求头域,一般将会作为实体头域处理。
Host 头域指定请求资源的 Intenet 主机和端口号,必须表示请求 url 的原始服务器或网关的位置。 HTTP/1.1 请求必须包含主机头域,否则系统会以 400 状态码返回。
Referer 头域允许客户端指定请求 uri 的源资源地址,这可以允许服务器生成回退链表,可用来登陆、优化 cache 等。也允许废除的或错误的连接由于维护的目的被追踪。如果请求的 uri 没有自己的 uri 地址, Referer 不能被发送。如果指定的是部分 uri 地址,则此地址应该是一个相对地址。
User-Agent 头域的内容包含发出请求的用户信息。
GET http://www.ebdoor.com:80/ HTTP/1.0
Host: www.ebdoor.com
Accept:*/*
Pragma: no-cache
Cache-Control: no-cache
Referer: http://www.ebdoor.com/
User-Agent:Mozilla/4.0(…)
Range:bytes=554554-
消息体 ….
上例第一行表示 HTTP 客户端(可能是浏览器、下载程序)通过 GET 方法获得指定 URL 下的文件。绿色的部分表示请求头域的信息,兰色的部分表示