HTTP内容格式详细说明1(协议)

前言

HTTP 消息由客户端到服务器的请求和服务器到客户端的响应组成。请求消息和响应消息都是由开始行(对于请求消息,开始行就是请求行,对于响应消息,开始行就是状态行),消息报头,空行(只有 CRLF 的行),消息正文(可选)组成。

HTTP 消息报头包括通用报头、请求报头、响应报头、实体报头。每一个报头域都是由名字 +“ ”+ 空格 + 值组成,消息报头域的名字是大小写无关的。 1       请求消息格式

HTTP 请求内容由三部分组成:请求行、消息头(报头)、可选的请求正文(信息体)

1.1    请求行格式:

请求行必须是放在所有内容的最前面,并且必须以换行回车符结束,格式如下:

Method< 空格 >Request-URI< 空格 >HTTP/Version< 换行回车符 >

1.2    Method

表示对于 Request-URI 完成的方法,这个字段是大小写敏感的,有 OPTIONS GET HEAD POST PUT DELETE TRACE 。方法 GET HEAD 应该被所有的通用 WEB 服务器支持,其他所有方法的实现是可选的。 GET 方法取回由 Request-URI 标识的信息。 HEAD 方法也是取回由 Request-URI 标识的信息,只是可以在响应时,不返回消息体。 POST 方法可以请求服务器接收包含在请求中的实体信息,可以用于提交表单,发送消息等

1.3    Request-URI

遵循 URI 格式,在此字段为星号( * )时,说明请求并不用于某个特定的资源地址,而是用于服务器本身

1.4    HTTP/Version

表示支持的 HTTP 版本,例如为 HTTP/1.1 CRLF 表示换行回车符。

2       响应消息格式

HTTP 响应内容也是由三个部分组成:响应 ( 状态 ) 行、消息报头、响应正文,响应行必须是放在所有内容的最前面,并且必须以换行回车符结束

2.1    响应行格式:

HTTP/Version< 空格 >Status-Code< 空格 >Reason-Phrase< 换行回车符 >

2.2    HTTP/Version

表示支持的 HTTP 版本,例如为 HTTP/1.1

2.3    Status- Code

是一个三位数字组成的结果代码(状态码)。 Status-Code 的第一个数字定义响应的类别,后两个数字没有分类的作用。第一个数字可能取 5 个不同的值:

1xx :信息响应类,表示接收到请求并且继续处理

2xx :处理成功响应类,表示动作被成功接收、理解和接受

3xx :重定向响应类,为了完成指定的动作,必须接受进一步处理

4xx :客户端错误,客户请求包含语法错误或者是不能正确执行

5xx :服务端错误,服务器不能正确执行一个正常的请求

 

常见状态代码、状态描述、说明:

200 OK       // 客户端请求成功

400 Bad Request   // 客户端请求有语法错误,不能被服务器所理解

401 Unauthorized // 请求未经授权,这个状态代码必须和 WWW-Authenticate 头域一起使用

403 Forbidden   // 服务器收到请求,但是拒绝提供服务

404 Not Found   // 请求资源不存在, eg :输入了错误的 URL

500 Internal Server Error // 服务器发生不可预期的错误

503 Server Unavailable   // 服务器当前不能处理客户端的请求,一段时间后,可能恢复正常

2.4    Reason-Phrase

状态描述,主要用于帮助用户理解。

3       通用头域

通用头域包含请求和响应消息都支持的头域,通用头域包含 Cache-Control Connection Date Pragma Transfer-Encoding Upgrade Via 。对通用头域的扩展要求通讯双方都支持此扩展,如果存在不支持的通用头域,一般将会作为实体头域处理。

3.1    Cache-Control 头域

Cache -Control 指定请求和响应 遵循的 缓存 制。在请求消息或响应消息中设置 Cache-Control 并不会修改另一个消息处理过程中的缓存处理过程。请求时的缓存指令 ( ) 包括 no-cache no-store max-age max-stale min-fresh only-if-cached ,响应消息中的指令包括 public private no-cache no- store no-transform must-revalidate proxy-revalidate max-age 。各个消息中的指令含义如下:

Public :指示响应可被任何缓存区缓存。

Private :指示对于单个用户的整个或部分响应消息,不能被共享缓存处理。这允许服务器仅仅描述当用户的部分响应消息,此响应消息对于其他用户的请求无效。

no-cache :指示请求或响应消息不能缓存

no-store :用于防止重要的信息被无意的发布。在请求消息中发送将使得请求和响应消息都不使用缓存。

max-age :指示客户机可以接收生存期不大于指定时间(以秒为单位)的响应。

min-fresh :指示客户机可以接收响应时间小于当前时间加上指定时间的响应。

max-stale :指示客户机可以接收超出超时期间的响应消息。如果指定 max-stale 消息的值,那么客户机可以接收超出超时期指定值之内的响应消息。

3.2    Date 头域

Date 头域表示消息发送的时间,时间的描述格式由 rfc822 定义。例如, Date:Mon,31Dec200104:25:57GMT Date 描述的时间表示世界标准时,如果换算成本地时间,需要知道用户所在的时区。

3.3      Pragma 头域

Pragma 头域用来包含实现特定的指令,最常用的是 Pragma:no-cache 。在 HTTP/1.1 协议中,它的含义和 Cache- Control:no-cache 相同。

3.4    Range 头域

Range 头域可以请求实体的一个或者多个子范围。例如:

表示头 500 个字节: bytes=0-499

表示第二个 500 字节: bytes=500-999

表示最后 500 个字节: bytes= -500

表示 500 字节以后的范围: bytes=500-

第一个和最后一个字节: bytes=0-0,-1

同时指定几个范围: bytes=500-600,601-999

但是服务器可以忽略此请求头,如果无条件 GET 包含 Range 请求头,响应会以状态码 206 PartialContent )返回而不是以 200 OK )。

4       请求头域:

允许客户端向服务器传递关于请求或者关于客户机的附加。请求头域可能包含下列字段 Accept Accept-Charset Accept- Encoding Accept-Language Authorization From Host If-Modified-Since If- Match If-None-Match If-Range If-Range If-Unmodified-Since Max-Forwards Proxy-Authorization Range Referer User-Agent 。对请求头域的扩展,要求通讯双方都支持,如果存在不支持的请求头域,一般将会作为实体头域处理。

4.1    Host 头域

Host 头域指定请求资源的 Intenet 主机和端口号,必须表示请求 url 的原始服务器或网关的位置。 HTTP/1.1 请求必须包含主机头域,否则系统会以 400 状态码返回。

4.2    Referer 头域

Referer 头域允许客户端指定请求 uri 的源资源地址,这可以允许服务器生成回退链表,可用来登陆、优化 cache 等。也允许废除的或错误的连接由于维护的目的被追踪。如果请求的 uri 没有自己的 uri 地址, Referer 不能被发送。如果指定的是部分 uri 地址,则此地址应该是一个相对地址。

4.3      User-Agent 头域

User-Agent 头域的内容包含发出请求的用户信息。

5       请求消息头示例:

GET http://www.ebdoor.com:80/ HTTP/1.0

Host: www.ebdoor.com

Accept:*/*

Pragma: no-cache

Cache-Control: no-cache

Referer: http://www.ebdoor.com/

User-Agent:Mozilla/4.0(…)

Range:bytes=554554-

 

消息体 ….

 

上例第一行表示 HTTP 客户端(可能是浏览器、下载程序)通过 GET 方法获得指定 URL 下的文件。绿色的部分表示请求头域的信息,兰色的部分表示

你可能感兴趣的:(cache,浏览器)