HTTP系列一:HTTP协议简单理解


   我们经常说到http,那么http到底是什么东西?怎么理解它?

    http,全文为HyperText Transfer Protocol,即超文本传输协议。重点:协议二字。也就是说http归根到底是一个协议。两台计算机间(通常发生的情况都是客户端和服务端)互相通信的一种协议。

    协议二字又如何理解?

    举个例子,写信。我们写信都是有格式要求的。只是格式我都忘的差不多了....只记得开头顶两个格,结尾此致敬礼之类的话。总之就是写信写或者写请假条之类的都有一定格式要求,严格按照格式要求书写的好处就是很方便大家看,按格式就可以快速对全文有一个了解,  什么地方是客套话,什么地方是正文一清二楚。其实对人类而言,格式并非必要条件,两个好朋友写信,完全是想怎么写就怎么写。因为人类有智能,可以在任何格式下提取到有用信息。

    协议跟信件的格式类似,也是一种固定格式,http协议,xmpp协议等等都是格式,采取这样的格式,双方都按这个规范包装数据,解析数据,彼此都能正常工作,就这么简单。其实开发app时候,跟后台约定传输json数据格式也是一种协议,它规定了后台只能返回json格式数据,前端也只需要按json数据格式解析数据就可以,只不过这个协议不像http协议这般流行并为世界所通用。

     我们都知道计算机是死的,虽然现在人工智能和深度学习越来越火,但那些情况靠的都是计算机收到输入结果,然后反馈调节前面的计算参数。现在还远没有发展到人类感知世界这般发达。所以计算机之间传输数据必须严格按照格式来进行,http协议的格式,有一个地方不正确那么请求都会失败。

     我们平常所使用的浏览器与服务器都是已经严格按照http协议规范好了的,当我们在浏览器地址栏输入网址,发出一个http请求的时候,浏览器会自动包装成一个规范的http请求,而服务器收到这方面的请求后,服务器也会做对应的处理,然后包装成一个规范的http响应 返回给浏览器。这些操作都是对普通用户封装的,普通用户没必要看到,也没必要关心。

   



请求格式

    http请求格式分为三个部分:

1. 请求行
2.请求头(Request Header)

3.请求正文(请求体)

其中请求行包含有 请求方法 URI  协议/版本

在一个http请求中,请求行和请求头是必须的,请求体可选

下面是使用telnet模拟一个http请求,可以看到

HTTP系列一:HTTP协议简单理解_第1张图片
telnet模拟http请求

(1)首行GET /2.html HTTP/1.1 这一行为请求行,

   GET是请求方法  /2.html表示请求url, HTTP/1.1 为协议/版本,根据HTTP标准,HTTP请求可以使用多种请求方法。例如:HTTP1.1目前支持7种请求方法:GET、POST、HEAD、OPTIONS、PUT、DELETE和TARCE。在实际应用中,最常用的方法是GET和POST

 (2)下一行Host: localhost为请求头信息。

    请求头包含许多有关的客户端环境和请求正文的有用信息。例如,请求头可以声明浏览器所用的语言,请求正文的长度等。请求头在此处为了简便,只填写了Host。但是另外还有很多可选参数,例如:

HTTP系列一:HTTP协议简单理解_第2张图片
请求头

(3)请求体


请求头和请求正文之间是一个空行,它表示请求头已经结束,接下来的是请求正文。请求正文中可以包含客户提交的查询字符串信息



响应格式

HTTP应答与HTTP请求相似,HTTP响应也由3个部分构成,分别是:

1.响应行

2.响应头

3.响应正文


HTTP系列一:HTTP协议简单理解_第3张图片
http响应    

在接收和解释请求消息后,服务器会返回一个HTTP响应消息。

状态行由协议版本、数字形式的状态代码、及相应的状态描述,各元素之间以空格分隔。

格式:HTTP-Version Status-Code Reason-Phrase CRLF

例如:HTTP/1.1 200 OK \r\n

状态代码:

状态代码由3位数字组成,表示请求是否被理解或被满足。

状态描述:

状态描述给出了关于状态代码的简短的文字描述。

状态代码的第一个数字定义了响应的类别,后面两位没有具体的分类。

第一个数字有五种可能的取值:

- 1xx:指示信息—表示请求已接收,继续处理。

- 2xx:成功—表示请求已经被成功接收、理解、接受。

- 3xx:重定向—要完成请求必须进行更进一步的操作。

- 4xx:客户端错误—请求有语法错误或请求无法实现。

- 5xx:服务器端错误—服务器未能实现合法的请求。

状态代码状态描述说明

200OK客户端请求成功

400Bad Request由于客户端请求有语法错误,不能被服务器所理解。

401Unauthonzed请求未经授权。这个状态代码必须和WWW-Authenticate报头域一起使用

403Forbidden服务器收到请求,但是拒绝提供服务。服务器通常会在响应正文中给出不提供服务的原因

404Not Found请求的资源不存在,例如,输入了错误的URL。

500Internal Server Error服务器发生不可预期的错误,导致无法完成客户端的请求。

503Service Unavailable服务器当前不能够处理客户端的请求,在一段时间之后,服务器可能会恢复正常。

响应头

响应头可能包括:

Location:

Location响应报头域用于重定向接受者到一个新的位置。例如:客户端所请求的页面已不存在原先的位置,为了让客户端重定向到这个页面新的位置,服务器端可以发回Location响应报头后使用重定向语句,让客户端去访问新的域名所对应的服务器上的资源。当我们在JSP中使用重定向语句的时候,服务器端向客户端发回的响应报头中,就会有Location响应报头域。

Server:

Server响应报头域包含了服务器用来处理请求的软件信息。它和User-Agent请求报头域是相对应的,前者发送服务器端软件的信息,后者发送客户端软件(浏览器)和操作系统的信息。下面是Server响应报头域的一个例子:Server: Apache-Coyote/1.1

WWW-Authenticate:

WWW-Authenticate响应报头域必须被包含在401(未授权的)响应消息中,这个报头域和前面讲到的Authorization请求报头域是相关的,当客户端收到401响应消息,就要决定是否请求服务器对其进行验证。如果要求服务器对其进行验证,就可以发送一个包含了Authorization报头域的请求,下面是WWW-Authenticate响应报头域的一个例子:WWW-Authenticate: Basic realm="Basic Auth Test!"

从这个响应报头域,可以知道服务器端对我们所请求的资源采用的是基本验证机制。

Content-Encoding:

Content-Encoding实体报头域被使用作媒体类型的修饰符,它的值指示了已经被应用到实体正文的附加内容编码,因而要获得Content- Type报头域中所引用的媒体类型,必须采用相应的解码机制。Content-Encoding主要用语记录文档的压缩方法,下面是它的一个例子:Content-Encoding: gzip。如果一个实体正文采用了编码方式存储,在使用之前就必须进行解码。

Content-Language:

Content-Language实体报头域描述了资源所用的自然语言。Content-Language允许用户遵照自身的首选语言来识别和区分实体。如果这个实体内容仅仅打算提供给丹麦的阅读者,那么可以按照如下的方式设置这个实体报头域:Content-Language: da。

如果没有指定Content-Language报头域,那么实体内容将提供给所以语言的阅读者。

Content-Length:

Content-Length实体报头域用于指明正文的长度,以字节方式存储的十进制数字来表示,也就是一个数字字符占一个字节,用其对应的ASCII码存储传输。

要注意的是:这个长度仅仅是表示实体正文的长度,没有包括实体报头的长度。

Content-Type

Content-Type实体报头域用语指明发送给接收者的实体正文的媒体类型。例如:

Content-Type: text/html;charset=ISO-8859-1

Content-Type: text/html;charset=GB2312

Last-Modified

Last-Modified实体报头域用于指示资源最后的修改日期及时间。

Expires

Expires实体报头域给出响应过期的日期和时间。通常,代理服务器或浏览器会缓存一些页面。当用户再次访问这些页面时,直接从缓存中加载并显示给用户,这样缩短了响应的时间,减少服务器的负载。为了让代理服务器或浏览器在一段时间后更新页面,我们可以使用Expires实体报头域指定页面过期的时间。当用户又一次访问页面时,如果Expires报头域给出的日期和时间比Date普通报头域给出的日期和时间要早(或相同),那么代理服务器或浏览器就不会再使用缓存的页面而是从服务器上请求更新的页面。不过要注意,即使页面过期了,也并不意味着服务器上的原始资源在此时间之前或之后发生了改变。

以上就是http协议的一些基本内容,下一章会讲述如何通过telnet来模拟http请求。

你可能感兴趣的:(HTTP系列一:HTTP协议简单理解)