HTTP协议详解

HTTP协议

超文本传输协议(英文:HyperText Transfer Protocol,缩写:HTTP)是一种用于分布式、协作式和超媒体信息系统的应用层协议。HTTP是万维网的数据通信的基础。

HTTP协议是请求响应的模式。HTTP协议中规定,请求从客户端发出,最后服务器端响应该请求并 返回。换句话说,肯定是先从客户端开始建立通信的,服务器端在没有 接收到请求之前不会发送响应。

HTTP的大概流程如下:

img

通信流程

HTTP通信机制是在一次完整的HTTP通信过程中,Web浏览器与Web服务器之间将完成下列7个步骤:

  • 建立TCP连接

    • 在HTTP工作开始之前,Web浏览器首先要通过网络与Web服务器建立连接,该连接是通过TCP来完成的,该协议与IP协议共同构建 Internet,即著名的TCP/IP协议族,因此Internet又被称作是TCP/IP网络。HTTP是比TCP更高层次的应用层协议,根据规则, 只有低层协议建立之后才能,才能进行更层协议的连接,因此,首先要建立TCP连接,一般TCP连接的端口号是80。
  • Web浏览器向Web服务器发送请求行

    • 一旦建立了TCP连接,Web浏览器就会向Web服务器发送请求命令。例如:GET /sample/hello.jsp HTTP/1.1。
  • Web浏览器发送请求头

    • 浏览器发送其请求命令之后,还要以头信息的形式向Web服务器发送一些别的信息,之后浏览器发送了一空白行来通知服务器,它已经结束了该头信息的发送。
  • Web服务器应答

    • 客户机向服务器发出请求后,服务器会客户机回送应答, HTTP/1.1 200 OK ,应答的第一部分是协议的版本号和应答状态码。
  • Web服务器发送应答头

    • 正如客户端会随同请求发送关于自身的信息一样,服务器也会随同应答向用户发送关于它自己的数据及被请求的文档。
  • Web服务器向浏览器发送数据

    • Web服务器向浏览器发送头信息后,它会发送一个空白行来表示头信息的发送到此为结束,接着,它就以Content-Type应答头信息所描述的格式发送用户所请求的实际数据。
  • Web服务器关闭TCP连接

    • 一般情况下,一旦Web服务器向浏览器发送了请求数据,它就要关闭TCP连接,然后如果浏览器或者服务器在其头信息加入了这行代码:
Connection:keep-alive

TCP连接在发送后将仍然保持打开状态,于是,浏览器可以继续通过相同的连接发送请求。保持连接节省了为每个请求建立新连接所需的时间,还节约了网络带宽。

请求相关

请求报文

file
file

简单来说请求报文的组成部分有:

  • 请求行:请求方法、请求URL、协议版本
  • 请求头:键值对的形式存在的,就是字段名:值
  • 内容实体:传输的数据

注意,每一行的末尾都有回车和换行,在内容实体和请求头之间另有一个空行。

简单示例:

file

请求方法

  • GET
    • 用来请求访问已被URI识别的资源。也就是指定了服务器处理请求之后响应的内容。
  • HEAD
    • 与GET方法一样,都是向服务器发出指定资源的请求。只不过服务器将不传回资源的本文部分。它的好处在于,使用这个方法可以在不必传输全部内容的情况下,就可以获取其中“关于该资源的信息”(元信息或称元数据)。
  • POST
    • 向指定资源提交数据,请求服务器进行处理(例如提交表单或者上传文件)。数据被包含在请求本文中。这个请求可能会创建新的资源或修改现有资源,或二者皆有。
  • PUT
    • PUT方法用来传输文件,向指定资源位置上传其最新内容。类似FTP协议,文件内容包含在请求报文的实体中,然后请求保存到URL指定的服务器位置。
  • DELETE
    • 请求服务器删除Request-URI所标识的资源。,是与PUT相反的方法。DELETE是要求返回URL指定的资源。
  • OPTIONS:
    • 因为并不是所有的服务器都支持规定的方法,为了安全有些服务器可能会禁止掉一些方法例如DELETE、PUT等。那么OPTIONS就是用来询问服务器支持的方法。
  • TRACE:
    • 回显服务器收到的请求,主要用于测试或诊断。
  • CONNECT:
    • CONNECT方法要求在与代理服务器通信时建立隧道,实现用隧道协议进行TCP通信。主要使用SSL/TLS协议对通信内容加密后传输。

响应相关

响应报文

file
file

简单来说响应报文组成部分有:

  • 状态行:HTTP版本,状态码和状态短语
  • 响应首部字段(响应头):是键值对的形式,字段名:值
  • 响应实体组成:要传输的数据

注意,每一行的末尾都有回车和换行,在响应实体和响应头之间另有一个空行。

响应示例:

file

响应码

列举了一些比较常见的,面试频率比较高的响应码:

  • 1(信息类):表示接收到请求并且继续处理

    • 100——客户必须继续发出请求
    • 101——客户要求服务器根据请求转换HTTP协议版本
  • 2(响应成功):表示动作被成功接收、理解和接受

    • 200——表明该请求被成功地完成,所请求的资源发送回客户端
    • 201——提示知道新文件的URL
    • 202——接受和处理、但处理未完成
    • 203——返回信息不确定或不完整
    • 204——请求收到,但返回信息为空
    • 205——服务器完成了请求,用户代理必须复位当前已经浏览过的文件
    • 206——服务器已经完成了部分用户的GET请求
  • 3(重定向类):为了完成指定的动作,必须接受进一步处理

    • 300——请求的资源可在多处得到
    • 301——本网页被永久性转移到另一个URL
    • 302——请求的网页被转移到一个新的地址,但客户访问仍继续通过原始URL地址,重定向,新的URL会在response中的Location中返回,浏览器将会使用新的URL发出新的Request。
    • 303——建议客户访问其他URL或访问方式
    • 304——自从上次请求后,请求的网页未修改过,服务器返回此响应时,不会返回网页内容,代表上次的文档已经被缓存了,还可以继续使用
    • 305——请求的资源必须从服务器指定的地址得到
    • 306——前一版本HTTP中使用的代码,现行版本中不再使用
    • 307——申明请求的资源临时性删除
  • 4(客户端错误类):请求包含错误语法或不能正确执行

    • 400——客户端请求有语法错误,不能被服务器所理解
    • 401——请求未经授权,这个状态代码必须和WWW-Authenticate报头域一起使用
    • 402——保留有效ChargeTo头响应
    • 403——禁止访问,服务器收到请求,但是拒绝提供服务
    • 404——一个404错误表明可连接服务器,但服务器无法取得所请求的网页,请求资源不存在。eg:输入了错误的URL
    • 405——用户在Request-Line字段定义的方法不允许
    • 406——根据用户发送的Accept拖,请求资源不可访问
    • 407——类似401,用户必须首先在代理服务器上得到授权
    • 408——客户端没有在用户指定的饿时间内完成请求
    • 409——对当前资源状态,请求不能完成
    • 410——服务器上不再有此资源且无进一步的参考地址
    • 411——服务器拒绝用户定义的Content-Length属性请求
    • 412——一个或多个请求头字段在当前请求中错误
    • 413——请求的资源大于服务器允许的大小
    • 414——请求的资源URL长于服务器允许的长度
    • 415——请求资源不支持请求项目格式
    • 416——请求中包含Range请求头字段,在当前请求资源范围内没有range指示值,请求也不包含If-Range请求头字段
    • 417——服务器不满足请求Expect头字段指定的期望值,如果是代理服务器,可能是下一级服务器不能满足请求长。
  • 5(服务端错误类):服务器不能正确执行一个正确的请求

    • 500 - 服务器遇到错误,无法完成请求
    • 501 - 未实现
    • 502 - 网关错误
    • 503:由于超载或停机维护,服务器目前无法使用,一段时间后可能恢复正常

浏览器输入网址到看到网页的过程

  • 浏览器向 DNS 服务器请求解析该 URL 中的域名所对应的 IP 地址;
  • 解析出 IP 地址后,根据该 IP 地址和默认端口 80,和服务器建立TCP连接
  • 浏览器发出读取文件(URL 中域名后面部分对应的文件)的HTTP 请求,该请求报文作为 TCP三次握手中的第三个报文的数据发送给服务器;
  • 服务器对浏览器请求作出响应,并把对应的 html 文本发送给浏览器;
  • 释放 TCP连接
  • 浏览器将该 html 文本并显示内容;

HTTPS

HTTPS工作原理

  • 首先HTTP请求服务端生成证书,客户端对证书的有效期、合法性、域名是否与请求的域名一致、证书的公钥(RSA加密)等进行校验;
  • 客户端如果校验通过后,就根据证书的公钥的有效, 生成随机数,随机数使用公钥进行加密(RSA加密);
  • 消息体产生的后,对它的摘要进行MD5(或者SHA1)算法加密,此时就得到了RSA签名;
  • 发送给服务端,此时只有服务端(RSA私钥)能解密。
  • 解密得到的随机数,再用AES加密,作为密钥(此时的密钥只有客户端和服务端知道)。
file

HTTP与HTTPS的区别

  • HTTP 的URL 以http:// 开头,而HTTPS 的URL 以https:// 开头
  • HTTP 是不安全的,而 HTTPS 是安全的
  • HTTP 标准端口是80 ,而 HTTPS 的标准端口是443
  • 在OSI 网络模型中,HTTP工作于应用层,而HTTPS 的安全传输机制工作在传输层
  • HTTP 无法加密,而HTTPS 对传输的数据进行加密
  • HTTP无需证书,而HTTPS 需要CA机构wosign的颁发的SSL证书


如果对这篇文章感兴趣,想学习更多的技术,也可以关注我的个人微信公众号。里面会不定期分享一些学习积累技术文章,同时也会有一些碎碎念的日常博文,笔芯!

http://weixin.qq.com/r/vS0MFKPEKf5Wred393iv (二维码自动识别)

参考网址

https://www.cnblogs.com/an-wen/p/11180076.html

本文由博客群发一文多发等运营工具平台 OpenWrite 发布

你可能感兴趣的:(HTTP协议详解)