HTTP 第一章 概述

HTTP(超文本传输协议),是一个用于传输超媒体文档的应用层协议。
HTTP是为 Web 浏览器与 Web 服务器之间的通信而设计的。
HTTP 遵循经典的客户端—服务端模型,客户端打开一个连接以发出请求,然后等待直到收到服务器端响应。
HTTP是无状态协议,服务器不会在两个请求之间保留任何数据(状态)
随之HTTP不断的扩展,还可以用来传输图片、视频或者向服务端发送信息
HTTP 还可以用来获取文档的部分内容,以便按需更新 Web 页面

HTTP 第一章 概述_第1张图片
客户端服务端之间通过交换一个个独立的消息(而非数据流)进行通信。

  • 客户端(通常是个浏览器)发出的消息被称作请求(request)。
  • 服务端发出的应答消息被称作响应(response)。

HTTP 第一章 概述_第2张图片

HTTP请求由一个实体,即用户代理(user agent),或是一个可以代表它的代理方(proxy) 发出

每个请求都会被发送到一个服务端,它会处理这个请求并提供一个称作响应的回复。

客户端和服务端之前可以有很多的代理实体,履行不同作用

在这里插入图片描述
当客户端想要和服务端——不管是最终的服务端还是中间的代理——进行信息交互时,过程表现为下面几步:

  1. 打开一个 TCP 连接:TCP 连接被用来发送一条或多条请求,以及接受响应消息。客户端可能打开一条新的连接,或重用一个已经存在的连接,或者也可能开几个新的 TCP 连接连向服务端。
  2. 发送一个 HTTP 报文:HTTP 报文(在 HTTP/2 之前)是语义可读的。在 HTTP/2 中,这些简单的消息被封装在了帧中,这使得报文不能被直接读取,但是原理仍是相同的。
GET / HTTP/1.1
Host: developer.mozilla.org
Accept-Language: zh
  1. 读取服务端返回的报文信息
HTTP/1.1 200 OK
Date: Sat, 09 Oct 2010 14:28:02 GMT
Server: Apache
Last-Modified: Tue, 01 Dec 2009 20:18:22 GMT
ETag: "51142bc1-7449-479b075b2891b"
Accept-Ranges: bytes
Content-Length: 29769
Content-Type: text/html

<!DOCTYPE html>…(此处是所请求网页的 29769 字节)
  1. 关闭连接或者为后续请求重用连接

客户端:用户代理

用户代理是任何能够代表用户行为的工具。例如:浏览器。

Web 服务端

Web 服务端负责提供客户端所请求的文档。服务端可以表现为仅有一台机器,实际可以是共享负载的一组服务器集群(负载均衡)或是其他类型的软件(如缓存、数据库服务、电商服务等),按需完整或部分地生成文档。

一个服务器可以不仅仅只有一台机器,而多个服务端软件实例也可部署在同一台机器上。利用 HTTP/1.1 和 Host 标头,它们甚至可以共用同一个 IP 地址。

代理

在浏览器和服务器之间参与传递 HTTP 消息的实体称为代理。代理可以是透明的,即转发它们收到的请求并不做任何修改,也可以表现得不透明,将它传递给服务端之前使用一些手段修改这个请求

  • 代理的作用
    • 缓存(可以是公开的也可以是私有的,如浏览器的缓存)
    • 过滤(如反病毒扫描、家长控制…)
    • 负载均衡(让多个服务器服务不同的请求)
    • 认证(控制对不同资源的访问)
    • 日志(使得代理可以存储历史信息)

HTTP性质

  • 简约
    • HTTP 被设计得简单且易读,尽管在 HTTP/2 中,HTTP 消息被封装进**帧(frame)**这点引入了额外的复杂度。
  • 可扩展
    • HTTP/1.0 中引入的 **HTTP 标头(header)**让协议扩展变得非常容易。只要服务端客户端之间对新标头的语义经过简单协商,新功能就可以被加入进来。
  • 无状态
    • 在同一个连接中,两个执行成功的请求之间是没有关系的。借助 HTTP Cookie 就可使用有状态的会话

HTTP 控制的常见特性

  • 缓存
    • 服务端能指示代理客户端缓存内容以和缓存时间
    • 客户端能够指示中间的缓存代理来忽略已存储的文档。
  • 开放同源限制浏览器同源策略限制有时对服务器是一种负担,服务器的 HTTP 标头可以减弱此类严格分离,使得一个网页可以是由源自不同地址的信息拼接而成。
  • 认证:一些页面可能会被保护起来,仅让特定的用户进行访问。基本的认证功能可以直接由 HTTP 提供
    1. 可以使用 WWW-Authenticate 或其他类似的标头
    2. 可以用 HTTP cookie 来设置一个特定的会话。
  • 代理服务器和隧道: 服务器或客户端常常是处于内网的,对其他计算机隐藏真实 IP 地址。因此 HTTP 请求就要通过代理服务器越过这个网络屏障。并非所有的代理都是 HTTP 代理,例如,SOCKS 协议就运作在更底层。其他的协议,比如 ftp,也能够被这些代理处理。
  • 会话:使用 HTTP Cookie 可以利用服务端的状态将不同请求联系在一起。这就创建了会话,尽管 HTTP 本身是无状态协议。

HTTP 报文

HTTP/1.1 以及更早的 HTTP 协议报文都是语义可读的。在 HTTP/2 中,这些报文被嵌入到了一个新的二进制结构,允许实现很多优化,比如报文标头的压缩以及多路复用。即使只有原始 HTTP 报文的一部分以 HTTP/2 发送出来,每条报文的语义依旧不变,客户端会重组原始 HTTP/1.1 请求。因此用 HTTP/1.1 格式来理解 HTTP/2 报文仍旧有效。

  • 请求报文组成

    • 请求方法,例如:GET、POST
    • 要获取资源的路径
    • HTTP 协议版本号
    • 为服务端表达其他信息的可选标头。
    • 请求体(body)
      HTTP 第一章 概述_第3张图片
  • 响应报文

    • HTTP 协议版本号
    • 一个状态码(status code),来指明对应请求已成功执行或是没有,以及相应的原因。
    • 一个状态信息,这个信息是一个不权威、简短的状态码描述
    • HTTP 标头,与请求标头类似。
    • 可选项,一个包含了被获取资源的主体。
      HTTP 第一章 概述_第4张图片

浏览器发送 HTTP API

  • XMLHttpRequest
  • Fetch API

服务端向客户端发送 HTTP API

  • server-sent 事件

总结

HTTP 是一种简单、易用、具有可扩展性的协议,其客户端—服务器模式的结构,加上能够增加标头的能力,使得 HTTPWeb 中不断扩展的能力一起发展。

为了提高性能,HTTP/2HTTP 报文嵌入到帧中,但是报文的基本结构自 HTTP/1.0 起仍保持不变。会话流依旧简单,通过一个简单的 HTTP 消息监视器就可以查看和纠错。

你可能感兴趣的:(网络通信,http,网络协议,网络)