HTTP概况

之前在校总是HTTP、TCP等的叫着,其实没有去过多的研究下,随着需要对网络进行深入了解,在网上开始查资料然后理解并整理这样一个HTTP的知识总结,其中并没有去研读《HTTP权威指南》,确实晦涩繁杂,等确实需要对某个方面进行优化时再读吧。因此本文是对HTTP的基础细节进行的总结,但对于WEB的理解和应用足够了。

一.HTTP层次结构

HTTP是一种能够获取如 HTML 这样的网络资源的通信协议。它是在 Web 上进行数据交换的基础,是一种 client-server 协议,也就是说,请求通常是由像浏览器这样的接受方发起的。一个完整的Web文档通常是由不同的子文档拼接而成的,像是文本、布局描述、图片、视频、脚本等等。

其中浏览器这样的客户端发出的消息叫做 requests,被服务端回应的消息叫做 responses,在这个请求与回应之间,还有许许多多的被称为的实体,他们的作用与表现各不相同,比如有些是网关,还有些是caches等。HTTP是应用层协议,建立在TCP等可靠传输之上的协议。

HTTP概况_第1张图片
HTTP & layers.png

二.HTTP的组成部分

基于HTTP的组件包括:客户端(user-agent)、Web服务端、代理(Proxies)

(1)客户端

一个网页就是一个超文本文档,要展现一个网页,浏览器首先发送一个请求来获取页面的HTML文档,再解析文档中的资源信息发送其他请求,获取可执行脚本或CSS样式来进行页面布局渲染,以及一些其它页面资源(如图片和视频等)。然后,浏览器将这些资源整合到一起,展现出一个完整的文档,也就是网页。浏览器执行的脚本可以在之后的阶段获取更多资源,并相应地更新网页。

(2)Web服务端

Server只是虚拟意义上代表一个机器:它可以是共享负载(负载均衡)的一组服务器组成的计算机集群,也可以是一种复杂的软件,通过向其他计算机(如缓存,数据库服务器,电子商务服务器 ...)发起请求来获取部分或全部资源。同时Server 不一定是一台机器,但一个机器上可以装载的众多Servers。在HTTP/1.1 和Host头部中,它们甚至可以共享同一个IP地址。

(3)代理(Proxies)

在浏览器和服务器之间,有许多计算机和其他设备转发了HTTP消息。由于Web栈层次结构的原因,它们大多都出现在传输层、网络层和物理层上,对于HTTP应用层而言就是透明的,虽然它们可能会对应用层性能有重要影响。还有一部分是表现在应用层上的,被称为代理(Proxies)。代理(Proxies)既可以表现得透明,又可以不透明(“改变请求”不会通过它们)。代理主要有如下几种作用:

  • 缓存(可以是公开的也可以是私有的,像浏览器的缓存)
  • 过滤(像反病毒扫描,家长控制...)
  • 负载均衡(让多个服务器服务不同的请求)
  • 认证(对不同资源进行权限管理)
  • 日志记录(允许存储历史信息)

三.HTTP 的基本性质

  • HTTP是可扩展的;

  • HTTP是简单的; HTTP大体上还是被设计得简单易读;

  • HTTP 是无状态,有会话的;HTTP是无状态的:在同一个连接中,两个执行成功的请求之间是没有关系的。这就带来了一个问题,用户没有办法在同一个网站中进行连续的交互,比如在一个电商网站里,用户把某个商品加入到购物车,切换一个页面后再次添加了商品,这两次添加商品的请求之间没有关联,浏览器无法知道用户最终选择了哪些商品。而使用HTTP的头部扩展,HTTP Cookies就可以解决这个问题。把Cookies添加到头部中,创建一个会话让每次请求都能共享相同的上下文信息,达成相同的状态。注意,HTTP本质是无状态的,使用Cookies可以创建有状态的会话

  • HTTP的连接; 我们知道HTTP是基于TCP的可靠连接的,但是HTTP/1.0为每一个请求/响应都打开一个TCP连接,导致了2个缺点:打开一个TCP连接需要多次往返消息传递,因此速度慢;为了减轻这些缺陷,HTTP/1.1引入了流水线(被证明难以实现)和持久连接的概念:底层的TCP连接可以通过Connection 头(header) 决定当前的事务完成后,是否会关闭网络连接。如果该值是“keep-alive”,网络连接就是持久的,不会关闭,使得对同一个服务器的请求可以继续在该连接上完成。

四.HTTP数据流

  • 一.打开一个TCP连接
    TCP连接被用来发送一条或多条请求,以及接受回应消息。客户端可能打开一条新的连接,或重用一个已经存在的连接,或者也可能开几个新的TCP连接连向服务端。

  • 二.发送一个HTTP报文
    HTTP报文(在HTTP/2之前)是语义可读的。在HTTP/2中,这些简单的消息被封装在了帧中,这使得报文不能被直接读取,但是原理仍是相同的。

  • 三.读取服务端返回的报文信息

  • 四.关闭连接或者为后续请求重用连接

当HTTP流水线启动时,后续请求都可以不用等待第一个请求的成功回应就被发送

你可能感兴趣的:(HTTP概况)