面试题:每发送一个http请求就要建立一个tcp连接吗(非持久连接/持久连接)

文章目录

  • 一、非持久连接和持久连接
  • 二、TCP 连接中多个 HTTP 请求可以并行发送吗?
  • 三、一个TCP连接可以发送多少个HTTP请求问题?

一、非持久连接和持久连接

  • 非持久连接:HTTP/1.0 中 的首部字段Connection 默认值为 close,即每次请求都会重新建立和断开 TCP 连接。
  • 持久连接:HTTP/1.1 中 的首部字段 Connection 默认值为 keep-alive ,连接可以复用,只要发送端、接收端都没有提出断开连接,则保持tcp连接状态。
    http1.1中,所有的连接默认为持久连接,但在http1.0中并未标准化,即使有部分的服务器通过非标准化的手段实现了持久连接,但是服务器端不一定支持持久连接。
  • 持久连接的优点:
    减少了tcp连接的重复建立和断开所造成的额外开销,减轻了服务器端的负担,其中减少开销的这部分时间实际上也使http请求和响应更早的结束,提高了web页面的显示速度。

二、TCP 连接中多个 HTTP 请求可以并行发送吗?

  • 在http1.1中,单个 TCP 连接在同一时刻只能处理一个请求,即两个请求的生命周期不能重叠,任意两个 HTTP 请求从开始到结束的时间在同一个 TCP 连接里不能重叠。上一个请求得到响应之后,才能发送下一个请求。

  • 管线化(pipelining)
    管线化技术的出现,实现了同时发送多个http请求,不必等待上一请求返回响应,但是浏览器默认关闭管线化,原因如下:

  • 一些代理服务器不能正确的处理 HTTP Pipelining。

  • Head-of-line Blocking 连接头阻塞:在建立起一个 TCP 连接之后,假设客户端在这个连接连续向服务器发送了多个请求。如果按照标准的话,服务器应该按照收到请求的顺序返回结果,假设服务器在处理首个请求时花费了大量时间,那么后面所有的请求都需要等着首个请求结束才能响应,造成了阻塞。

  • 多路复用(Multiplexing)
    因为http1.1中的管线化实际上无法使用,因此在http2.0中出现了Multiplexing 多路传输特性。

  • 在 HTTP 2.0 中,有两个非常重要的概念,分别是帧(frame)和流(stream),帧代表着最小的数据单位,每个帧会标识出该帧属于哪个流,流也就是多个帧组成的数据流。

  • 多路复用,就是在一个 TCP 连接中可以存在多条流。换句话说,也就是可以发送多个请求,对端可以通过帧中的标识知道属于哪个请求。通过这个技术,可以避免 HTTP 旧版本中的队头阻塞问题,极大的提高传输性能。

三、一个TCP连接可以发送多少个HTTP请求问题?

1、浏览器在与服务器建立了一个 TCP 连接后是否会在一个 HTTP 请求完成后断开?什么情况下会断开?

关于这个 TCP 连接后是否断开的问题,请参考:nginx中http1.1 KeepAlive 失效
我们知道 Header 中 Connection 属性决定了连接是否持久,HTTP/1.0 中 Connection 默认是 close 的,即每次请求都会重新建立和断开 TCP 连接,而在 HTTP/1.1 中 Connection 默认是 keep-alive 的,即连接可以复用,不用每次都重新建立和断开 TCP 连接。如果想主动断开连接,只需要将 Connection 属性设置为 close 即可,即 Connection: close。一般情况下复用的 TCP 连接在等待设置的超时时间之后还没有被任何连接使用的话,TCP 连接就会主动断开。

2、一个 TCP 连接可以对应几个 HTTP 请求?

了解了第一个问题之后,可以得知如果维持连接的话,一个 TCP 连接是可以发送多个 HTTP 请求的。

3、一个 TCP 连接中 HTTP 请求发送可以一起发送么(比如一起发三个请求,再三个响应一起接收)?

  • HTTP/1.1 存在一个问题,单个 TCP 连接在同一时刻只能处理一个请求,即两个请求的生命周期不能重叠,任意两个 HTTP 请求从开始到结束的时间在同一个 TCP 连接里不能重叠。
  • 虽然 HTTP/1.1 规范中规定了 Pipelining 来试图解决这个问题,但是这个功能在浏览器中默认是关闭的。

一个支持持久连接的客户端可以在一个连接中发送多个请求(不需要等待任意请求的响应)。收到请求的服务器必须按照请求收到的顺序发送响应。

至于标准为什么这么设定,我们可以推测以下原因:

  • 由于 HTTP/1.1 是个文本协议,同时返回的内容也并不能区分对应于哪个发送的请求,所以顺序必须维持一致。例如你向服务器发送了两个请求 GET/query?type=1 和 GET/query?type=2,服务器返回了两个结果,浏览器是没有办法根据响应结果来判断响应对应于哪一个请求的。

虽然 Pipelining 这种设想看起来比较美好,但是在实践中会出现许多问题:

  • 1)、一些代理服务器不能正确的处理 HTTP Pipelining
  • 2)、Head-of-line Blocking 连接头阻塞:在建立起一个 TCP 连接之后,假设客户端在这个连接连续向服务器发送了多个请求。如果按照标准的话,服务器应该按照收到请求的顺序返回结果,假设服务器在处理首个请求时花费了大量时间,那么后面所有的请求都需要等着首个请求结束才能响应,造成了阻塞。

结论: 在 HTTP/1.1 存在 Pipelining 技术可以完成这个多个请求同时发送,但是由于浏览器默认关闭,所以可以认为这是不可行的。在 HTTP2 中由于 Multiplexing 特点的存在,多个 HTTP 请求可以在同一个 TCP 连接中并行进行。

那么在 HTTP/1.1 中,浏览器是如何提高页面加载效率的呢?主要有以下两点:

  • 1)、连接复用,即维持和服务器已经建立的 TCP 连接,在同一连接上顺序处理多个请求。
  • 2)、和服务器建立多个 TCP 连接。

4、为什么有的时候刷新页面不需要重新建立 SSL 连接?

第一个问题已经给出了答案,连接如果是维持的话,是可以复用 TCP 连接的,刷新页面也不需要重新建立 SSL 连接。

5、浏览器对同一 Host 建立 TCP 连接到数量有没有限制?

如果使用的是 HTTP/1.1 ,即没有多路传输,当浏览器需要加载有几十张图片的网页该怎么办呢?肯定不能只开一个 TCP 连接顺序下载,那样用户肯定不能接受,但是如果每个图片都开一个 TCP 连接发 HTTP 请求,那电脑或者服务器都可能受不了,要是有 1000 张图片的话总不能开 1000 个TCP 连接吧,即使你的电脑同意 NAT 也不定同意的。

因此答案是:有,Chrome 最多允许对同一个 Host 建立六个 TCP 连接。不同的浏览器有一些区别。

6、浏览器需要加载有几十张图片的网页时,那么这些图片是以什么方式、什么顺序、建立了多少连接、使用什么协议被下载下来的呢?

  • 如果图片都是 HTTPS 连接并且在同一个域名下,那么浏览器在 SSL 握手之后会和服务器商量能不能用 HTTP2,如果能的话就使用 Multiplexing 功能在这个连接上进行多路传输。不过也未必会所有挂在这个域名的资源都会使用一个 TCP 连接去获取,但是可以确定的是 Multiplexing 很可能会被用到。
  • 如果发现用不了 HTTP2 呢?或者用不了 HTTPS(现实中的 HTTP2 都是在 HTTPS 上实现的,所以也就是只能使用 HTTP/1.1)。那浏览器就会在一个 HOST 上建立多个 TCP 连接,连接数量的最大限制取决于浏览器设置,这些连接会在空闲的时候被浏览器用来发送新的请求,如果所有的连接都正在发送请求呢?那其他的请求就只能等等了。

你可能感兴趣的:(Linux,面试题,http,tcp/ip,面试)