一篇文章带你搞懂运输层(概述篇)

简单回顾一下:物理层完成了数据转换为信号,使其能够在信道上进行传输。数据链路层能够实现点对点信道和广播通信信道的数据传输。网际层通过路由器的分组与转发就能完成数据在整个网络间的数据传输。说到这里,好像已经完成的网络的数据传输功能,但是这里的运输层是干嘛的?

从通信和信息处理的角度看,运输层向它上面的应用层提供通信服务,它属于面向通信部分的最高层,同时也是用户功能中的最低层。当网络的边缘部分中的两个主机使用网络的核心部分的功能进行端到端的通信时,只有位于网络边缘部分的主机的协议栈才有运输层,而位于网络核心部分的路由器在转发分组时都只用到下三层的功能。

从IP层来说,通信的两端是两台主机。但“两台主机之间的通信”这种说法还不够清楚。严格地讲,两台主机进行通信就是两台主机中的应用进程互相通信。从运输层的角度看,通信的真正端点并不是主机而是主机中的进程。也就是说,端到端的通信是应用进程之间的通信。

文章目录

    • 0、 概述 -- 运输层的端口
    • 1、用户数据协议报UDP
    • 2、TCP 概述
      • 2.1 TCP 协议的特点
      • 2.2 TCP 的连接
    • 3、TCP的可靠传输协议
      • 3.1 停止等待协议
            • 无差错情况
            • 出现差错
            • 确认丢失和确认迟到
      • 3.2 连续 ARQ 协议
    • 4、TCP 报文段的首部格式

0、 概述 – 运输层的端口

在一台主机中经常有多个应用进程同时分别和另一台主机中的多个应用进程通信。这表明运输层有一个很重要的功能——复用 (multiplexing)和分用 (demultiplexing)。根据应用程序的不同需求,运输层需要有两种不同的运输协议,即面向连接的 TCP无连接的 UDP

但这条逻辑通信信道对上层的表现却因运输层使用的不同协议而有很大的差别。当运输层采用面向连接的 TCP 协议时,尽管下面的网络是不可靠的(只提供尽最大努力服务),但这种逻辑通信信道就相当于一条全双工的可靠信道当运输层采用无连接的 UDP 协议时,这种逻辑通信信道是一条不可靠信道

两个对等运输实体在通信时传送的数据单位叫作运输协议数据单元 TPDU (Transport Protocol Data Unit)。

  • TCP 传送的数据单位协议是 TCP 报文段(segment)。
  • UDP 传送的数据单位协议是 UDP 报文或用户数据报。

UDP:一种无连接协议

  • 提供无连接服务。
  • 在传送数据之前不需要先建立连接。
  • 传送的数据单位协议是 UDP 报文或用户数据报。
  • 对方的运输层在收到 UDP 报文后,不需要给出任何确认
  • 虽然 UDP 不提供可靠交付,但在某些情况下 UDP 是一种最有效的工作方式。

TCP:一种面向连接的协议

  • 提供面向连接的服务。
  • 传送的数据单位协议是 TCP 报文段 (segment)。
  • TCP 不提供广播或多播服务
  • 由于 TCP 要提供可靠的、面向连接的运输服务,因此不可避免地增加了许多的开销。这不仅使协议数据单元的首部增大很多,还要占用许多的处理机资源。

运输层的 UDP 用户数据报与网际层的IP数据报有很大区别。

  • IP 数据报要经过互连网中许多路由器的存储转发。
  • UDP 用户数据报是在运输层的端到端抽象的逻辑信道中传送的。
  • TCP 报文段是在运输层抽象的端到端逻辑信道中传送,这种信道是可靠的全双工信道。但这样的信道却不知道究竟经过了哪些路由器,而这些路由器也根本不知道上面的运输层是否建立了 TCP 连接。

我们来思考一下,是TCP协议好还还是UDP协议好些?

实际上难分上下,它们有各自的使用场景,如果希望传输的数据可靠,就需要使用TCP协议,如果希望发送接收快速就要使用UDP协议,但是UDP协议的可靠性就需要程序员来自己实现。

实际上的数据通信不是主机与主机间的进程通信,而是用户进程与进程之间的相互通信。为了使运行不同操作系统的计算机的应用进程能够互相通信,就必须用统一的方法对 TCP/IP 体系的应用进程进行标志。 由于进程的创建和撤销都是动态的,发送方几乎无法识别其他机器上的进程。有时我们会改换接收报文的进程,但并不需要通知所有发送方。我们往往需要利用目的主机提供的功能来识别终点,而不需要知道实现这个功能的进程。

解决这个问题的方法就是在运输层使用协议端口号 (protocol port number),或通常简称为端口 (port)。虽然通信的终点是应用进程,但我们可以把端口想象是通信的终点,因为我们只要把要传送的报文交到目的主机的某一个合适的目的端口,剩下的工作(即最后交付目的进程)就由 TCP 来完成。

在协议栈层间的抽象的协议端口是软件端口路由器或交换机上的端口是硬件端口。硬件端口是不同硬件设备进行交互的接口;而软件端口是应用层的各种协议进程与运输实体进行层间交互的一种地址。

端口用一个 16 位端口号进行标志端口号只具有本地意义,即端口号只是为了标志本计算机应用层中的各进程。在互联网中,不同计算机的相同端口号是没有联系的。

  • 服务器端使用的端口号
    • 熟知端口,数值一般为 0~1023。
    • 登记端口号,数值为 1024~49151,为没有熟知端口号的应用程序使用的。使用这个范围的端口号必须在 IANA 登记,以防止重复。
  • 客户端使用的端口号
    • 又称为短暂端口号,数值为 49152~65535,留给客户进程选择暂时使用。
    • 当服务器进程收到客户进程的报文时,就知道了客户进程所使用的动态端口号。通信结束后,这个端口号可供其他客户进程以后使用。
一篇文章带你搞懂运输层(概述篇)_第1张图片

常用的熟知端口

1、用户数据协议报UDP

UDP 只在 IP 的数据报服务之上增加了很少一点的功能:

  • 复用和分用的功能
  • 差错检测的功能

虽然 UDP 用户数据报只能提供不可靠的交付,但 UDP 在某些方面有其特殊的优点。

UDP 的主要特点

  1. UDP 是无连接的,发送数据之前不需要建立连接,,因此减少了开销和发送数据之前的时延。
  2. UDP 使用尽最大努力交付,即不保证可靠交付,因此主机不需要维持复杂的连接状态表。
  3. UDP 是面向报文的。UDP 对应用层交下来的报文,既不合并,也不拆分,而是保留这些报文的边界。UDP 一次交付一个完整的报文。
  4. UDP 没有拥塞控制,因此网络出现的拥塞不会使源主机的发送速率降低。这对某些实时应用是很重要的。很适合多媒体通信的要求。
  5. UDP 支持一对一、一对多、多对一和多对多的交互通信。
  6. UDP 的首部开销小,只有 8 个字节,比 TCP 的 20 个字节的首部要短

发送方 UDP 对应用程序交下来的报文,在添加首部后就向下交付 IP 层。UDP 对应用层交下来的报文,既不合并,也不拆分,而是保留这些报文的边界。应用层交给 UDP 多长的报文,UDP 就照样发送,即一次发送一个报文。

接收方 UDP 对 IP 层交上来的 UDP 用户数据报,在去除首部后就原封不动地交付上层的应用进程,一次交付一个完整的报文。应用程序必须选择合适大小的报文。

  • 若报文太长,UDP 把它交给 IP 层后,IP 层在传送时可能要进行分片,这会降低 IP 层的效率。
  • 若报文太短,UDP 把它交给 IP 层后,会使 IP 数据报的首部的相对长度太大,这也降低了 IP 层的效率。
一篇文章带你搞懂运输层(概述篇)_第2张图片

UDP 数据报

用户数据报 UDP 有两个字段:数据字段首部字段。首部字段很简单,只有 8 个字节。当运输层从 IP 层收到 UDP 数据报时,就根据首部中的目的端口,把 UDP 数据报通过相应的端口,上交最后的终点——应用进程。

  • 首部字段有 8 个字节,由 4 个字段组成,每个字段都是 2 个字节。
  • 在计算检验和时,临时把“伪首部”和 UDP 用户数据报连接在一起。伪首部仅仅是为了计算检验和。

具体的校验和的计算过程可以看我的上一篇博客一篇文章带你搞懂网络层(网际层)-- 地址篇在1.4 IP数据报的格式中首部校验和的计算过程有详细的说明与案例。

2、TCP 概述

2.1 TCP 协议的特点

TCP 是面向连接的运输层协议。每一条 TCP 连接只能有两个端点 (endpoint),每一条 TCP 连接只能是点对点的(一对一)。 TCP 提供可靠交付的服务提供全双工通信面向字节流

TCP 中的“流”(stream)指的是流入或流出进程的字节序列。“面向字节流”的含义是:虽然应用程序和 TCP 的交互是一次一个数据块,但 TCP 把应用程序交下来的数据看成仅仅是一连串无结构的字节流。

TCP 不保证接收方应用程序所收到的数据块和发送方应用程序所发出的数据块具有对应大小的关系。但接收方应用程序收到的字节流必须和发送方应用程序发出的字节流完全一样。

  • TCP 连接是一条虚连接而不是一条真正的物理连接。
  • TCP 对应用进程一次把多长的报文发送到TCP 的缓存中是不关心的。
  • TCP 根据对方给出的窗口值和当前网络拥塞的程度来决定一个报文段应包含多少个字节(UDP 发送的报文长度是应用进程给出的)。
  • TCP 可把太长的数据块划分短一些再传送。TCP 也可等待积累有足够多的字节后再构成报文段发送出去。
一篇文章带你搞懂运输层(概述篇)_第3张图片

TCP 面向字节流示意图

2.2 TCP 的连接

TCP 把连接作为最基本的抽象。每一条 TCP 连接有两个端点。TCP 连接的端点不是主机,不是主机的IP 地址,不是应用进程,也不是运输层的协议端口。TCP 连接的端点叫做套接字 (socket) 或插口。
端口号拼接到 (contatenated with) IP 地址即构成了套接字。

套 接 字 s o c k e t = ( I P 地 址 : 端 口 号 ) 套接字 socket = (IP地址 : 端口号) socket=(IP:)
T C P 连 接 : : = s o c k e t 1 , s o c k e t 2 = ( I P 1 : p o r t 1 ) , ( I P 2 : p o r t 2 ) TCP 连接 ::= {socket1, socket2} = {(IP1: port1),(IP2: port2)} TCP::=socket1,socket2=(IP1:port1)(IP2:port2)

  • TCP 连接就是由协议软件所提供的一种抽象。
  • TCP 连接的端点是个很抽象的套接字,即(IP 地址:端口号)。
  • 同一个 IP 地址可以有多个不同的 TCP 连接。
  • 同一个端口号也可以出现在多个不同的 TCP 连接中。

3、TCP的可靠传输协议

3.1 停止等待协议

理想的传输条件有以下两个特点:

  • 传输信道不产生差错。
  • 不管发送方以多快的速度发送数据,接收方总是来得及处理收到的数据。
    在这样的理想传输条件下,不需要采取任何措施就能够实现可靠传输。然而实际的网络都不具备以上两个理想条件。必须使用一些可靠传输协议,在不可靠的传输信道实现可靠传输

“停止等待”就是每发送完一个分组就停止发送,等待对方的确认。在收到确认后再发送下一个分组。全双工通信的双方既是发送方也是接收方。为了讨论问题的方便,我们仅考虑 A 发送数据而 B 接收数据并发送确认。因此 A 叫做发送方,而 B 叫做接收方。

无差错情况

A 发送分组 M1,发完就暂停发送,等待 B 的确认 (ACK)。B 收到了 M1 向 A 发送 ACK。A 在收到了对 M1 的确认后,就再发送下一个分组 M2。

一篇文章带你搞懂运输层(概述篇)_第4张图片
出现差错

在接收方 B 会出现两种情况:

  • B 接收 M1 时检测出了差错,就丢弃 M1,其他什么也不做(不通知 A 收到有差错的分组)。
  • M1 在传输过程中丢失了,这时 B 当然什么都不知道,也什么都不做。
一篇文章带你搞懂运输层(概述篇)_第5张图片

在这两种情况下,都需要启动超时重传机制:A 为每一个已发送的分组都设置了一个超时计时器。A 只要在超时计时器到期之前收到了相应的确认,就撤销该超时计时器,继续发送下一个分组 M2 。

确认丢失和确认迟到

确认丢失
若 B 所发送的对 M1 的确认丢失了,那么 A 在设定的超时重传时间内不能收到确认,但 A 并无法知道:是自己发送的分组出错、丢失了,或者 是 B 发送的确认丢失了。因此 A 在超时计时器到期后就要重传 M1。
假定 B 又收到了重传的分组 M1。这时 B 应采取两个行动:

  • 第一,丢弃这个重复的分组 M1,不向上层交付。
  • 第二,向 A 发送确认。不能认为已经发送过确认就不再发送,因为 A 之所以重传 M1 就表示 A 没有收到对 M1 的确认。

确认迟到
传输过程中没有出现差错,但 B 对分组 M1 的确认迟到了。A 会收到重复的确认。对重复的确认的处理很简单:收下后就丢弃。B 仍然会收到重复的 M1,并且同样要丢弃重复的 M1,并重传确认分组。
什么都不做。

一篇文章带你搞懂运输层(概述篇)_第6张图片

在发送完一个分组后,必须暂时保留已发送的分组的副本,以备重发。分组和确认分组都必须进行编号。超时计时器的重传时间应当比数据在分组传输的平均往返时间更长一些

总结就是两条

  1. 接收端确认后发送ACK,发送端接收到ACK之后发送下一条信息
  2. 超时重传,不管是帧丢失、帧出错、确认丢失、确认迟到都是这个

3.2 连续 ARQ 协议

一篇文章带你搞懂运输层(概述篇)_第7张图片

信道利用率

停止等待协议的优点是简单,缺点是信道利用率太低。可以看出,当往返时间 RTT 远大于分组发送时间 TD 时,信道的利用率就会非常低。若出现重传,则对传送有用的数据信息来说,信道的利用率就还要降低。

为了提高传输效率,发送方可以不使用低效率的停止等待协议,而是采用流水线传输。流水线传输就是发送方可连续发送多个分组,不必每发完一个分组就停顿下来等待对方的确认。这样可使信道上一直有数据不间断地传送。由于信道上一直有数据不间断地传送,这种传输方式可获得很高的信道利用率。

一篇文章带你搞懂运输层(概述篇)_第8张图片

通常 A 最终总是可以收到对所有发出的分组的确认。如果 A 不断重传分组但总是收不到确认,就说明通信线路太差,不能进行通信。使用上述的确认和重传机制,我们就可以在不可靠的传输网络上实现可靠的通信。像上述的这种可靠传输协议常称为自动重传请求 ARQ (Automatic Repeat reQuest)。意思是重传的请求是自动进行的,接收方不需要请求发送方重传某个出错的分组。

滑动窗口协议比较复杂,是 TCP 协议的精髓所在。发送方维持的发送窗口,它的意义是:位于发送窗口内的分组都可连续发送出去,而不需要等待对方的确认。这样,信道利用率就提高了。连续 ARQ 协议规定,发送方每收到一个确认,就把发送窗口向前滑动一个分组的位置。

一篇文章带你搞懂运输层(概述篇)_第9张图片

接收方一般采用累积确认的方式。即不必对收到的分组逐个发送确认,而是对按序到达的最后一个分组发送确认,这样就表示:到这个分组为止的所有分组都已正确收到了。

  • 优点:容易实现,即使确认丢失也不必重传。
  • 缺点:不能向发送方反映出接收方已经正确收到的所有分组的信息。

如果发送方发送了前 5个分组 (比如为1、2、3、4、5 ),而中间的第 3 个分组丢失了(接收到1、2、4、5 )。这时接收方只能对前两个分组发出确认(只能确认1、2,于是发送方需要重发3、4、5 )。发送方无法知道后面三个分组的下落,而只好把后面的三个分组都再重传一次。这就叫做 Go-back-N(回退 N),表示需要再退回来重传已发送过的 N 个分组。

可见当通信线路质量不好时,连续 ARQ 协议会带来负面的影响。

  • TCP 连接的每一端都必须设有两个窗口——一个发送窗口和一个接收窗口。
  • TCP 的可靠传输机制用字节的序号进行控制。TCP 所有的确认都是基于序号而不是基于报文段。
  • TCP 两端的四个窗口经常处于动态变化之中。
  • TCP连接的往返时间 RTT 也不是固定不变的。需要使用特定的算法估算较为合理的重传时间。

4、TCP 报文段的首部格式

一篇文章带你搞懂运输层(概述篇)_第10张图片
  • 源端口和目的端口字段——各占 2 字节。端口是运输层与应用层的服务接口。运输层的复用和分用功能都要通过端口才能实现。

  • 序号字段——占 4 字节。TCP 连接中传送的数据流中的每一个字节都编上一个序号。序号字段的值则指的是本报文段所发送的数据的第一个字节的序号。

  • 确认号字段——占 4 字节,是期望收到对方的下一个报文段的数据的第一个字节的序号

  • 保留字段——占 6 位,保留为今后使用,但目前应置为 0。

  • 紧急 URG —— 当 URG = 1 时,表明紧急指针字段有效。它告诉系统此报文段中有紧急数据,应尽快传送(相当于高优先级的数据)。

  • 确认 ACK —— 只有当 ACK = 1 时确认号字段才有效。当 ACK = 0 时,确认号无效。

  • 推送 PSH (PuSH) —— 接收 TCP 收到 PSH = 1 的报文段,就尽快地交付接收应用进程,而不再等到整个缓存都填满了后再向上交付。

  • 复位 RST (ReSeT) —— 当 RST = 1 时,表明 TCP 连接中出现严重差错(如由于主机崩溃或其他原因),必须释放连接,然后再重新建立运输连接。

  • 同步 SYN —— 同步 SYN = 1 表示这是一个连接请求或连接接受报文。

  • 终止 FIN (FINish) —— 用来释放一个连接。FIN  1 表明此报文段的发送端的数据已发送完毕,并要求释放运输连接。

  • 窗口字段 —— 占 2 字节,用来让对方设置发送窗口的依据,单位为字节。

  • 紧急指针字段 —— 占 16 位,指出在本报文段中紧急数据共有多少个字节(紧急数据放在本报文段数据的最前面)。

  • 选项字段 —— 长度可变。TCP 最初只规定了一种选项,即最大报文段长度 MSS。
    MSS 告诉对方 TCP:“我的缓存所能接收的报文段的数据字段的最大长度是 MSS 个字节。” MSS (Maximum Segment Size)是 TCP 报文段中的数据字段的最大长度。数据字段加上 TCP 首部才等于整个的 TCP 报文段。所以,MSS是“TCP 报文段长度减去 TCP 首部长度”。

为什么要规定 MSS ?
MSS 与接收窗口值没有关系。若选择较小的 MSS 长度,网络的利用率就降低。当 TCP 报文段只含有 1 字节的数据时,在 IP 层传输的数据报的开销至少有 40 字节(包括 TCP 报文段的首部和 IP 数据报的首部)。这样,对网络的利用率就不会超过 1/41。到了数据链路层还要加上一些开销。若 TCP 报文段非常长,那么在 IP 层传输时就有可能要分解成多个短数据报片。在终点要把收到的各个短数据报片装配成原来的 TCP 报文段。当传输出错时还要进行重传。这些也都会使开销增大。

  • 其他选项
    • 窗口扩大选项 ——占 3 字节,其中有一个字节表示移位值 S。新的窗口值等于 TCP 首部中的窗口位数增大到 (16 + S),相当于把窗口值向左移动 S 位后获得实际的窗口大小。
    • 时间戳选项——占 10 字节,其中最主要的字段时间戳值字段(4 字节)和时间戳回送回答字段(4 字节)。
    • 选择确认选项——在后面的 5.6.3 节介绍。

你可能感兴趣的:(计算机网络)