- 5.1、传输层的两个协议
- 5.1.1、概述
- 5.1.2、TCP & UDP 协议的应用场景
- 5.1.3、传输层的端口
- 5.1.4、传输层协议和应用层协议之间的关系
- 5.1.5、网络安全知识
- 5.2、用户数据报协议 UDP
- 5.2.1、UDP 协议的特点
- 5.2.2、UDP 的首部格式
- 5.3、传输控制协议 TCP
- 5.3.1、TCP 协议特点
- 5.3.2、TCP 首部格式
- 5.4、可靠传输的工作原理
- 5.4.1、停止等待协议
- 5.4.2、连续的 ARQ 协议
- 5.5、可靠传输的具体实现
- 5.5.1、以字节为单位的滑动窗口技术
- 5.5.2、超时重传时间的选择
- 5.5.3、选择确认 SACK(Selective ACK)
- 5.6、TCP 的流量控制
- 5.6.1、利用滑动窗口实现流量控制
- 5.6.2、必须考虑传输效率
- 5.7、TCP 的拥塞控制
- 5.7.1、拥塞控制的一般原理
- 5.7.2、几种拥塞控制方法
- 5.8、TCP 传输连接管理
- 5.8.1、TCP 连接建立——三次握手
- 5.8.2、三次握手建立 TCP 连接的各状态
- 5.8.3、TCP 连接释放——四次挥手
- 5.8.4、四次挥手释放 TCP 连接的各状态
计算机网络:传输层
- 应用层协议:http、https、ftp、dns、smtp、pop3、rdp、telnet、……-
传输层协议:TCP、UDP
-
网络层协议:IP(RIP、OSPF、BGP)、ARP、ICMP、IGMP
5.1、传输层的两个协议
传输层也称为运输层。
5.1.1、概述
进程之间的通信
- 从通信和信息处理的角度看,传输层向它上面的应用层提供通信服务,它属于面向通信部分的最高层,同时也是用户功能中的最低层。
- 当网络的边缘部分中的两个主机使用网络的核心部分的功能进行端到端的通信时,只有位于网络边缘部分的主机的协议栈才有传输层,而网络核心部分中的路由器在转发分组时都只用到下三层的功能。
运输层为相互通信的应用进程提供了逻辑通信
- 两个主机进行通信实际上就是两个主机中的应用进程互相通信。
- 应用进程之间的通信又称为端到端的通信。
- 运输层的一个很重要的功能就是复用和分用。应用层不同进程的报文通过不同的端口向下交到运输层,再往下就共用网络层提供的服务。
- “运输层提供应用进程间的逻辑通信”。“逻辑通信”的意思是:运输层之间的通信好像是沿水平方向传送数据。但事实上这两个运输层之间并没有一条水平方向的物理连接。
运输层协议和网络层协议的主要区别
运输层协议和网络层协议的主要区别
运输层为应用进程之间提供端到端的逻辑通信(但网络层是为主机之间提供逻辑通信)
- 运输层还要对收到的报文进行差错检测
- 运输层需要有两种不同的运输协议,即面向连接的 TCP 和无连接的 UDP
- 运输层的 UDP 用户数据报与网际层的 IP 数据报有很大区别。IP 数据报要经过互连网中许多路由器的存储转发,但 UDP 用户数据报是在运输层的端到端抽中象的逻辑信道中传送的。
两种不同的运输协议
- 运输层向高层用户屏蔽了下面网络核心的细节(如网络拓扑、所采用的路由选择协议等),它使应用进程看见的就是好像在两个运输层实体之间有一条端到端的逻辑通信信道。
- 当运输层采用面向连接的 TCP 协议时,尽管下面的网络是不可靠的(只提供尽最大努力服务),但这种逻辑通信信道就相当于一条全双工的可靠信道。
- 当运输层采用无连接的 UDP 协议时,这种逻辑通信信道是一条不可靠信道。
5.1.2、TCP & UDP 协议的应用场景
网络中的计算机通信无外乎有以下两种情况:
- 要发送的内容多,需要将发送的内容分成多个数据包发送。
- 要发送的内容少,一个数据包就能发送全部内容。
针对这两种情况,在传输层有两个协议:
- TCP(Transmission Control Protocol,传输控制协议)
- UDP(User Datagram Protocol,用户数据报协议)
TCP:分段,编号,流量控制,建立会话
UDP:一个数据包就能完成数据通信,不建立会话,多播
TCP & UDP 的关系
- 两个对等运输实体在通信时传送的数据单位叫作
运输协议数据单元 TPDU (Transport Protocol Data Unit)
- TCP 传送的数据单位是
TCP 报文段(segment)
- UDP 传送的数据单位是
UDP 报文 or 用户数据报
几点注意:
-
UDP 在传送数据之前不需要建立连接。对方的传输层在收到 UDP 报文后,不需要给出任何确认。虽然 UDP 不提供可靠交付,但在某些情况下,UDP 是一种最有效的工作方式。
-
TCP 则是面向连接的服务。TCP 不提供广播或多播服务。由于 TCP 要提供可靠的、面向连接的传输服务,因此不可避免地增加了许多的开销。这不仅使协议数据单元的首部增大很多,还要占用许多的处理机资源。
-
TCP 报文段是在运输层抽象的端到端逻辑信道中传送,这种信道是可靠的全双工信道。但这样的信道却不知道究竟经过了哪些路由器,而这些路由器也根本不知道上面的运输层是否建立了 TCP 连接。
5.1.3、传输层的端口
- 运行在计算机中的进程是用进程标识符来标志的。
- 运行在应用层的各种应用进程却不应当让计算机操作系统指派它的进程标识符。这是因为在因特网上使用的计算机的操作系统种类很多,而不同的操作系统又使用不同格式的进程标识符。
- 为了使运行不同操作系统的计算机的应用进程能够互相通信,就必须用统一的方法对 TCP/IP 体系的应用进程进行标志。
需要解决的问题
- 由于进程的创建和撤销都是动态的,发送方几乎无法识别其他机器上的进程。
- 有时我们会改换接收报文的进程,但并不需要通知所有发送方。
- 我们往往需要利用目的主机提供的功能来识别终点,而不需要知道实现这个功能的进程。
解决这个问题的方法就是在运输层使用协议端口号(protocol port number),或通常简称为 端口(port)
-
端口用一个 16 位端口号进行标志。
-
端口号只具有本地意义,即端口号只是为了标志本计算机应用层中的各进程。在因特网中不同计算机的相同端口号是没有联系的。
虽然通信的终点是应用进程,但我们可以把端口想象是通信的终点,因为我们只要把要传送的报文交到目的主机的某一个合适的目的端口,剩下的工作(即最后交付目的进程)就由 TCP 来完成。
软件端口与硬件端口
- 在协议栈层间的抽象的协议端口是软件端口。
- 路由器或交换机上的端口是硬件端口。
- 硬件端口是不同硬件设备进行交互的接口,而软件端口是应用层的各种协议进程与运输实体进行层间交互的一种地址。
端口的分类
按端口号可分为 3 大类:
- 熟知端口(Well Known Ports):数值一般为 0~1023。例如:80 端口实际上总是 HTTP 通讯。
- 注册端口(Registered Ports):从 1024 到 49151。它们松散地绑定于一些服务。也就是说有许多服务绑定于这些端口,这些端口同样用于许多其它目的。例如:许多系统处理动态端口从 1024 左右开始。
- 动态和 / 私有端口(Dynamic and/or Private Ports):从 49152 到65535。理论上,不应为服务分配这些端口。实际上,机器通常从 1024起分配动态端口。但也有例外:SUN 的 RPC 端口从 32768 开始。
5.1.4、传输层协议和应用层协议之间的关系
- FTP = TCP + 21
- SSH = TCP + 22
- Telnet = TCP + 23
- SMTP = TCP + 25
- DNS = UDP + 53 or TCP(很少) + 53
- HTTP= TCP + 80
- POP3 = TCP + 110
- HTTPS = TCP + 443
- 共享文件夹 = TCP + 445
- SQL Server = TCP + 1433
- MySQL = TCP + 3306
- RDP = TCP + 3389
应用层协议和服务之间的关系:服务运行后会在 TCP or UDP 的某个端口一直侦听客户端请求(对外提供的服务侦听,对内提供的服务不侦听)
端口代表服务,用端口区分服务
更改端口有利于增加服务器安全
5.1.5、网络安全知识
Windows 10 系统打开 telnet 服务
# 打开控制面板
control
# 打开 微软终端服务客户端,Microsoft terminal services client
mstsc
# 打开防火墙的高级设置
wf.msc
# 打开服务
services.msc
# 打开系统配置实用程序
msconfig
# 测试远程计算机打开的端口
telnet 192.s168.2.116 21
Windows 10 防火墙的作用
当启用 Windows 10 防火墙阻止所有传入连接时,会把所有的端口都关闭,Windows 10 防火墙不拦截出去的流量,但拦截主动进来的流量,出去的流量还可以回来,端口是动态打开和关闭的,此时,你的计算机就相当于在互联网上隐身了,但还可以访问外网,可以防止别人扫描你的端口来攻击你计算机上安装的服务。
打开 Windows 10 防火墙 阻止所有传入连接操作步骤:
第一步:打开控制面板 --> 点击 系统和安全
第二步:点击 Windows Defender 防火墙
第三步:测试:
① 让另一台计算机 ping 本计算机的 IP 地址,发现 ping 不通
② 本计算机 ping www.baidu.com 可以 ping 通
取消勾选时,发现可以 ping 通了!
灰鸽子木马
一般来说,是客户端主动连接服务器,但木马程序是木马服务主动连接客户端,如果计算机一旦中了木马,Windows 防火墙不能防控木马程序!
Windows 系统可以指定 安全策略,例如可以让主动进入且目标端口为 80 进,让出去且源端口为 80 的出,这时木马就只是一段运行着的代码,无法与外界客户端取得连接,被堵在里
面,没有威胁!
5.2、用户数据报协议 UDP
5.2.1、UDP 协议的特点
1)、UDP 是无连接的,即发送数据之前不需要建立连接(当然发送数据结束时也没有连接可释放),因此减少了开销和发送数据之前的时延。
2)、UDP 使用尽最大努力交付,即不保证可靠交付,因此主机不需要维持复杂的连接状态表(这里面有许多参数),通信的两端不用保持连接,因此节省系统资源。
3)、UDP 是面向报文的,发送方的 UDP 对应用程序交下来的报文,在添加首部后就向下交付给网络层。UDP 对应用层交下来的报文,既不合并,也不拆分,而是保留这些报文的边界。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-W0VJs1iK-1596446046744)(计算机网络05:传输层.assets/image-20200801145940333.png)]
4)、UDP 没有拥塞控制,即使网络出现的拥塞也不会使源主机的发送速率降低。这对某些实时应用是很重要的。
5)、UDP 支持一对一、一对多、多对一和多对多的交互通信。
6)、UDP 的首部开销小,只有 8 个字节,比 TCP 的 20 个字节的首部要短。
5.2.2、UDP 的首部格式
UDP 的首部包括四个字段,每个字段的长度是 2 个字节,因此首部共 8 个 字节。
- 源端口:源端口号。在需要对方回信时选用。不需要时可用全 0
- 目标端口:目的端口号。在终点交付报文时使用。
- 长度:UDP 用户数据报的长度,其最小值是 8(仅有首部)。
- 校验和:检测 UDP 用户数据报在传输中是否有错。有错就丢弃。
如果接收方 UDP 发现收到的报文中的目的端口号不正确(即不存在对应于该端口号的应用进程),就丢弃该报文,并由网际控制报文协议 ICMP 发送“端口不可达”差错报文给发送方。
虽然在 UDP 之间的通信要用到其端口号,但由于 UDP 的通信是无连接的,因此不需要使用套接字(TCP 之间的通信必须要在两个套接字之间建立连接)。
UDP 用户数据报首部中检验和的计算方法很特殊。
伪首部包括:源地址、目的地址、UDP数据长度、协议类型(0x11),协议类型就一个字节,但需要在前补一个字节的 0x0,构成 12 个字节。
在计算检验和时,要在UDP 用户数据报之前增加 12 个字节的伪首部。所谓“伪首部”是因为这种伪首部并不是 UDP 用户数据报的真正的首部。只是在计算检验和时临时添加在UDP用户数据报前面,得到一个临时的 UDP 用户数据报。
检验和就是按照这个临时的 UDP 用户数据报来计算的。伪首部既不向下传送也不向上递交,而仅仅是为了计算检验和。
5.3、传输控制协议 TCP
- TCP 协议的特点?
- TCP 协议首部格式?
- TCP 协议是如何实现可靠传输?
- TCP 协议是如何实现流量控制?
- TCP 协议是如何避免网络拥塞?
5.3.1、TCP 协议特点
-
TCP 是面向连接的传输层协议。
-
在传送数据完毕后,必须释放已经建立的 TCP 连接。这就是说,应用进程之间的通信好像在“打电话”:通话前要先拨号建立连接,通话结束后要挂机释放连接。
-
每一条 TCP 连接只能有两个端点(endpoint),每一条 TCP 连接只能是点对点的(一对一,单播)。
-
-
TCP 提供可靠交付的服务。
-
也就是说,通过 TCP 连接传送的数据,无差错、不丢失、不重复、且按序发送。
-
TCP 提供全双工通信。
- TCP 允许通信双方的应用进程可以同时发送和接受数据。
- TCP 连接的两端都设有 TCP 发送缓存 和 TCP 接收缓存,用来临时存放双向通信的数据。
- 在发送时,应用程序把即将发送的数据发送到给 TCP 发送缓存后,就可以做自己的事,而 TCP 在合适的时候把数据发送出去。
- 在接收时,TCP 把收到的数据放入 TCP 接受缓存中,上层的应用进程在合适的时候读取缓存中的数据。
-
面向字节流。
- TCP 中的“流”(steam)指的是 流入到进程 或 从进程流出的字节 序列。
注意:
- TCP 连接是一条虚连接而不是一条真正的物理连接。
- TCP 对应用进程一次把多长的报文发送到 TCP 的缓存中是不关心的。
- TCP 根据对方给出的窗口值和当前网络拥塞的程度来决定一个报文段应包含多少个字节(UDP 发送的报文长度是应用进程给出的)。
- TCP 可把太长的数据块划分短一些再传送。
- TCP 也可等待积累有足够多的字节后再构成报文段发送出去。
TCP 的连接
-
TCP 把连接作为最基本的抽象。
-
每一条 TCP 连接有两个端点。TCP 连接的端点叫做 套接字(socket)或插口。
-
TCP 连接的端点不是主机,不是主机的 IP 地址,不是应用进程,也不是传输层的协议端口。而是 IP 地址 + 端口。
-
每一条 TCP 连接唯一地被通信两端的两个端点(即套接字)所确定。
5.3.2、TCP 首部格式
TCP 协议是能够实现数据分段传输、可靠传输、流量控制、网络拥塞避免等功能,因此 TCP 报文的首部要比 UDP 报文首部字段要多,并且首部长度不固定。
TCP 报文段中各字段的意义
-
源端口(Source Port):占 2 个字节
-
目标端口(Destination Port):占 2 个字节
-
序号(Sequence number,seq):占 4 个字节,发送的数据部分(段)的第一个字节的位置
-
确认号(Acknowledgment number,ack):占 4 个字节,告诉发送者下一次该发第几个字节了
- 数据偏移(即首部长度):占 4 位,记录 TCP 报文段从多少个字节以后就开始有数据了
- 因为 TCP 报文段的首部有固定部分(前 20 个字节),也有可选部分,所以要用数据偏移来标记从多少个字节开始就是数据了。
- 保留:占 6 位,保留为今后使用,但目前应置为 0。
- 标志位(Flags):
-
窗口(Window size value):占 2 字节。窗口值是 [0,216-1] 之间的整数。TCP 协议有流量控制功能,窗口值告诉对方:从本报文段首部中的确认号算起,接收方目前允许对方发送的数据量(单位是字节)。
-
检验和(Check sum):占 2 字节。检验和字段检验的范围包括首部和数据这两部分。和 UDP 用户数据报一样,在计算检验和时,要在 TCP 报文段的前面加上 12 字节的伪首部。
-
紧急指针(Urgent pointer):占 2 字节。紧急指针仅在 URG = 1 时才有意义,它指出本报文段中的紧急数据的字节数(紧急数据结束后就是普通数据)。因此紧急指针指出了紧急数据的下一个字节在报文段中的位置。
-
选项(Options):长度可变,最长可达 40 个字节。当没有使用选项时,TCP 的首部长度是 20 字节。
- TCP 最初只规定了一种选项,即最大报文段长度 MSS(Maximum Segment Size)。
- MSS 告诉对方 TCP:“我的缓存所能接收的报文段的数据字段的最大长度是 MSS 个字节。”
MSS (Maximum Segment Size) 是 TCP 报文段中的数据字段的最大长度。
数据字段 + TCP 首部才等于整个的 TCP 报文段。
-
填充字段: 这是为了使整个首部长度是 4 字节的整数倍。
其他选项
- 窗口扩大选项:占 3 字节,其中有一个字节表示移位值 S。新的窗口值等于 TCP 首部中的窗口位数增大到(16 + S),相当于把窗口值向左移动 S 位后获得实际的窗口大小。
- 时间戳选项:占10 字节,其中最主要的字段时间戳值字段(4 字节)和时间戳回送回答字段(4 字节)。
- 选择确认选项
5.4、可靠传输的工作原理
网络层是不可靠的,只负责把一个数据包从一个网段转到另外一个网段,数据包丢了是不管的,可靠传输是由传输层实现的。
5.4.1、停止等待协议
- 在发送完一个分组后,必须暂时保留已发送的分组的副本。
- 分组和确认分组都必须进行编号。
- 超时计时器的重传时间应当比数据在分组传输的平均往返时间更长一些。
只要你没有告诉我你收到了,我就认为你没收到,我就重传
使用上述的确认和重传机制,我们就可以在不可靠的传输网络上实现可靠的通信。
这种可靠传输协议常称为:[自动重传请求](ARQ,Automatic Repeat reQuest)
ARQ 表明重传的请求是[自动]进行的。接收方不需要请求发送方重传某个出错的分组。
信道利用率
- 停止等待协议的优点是简单,但缺点是信道利用率太低。
\(信道利用率:U = \frac{T_D}{T_D + RTT + T_A}\)
流水线传输
- 发送方可连续发送多个分组,不必每发完一个分组就停顿下来等待对方的确认。
- 由于信道上一直有数据不间断地传送,这种传输方式可获得很高的信道利用率。
5.4.2、连续的 ARQ 协议
累积确认
-
接收方一般采用 累积确认 的方式。即不必对收到的分组逐个发送确认,而是对按序到达且连续的最后一个分组发送确认,这样就表示:
到这个分组为止的所有分组都已正确收到了。
-
累积确认有的优点是:容易实现
-
缺点是:不能向发送方反映出接收方已经正确收到的所有分组的信息。
Go-back-N(回退 N)
- 如果发送方发送了前 5 个分组,而中间的第 3 个分组丢失了。这时接收方只能对前两个分组发出确认。
- 发送方无法知道后面三个分组的下落,而只好把后面的三个分组都再重传一次。
- 这就叫做 Go-back-N(回退 N),表示需要再退回来重传已发送过的 N 个分组。
- 可见当通信线路质量不好时,连续 ARQ 协议会带来负面的影响。
TCP 可靠通信的具体实现
- TCP 连接的每一端都必须设有两个窗口——一个发送窗口和一个接收窗口。
- TCP 的可靠传输机制用字节的序号进行控制。TCP 所有的确认都是基于序号而不是基于报文段。
- TCP 两端的四个窗口经常处于动态变化之中。
- TCP连接的往返时间 RTT 也不是固定不变的。需要使用特定的算法估算较为合理的重传时间。
5.5、可靠传输的具体实现
5.5.1、以字节为单位的滑动窗口技术
发送缓存与接收缓存的作用
- 发送缓存用来暂时存放:
- 发送应用程序传送给发送方 TCP 准备发送的数据;
- TCP 已发送出但尚未收到确认的数据。
- 接收缓存用来暂时存放:
- 按序到达的、但尚未被接收应用程序读取的数据;
- 不按序到达的数据。
注意:
- A 的发送窗口并不总是和 B 的接收窗口一样大(因为有一定的时间滞后)。
- TCP 标准没有规定对不按序到达的数据应如何处理。通常是先临时存放在接收窗口中,等到字节流中所缺少的字节收到后,再按序交付上层的应用进程。
- TCP 要求接收方必须有累积确认的功能,这样可以减小传输开销。
5.5.2、超时重传时间的选择
- 重传机制是 TCP 中最重要和最复杂的问题之一。
- TCP 每发送一个报文段,就对这个报文段设置一次计时器。只要计时器设置的重传时间到但还没有收到确认,就要重传这一报文段。
往返时延的方差很大
由于 TCP 的下层是一个互联网环境,IP 数据报所选择的路由变化很大。因而运输层的往返时间的方差也很大。
加权平均往返时间 \(RTT_s\)
- TCP 保留了 RTT 的一个加权平均往返时间 RTTS(这又称为平滑的往返时间)。
- 第一次测量到 RTT 样本时,RTTS 值就取为所测量到的 RTT 样本值。以后每测量到一个新的 RTT 样本,就按下式重新计算一次 RTTS:
\(新的 RTT_s = (1 - α) × (旧的 RTT_s) + α × (新的 RTT 样本)\)
- 式中, \(0 ≤ α <1\)
- 若 α 很接近于零,表示 RTT 值更新较慢。
- 若选择 α 接近于 1,则表示 RTT 值更新较快。
- RFC 2988 推荐的 α 值为 1/8,即 0.125。
超时重传时间 \(RTO\) (RetransmissionTime-Out)
- \(RTO\) 应略大于上面得出的加权平均往返时间 \(RTT_S\)。
- RFC 2988 建议使用下式计算 RTO:\(RTO = RTTS + 4 × RTT_D\)
- \(RTT_D\) 是 \(RTT\) 的偏差的加权平均值。
- RFC 2988 建议这样计算 \(RTT_D\) 。第一次测量时,\(RTT_D\) 值取为测量到的 \(RTT\) 样本值的一半。在以后的测量中,则使用下式计算加权平均的 \(RTT_D:\)
- $新的 RTT_D = (1 - β) × (旧的 RTT_D) + β × | RTT_s - 新的 RTT 样本 | $
- β 是个小于 1 的系数,其推荐值是 1/4,即 0.25。
往返时间的测量相当复杂
- TCP 报文段 1 没有收到确认。重传(即报文段 2)后,收到了确认报文段 ACK。
- 如何判定此确认报文段是对原来的报文段 1 的确认,还是对重传的报文段 2 的确认?
Karn 算法
- 在计算平均往返时间 RTT 时,只要报文段重传了,就不采用其往返时间样本。
- 这样得出的加权平均平均往返时间 \(RTT_S\) 和超时重传时间 \(RTO\) 就较准确。
修正的 Karn 算法
- 报文段每重传一次,就把 RTO 增大一些:
- $新的 RTO = γ × (旧的 RTO) $
- 系数 γ 的典型值是 2 。
- 当不再发生报文段的重传时,才根据报文段的往返时延更新平均往返时延 \(RTT\) 和超时重传时间 \(RTO\) 的数值。
- 实践证明,这种策略较为合理。
5.5.3、选择确认 SACK(Selective ACK)
- 接收方收到了和前面的字节流不连续的两个字节块。
- 如果这些字节的序号都在接收窗口之内,那么接收方就先收下这些数据,但要把这些信息准确地告诉发送方,使发送方不要再重复发送这些已收到的数据。
RFC 2018 的规定
- 如果要使用选择确认,那么在建立 TCP 连接时,就要在 TCP 首部的选项中加上“允许 SACK”的选项,而双方必须都事先商定好。
- 如果使用选择确认,那么原来首部中的“确认号字段”的用法仍然不变。只是以后在 TCP 报文段的首部中都增加了 SACK 选项,以便报告收到的不连续的字节块的边界。
- 由于首部选项的长度最多只有 40 字节,而指明一个边界就要用掉 4 字节,因此在选项中最多只能指明 4 个字节块的边界信息。
5.6、TCP 的流量控制
流量控制解决的是通信两端处理速度不一致问题的!
流量控制是通过接收端告诉发送端接收窗口的大小来控制的!
5.6.1、利用滑动窗口实现流量控制
持续计时器 (persistence timer)
- TCP 为每一个连接设有一个持续计时器。
- 只要 TCP 连接的一方收到对方的零窗口通知,就启动持续计时器。
- 若持续计时器设置的时间到期,就发送一个零窗口探测报文段(仅携带 1 字节的数据),而对方就在确认这个探测报文段时给出了现在的窗口值。
- 若窗口仍然是零,则收到这个报文段的一方就重新设置持续计时器。
- 若窗口不是零,则死锁的僵局就可以打破了。
5.6.2、必须考虑传输效率
可以用不同的机制来控制 TCP 报文段的发送时机:
- 第一种机制是 TCP 维持一个变量,它等于最大报文段长度 MSS。只要缓存中存放的数据达到 MSS 字节时,就组装成一个 TCP 报文段发送出去。
- 第二种机制是由发送方的应用进程指明要求发送报文段,即 TCP 支持的推送(push)操作。
- 第三种机制是发送方的一个计时器期限到了,这时就把当前已有的缓存数据装入报文段(但长度不能超过 MSS)发送出去。
5.7、TCP 的拥塞控制
5.7.1、拥塞控制的一般原理
拥塞控制
- 在某段时间,若对网络中某资源的需求超过了该资源所能提供的可用部分,网络的性能就要变坏——产生拥塞(congestion)。
- 出现资源拥塞的条件: 对资源需求的总和 > 可用资源
- 若网络中有许多资源同时产生拥塞,网络的性能就要明显变坏,整个网络的吞吐量将随输入负荷的增大而下降。
拥塞控制与流量控制的关系
- 拥塞控制所要做的都有一个前提,就是网络能够承受现有的网络负荷。
- 拥塞控制是一个全局性的过程,涉及到所有的主机、所有的路由器,以及与降低网络传输性能有关的所有因素。
- 流量控制往往指在给定的发送端和接收端之间的点对点通信量的控制。
- 流量控制所要做的就是抑制发送端发送数据的速率,以便使接收端来得及接收。
拥塞控制所起的作用
开环控制和闭环控制
- 开环控制方法就是在设计网络时事先将有关发生拥塞的因素考虑周到,力求网络在工作时不产生拥塞。
- 闭环控制是基于反馈环路的概念。属于闭环控制的有以下几种措施:
- 监测网络系统以便检测到拥塞在何时、何处发生。
- 将拥塞发生的信息传送到可采取行动的地方。
- 调整网络系统的运行以解决出现的问题。
5.7.2、几种拥塞控制方法
1、慢开始和拥塞避免
发送方维持一个叫做拥塞窗口 cwnd (congestion window) 的状态变量。拥塞窗口的大小取决于网络的拥塞程度,并且动态地在变化。发送方让自己的发送窗口等于拥塞窗口。如再考虑到接收方的接收能力,则发送窗口还可能小于拥塞窗口。
发送方控制拥塞窗口的原则是:只要网络没有出现拥塞,拥塞窗口就再增大一些,以便把更多的分组发送出去。但只要网络出现拥塞,拥塞窗口就减小一些,以减少注入到网络中的分组数。
慢开始算法的原理
- 在主机刚刚开始发送报文段时可先设置拥塞窗口 cwnd = 1,即设置为一个最大报文段 MSS 的数值。
- 在每收到一个对新的报文段的确认后,将拥塞窗口加 1,即增加一个 MSS 的数值。
- 用这样的方法逐步增大发送端的拥塞窗口 cwnd,可以使分组注入到网络的速率更加合理。
传输轮次 (transmission round)
- 使用慢开始算法后,每经过一个传输轮次,拥塞窗口 cwnd 就加倍。
一个传输轮次所经历的时间其实就是往返时间 RTT。 “传输轮次”更加强调:把拥塞窗口 cwnd 所允许发送的报文段都连续发送出去,并收到了对已发送的最后一个字节的确认。
- 例如,拥塞窗口 cwnd = 4,这时的往返时间 RTT 就是发送方连续发送 4 个报文段,并收到这 4 个报文段的确认,总共经历的时间。
设置慢开始门限状态变量 ssthresh
ssthresh——慢启动阈值
慢开始门限 ssthresh 的用法如下:
- 当 cwnd < ssthresh 时,使用慢开始算法。
- 当 cwnd > ssthresh 时,停止使用慢开始算法而改用拥塞避免算法。
- 当 cwnd = ssthresh 时,既可使用慢开始算法,也可使用拥塞避免算法。
拥塞避免算法的思路是让拥塞窗口 cwnd 缓慢地增大,即每经过一个往返时间 RTT 就把发送方的拥塞窗口 cwnd 加 1,而不是加倍,使拥塞窗口 cwnd 按线性规律缓慢增长。
无论在慢开始阶段还是在拥塞避免阶段,只要发送方判断网络出现拥塞(其根据就是没有按时收到确认),就要把慢开始门限 ssthresh 设置为出现拥塞时的发送方窗口值的一半(但不能小于2)。
然后把拥塞窗口 cwnd 重新设置为 1,执行慢开始算法。
这样做的目的就是要迅速减少主机发送到网络中的分组数,使得发生拥塞的路由器有足够时间把队列中积压的分组处理完毕。
慢开始和拥塞避免算法的实现举例
当 TCP 连接进行初始化时,将拥塞窗口置为 1。图中的窗口单位不使用字节而使用报文段。
慢开始门限的初始值设置为 16 个报文段,即 ssthresh = 16。
发送端的发送窗口不能超过拥塞窗口 cwnd 和接收端窗口 rwnd 中的最小值。我们假定接收端窗口足够大,因此现在发送窗口的数值等于拥塞窗口的数值。
在执行慢开始算法时,拥塞窗口 cwnd 的初始值为 1,发送第一个报文段 M0。
发送端每收到一个确认 ,就把 cwnd 加 1。于是发送端可以接着发送 M1 和 M2 两个报文段。
接收端共发回两个确认。发送端每收到一个对新报文段的确认,就把发送端的 cwnd 加 1。现在 cwnd 从 2 增大到 4,并可接着发送后面的 4 个报文段。
发送端每收到一个对新报文段的确认,就把发送端的拥塞窗口加 1,因此拥塞窗口 cwnd 随着传输轮次按指数规律增长。
当拥塞窗口 cwnd 增长到慢开始门限值 ssthresh 时(即当 cwnd = 16 时),就改为执行拥塞避免算法,拥塞窗口按线性规律增长。
假定拥塞窗口的数值增长到 24 时,网络出现超时,表明网络拥塞了。
更新后的 ssthresh 值变为 12(即发送窗口数值 24 的一半),拥塞窗口再重新设置为 1,并执行慢开始算法。
当 cwnd = 12 时改为执行拥塞避免算法,拥塞窗口按按线性规律增长,每经过一个往返时延就增加一个 MSS 的大小。
乘法减小 (multiplicative decrease)
- “乘法减小“是指不论在慢开始阶段还是拥塞避免阶段,只要出现一次超时(即出现一次网络拥塞),就把慢开始门限值 ssthresh 设置为当前的拥塞窗口值乘以 0.5。
- 当网络频繁出现拥塞时,ssthresh 值就下降得很快,以大大减少注入到网络中的分组数。
加法增大 (additive increase)
“加法增大”是指执行拥塞避免算法后,在收到对所有报文段的确认后(即经过一个往返时间),就把拥塞窗口 cwnd增加一个 MSS 大小,使拥塞窗口缓慢增大,以防止网络过早出现拥塞。
注意:
- “拥塞避免”并非指完全能够避免了拥塞。利用以上的措施要完全避免网络拥塞还是不可能的。
- “拥塞避免”是说在拥塞避免阶段把拥塞窗口控制为按线性规律增长,使网络比较不容易出现拥塞。
2、快重传和快恢复
快重传算法
- 快重传算法首先要求接收方每收到一个失序的报文段后就立即发出重复确认。这样做可以让发送方及早知道有报文段没有到达接收方。
- 发送方只要一连收到三个重复确认就应当立即重传对方尚未收到的报文段。
- 不难看出,快重传并非取消重传计时器,而是在某些情况下可更早地重传丢失的报文段。
快恢复算法
1)、当发送端收到连续三个重复的确认时,就执行“乘法减小”算法,把慢开始门限 ssthresh 减半。但接下去不执行慢开始算法。
2)、由于发送方现在认为网络很可能没有发生拥塞,因此现在不执行慢开始算法,即拥塞窗口 cwnd
现在不设置为 1,而是设置为慢开始门限 ssthresh 减半后的数值
,然后开始执行拥塞避免算法(“加法增大”),使拥塞窗口缓慢地线性增大。
发送窗口的上限值
发送方的发送窗口的上限值应当取为接收方窗口 rwnd 和拥塞窗口 cwnd 这两个变量中较小的一个,即应按以下公式确定:
发送窗口的上限值:\(发送窗口的上限值 = Min[rwnd, cwnd]\)
- 当 rwnd < cwnd 时,是接收方的接收能力限制发送窗口的最大值。
- 当 cwnd < rwnd 时,则是网络的拥塞限制发送窗口的最大值。
5.8、TCP 传输连接管理
建议看这一篇转载的文章
:https://blog.csdn.net/qq_43591881/article/details/107768812
运输连接就有三个阶段,即:连接建立、数据传送和连接释放。运输连接的管理就是使运输连接的建立和释放都能正常地进行。
连接建立过程中要解决以下三个问题:
- 要使每一方能够确知对方的存在。
- 要允许双方协商一些参数(如最大报文段长度,最大窗口大小,服务质量等)。
- 能够对运输实体资源(如缓存大小,连接表中的项目等)进行分配。
5.8.1、TCP 连接建立——三次握手
- TCP 连接的建立都是采用客户服务器方式。
- 主动发起连接建立的应用进程叫做客户(client)。
- 被动等待连接建立的应用进程叫做服务器(server)。
- A 的 TCP 向 B 发出连接请求报文段,其首部中的同步位 SYN = 1,并选择序号 seq = x,表明传送数据时的第一个数据字节的序号是 x。
- B 的 TCP 收到连接请求报文段后,如同意,则发回确认。
- B 在确认报文段中应使 SYN = 1,使 ACK = 1, 其确认号ack = x + 1,自己选择的序号 seq = y。
- A 收到此报文段后向 B 给出确认,其 ACK = 1,确认号 ack = y + 1。
- A 的 TCP 通知上层应用进程,连接已经建立。
- B 的 TCP 收到主机 A 的确认后,也通知其上层应用进程:TCP 连接已经建立。
确认双方可发送并且可接受,最少需要 3 次通信。
前两个数据包无法证明客户端的接受能力时正常的。
抓包时相对序列号是从 0 开始的,但是真实的序列号不是从 0 开始的。
必须得有第三次握手,才能让服务器知道客户端的状态也是建立好的状态。
就跟打电话一样
A:“你听到了吗?”
B:“我听到了”
A:“那就好”
Q:TCP 传输连接的建立为什么要经过三次握手,而不是两次握手,也就是第三次握手存在的意义是什么?
A:下面假设了一种情景
1、客户端 A 给服务器 B 发送一个建立会话的同步请求,但这个请求可能会走比较远的路由,到达的时间可能会比较长一点,经过了比一个 RTT 时间多一点后,客户端发现还没有收到回应,这时客户端 A 再给服务器 B 发送一个请求,这次服务器立刻就收到了,给了客户端 A 一个回应,前两次请求足够让客户端 A 和服务器 B 协商一些参数。
2、这时如果服务器 B 又收到了那个经过比较远的路由发送的同步请求,服务器 B 呢,又会给客户端 A 发送一个确认,但此时客户端 A 已经和服务器 B 建立会话了,所以客户端 A 它不会搭理服务器 B 这一次的确认,而服务器 B 会一直在等客户端 A 的确认,就会造成服务器资源的浪费。
3、如果没有第三次确认,服务器 B 就不知道客户端 A 是否已经收到了我的确认,会话是否已经建立了。
5.8.2、三次握手建立 TCP 连接的各状态
状态 | 含义 |
---|---|
LISTEN | 表示 socket 已经处于 listen 状态了,可以建立连接; |
SYN-SENT | 表示 socket 在发出 connect 连接的时候,会首先发送SYN报文,然后等待另一端发送的确认报文 (ACK),表示这端已经发送完 SYN 报文了; |
SYN-RCVD | 表示一端已经接收到 SYN 报文了; |
ESTAB-LISHED | 表示已经建立连接了,可以发送数据了。 |
CLOSED | 这个状态表示连接已经断开。 |
Q:如何在客户端查看会话的 SYN-SENT 状态呢?
A:访问一个不存在的地址,会话请求发出去了,但该地址不存在服务器,服务器也就没有发送确认了,此时客户端会话的状态即为:SYN-SENT
提前打开命令提示符提前输入:netstat -n
例如访问:http://192.168.2.200/
介绍一下 SYN 攻击器
SYN 攻击器是通过 TCP 建立连接的特点,也就是客户端向服务器发送建立连接的请求,对于发送方来说,这个请求里可以伪造源 IP 地址。服务器要给客户端一个确认,对于接收方来说,目标 IP 地址是伪造,也就无法获得客户端的确认,从而服务器会话状态一直处于接收状态,即 SYN-RCVD
从而一直浪费服务器资源,攻击次数和强度足够大时,导致宕机。
Q:如何在服务端查看会话的 SYN-RCVD状态呢?
A:操作都要在虚拟机中进行,通过一台电脑使用 SYN 攻击器攻击另一台服务器,来查看服务器会话状态。
5.8.3、TCP 连接释放——四次挥手
- 数据传输结束后,通信的双方都可释放连接。
- 现在 A 的应用进程先向其 TCP 发出连接释放报文段,并停止再发送数据,主动关闭 TCP 连接。
- A 把连接释放报文段首部的 FIN = 1,其序号 seq = u,等待 B 的确认。
- B 发出确认,确认号 ack = u + 1,而这个报文段自己的序号 seq = v。
TCP 服务器进程通知高层应用进程,A 通向 B 方向的连接已经释放。 - 从 A 到 B 这个方向的连接就释放了,TCP 连接处于半关闭状态。B 若发送数据,A 仍要接收。
- 若 B 已经没有要向 A 发送的数据,其应用进程就通知 TCP 释放连接。
- A 收到连接释放报文段后,必须发出确认。
还是跟打电话一样
A:“我说完了”
B:“收到”
B:“我也说完了”
A:“收到”
5.8.4、四次挥手释放 TCP 连接的各状态
状态 | 含义 |
---|---|
ESTAB-LISHED | 这个状态表示连接已经建立。 |
FIN-WAIT-1 | 表示在等待另一方的 FIN 报文,和 FIN_WAIT_2 的区别是,FIN_WAIT_1 表示 socket 现在要主动关闭连接,在发送完 FIN 报文后 socket 进入 FIN_WAIT_1 状态,当收到另一方发送 FIN 的 ACK 之后立即进入 FIN_WAIT_2 状态; |
FIN-WAIT-2 | 同上,此时需要做的事情是可能还会接收数据,然后等待另一方的 FIN;也就是说此时发送的通路已断,接收的通路还是正常的。 |
TIME-WAIT | 存在主动关闭的一方,表示收到了对方的 FIN 报文,并发送出了 ACK 报文,就等 2MSL(Max Segment Lifetime) 后即可回到 CLOSED 可用状态了,需要等一段时间时原因是网络是不可靠的,不能保证这个 ACK 发送成功了,如果失败了,对端会超时重传 FIN; |
CLOSING | 表示在发送 FIN 之后,没有收到对方的 ACK,而是收到了对方的 FIN,这中情况很少见,只有在两端几乎同时关闭同一个socket 的时候才会出现 CLOSING 状态; |
CLOSE-WAIT | 表示收到对方的 FIN 之后,回给对方 ACK,此时处于CLOSE_WAIT 状态,等待关闭,要看自己是否还有数据要发送; |
LAST-ACK | 表示收到对方的 FIN 之后,回给对方 ACK,然后自己也要关闭发送 FIN ,等待另一方的 ACK 时候的状态; |
CLOSED | 这个状态表示连接已经断开。 |
注:TCP 连接必须经过时间 2MSL 后才真正释放掉。
MSL(Maximum Segment Lifetime): 报文最大生存时间,报文最长寿命
Windows: MSL = 2min
linux(Ubuntu, CentOs): MSL = 60s
Unix: MSL = 30s
Q:为什么第四次挥手后客户端还要等待 2MSL 的时间,而不立刻 CLOSED呢?
A:
如果没有 2MSL 的等待时间的话,客户端立刻 CLOSED,一旦客户端发送的确认包丢失,而服务器未收到确认,会一直发送请求释放连接的数据包,而这时客户端已经关闭会话了,使得服务器这端的会话一直处于 LAST-ACK 状态,从而就无法关闭这次会话。
如果有 2MSL 的等待时间的话,如果客户端发的确认包丢失了,在这 2MSL 的时间内,服务器向我再次发送请求释放连接的数据包,我就能再次发送确认。