UNIX网络编程--传输层:TCP、UDP、SCTP(二)

UNIX网络编程----传输层:TCP、UDP、SCTP

一、概述

本章的焦点是传输层:包括TCP、UDP、和SCTP(流控制传输协议)。SCTP是一个较新的协议,最初设计用于跨因特网传输电话信令。

应用层数据可以直接绕过传输层直接使用IPv4或者IPv6,但这种技术(原始套接字)很少使用,不过在后续章节中还是会讲到。

UDP是一个简单的、不可靠的数据报协议。TCP是一个复杂、可靠的字节流协议。SCTP与TCP类似之处在于它也是一个可靠的数据报协议,但它还提供消息边界、传输级别多宿支持以及将头端阻塞减少到最小的一种方法。需要关注的几点:TCP的三路握手、TCP的链接终止序列和TCP的TIME_WAIT状态,SCTP的思路握手和SCTP的链接终止,加上由套接字层提供的TCP、UDP和SCTP缓冲区机制。

二、总图

TCP/IP协议簇并不仅仅只有TCP、IP两种协议,还有别的协议存在,从右向左查看该图,最右边的5个网络应用在使用IPv6,

UNIX网络编程--传输层:TCP、UDP、SCTP(二)_第1张图片

最右边的tcpdump的网络应用可能是使用数据链路提供者接口直接与数据链路进行通信。从上图可以看出来,上层的应用程序,不管是自己写的应用程序还是系统提供的程序,几乎所有(tcpdump除外)都是通过中间层(已经处于内核里)的不同协议和底层的数据链路层进行交互。中间层的协议有TCP UDP ICMP IGMP ,这也就照应了概述中说的TCP/IP协议簇不仅仅只有TCP和UDP协议。

1)TCP(传输控制协议Transmission Control Protocol)

TCP是中面向链接的协议,为用户进程提供可靠的全双工字节流。TCP套接字是一种流套接字。TCP关心确认、超时和重传之类的细节。TCP既可以使用IPv4,又可以使用IPv6

2)UDP(用户数据报协议 UserDatagram Protocol)

UDP是一种无连接的协议。UDP套接字是一种数据报套接字。UDP数据报不能保证最终到达他们的目的地,IPv4和IPv6都可以使用。

3) SCTP(流控制协议 StreamContril Transmission Protocol)

SCTP是一个提供可靠全双工关联的面向连接的协议。SCTP是多宿的,从而每个关联的两端均涉及一组IP地址和一个端口号。TCP既可以使用IPv4,又可以使用IPv6

4) ICMP(网际控制消息协议 Internet Control Message Protocol)

ICMP处理在路由器和主机之间流通的错误和控制消息。这些消息通常有TCP/IP网络支持软件本身(而不是用户进程)产生和处理,不过图中展示的ping和tracerroute程序同样适用ICMP。

5)IGMP(网际组管理协议 Internet Group Management Protocol) 由于多播,在21章会有讲解

6)ARP(地址解析协议Adress Resulation Protocol)

ARP把一个IPv4地址映射成一个硬件地址(如以太网地址)。ARP通常用于注入以太网、令牌环网和FDDI等广播网络,在点到点网络上并不需要。

三、用户数据报协议(UDP)

应用进程往一个UDP套接字写入一个消息,该消息随后被封装到一个UDP数据报,该UDP数据报进而被封装到一个IP数据报,然后发送到目的地。UDP不保证UDP数据会到达其最终目的地,不保证各个数据报的先后顺序跨网络后保证不变,也不保证每个数据报只到达一次。它的重要特点就是缺乏可靠性。如果数据报到达了其最终目的地,但是校验和检测发现有错误,或者改数据报在网络传输中被丢弃了,它就无法被投递给UDP套接字,也不会被源端自动重传。如果想保证一个数据报到达其目的地,可以往应用程序中添加特性:来自对端的确认、本段的超时与重传等。

每个UDP数据报都有一个长度。如果一个数据报正确到达目的地,那么数据报的长度将随数据一道传递给接受端的应用进程。而TCP是一个字节流协议,没有任何记录边界,这一点不同与UDP.

UDP提供无连接服务,因为UDP客户与服务器之间不必存在任何长期的关系。举例说明,一个UDP客户可以创建一个套接字并发送一个数据报给一个给定的服务器,然后立即用同一个套接字大宋另一个数据报给另一个服务器。同样,一个UDP服务器可以用通一个UDP套接字从若干个不用的客户接受数据报,每个客户一个数据报。

四、传输控制协议(TCP)

TCP首先和服务器建立连接,还提供了可靠性,当TCP向另一端发送数据时,它要求对端但会一个确认。如果没有确认,TCP就自动重传数据并等待更长时间。在数次重传失败后,TCP才放弃,如此尝试发送数据上所化的总时间一般为4~10分钟。

1) TCP的几个能力,首先能够估算客户和服务器之间的往返时间(RTT)

2) TCP给传输的数据加上序号,并对所发送的数据进行排序。如果接收端TCP接受到雷子对端的重复数据,它可以判定数据时充当的,从而丢弃。如果数据非顺序到达,接收端TCP将先根据他们的需要重新排序。还提供流量控制。TCP总是告知对端在任何时刻它一次能够从对端接受对少字节的数据,称为通告窗口。任何时刻,该窗口指出接受缓冲区当前可用的空间量,从而保证发送端发送数据不会使接受缓冲区溢出。该窗口时刻动态变化。也有可能为0

3) TCP连接是全双工的,意味着在一个给定的连接上应用可以在任何时刻在进入方向上既可以发送数据由接受数据。建立一个全双工连接后,需要的话可以把它转换成一个单工连接。

4) UDP可以是全双工的

五、流控制传输协议(SCTP)

SCTP在客户和服务器之间提供关联,并像TCP那样给应用提供可靠性、排序、流量控制以及全双工的数据传送。SCTP中使用“关联”一词取代“连接”是为了避免这样的的内涵:一个连接只涉及两个IP地址之间的通信。一个关联指代两个系统之间的一次通信,它可鞥因为SCTP支持多宿而涉及不止两个地址。

与TCP不同的是,SCTP是面向消息的(TCP是面向字节的)。和UDP一样,由发送端写入的每条记录的长度随数据一道传递给接受端应用。

SCTP能够在所连接的端点之间提供多个流,每个流各自可靠地按序递送消息。一个流上某个消息的丢失不会阻塞通一个关联其他流上消息的投递,这个做法和TCP相反,TCP字节丢失将阻塞连接上其后所有数据的递送,直到该丢失被恢复为止。

六、TCP连接的建立和终止

1) 服务器准备好接受外来的连接,使用socket、bind、listen这三个函数使套接字称为被动套接字,称为被动打开

2) 客户通过connect连接固定IP固定端口的套接字,这导致客户TCP发送一个SYN分节,它告诉服务器客户讲在连接中发送的数据的初始序列号。通常SYN分节不携带数据。

3) 服务器确认(ACK)客户的SYN,同时自己也得发送一个SYN分节,它含有服务器在同一连接中发送的数据的初始化序列号。服务器在单个分节中发送SYN和对客户SYN的ACK(确认)。

4) 客户必须确认服务器的SYN。

UNIX网络编程--传输层:TCP、UDP、SCTP(二)_第2张图片

客户的初始序列号为J,服务器的初始序列为K。ACK中的确认号是发送这个ACK的一端所期待的下一个序列号。

一个例子很好的说明TCP建立连接的过程:

建立TCP连接就好比一个电话系统,socket函数等同于有电话可用、bind函数是在告诉别人你的电话号码,这样他们可以呼叫你。listen函数是打开电话振铃,这样当有一个外来呼叫到达时,你就可以听到。connect函数要求我们知道对方的电话号码并拨打它。accept函数发生在被呼叫的人应答电话之时,由accept返回客户的表示(既客户的IP地址和端口号)类似于让电话机的呼叫者ID功能部件显示呼叫者的电话号码。然而两者的不同之处在于accept只在连接建立之后返回客户的标识,而呼叫者ID功能部件却在我们选择应答或不应答电话之前显示呼叫者的电话号码。

TCP选项:

每一个SYN可以含有多个TCP选项:

1)MSS选项。发送SYN的TCP一端使用本选项通告对端它的最大分节大小,也就是他在本连接的每个TCP分节中愿意接受的最大数据量。发送端TCP使用接收端的MSS作为所发送分节的最大大小。

2)窗口规模选项。TCP连接任何一端能够通告对端的最大窗口大小为65535,因为在TCP首部中响应的字段栈16位。

3)时间戳选项。这个选项对于高速网络是必要的,它可以防止由失而复得的分组可能造成的数据损坏。


连接终止:

1)TCP建立一个连接需要3个分节,终止一个连接则需要4个字节。某个应用进程首先调用close,我们称该端执行主动关闭,该端的TCP于是发送一个FIN分节,表示数据发送完毕。

2)接受到这个FIN的对端执行被动关闭,这个FIN有TCP确认。它的接受也作为一个文件结束符传递给接受端应用进程(放在已排队等候该应用进程接受的任何其他数据之后),因为FUN的接受一位这接受端应用进程在响应连接上再无额外数据可接受。

3)接受待这个文件结束符的应用进程将调用close关闭它的套接字。这道指它的TCP也发送一个FIN。

4)接受这个最终FIN的原发送端TCP(既执行主动关闭的那一端)确认这个FIN。

既然每个方向都需要一个FIN和一个ACK,因此通常需要4个分节。

UNIX网络编程--传输层:TCP、UDP、SCTP(二)_第3张图片

在步骤2与步骤3之间,从执行别动关闭一端到执行主动关闭一端流动数据时可能的,这称为半关闭,使用函数shutdown。

当套接字被关闭时,其所在端TCP各自发送一个FIN。上图指出,这是由应用进程调用close而发生的,不过需要认识到,当一个UNIX进程无论资源帝(调用exit或从main函数返回)还是非自愿地(收到一个终止本进程的信号)终止时,所有打开的描述符都被关闭,这也导致仍然打开的任何TCP连接上也发出一个FIN。

无论是客户还是服务器,任何一端都可以执行主动关闭。通常情况是客户执行主动关闭,但是某些协议却由服务器执行主动关闭。

TCP状态转换图

TCP为一个连接定义11种状态。

UNIX网络编程--传输层:TCP、UDP、SCTP(二)_第4张图片

例如:当某个应用进程在CLOSED状态下执行主动打开时,TCP将发送一个SYN,且新的状态是ESTABLISHED。

自ESTABLISHED状态引出的两个箭头处理连接的终止。如果某个应用进程在接受到一个FIN之前调用close(主动关闭),那就转换到FIN_WAIT_1状态。如果某个应用进程在ESTABLISHED状态期间接受到一个FIN(被动关闭),那就转换到CLOSE_WAIT状态。

我们用粗线实线表示通常的客户状态转换,用粗虚线表示通常的服务器状态转换。


七、TIME_WAIT状态

在讲解着个重要的状态之前,需要看下TCP连接的到断开的全部过程。这个过程和上图结合之后可以更深入了解。

UNIX网络编程--传输层:TCP、UDP、SCTP(二)_第5张图片

从上图得知的东西,本例中的客户通告一个值为536的MSS(表明客户只实现了最小重组缓冲区大小),服务器通告一个值为1460的MSS(以太网上IPv4的典型值),不同方向上MSS值不相同不成问题。一旦建立练级额,客户就构造一个请求并发送给服务器。这里假设该请求适合于单个TCP分节(既请求大小小于服务器通告的值为1460字节的MSS)服务器处理请求并发送一个应答,假设该应答适合于单个分节(小于536字节)。

服务器对客户的请求的确认是伴随其应答发送的,这种做法称为捎带。

随后展示的是终止连接的4个分节。执行主动关闭的那一端(本例中为客户)就是下面讨论的TIME_WAIT状态。

1) 此状态存在的理由

可靠地实现TCP全双工连接的终止

允许老的重读分节在网络中消失

假设上图中最后一个ACK丢失。服务器将重新发送它的最终那个FIN,因此客户必须维护状态信息,以允许他重新发送最中那个ACK。说明了为什么执行主动关闭的那一端是处于TIME_WAIT状态的那一端,因为可能不得不重传最终那个ACK的就是那一端。

对于第二个理由,我们假设通一个IP和端口之间有一个TCP连接,我们关闭这个连接,过一端时间后在相同的IP地址和端口号之间建立另一个连接。后一个连接成为前一个连接的化身,因为他们的IP地址和端口号相同。TCP必须防止来自某个连接的老的重复分组在该连接已经中国知网后再现,从而被误解成同一个连接的某个新的化身。为做到这一点,TCP将不给处于TIME_WAIT状态的链接发起新的化身。既然TIME_WAIT状态的持续时间是MSL的2倍,这就足以让某个方向上的分组最多存货MSL秒被丢弃。另一个方向上的应答最多存货MSL秒也被丢弃。

其实这个状态存在的原因在为了上述所说的两个理由可以归结为两句话:

万一在最中确认连接中断时服务器的ACK回应丢失怎么办,这样就必须再次重传FIN。

万一在极短的时间内从新有一个相同套接字连接建立怎么办,这样就必须为刚才的数据做处理

八、缓冲区大小及限制

IPV4数据报的最大大小事65535字节,包括IPV4首部。关于其首部在后续章节讲述。

许多网络有一个可由硬件规定的MTU。举例来说,以太网的MTU是1500字节。

IPv4的最小链路MTU为68字节。IPV6要求最小的链路MTU为1680字节。

两个主机之间的路径中最小的MTU称为路径MTU。1500字节的以太网MTU是当今常见的路径MTU。

当一个IP数据报将从某个接口送出时,如果它的大小超过相应链路的MTU,IPV4和IPV6都将执行分片

TCP有一个MSS,用于向对端TCP通告对端在每个分节中能发送的最大TCP数据量。看到过SYN分解上的MSS选项。MSS的目的是告诉对端其重组缓冲区大小的实际值,从而避免分节。MSS经常设置成MTU减去IP和TCP首部的固定长度。在以太网中使用IPV4的MSS值为1460,使用IPV6的MSS值为1440(两者的TCP首部都是20资金额,但是IP首部相差20字节)。在TCP的MSS选项中,MSS值是一个16位的字段,限定其最大值为65535.额对于IPV4是适合的,因为IPV4数据报中的最大TCP数据量为65495(65535减去IPV4首部的20字节和TCP首部的20字节)

1) TCP输出

每一个TCP套接字有一个发送缓冲区,我们可以使用SO_SNDBUF套接字选项来更改穿冲去的大小。当某个应用进程调用write时,内核从该应用进程的缓冲区中复制所有数据到缩写套接字的发送缓冲区。如果该套接字的发送缓冲区容不下该应用进程的所有数据(或是应用进程的缓冲区大于套接字的发送缓冲区,或是套接字的发送缓冲区已有其他数据),该应用进程将被投入睡眠。这里假设该套接字时阻塞的,它是通常的默认设置。内核将不从write系统调用返回,直到应用进程缓冲区中的所有数据都复制到套接字发送缓冲区。从写一个TCP套接字的write或应用进程成功返回仅仅表示我们可以重新使用原来的应用缓冲区,并不表明对端的TCP或应用进程已接收到数据。

2) UDP输出

其实UDP套接字没有发送缓冲区。任何UDP套接字都有发送缓冲区大小,不过它仅仅是可写到该套接字的UDP数据报的大小的上限,如果一个应用进程写一个大于套接字发送缓冲区大小的数据报,内核将返回进程一个EMSGSIEZE错误。既然UDP是不可靠的,它不必保存应用进程数据的一个副本,因此无需一个真正的发送缓冲区。如果某个UDP应用进程发送大数据报(比如2000字节的数据报),那么他们相比TPC应用数据更有可能被分片,因为TCP会把应用数据划分成MSS大小的块,而UDP却没有对等的手段。

从写一个UDP套接字的WRITE调用成功返回表示所写的数据报或其所有片段已被加入数据链路层的输出队列。如果该对垒没有足够的空间存放该数据报或它的某个片段,内核通常会返回一个ENOBUFS错误给他的应用进程。

3) SCTP输出

这个的输出和TCP的输出相似

ps:

你可能感兴趣的:(UNIX网络编程--传输层:TCP、UDP、SCTP(二))