TCP/IP协议

一 、网络基础

1. 认识IP地址

IP地址描述的是路途总体的起点和终点;是给人使用的网络逻辑地址。

IP地址(Internet Protocol Address)是指互联网协议地址,又译为网际协议地址。

IP地址是IP协议提供的一种统一的地址格式,
它为互联网上的每一个网络和每一台主机分配一个逻辑地址,
以此来屏蔽物理地址的差异。

IP地址是一个32位的二进制数,
通常被分割为4个“8位二进制数”(也就是4个字节),如:01100100.00000100.00000101.00000110。

通常用“点分十进制”的方式来表示,即 a.b.c.d 的形式(a,b,c,d都是0~255之间的十进制整数)。如:
100.4.5.6。

IPv4数量=2^32,大约43亿左右,而TCP/IP协议规定,每个主机都需要有一个IP地址。
对于全世界计算机来说,这个数量是不够的,所以后来推出了IPv6(长度128位,是IPv4的4倍)。
但因为目前IPv4还广泛的使用,且可以使用其他技术来解决IP地址不足的问题,所以IPv6也就没有普及。

  • 构成
    IP地址分为两个部分,网络号和主机号。

    网络号:
    标识网段,保证相互连接的两个网段具有不同的标识;

    主机号:
    标识主机,同一网段内,主机之间具有相同的网络号,但是必须有不同的主机号;

  • 分类

  • 子网掩码

2. 认识MAC地址

MAC地址描述的是路途上的每一个区间的起点和终点,即每一跳的起点和终点;
是给网络硬件设备使用的网络物理地址。

MAC地址,即 Media Access Control Address,用于标识网络设备的硬件物理地址。

主机具有一个或多个网卡,路由器具有两个或两个以上网卡;
其中每个网卡都有唯一的一个MAC地址。

主机具有一个或多个网卡,路由器具有两个或两个以上网卡;
其中每个网卡都有唯一的一个MAC地址。

硬件层面,只能基于MAC地址识别网络设备的网络物理地址。

MAC地址用来识别数据链路层中相连的节点;

长度为48位,及6个字节。一般用16进制数字加上冒号的形式来表示(例如:08:00:27:03:fb:19)

在网卡出厂时就确定了,不能修改。虚拟机中的MAC地址不是真实的MAC地址,可能会冲突;
也有些网卡支持用户配置MAC地址。

特殊的MAC地址:发送一个广播数据报,表示对同网段所有主机发送数据报。
广播数据报的MAC地址为:FF:FF:FF:FF:FF:FF。

3. 一跳一跳的网络数据传输

以下为主机B传输数据到主机C经过的网络设备:
TCP/IP协议_第1张图片
对于以上经过的网络设备:
主机:
配有IP地址,但是不进行路由控制的设备。
路由器:
即配有IP地址,又能进行路由控制。
节点:
主机和路由器的统称。

集线器和二层交换机不会对数据报封装和分用,不算在下一跳设备。

对于网络数据传输,不是想象中那样,数据直接从源主机到达目的主机,而是类似在地图中,从A到B的过程。

IP地址描述的是路途总体的起点和终点,而行进也必须一个地点一个地点的前进,由MAC地址来描述路途上每一个区间的起点和终点。

二 、网络数据传输流程

1. 集线器

使用集线器网络互联的情况下,发送端主机发送数据包时,需要先从上到下封装数据报。但封装时,目的MAC可能并不知道,需要先进行ARP寻址:

  1. 发送端在本机ARP缓存表中,根据目的IP查找对应的MAC地址。
  2. 如果找到,则可以在数据链路层以太网帧头中,设置目的MAC并发送数据包。
  3. 如果没有找到,需要先发送ARP广播请求,让接收端,即目的主机告诉自己,目的MAC是多少。
  4. 发送端更新本机ARP缓存表:保存目的IP与目的MAC的映射。
  5. 有了目的MAC,就可以按照第(2)个步骤发送数据了。

以下为本机ARP缓存表能找到目的MAC的流程:
TCP/IP协议_第2张图片
TCP/IP协议_第3张图片

2. 交换机

TCP/IP协议_第4张图片

3. 交换机+路由器

TCP/IP协议_第5张图片

4. 广域网数据传输流程

TCP/IP协议_第6张图片
请说明浏览器中输入url后,发生的事情,越详细越好?

二 、应用层重点协议

1. DNS

TCP/IP协议_第7张图片

DNS,即Domain Name System,域名系统。
DNS是一整套从域名映射到IP的系统。

TCP/IP中使用IP地址来确定网络上的一台主机,
但是IP地址不方便记忆,且不能表达地址组织信息,
于是人们发明了域名,并通过域名系统来映射域名和IP地址。

域名是一个字符串,如 www.baidu.com ,hr.nowcoder.com
域名系统为一个树形结构的系统,包含多个根节点。其中:

  1. 根节点即为根域名服务器,最早IPv4的根域名服务器全球只有13台,IPv6在此基础上扩充了
    数量。
  2. 子节点主要由各级DNS服务器,或DNS缓存构成。
    DNS域名服务器,即提供域名转换为IP地址的服务器。
    浏览器、主机系统、路由器中都保存有DNS缓存。
    Windows系统的DNS缓存在C:\Windows\System32\drivers\etc\hosts 文件中,
    Mac/Linux系统的DNS缓存在 /etc/hosts 文件中。

网络通信发送数据时,如果使用目的主机的域名,
需要先通过域名解析查找到对应的IP地址:

域名解析的过程,可以简单的理解为:
发送端主机作为域名系统树形结构的一个子节点,通过域名信息,从下到上查找对应IP地址的过程。
如果到根节点(根域名服务器)还找不到,即找不到该主机。

域名解析使用DNS协议来传输数据。DNS协议是应用层协议,基于传输层UDP或TCP协议来实现。

2. NAT

TCP/IP协议_第8张图片

NAT路由器将源地址从10.0.0.10替换成全局的IP 202.244.174.37;
NAT路由器收到外部的数据时,又会把目标IP从202.244.174.37替换回10.0.0.10;
在NAT路由器内部,有一张自动生成的,用于地址转换的表;
当 10.0.0.10 第一次向 163.221.120.9 发送数据时就会生成表中的映射关系。

NAT技术当前解决IP地址不够用的主要手段,是路由器的一个重要功能。

NAT能够将私有IP对外通信时转为全局IP。
也就是就是一种将私有IP和全局IP相互转化的技术方法。

很多学校,家庭,公司内部采用每个终端设置私有IP,而在路由器或必要的服务器上设置全局IP。

全局IP要求唯一,但是私有IP不需要;
在不同的局域网中出现相同的私有IP是完全不影响的。

3. NAPT

如果局域网内,有多个主机都访问同一个外网服务器,那么对于服务器返回的数据中,目的IP都是相同的。

NAPT来解决这个问题。
使用IP+port来建立这个关联关系。

TCP/IP协议_第9张图片
这种关联关系也是由NAT路由器自动维护的。例如在TCP的情况下,建立连接时,就会生成这个表项;在断开连接后,就会删除这个表项。

  • NAT技术的缺陷 :

    由于NAT依赖这个转换表,所以有诸多限制:

    无法从NAT外部向内部服务器建立连接。
    转换表的生成和销毁都需要额外开销。
    通信过程中一旦NAT设备异常,即使存在热备,所有的TCP连接也都会断开。

4. HTTP/HTTPS

三 、传输层重点协议 :TCP

传输层的作用:负责数据能够从发送端传输接收端。

TCP,即Transmission Control Protocol,传输控制协议,要对数据的传输进行一个详细的控制。

1. TCP协议段格式

TCP/IP协议_第10张图片

  • 源/目的端口号:
    表示数据是从哪个进程来,到哪个进程去。

  • 32位序号/32位确认号:

  • 4位TCP报头长度:
    表示该TCP头部有多少个32位bit(有多少个4字节);所以TCP头部最大长度是15 * 4 = 60。

  • 6位标志位:

    • URG:
      紧急指针是否有效。
    • ACK:
      确认号是否有效。
    • PSH:
      提示接收端应用程序立刻从TCP缓冲区把数据读走。
    • RST:
      对方要求重新建立连接;我们把携带RST标识的称为复位报文段。
    • SYN:
      请求建立连接;我们把携带SYN标识的称为同步报文段。
    • FIN:
      通知对方,本端要关闭了,我们称携带FIN标识的为结束报文段。
  • 16位窗口大小:

  • 16位校验和:
    发送端填充,CRC校验。接收端校验不通过,则认为数据有问题。。
    此处的检验和不光包含TCP首部,也包含TCP数据部分。

  • 16位紧急指针:
    标识哪部分数据是紧急数据。

  • 40字节头部选项:

2. TCP原理

TCP对数据传输提供的管控机制,主要体现在两个方面:安全和效率。

这些机制和多线程的设计原则类似:
保证数据传输安全的前提下,尽可能的提高传输效率。

  • 确认应答机制(安全机制)
    TCP/IP协议_第11张图片
    TCP将每个字节的数据都进行了编号,即为序列号。
    TCP/IP协议_第12张图片
    每一个ACK都带有对应的确认序列号,
    意思是告诉发送者,我已经收到了哪些数据;
    下一次你从哪里开始发。

  • 超时重传机制(安全机制)
    TCP/IP协议_第13张图片

主机A发送数据给B之后,可能因为网络拥堵等原因,数据无法到达主机B。

如果主机A在一个特定时间间隔内没有收到B发来的确认应答,就会进行重发。

但是,主机A未收到B发来的确认应答,也可能是因为ACK丢失了。TCP/IP协议_第14张图片
因此主机B会收到很多重复数据。
那么TCP协议需要能够识别出那些包是重复的包,并且把重复的丢弃掉。
这时候可以利用前面提到的序列号,就可以很容易做到去重的效果。

如何确定超时的时间?
最理想的情况下,找到一个最小的时间,保证 “确认应答一定能在这个时间内返回”。
但是这个时间的长短,随着网络环境的不同,是有差异的。
如果超时时间设的太长,会影响整体的重传效率;
如果超时时间设的太短,有可能会频繁发送重复的包。

TCP为了保证无论在任何环境下都能比较高性能的通信,因此会动态计算这个最大超时时间。

Linux中(BSD Unix和Windows也是如此),
超时以500ms为一个单位进行控制,
每次判定超时重发的超时时间都是500ms的整数倍。
如果重发一次之后,仍然得不到应答,
等待 2500ms 后再进行重传。
如果仍然得不到应答,等待 4
500ms 进行重传。
依次类推,以指数形式递增。
累计到一定的重传次数,
TCP认为网络或者对端主机出现异常,强制关闭连接。

  • 连接管理机制(安全机制)

在正常情况下,TCP要经过三次握手建立连接,四次挥手断开连接。

TCP/IP协议_第15张图片
TCP/IP协议_第16张图片

较粗的虚线表示服务端的状态变化情况;
较粗的实线表示客户端的状态变化情况;
CLOSED是一个假想的起始点,不是真实状态;

    • 服务端状态转化:
      [CLOSED -> LISTEN] :
      服务器端调用listen后进入LISTEN状态,等待客户端连接。

      [LISTEN -> SYN_RCVD] :
      一旦监听到连接请求(同步报文段),就将该连接放入内核等待队列中,并向客户端发送SYN确认报文。

      [SYN_RCVD -> ESTABLISHED]:
      服务端一旦收到客户端的确认报文,就进入ESTABLISHED状态,可以进行读写数据了。

      [ESTABLISHED -> CLOSE_WAIT] :
      当客户端主动关闭连接(调用close),服务器会收到结束报文段,服务器返回确认报文段并进CLOSE_WAIT。

      [CLOSE_WAIT -> LAST_ACK] :
      进入CLOSE_WAIT后说明服务器准备关闭连接(需要处理完之前的数据);
      当服务器真正调用close关闭连接时,会向客户端发送FIN,
      此时服务器进入LAST_ACK状态,等待最后一个ACK到来(这个ACK是客户端确认收到了FIN)。

      [LAST_ACK -> CLOSED] :
      服务器收到了对FIN的ACK,彻底关闭连接。

    • 客户端状态转化:
      [CLOSED -> SYN_SENT]:
      客户端调用connect,发送同步报文段。

      [SYN_SENT -> ESTABLISHED] :
      connect调用成功,则进入ESTABLISHED状态,开始读写数据。

      [ESTABLISHED -> FIN_WAIT_1] :
      客户端主动调用close时,向服务器发送结束报文段,同时进入FIN_WAIT_1。

      [FIN_WAIT_1 -> FIN_WAIT_2] :
      客户端收到服务器对结束报文段的确认,则进入FIN_WAIT_2,开始等待服务器的结束报文段。

      [FIN_WAIT_2 -> TIME_WAIT] :
      客户端收到服务器发来的结束报文段,进入TIME_WAIT,并发出LAST_ACK。

      [TIME_WAIT -> CLOSED] :
      客户端要等待一个2MSL(Max Segment Life,报文最大生存时间)的时间,才会进入CLOSED状态。

    • TIME_WAIT
      为什么是TIME_WAIT的时间是2MSL?

    MSL是TCP报文的最大生存时间,因此TIME_WAIT持续存在2MSL的话就能保证在两个传输方向上的尚未被接收或迟到的报文段都已经消失(否则服务器立刻重启,可能会收到来自上一个进程的迟到的数据,但是这种数据很可能是错误的)。

    同时也是在理论上保证最后一个报文可靠到达(假设最后一个ACK丢失,那么服务器会再重发一个FIN。这时虽然客户端的进程不在了,但是TCP连接还在,仍然可以重发LAST_ACK)。

    • CLOSE_WAIT
      一般而言,对于服务器上出现大量的 CLOSE_WAIT 状态,原因就是服务器没有正确的关闭 socket,导致四次挥手没有正确完成。这是一个 BUG。只需要加上对应的 close 即可解决问题。
  • 滑动窗口(效率机制)
    这种机制被称为 “高速重发控制”(也叫 “快重传”)。
    对每一个发送的数据段,都要给一个ACK确认应答。
    收到ACK后再发送下一个数据段。
    这样做有一个比较大的缺点,就是性能较差。
    尤其是数据往返的时间较长的时候。

TCP/IP协议_第17张图片
既然这样一发一收的方式性能较低,那么我们一次发送多条数据,
就可以大大的提高性能(其实是将多个段的等待时间重叠在一起了)。

TCP/IP协议_第18张图片
窗口大小指的是无需等待确认应答而可以继续发送数据的最大值。上图的窗口大小就是4000个字节(四段)。
发送前四个段的时候,不需要等待任何ACK,直接发送。
收到第一个ACK后,滑动窗口向后移动,继续发送第五个段的数据。
依次类推;操作系统内核为了维护这个滑动窗口,需要开辟 发送缓冲区 来记录当前还有哪些数据没有应答;只有确认应答过的数据,才能从缓冲区删掉;窗口越大,则网络的吞吐率就越高。

TCP/IP协议_第19张图片

    • 情况一:数据包已经抵达,ACK被丢了。

      这种情况下,部分ACK丢了并不要紧,因为可以通过后续的ACK进行确认;
      TCP/IP协议_第20张图片

    • 情况二:数据包就直接丢了。
      TCP/IP协议_第21张图片

    当某一段报文段丢失之后,发送端会一直收到 1001 这样的ACK,
    就像是在提醒发送端 “我想要的是 1001” 一样。

    如果发送端主机连续三次收到了同样一个 “1001” 这样的应答,就会将对应的数据 1001 - 2000 重新发送。

    这个时候接收端收到了 1001 之后,再次返回的ACK就是7001了(因为2001 - 7000)接收端其实之前就已经收到了,被放到了接收端操作系统内核的接收缓冲区中。

  • 流量控制(安全机制)
    接收端处理数据的速度是有限的。
    如果发送端发的太快,导致接收端的缓冲区被打满,这个时候如果发送端继续发送,就会造成丢包,继而引起丢包重传等等一系列连锁反应。

    因此TCP支持根据接收端的处理能力,来决定发送端的发送速度。这个机制就叫做流量控制(Flow Control)。

    接收端将自己可以接收的缓冲区大小放入 TCP 首部中的 “窗口大小” 字段,通过ACK端通知发送端。

    窗口大小字段越大,说明网络的吞吐量越高。

    接收端一旦发现自己的缓冲区快满了,就会将窗口大小设置成一个更小的值通知给发送端。

    发送端接受到这个窗口之后,就会减慢自己的发送速度。

    如果接收端缓冲区满了,就会将窗口置为0。

    这时发送方不再发送数据,但是需要定期发送一个窗口探测数段,使接收端把窗口大小告诉发送端。

TCP/IP协议_第22张图片
接收端如何把窗口大小告诉发送端呢
TCP首部中,有一个16位窗口字段,就是存放了窗口
大小信息。
那么问题来了,16位数字最大表示65535,那么TCP窗口最大就是65535字节么?
实际上,TCP首部40字节选项中还包含了一个窗口扩大因子M,实际窗口大小是 窗口字段的值左移 M位。

  • 拥塞控制(安全机制)

    TCP引入 慢启动 机制,先发少量的数据,探探路,摸清当前的网络拥堵状态,再决定按照多大的速度传输据。
    TCP/IP协议_第23张图片
    此处引入一个概念为拥塞窗口。
    发送开始的时候,定义拥塞窗口大小为1,
    每次收到一个ACK应答,拥塞窗口加1,
    每次发送数据包的时候,将拥塞窗口和接收端主机反馈的窗口大小做比较,取较小的值作为实际发送的窗口。

    像上面这样的拥塞窗口增长速度,是指数级别的。
    “慢启动” 只是指初使时慢,但是增长速度非常快。

    为了不增长的那么快,因此不能使拥塞窗口单纯的加倍。
    此处引入一个叫做慢启动的阈值。
    当拥塞窗口超过这个阈值的时候,不再按照指数方式增长,而是按照线性方式增长。

TCP/IP协议_第24张图片
当TCP开始启动的时候,慢启动阈值等于窗口最大值。
在每次超时重发的时候,慢启动阈值会变成原来的一半,同时拥塞窗口置回1。

少量的丢包,我们仅仅是触发超时重传;大量的丢包,我们就认为网络拥塞。

当TCP通信开始后,网络吞吐量会逐渐上升;随着网络发生拥堵,吞吐量会立刻下降。

拥塞控制,归根结底是TCP协议想尽可能快的把数据传输给对方,但是又要避免给网络造成太大压力的折中方案。

  • 延迟应答(效率机制)

    如果接收数据的主机立刻返回ACK应答,这时候返回的窗口可能比较小。

    假设接收端缓冲区为1M。一次收到了500K的数据;如果立刻应答,返回的窗口就是500K;
    但实际上可能处理端处理的速度很快,10ms之内就把500K数据从缓冲区消费掉了;
    在这种情况下,接收端处理还远没有达到自己的极限,即使窗口再放大一些,也能处理过来;
    如果接收端稍微等一会再应答,比如等待200ms再应答,那么这个时候返回的窗口大小就是1M。

一定要记得,窗口越大,网络吞吐量就越大,传输效率就越高。我们的目标是在保证网络不拥塞的情况下尽量提高传输效率。

那么所有的包都可以延迟应答么?肯定也不是;
数量限制:每隔N个包就应答一次;
时间限制:超过最大延迟时间就应答一次。

具体的数量和超时时间,依操作系统不同也有差异;一般N取2,超时时间取200ms。

TCP/IP协议_第25张图片

  • 捎带应答(效率机制)
    在延迟应答的基础上,我们发现,很多情况下,客户端服务器在应用层也是 “一发一收” 的。
    意味着客户端给服务器说了 “How are you”,服务器也会给客户端回一个 “Fine, thank you”;
    那么这个时候ACK就可以搭顺风车,和服务器回应的 “Fine,thank you” 一起回给客户端。

    TCP/IP协议_第26张图片

  • 面向字节流

  • 缓冲区

  • 大小限制
    创建一个TCP的socket,同时在内核中创建一个 发送缓冲区 和一个 接收缓冲区。

    调用write时,数据会先写入发送缓冲区中;
    如果发送的字节数太长,会被拆分成多个TCP的数据包发出。

    如果发送的字节数太短,就会先在缓冲区里等待,等到缓冲区长度差不多了,或者其他合适的时机发送出去。

    接收数据的时候,数据也是从网卡驱动程序到达内核的接收缓冲区。
    然后应用程序可以调用read从接收缓冲区拿数据。

    另一方面,TCP的一个连接,既有发送缓冲区,也有接收缓冲区,那么对于这一个连接,既可以读数据,也可以写数据。这个概念叫做 全双工。

    由于缓冲区的存在,TCP程序的读和写不需要一一匹配,例如:

    写100个字节数据时,可以调用一次write写100个字节,也可以调用100次write,每次写一个字节。

    读100个字节数据时,也完全不需要考虑写的时候是怎么写的,既可以一次read 100个字节,也可以一次read一个字节,重复100次。

3. 粘包问题

首先要明确,粘包问题中的 “包” ,是指的应用层的数据包。

在TCP的协议头中,没有如同UDP一样的 “报文长度” 这样的字段,但是有一个序号这样的字段。

站在传输层的角度,TCP是一个一个报文过来的。按照序号排好序放在缓冲区中。

站在应用层的角度,看到的只是一串连续的字节数据。

首先要明确,粘包问题中的 “包” ,是指的应用层的数据包。

在TCP的协议头中,没有如同UDP一样的 “报文长度” 这样的字段,但是有一个序号这样的字段。

站在传输层的角度,TCP是一个一个报文过来的。按照序号排好序放在缓冲区中。

站在应用层的角度,看到的只是一串连续的字节数据。

那么如何避免粘包问题呢?

对于定长的包,保证每次都按固定大小读取即可;例如上面的Request结构,是固定大小的,那么就从缓冲区从头开始按sizeof(Request)依次读取即可;

对于变长的包,可以在包头的位置,约定一个包总长度的字段,从而就知道了包的结束位置;

对于变长的包,还可以在包和包之间使用明确的分隔符(应用层协议,是程序猿自己来定的,只要保证分隔符不和正文冲突即可)。

对于UDP协议来说,是否也存在 “粘包问题” 呢?
对于UDP,如果还没有上层交付数据,UDP的报文长度仍然在。
同时,UDP是一个一个把数据交付给应用层。就有很明确的数据边界。

站在应用层的站在应用层的角度,使用UDP的时候,要么收到完整的UDP报文,要么不收。不会出现"半个"的情况。

4. TCP异常情况

  • 进程终止:
    进程终止会释放文件描述符,仍然可以发送FIN。和正常关闭没有什么区别。

  • 机器重启:
    和进程终止的情况相同。

  • 机器掉电/网线断开:
    接收端认为连接还在,一旦接收端有写入操作,接收端发现连接已经不在了,就会进行reset。
    即使没有写入操作,TCP自己也内置了一个保活定时器,会定期询问对方是否还在。
    如果对方不在,也会把连接释放。

另外,应用层的某些协议,也有一些这样的检测机制。例如HTTP长连接中,也会定期检测对方的状态。
例如QQ,在QQ断线之后,也会定期尝试重新连接。

5. 基于TCP应用层协议

HTTP
HTTPS
SSH
Telnet
FTP
SMTP

四 、传输层重点协议:UDP

传输层的作用:负责数据能够从发送端传输接收端。

1. 格式

TCP/IP协议_第27张图片
16位UDP长度,表示整个数据报(UDP首部+UDP数据)的最大长度。
如果校验和出错,就会直接丢弃。

2. UDP的特点

  • 无连接
    知道对端的IP和端口号就直接进行传输,不需要建立连接。

  • 不可靠
    没有任何安全机制,发送端发送数据报以后,如果因为网络故障该段无法发到对方,UDP协议层也不会给应用层返回任何错误信息。

  • 面向数据报
    应用层交给UDP多长的报文,UDP原样发送,既不会拆分,也不会合并。
    用UDP传输100个字节的数据,如果发送端一次发送100个字节,那么接收端也必须一次接收100个字节;而不能循环接收10次,每次接收10个字节。

  • 缓冲区
    UDP的socket既能读,也能写,这个概念叫做 全双工。
    UDP只有接收缓冲区,没有发送缓冲区。
    UDP没有真正意义上的 发送缓冲区。
    发送的数据会直接交给内核,由内核将数据传给网络层协议进行后续的传输动作。
    UDP具有接收缓冲区,但是这个接收缓冲区不能保证收到的UDP报的顺序和发送UDP报的顺序一致。
    如果缓冲区满了,再到达的UDP数据就会被丢弃。

  • 大小受限
    UDP协议首部中有一个16位的最大长度。
    也就是说一个UDP能传输的数据最大长度是64K(包含UDP首部)。

4. 基于UDP的应用层协议

NFS:网络文件系统
TFTP:简单文件传输协议
DHCP:动态主机配置协议
BOOTP:启动协议(用于无盘设备启动)
DNS:域名解析协议
也包括自己写UDP程序时自定义的应用层协议。

UDP本身是无连接,不可靠,面向数据报的协议,如果要基于传输层UDP协议,来实现一个可靠传
输,应该如何设计?
UDP大小是受限的,如果要基于传输层UDP协议,传输超过64K的数据,应该如何设计?

以上两个问题答案类似,都可以参考TCP的可靠性机制在应用层实现类似的逻辑:
例如:
引入序列号,保证数据顺序;
引入确认应答,确保对端收到了数据;
引入超时重传,如果隔一段时间没有应答,就重发数据;
……

五 、网络层重点协议

在复杂的网络环境中确定一个合适的路径。

1. IP协议

TCP/IP协议_第28张图片

  • 4位版本号(version):

    指定IP协议的版本,对于IPv4来说,就是4。

  • 4位头部长度(header length):

    IP头部的长度是多少个32bit,也就是 length * 4 的字节
    数。
    4bit表示最大的数字是15,因此IP头部最大长度是60字节。

  • 8位服务类型(Type Of Service):

    3位优先权字段(已经弃用),4位TOS字段,和1位保留字段(必须置为0)。

  • 4位TOS分别表示:

    最小延时,最大吞吐量,最高可靠性,最小成本。
    这四者相互冲突,只能选择一个。
    对于ssh/telnet这样的应用程序,最小延时比较重要;
    对于ftp这样的程序,最大吞吐量比较重要。

  • 16位总长度(total length):
    IP数据报整体占多少个字节。

  • 16位标识(id):

    唯一的标识主机发送的报文。
    如果IP报文在数据链路层被分片了,那么每一个片里面的这个id都是相同的。

  • 3位标志字段:

    第一位保留(保留的意思是现在不用,但是还没想好说不定以后要用到)。
    第二位置为1表示禁止分片,这时候如果报文长度超过MTU,IP模块就会丢弃报文。
    第三位表示"更多分片",如果分片了的话,最后一个分片置为1,其他是0,类似于一个结束标记。

  • 13位分片偏移(framegament offset):

    是分片相对于原始IP报文开始处的偏移。
    其实就是在表示当前分片在原报文中处在哪个位置。
    实际偏移的字节数是这个值 * 8 得到的。
    因此,除了最后一个报文之外,其他报文的长度必须是8的整数倍(否则报文就不连续了)。

  • 8位生存时间(Time To Live,TTL):

    数据报到达目的地的最大报文跳数。
    一般是64。每次经过一个路由,TTL -= 1,一直减到0还没到达,那么就丢弃了。
    这个字段主要是用来防止出现路由循环。

  • 8位协议:

    表示上层协议的类型。

  • 16位头部校验和:

    使用CRC进行校验,来鉴别头部是否损坏。

  • 32位源地址和32位目标地址:

    表示发送端和接收端。

  • 选项字段(不定长,最多40字节)。

六 、数据链路层重点协议

数据链路层的作用:
两个设备(同一种数据链路节点)之间进行传递数据。

1. 以太网

“以太网” 不是一种具体的网络,而是一种技术标准;
既包含了数据链路层的内容,也包含了一些物理层的内容。

例如:规定了网络拓扑结构,访问控制方式,传输速率等;
例如以太网中的网线必须使用双绞线;
传输速率有10M,100M,1000M等;

以太网是当前应用最广泛的局域网技术;
和以太网并列的还有令牌环网,无线LAN等。

  • 以太网帧格式:

TCP/IP协议_第29张图片
源地址和目的地址是指网卡的硬件地址(也叫MAC地址),长度是48位,是在网卡出厂时固化的。

帧协议类型字段有三种值,分别对应IP、ARP、RARP。

帧末尾是CRC校验码。

2. MTU

MTU相当于发快递时对包裹尺寸的限制。
这个限制是不同的数据链路对应的物理层,产生的限制。

以太网帧中的数据长度规定最小46字节,最大1500字节,
ARP数据包的长度不够46字节,要在后面补填充位。

最大值1500称为以太网的最大传输单元(MTU),不同的网络类型有不同的MTU。

如果一个数据包从以太网路由到拨号链路上,数据包长度大于拨号链路的MTU了,则需要对数据包进行分片(fragmentation)。

不同的数据链路层标准的MTU是不同的。

  • MTU对IP协议的影响 :
    由于数据链路层MTU的限制,
    对于较大的IP数据包要进行分包。

    将较大的IP包分成多个小包,并给每个小包打上标签。

    每个小包IP协议头的 16位标识(id) 都是相同的。

    每个小包的IP协议头的3位标志字段中,第2位置为0,表示允许分片,第3位来表示结束标记(当前是否是最后一个小包,是的话置为1,否则置为0)。

    到达对端时再将这些小包,会按顺序重组,拼装到一起返回给传输层。

    一旦这些小包中任意一个小包丢失,接收端的重组就会失败。但是IP层不会负责重新传输数据。

TCP/IP协议_第30张图片
TCP/IP协议_第31张图片

  • MTU对UDP协议的影响
    一旦UDP携带的数据超过1472(1500 - 20(IP首部) - 8(UDP首部)),那么就会在网络层分成多个IP数据报。

    这多个IP数据报有任意一个丢失,都会引起接收端网络层重组失败。

    那么这就意味着,如果UDP数据报在网络层被分片,整个数据被丢失的概率就大大增加了。

  • MTU对于TCP协议的影响 :
    TCP的一个数据报也不能无限大,还是受制于MTU。
    TCP的单个数据报的最大消息长度,称为MSS(Max Segment Size)。

    TCP在建立连接的过程中,通信双方会进行MSS协商。
    最理想的情况下,MSS的值正好是在IP不会被分片处理的最大长度(这个长度仍然是受制于数据链路层的MTU)。

    双方在发送SYN的时候会在TCP头部写入自己能支持的MSS值。

    然后双方得知对方的MSS值之后,选择较小的作为最终MSS。
    MSS的值就是在TCP首部的40字节变长选项中(kind=2)。

TCP/IP协议_第32张图片

3. ARP协议

ARP不是一个单纯的数据链路层的协议,而是一个介于数据链路层和网络层之间的协议。

  • ARP协议的作用:
    ARP协议建立了主机 IP地址 和 MAC地址 的映射关系。

    在网络通讯时,源主机的应用程序知道目的主机的IP地址和端口号,却不知道目的主机的硬件地址。

    数据包首先是被网卡接收到再去处理上层协议的,如果接收到的数据包的硬件地址与本机不符,则直接丢弃。

    因此在通讯前必须获得目的主机的硬件地址。

  • ARP协议的工作流程
    TCP/IP协议_第33张图片
    源主机发出ARP请求,询问“IP地址是192.168.0.1的主机的硬件地址是多少”,
    并将这个请求广播到本地网段(以太网帧首部的硬件地址填FF:FF:FF:FF:FF:FF表示播)。

    目的主机接收到广播的ARP请求,发现其中的IP地址与本机相符,
    则发送一个ARP应答数据包给源主机,将自己的硬件地址填写在应答包中。

    每台主机都维护一个ARP缓存表,可以用arp -a命令查看。
    缓存表中的表项有过期时间(一般为20分钟),
    如果20分钟内没有再次使用某个表项,则该表项失效,
    下次还要发ARP请求来获得目的主机的硬件地址。

你可能感兴趣的:(网络,tcp/ip,网络,智能路由器)