网络原理之TCP/IP协议

文章目录

    • 1、网络基础
      • 1.1 认识IP地址
        • 1.1.1概念
        • 1.1.2 作用
        • 1.1.3 格式
        • 1.1.4 组成
        • 1.1.5 分类
      • 1.2 子网掩码
        • 1.2.1 格式
        • 1.2.2 作用
        • 1.2.3 计算方式
      • 1.3 认识MAC地址
        • 1.3.1 特殊的MAC地址
      • 1.4 一跳一跳的网络数据传输
      • 1.4 总结IP地址和MAC地址
    • 2 网络设备及相关技术
      • 2.1 集线器:转发所有端口
      • 2.2 交换机:MAC地址转换表+转发对应端口
      • 2.3 主机:网络分层从上到下封装
      • 2.4 主机&路由器:ARP缓存表+ARP寻址
      • 2.5 路由器:路由+NAPT
      • 2.6 冲突域
      • 2.7 广播域
    • 3 网络数据传输流程
      • 3.1 局域网传输流程:集线器
      • 3.2 局域网传输流程:交换机
      • 3.3 局域网传输流程:交换机+路由器
      • 3.4 广域网数据传输流程
    • 4 应用层重点协议
      • 4.1 DNS
      • 4.2 NAT
        • 4.2.1 技术背景
        • 4.2.2 NAT IP转换过程
      • 4.3 NAPT
      • 4.4 NAT技术的缺陷
    • 5 传输层重点协议
      • 5.1 TCP协议
      • 5.2 TCP协议段格式
      • 5.3 TCP原理
        • 5.3.1 确认应答机制(安全机制)
        • 5.3.2 超时重传机制(安全机制)
        • 5.3.3 连接管理机制(安全机制)
        • 5.3.4 滑动窗口(效率机制)
        • 5.3.5 流量控制(安全机制)
        • 5.3.6 拥塞控制(安全机制)
        • 5.3.7 延迟应答(效率机制)
        • 5.3.8 捎带应答(效率机制)
        • 5.3.9 面向字节流=>粘包问题
        • 5.3.10 TCP异常情况
        • 5.3.11 TCP小结
        • 5.3.12 基于TCP应用层协议
    • 6、UDP协议
      • 6.1 UDP协议端格式
      • 6.2 UDP的特点
        • 6.2.1 无连接
        • 6.2.2 不可靠
        • 6.2.3 面向数据报
        • 6.2.4 缓冲区
        • 6.2.5 大小受限
      • 6.3 基于UDP的应用层协议
      • 6.4 扩展问题
      • 6.5 TCP/UDP对比
    • 7、网络层重点协议
      • 7.1 IP协议
    • 8、数据链路层重点协议
      • 8.1 认识以太网
      • 8.2 以太网帧格式
      • 8.3 认识MTU
        • 8.3.1 MTU对IP协议的影响
        • 8.3.2 MTU对UDP协议的影响
        • 8.3.3 MTU对于TCP协议的影响
      • 8.4 ARP协议
        • 8.4.1 ARP协议的作用
        • 8.4.2 ARP协议的工作流程
    • 9 总结
      • 9.1 数据链路层
      • 9.2 网络层
      • 9.3 传输层
      • 9.4 应用层

1、网络基础

1.1 认识IP地址

1.1.1概念

IP地址(Internet Protocol Address)是指互联网协议地址,又译为网际协议地址。

1.1.2 作用

IP地址是IP协议提供的一种统一的地址格式,它为互联网上的每一个网络和每一台主机分配一个逻辑地址,以此来屏蔽物理地址的差异。

1.1.3 格式

IP地址是一个32位的二进制数,通常被分割为4个“8位二进制数”(也就是4个字节),如:
01100100.00000100.00000101.00000110。
通常用“点分十进制”的方式来表示,即 a.b.c.d 的形式(a,b,c,d都是0~255之间的十进制整数)。如:100.4.5.6。

IP协议有两个版本,IPv4和IPv6。凡是提到IP协议,没有特殊说明的,默认都是IPv4。
IPv4数量=2^32,大约43亿左右,而TCP/IP协议规定,每个主机都需要有一个IP地址。对于全世界计算机来说,这个数量是不够的,所以后来推出了IPv6(长度128位,是IPv4的4倍)。但因为目前IPv4还广泛的使用,且可以使用其他技术来解决IP地址不足的问题,所以IPv6也就没有普及。

1.1.4 组成

IP地址分为两个部分,网络号和主机号
网络号:标识网段,保证相互连接的两个网段具有不同的标识;
主机号:标识主机,同一网段内,主机之间具有相同的网络号,但是必须有不同的主机号;

1.1.5 分类

过去曾经提出一种划分网络号和主机号的方案,把所有IP 地址分为五类,如下图所示(该图出 自[TCPIP])。
网络原理之TCP/IP协议_第1张图片
各类地址的表示范围是:

分类 范围 适用网络 网络数量 主机最大连接数
A类 0.0.0.0 ~127.255.255.255 大型网络 126 16777214( 2 24 2^{24} 224-2)
B类 128.0.0.0 ~191.255.255.255 中等规模网络 约16000个 65534( 2 16 2^{16} 216-2)
C类 192.0.0.0 ~223.255.255.255 小型网络 254( 2 8 2^8 28-2)
D类 224.0.0.0 ~239.255.255.255
E类 240.0.0.0 ~247.255.255.255

备注:主机最大连接数减去2,是扣除主机号为全0和全1的特殊IP地址。
特殊的IP地址
1、将IP地址中的主机地址全部设为0,就成为了网络号,代表这个局域网;
2、将IP地址中的主机地址全部设为1,就成为了广播地址,用于给同一个链路中相互连接的所有主机发送数据包;
3、127.*的IP地址用于本机环回(loop back)测试,通常是127.0.0.1
4、本机环回主要用于本机到本机的网络通信(系统内部为了性能,不会走网络的方式传输),对于开发网络通信的程序(即网络编程)而言,常见的开发方式都是本机到本机的网络通信。
在上述的分类中,存在IP地址浪费的问题:
(1)单位一般会申请B类网络(C类连接主机数量有限),但实际网络架设时,连接的主机数量又常远小于65534(B类连接主机数),造成IP地址浪费;同理,A类网络的IP地址也会造成大量的浪费。
(2)当一个单位申请了一个网络号。他想将该网络能表示的IP地址再分给它下属的几个小单位时,如果在申请新的网络就会造成浪费。
为了解决以上问题,引入子网掩码来进行子网划分:

1.2 子网掩码

1.2.1 格式

子网掩码格式和IP地址一样,也是一个32位的二进制数。其中左边是网络位,用二进制数字“1”表示,1
的数目等于网络位的长度;右边是主机位,用二进制数字“0”表示,0的数目等于主机位的长度。
子网掩码也可以使用二进制所有高位1相加的数值来表示,如以上子网掩码也可以表示为24。

1.2.2 作用

(1)划分A,B,C三类 IP 地址子网:
如一个B类IP地址:191.100.0.0,按A ~ E类分类来说,网络号二进制数为16位网络号+16位主机号。
假设使用子网掩码 255.255.128.0(即17) 来划分子网,意味着划分子网后,高17位都是网络位/网络号,也就是将原来16位主机号,划分为1位子网号+15位主机号。
此时,IP地址组成为:网络号+子网号+主机号,网络号和子网号统一为网络标识(划分子网后的网络号/网段)
网络原理之TCP/IP协议_第2张图片
(2)网络通信时,子网掩码结合IP地址,可以计算获得网络号(划分子网后的网络号)及主机号(划分子网后的主机号)。一般用于判断目的IP与本IP是否为同一个网段。
对于网络通信来说,发送数据报时,目的主机与发送端主机是否在同一个网段,流程是不一样的。

1.2.3 计算方式

将 IP 地址和子网掩码进行“按位与”操作(二进制相同位,与操作,两个都是1结果为1,否则为0),得到的结果就是网络号。
将子网掩码二进制按位取反,再与 IP 地址位与计算,得到的就是主机号。
示例:

十进制 二进制
IP地址 180.210.242.131 10110100.11010010.11110010.10000011
子网掩码 255.255.248.0 11111111.11111111.11111000.00000000
网络号 180.210.240.0 10110100.11010010.11110000.00000000
主机号 0.0.2.131 00000000.00000000.00000010.10000011

1.3 认识MAC地址

MAC地址,即 Media Access Control Address,用于标识网络设备的硬件物理地址。
1、主机具有一个或多个网卡,路由器具有两个或两个以上网卡;其中每个网卡都有唯一的一个MAC地址。
2、网络通信,即网络数据传输,本质上是网络硬件设备,将数据发送到网卡上,或从网卡接收数据。
3、硬件层面,只能基于MAC地址识别网络设备的网络物理地址。

1、MAC地址用来识别数据链路层中相连的节点;
2、长度为48位,及6个字节。一般用16进制数字加上冒号的形式来表示(例如08:00:27:03:fb:193、在网卡出厂时就确定了,不能修改。虚拟机中的MAC地址不是真实的MAC地址,可能会冲突;也有些网卡支持用户配置MAC地址。

1.3.1 特殊的MAC地址

广播数据报:发送一个广播数据报,表示对同网段所有主机发送数据报。广播数据报的MAC地址为:FF:FF:FF:FF:FF:FF

1.4 一跳一跳的网络数据传输

以下为主机B传输数据到主机C经过的网络设备:
网络原理之TCP/IP协议_第3张图片
对于以上经过的网络设备:
主机:配有IP地址,但是不进行路由控制的设备;
路由器:即配有IP地址,又能进行路由控制;
节点:主机和路由器的统称;

集线器和二层交换机不会对数据报封装和分用,不算在下一跳设备。

对于网络数据传输,不是想象中那样,数据直接从源主机到达目的主机,而是类似在地图中,从A到B的过程:

唐僧去西天取经,行程为长安、五指山、黑风山、女儿国……大雷音寺。
IP地址描述的是路途总体的起点和终点:
1、源IP就是整个行程的起点:长安;
2、目的IP对应为整个行程的终点:大雷音寺
而行进也必须一个地点一个地点的前进,由MAC地址来描述路途上每一个区间的起点和终点:
1、从长安到五指山,为一跳的区间,源MAC为长安,目的MAC为五指山;
2、从五指山到黑风山,为下一跳的区间,源MAC为五指山,目的MAC为黑风山。

1.4 总结IP地址和MAC地址

1、IP地址描述的是路途总体的起点和终点;是给人使用的网络逻辑地址。
2、MAC地址描述的是路途上的每一个区间的起点和终点,即每一跳的起点和终点;是给网络硬件设备使用的网络物理地址。

2 网络设备及相关技术

2.1 集线器:转发所有端口

网络原理之TCP/IP协议_第4张图片
集线器是工作在物理层的网络设备,发送到集线器的任何数据,都只是简单的将数据复制并转发到其他所有端口。(端口指集线器后边的物理端口)
网络原理之TCP/IP协议_第5张图片

2.2 交换机:MAC地址转换表+转发对应端口

网络原理之TCP/IP协议_第6张图片
交换机工作在数据链路层,交换机内部会记录并维护一张MAC地址转换表:

  1. MAC地址转换表主要记录MAC地址与端口之间的映射。(端口指交换机后边的物理端口)。
  2. 主机连接到交换机,及主机发送数据的时候,交换机可以学习并记录该主机MAC地址与端口信息。
  3. 交换机接收到数据报以后,在MAC地址转换表中,通过目的MAC查找到对应的端口,则目的主机为该端口相连接的主机。只需要将数据报转发到对应端口上即可。
    网络原理之TCP/IP协议_第7张图片
  4. 以上是使用MAC地址转换表,通过目的MAC能找到对应端口的情况;如果找不到,交换机设置数据报目的MAC为广播地址FF:FF:FF:FF:FF:FF,发送到其他所有端口,目的主机返回响应后,交换机再记录该主机MAC与端口的映射信息。

2.3 主机:网络分层从上到下封装

发送数据报时,发送端主机都需要先根据网络分层从上到下封装:
网络原理之TCP/IP协议_第8张图片
由“一跳一跳的网络数据传输”可知,以上:
1、源IP与目的IP标识整个路途的起点和终点;
2、源MAC与目的MAC标识了每一跳的起点和终点;
此时,需要根据发送端主机(源主机)与接收端主机(目的主机)是否在同一网段,来设置下一跳设备:
1、源主机和目的主机在同一个网段时,下一跳设备就是目的主机;
2、发送端主机和接收端主机在不同网段时,发送端主机是无法知道目的主机在哪,此时会设置下一跳设备为网关设备;

所谓网关,我们这里可以简单理解为,不同网段的网络互连时,需要使用网关设备。
通常的网关设备是路由器,可以划分公网和局域网(内网),同时还可以把局域网划分为多
个子网(不同网段)Windows中,可以在网络设置中,更改适配器设置查看网关IP

网络原理之TCP/IP协议_第9张图片
以上两种情况,下一跳设备IP地址都可以获取到,但该设备的MAC地址(即目的MAC)可能不知道,就需要使用以下ARP寻址:

2.4 主机&路由器:ARP缓存表+ARP寻址

首先,ARP是一个介于数据链路层和网络层之间的协议;ARP协议建立了IP地址与MAC地址的映射关系。
在数据链路层,寻找下一跳设备MAC地址的过程,称为ARP寻址:
(1)主机和路由器中都保存了一张ARP缓存表:通过IP地址可以找到对应的MAC地址。
(2)根据下一跳设备的IP地址,在ARP缓存表中能找到对应的MAC地址,则可以设置目的MAC并发送数据报。
(3)如果找不到,则发送ARP广播数据报:目的MAC为广播地址,询问下一跳设备的MAC地址。
这个过程类似于QQ群喊话:张三(下一跳设备IP地址),我要给你发快递(发送数据报),请告诉我你的收货地址(MAC地址)。
参见以下流程:
网络原理之TCP/IP协议_第10张图片

2.5 路由器:路由+NAPT

网络原理之TCP/IP协议_第11张图片
路由器主要有两个作用:
(1)网关
路由器作为网关,可以划分公网和局域网,某些路由器还可以将局域网划分为多个子网(不同网段)

公网端口即WAN口,为单独的网卡,具有公网IP地址和公网MAC地址。
划分的多个子网,是由局域网端口即LAN口划分,每个端口都有单独的网卡,具有该网段IP地址
和MAC地址。

了解:家庭用的路由器不能划分局域网子网,企业级专业路由器才能划分。
网络原理之TCP/IP协议_第12张图片
路由器作为网关:

  1. 划分局域网多个子网时,可以直接通过ARP寻址找到局域网任意主机。(这里的局域网就是路由器下的多个子网组成的局域网)。
  2. 划分公网和局域网时,局域网内主机发送数据报到公网主机时,需要基于NAPT协议,将局域网主机的IP地址和端口号,转换为路由器公网IP和端口号(指路由器中运行的程序的端口)。
局域网IP+端口需要转换为公网IP+端口,原因是接收端返回的响应数据报,目的IP和目的端口无法使用局域网IP和端口。

(2)路由
所谓路由,即在复杂的网络结构中,找出一条通往终点的路线;
网络通信(网络数据传输),路由器中的路由功能,就类似于规划路线,往哪个方向行进能更快到达目的地。

2.6 冲突域

主机之间通过网络设备(集线器、交换机)的物理端口、网线相连时,两个主机在同一时刻同时发送数据报,如果存在冲突,则该网络范围为一个冲突域(Collision Domain)。
冲突域是基于第一层物理层,又称为碰撞域。

所谓的冲突,类似两个人(主机)在一个房间(网络范围)同时说话,导致房间内其他人无法听
清讲话的内容,即产生了冲突。
冲突域中的网络通信,要解决冲突,就得按时间顺序来发送多个数据报:同一时刻,网络设备只
能接收并转发一个数据报,多余的会丢弃,让发送端主机重新发送。

集线器接收到数据报后,是将数据报简单的复制、转发到其他所有端口,如果有两个数据报要同时转发,就会出现冲突。整个集线器,即集线器的所有端口为一个冲突域。
网络原理之TCP/IP协议_第13张图片
交换机接收到数据报后,是将数据报转发到对应的一个端口:两个数据报同时转发到不同端口不存在冲突,但同时转发到一个端口就出现冲突。即交换机可以分割冲突域,分割后,一个端口为一个冲突域。
网络原理之TCP/IP协议_第14张图片

2.7 广播域

广播是指某个网络中的主机同时向网络中其它所有主机发送数据(IP、MAC地址设置为广播地址),这个数据所能传播到的范围即为广播域(Broadcast Domain)。
广播域基于第二层数据链路层。
集线器接收到广播数据报,仍是简单的复制、转发到其他所有端口,所以集线器的所有端口为一个广播域。
网络原理之TCP/IP协议_第15张图片
交换机接收到广播数据报,会转发到其他所有端口;而路由器可以隔离广播域

路由器某个LAN口网卡接收到广播数据报,如果发现是同网段,则丢弃,即广播数据不会扩散到路由器以外

网络原理之TCP/IP协议_第16张图片

3 网络数据传输流程

3.1 局域网传输流程:集线器

使用集线器网络互联的情况下,发送端主机发送数据包时,需要先从上到下封装数据报。但封装时,目的MAC可能并不知道,需要先进行ARP寻址:
(1)发送端在本机ARP缓存表中,根据目的IP查找对应的MAC地址。
(2)如果找到,则可以在数据链路层以太网帧头中,设置目的MAC并发送数据包。
(3)如果没有找到,需要先发送ARP广播请求,让接收端,即目的主机告诉自己,目的MAC是多少。
(4)发送端更新本机ARP缓存表:保存目的IP与目的MAC的映射。
(5)有了目的MAC,就可以按照第(2)个步骤发送数据了。
以下为本机ARP缓存表能找到目的MAC的流程:
涉及的知识:封装,集线器转发,ARP寻址。
网络原理之TCP/IP协议_第17张图片

如果本机ARP缓存表中找不到目的MAC,则需要先发送广播请求:
涉及的知识:ARP寻址,ARP广播。
网络原理之TCP/IP协议_第18张图片

3.2 局域网传输流程:交换机

涉及的知识:交换机MAC地址转换表。
网络原理之TCP/IP协议_第19张图片

3.3 局域网传输流程:交换机+路由器

涉及的知识:子网掩码,网关。
网络原理之TCP/IP协议_第20张图片

3.4 广域网数据传输流程

涉及的知识:DNS,NAPT,路由。
网络原理之TCP/IP协议_第21张图片

网络原理之TCP/IP协议_第22张图片

4 应用层重点协议

我们主要学习TCP/IP四层模型中的重点网络协议。

4.1 DNS

DNS,即Domain Name System,域名系统。DNS是一整套从域名映射到IP的系统。
TCP/IP中使用IP地址来确定网络上的一台主机,但是IP地址不方便记忆,且不能表达地址组织信息,于是人们发明了域名,并通过域名系统来映射域名和IP地址。

域名是一个字符串,如 www.baidu.com , hr.nowcoder.com
域名系统为一个树形结构的系统,包含多个根节点。其中:
1. 根节点即为根域名服务器,最早IPv4的根域名服务器全球只有13台,IPv6在此基础上扩充了
数量。
2. 子节点主要由各级DNS服务器,或DNS缓存构成。
2.1 DNS域名服务器,即提供域名转换为IP地址的服务器。
2.2 浏览器、主机系统、路由器中都保存有DNS缓存。
2.3 Windows系统的DNS缓存在 C:\Windows\System32\drivers\etc\hosts 文件中,Mac/Linux系统的DNS缓存在 /etc/hosts 文件中。

网络通信发送数据时,如果使用目的主机的域名,需要先通过域名解析查找到对应的IP地址:
1、域名解析的过程,可以简单的理解为:发送端主机作为域名系统树形结构的一个子节点,通过域名信息,从下到上查找对应IP地址的过程。如果到根节点(根域名服务器)还找不到,即找不到该主机。
2、域名解析使用DNS协议来传输数据。DNS协议是应用层协议,基于传输层UDP或TCP协议来实现。
网络原理之TCP/IP协议_第23张图片

4.2 NAT

4.2.1 技术背景

之前我们讨论了,IPv4协议中,IP地址数量不充足的问题。
NAT技术当前解决IP地址不够用的主要手段,是路由器的一个重要功能;

1、NAT能够将私有IP对外通信时转为全局IP。也就是就是一种将私有IP和全局IP相互转化的技
术方法:
2、很多学校,家庭,公司内部采用每个终端设置私有IP,而在路由器或必要的服务器上设置全
局IP;
3、全局IP要求唯一,但是私有IP不需要;在不同的局域网中出现相同的私有IP是完全不影响
的;

4.2.2 NAT IP转换过程

网络原理之TCP/IP协议_第24张图片

1、NAT路由器将源地址从10.0.0.10替换成全局的IP 202.244.174.372、NAT路由器收到外部的数据时,又会把目标IP从202.244.174.37替换回10.0.0.103、在NAT路由器内部,有一张自动生成的,用于地址转换的表;
4、当 10.0.0.10 第一次向 163.221.120.9 发送数据时就会生成表中的映射关系;

4.3 NAPT

那么问题来了,如果局域网内,有多个主机都访问同一个外网服务器,那么对于服务器返回的数据中,目的IP都是相同的。那么NAT路由器如何判定将这个数据包转发给哪个局域网的主机?
这时候NAPT来解决这个问题了。使用IP+port来建立这个关联关系。
网络原理之TCP/IP协议_第25张图片
这种关联关系也是由NAT路由器自动维护的。例如在TCP的情况下,建立连接时,就会生成这个表项;在断开连接后,就会删除这个表项。

4.4 NAT技术的缺陷

由于NAT依赖这个转换表,所以有诸多限制:

1、无法从NAT外部向内部服务器建立连接;
2、转换表的生成和销毁都需要额外开销;
3、通信过程中一旦NAT设备异常,即使存在热备,所有的TCP连接也都会断开;

5 传输层重点协议

负责数据能够从发送端传输接收端。

5.1 TCP协议

TCP,即Transmission Control Protocol,传输控制协议。人如其名,要对数据的传输进行一个详细的控制。

5.2 TCP协议段格式

网络原理之TCP/IP协议_第26张图片
1、源/目的端口号:表示数据是从哪个进程来,到哪个进程去;
2、32位序号/32位确认号:后面详细讲;
3、4位TCP报头长度:表示该TCP头部有多少个32位bit(有多少个4字节);所以TCP头部最大长度是15 * 4 = 60
4、6位标志位:
URG:紧急指针是否有效。
ACK:确认号是否有效。
PSH:提示接收端应用程序立刻从TCP缓冲区把数据读走。
RST:对方要求重新建立连接;我们把携带RST标识的称为复位报文段。
SYN:请求建立连接;我们把携带SYN标识的称为同步报文段。
FIN:通知对方,本端要关闭了,我们称携带FIN标识的为结束报文段。
5、16位窗口大小:后面再说。
6、16位校验和:发送端填充,CRC校验。接收端校验不通过,则认为数据有问题。此处的检验和不光包含TCP首部,也包含TCP数据部分。
7、16位紧急指针:标识哪部分数据是紧急数据;
8、40字节头部选项:暂时忽略;

5.3 TCP原理

TCP对数据传输提供的管控机制,主要体现在两个方面:安全和效率。
这些机制和多线程的设计原则类似:保证数据传输安全的前提下,尽可能的提高传输效率。

5.3.1 确认应答机制(安全机制)

网络原理之TCP/IP协议_第27张图片
上面图中,A给B发送了1000个字节,序号是1-1000,主机B给A返回的应答报文(ACK)就会带有一个确认序号,叫1001.小于1001的数据报都已经被主机B收到了,接下来主机A应该从1001这个序号开始往后进行传递。数据(1-1000)的意思是TCP报头的序号是1,报文长度是1000,1-1000这是同一个TCP数据报,这一个TCP数据报通过层层封装变成一个以太网数据帧进行传输。
TCP将每个字节的数据都进行了编号。即为序列号。
网络原理之TCP/IP协议_第28张图片
每一个ACK都带有对应的确认序列号,意思是告诉发送者,我已经收到了哪些数据;下一次你从哪里开始发。

5.3.2 超时重传机制(安全机制)

超时重传相当于对确认应答进行了补充,确认应答是网络一切正常的时候,通过ACK通知发送方我收到了,如果出现了丢包的情况,超时重传机制就要起到效果了。
网络原理之TCP/IP协议_第29张图片

1、主机A发送数据给B之后,可能因为网络拥堵等原因,数据无法到达主机B2、如果主机A在一个特定时间间隔内没有收到B发来的确认应答,就会进行重发;

但是,主机A未收到B发来的确认应答,也可能是因为ACK丢失了;
网络原理之TCP/IP协议_第30张图片
因此主机B会收到很多重复数据。那么TCP协议需要能够识别出那些包是重复的包,并且把重复的丢弃掉。
这时候我们可以利用前面提到的序列号,就可以很容易做到去重的效果。
TCP内部就会有一个去重操作:
接收方收到的数据会先放到操作系统内核的“接收缓冲区”中,接收缓冲区可以视为是一个内存空间,并且也可以视为是一个阻塞队列。收到新的数据,TCP就会根据序号,来检查这个数据是不是在接收缓冲区已经存在了,如果不存在,就会放进去,如果存在,直接丢弃,保证应用程序用socket api 拿到的这个数据一定是不重复的。
那么,如果超时的时间如何确定?

1、最理想的情况下,找到一个最小的时间,保证 "确认应答一定能在这个时间内返回"2、但是这个时间的长短,随着网络环境的不同,是有差异的。
3、如果超时时间设的太长,会影响整体的重传效率;
4、如果超时时间设的太短,有可能会频繁发送重复的包;

TCP为了保证无论在任何环境下都能比较高性能的通信,因此会动态计算这个最大超时时间。
重传如果失败,可能还会重试也不会无休止的重传,连续几次重传都不行,就认为这个网络可能遇到了严重的情况,再怎么传都不行,会自动断开TCP的连接。

1Linux中(BSD UnixWindows也是如此),超时以500ms为一个单位进行控制,每次判定超时重发的超时时间都是500ms的整数倍。
2、如果重发一次之后,仍然得不到应答,等待 2*500ms 后再进行重传。
3、如果仍然得不到应答,等待 4*500ms 进行重传。依次类推,以指数形式递增。
4、累计到一定的重传次数,TCP认为网络或者对端主机出现异常,强制关闭连接。

5.3.3 连接管理机制(安全机制)

在正常情况下,TCP要经过三次握手建立连接,四次挥手断开连接
网络原理之TCP/IP协议_第31张图片
中间两次合二为一,每次要传输的数据,都要经过一系列封装和分用,才能完成传输,封装一次更高效。
网络原理之TCP/IP协议_第32张图片
三次握手,一定是客户端主动发起的,四次挥手可能是客户端发起的,也可能是服务器主动发起。三次握手中间两次能合并,四次握手中间两次有时候能合并,有时候也不能,不能合并的原因是在于B给A发送ACK和B发送FIN的时机是不同的,四次挥手中,B给A发的ACK是内核负责的,B给A发的FIN是用户代码负责(B的代码中调用了socket。close()方法,才会触发FIN),收到FIN,立即就由内核返回ACK。
执行到用户代码中close才会触发,取决于用户代码写的,如果这两个操作之间的时间差比较大,就不能合并了,如果时间差比较小,这个可能合并的。
服务端状态转化:

1[CLOSED -> LISTEN] 服务器端调用listen后进入LISTEN状态,等待客户端连接;
2[LISTEN -> SYN_RCVD] 一旦监听到连接请求(同步报文段),就将该连接放入内核等待队
列中,并向客户端发送SYN确认报文。
3[SYN_RCVD -> ESTABLISHED] 服务端一旦收到客户端的确认报文,就进入ESTABLISHED状
态,可以进行读写数据了。
4[ESTABLISHED -> CLOSE_WAIT] 当客户端主动关闭连接(调用close),服务器会收到结束
报文段,服务器返回确认报文段并进入CLOSE_WAIT;
5[CLOSE_WAIT -> LAST_ACK] 进入CLOSE_WAIT后说明服务器准备关闭连接(需要处理完之
前的数据);当服务器真正调用close关闭连接时,会向客户端发送FIN,此时服务器进入
6、LAST_ACK状态,等待最后一个ACK到来(这个ACK是客户端确认收到了FIN)
[LAST_ACK -> CLOSED] 服务器收到了对FIN的ACK,彻底关闭连接。

客户端状态转化:

1[CLOSED -> SYN_SENT] 客户端调用connect,发送同步报文段;
2[SYN_SENT -> ESTABLISHED] connect调用成功,则进入ESTABLISHED状态,开始读写数
据;
3[ESTABLISHED -> FIN_WAIT_1] 客户端主动调用close时,向服务器发送结束报文段,同时
进入FIN_WAIT_1;
4[FIN_WAIT_1 -> FIN_WAIT_2] 客户端收到服务器对结束报文段的确认,则进入
FIN_WAIT_2,开始等待服务器的结束报文段;
5[FIN_WAIT_2 -> TIME_WAIT] 客户端收到服务器发来的结束报文段,进入TIME_WAIT,并发
出LAST_ACK;
6[TIME_WAIT -> CLOSED] 客户端要等待一个2MSL(Max Segment Life,报文最大生存时
间)的时间,才会进入CLOSED状态。

为什么是TIME_WAIT的时间是2MSL?

1、MSL是TCP报文的最大生存时间,因此TIME_WAIT持续存在2MSL的话
2、就能保证在两个传输方向上的尚未被接收或迟到的报文段都已经消失(否则服务器立刻重
启,可能会收到来自上一个进程的迟到的数据,但是这种数据很可能是错误的);
3、同时也是在理论上保证最后一个报文可靠到达(假设最后一个ACK丢失,那么服务器会再重
发一个FIN。这时虽然客户端的进程不在了,但是TCP连接还在,仍然可以重发LAST_ACK);

一般而言,对于服务器上出现大量的 CLOSE_WAIT 状态,原因就是服务器没有正确的关闭 socket,导致四次挥手没有正确完成。这是一个 BUG。只需要加上对应的 close 即可解决问题。

5.3.4 滑动窗口(效率机制)

滑动窗口存在的意义就是在保证可靠性的前提下,尽量提高传输效率。
刚才我们讨论了确认应答策略,对每一个发送的数据段,都要给一个ACK确认应答。收到ACK后再发送下一个数据段。这样做有一个比较大的缺点,就是性能较差。尤其是数据往返的时间较长的时候。
网络原理之TCP/IP协议_第33张图片
既然这样一发一收的方式性能较低,那么我们一次发送多条数据,就可以大大的提高性能(其实是将多个段的等待时间重叠在一起了)。
网络原理之TCP/IP协议_第34张图片
当前等待1001,2001,3001,4001四组ACK,不需要等到4001到了,菜继续往下发,只要1001到了,就可以往下多发一组,此时等待ACK的范围2001,3001,4001,5001,如果2001到了,就继续往下发一组,此时等待范围就变成了3001,4001,5001,6001。

1、窗口大小指的是无需等待确认应答而可以继续发送数据的最大值。上图的窗口大小就是4000
个字节(四个段)。
2、发送前四个段的时候,不需要等待任何ACK,直接发送;
3、收到第一个ACK后,滑动窗口向后移动,继续发送第五个段的数据;依次类推;
4、操作系统内核为了维护这个滑动窗口,需要开辟 发送缓冲区 来记录当前还有哪些数据没有
应答;只有确认应答过的数据,才能从缓冲区删掉;
5、窗口越大,则网络的吞吐率就越高;

网络原理之TCP/IP协议_第35张图片
当2001这个ACK到达之后就认为1001-2000这个数据已经收到了,然后就可以立即发送下一组数据。
那么如果出现了丢包,如何进行重传?这里分两种情况讨论。
情况一:数据包已经抵达,ACK被丢了。
网络原理之TCP/IP协议_第36张图片
在发送4001之前,发现收到了一个2001,此时没有收到1001,2001表示的意思是2001之前的数据都已经确认收到了,1001能否收到已经无足轻重了。ACK确认序号的特定含义,就保证了后一条ACK就能涵盖前一条。当发送方收到5001的时候 ,意味着1-5000的数据都确认收到了,3001和4001被丢包,也毫无影响,只要收到了5001,就涵盖了3001和4001表达的信息。

这种情况下,部分ACK丢了并不要紧,因为可以通过后续的ACK进行确认;

情况二:数据包就直接丢了
网络原理之TCP/IP协议_第37张图片

1、当某一段报文段丢失之后,发送端会一直收到 1001 这样的ACK,就像是在提醒发送端 "我想
要的是 1001" 一样;
2、如果发送端主机连续三次收到了同样一个 "1001" 这样的应答,就会将对应的数据 1001 - 
2000 重新发送;
3、这个时候接收端收到了 1001 之后,再次返回的ACK就是7001了(因为2001 - 7000)接收端
其实之前就已经收到了,被放到了接收端操作系统内核的接收缓冲区中;

由于1001-2000这个数据丢了,所以B就再反复索要1001这个数据,即使A给B已经往后发了,这个时候仍然是在索要1001,当索要若干次之后,A就明白了,就触发了重传。
这种机制被称为 “高速重发控制”(也叫 “快重传”)。
网络原理之TCP/IP协议_第38张图片
当A重传了1001-2000之后,B的接收缓冲区,九八缺口给补上了,后续的2001-7000这些数据都是有已经传输过了,这些数据就不必再重传,接下来B就向A索要7001开始的数据。这里的重传只是需要把丢了的数据给重传了即可,其它已经到了的数据就不必再重传了。

5.3.5 流量控制(安全机制)

滑动窗口的延伸,目的是为了保证可靠性。

接收端处理数据的速度是有限的。如果发送端发的太快,导致接收端的缓冲区被打满,这个时候如果发送端继续发送,就会造成丢包,继而引起丢包重传等等一系列连锁反应。
因此TCP支持根据接收端的处理能力,来决定发送端的发送速度。这个机制就叫做流量控制(Flow Control);

1、接收端将自己可以接收的缓冲区大小放入 TCP 首部中的 "窗口大小" 字段,通过ACK端通知
发送端;
2、窗口大小字段越大,说明网络的吞吐量越高;
3、接收端一旦发现自己的缓冲区快满了,就会将窗口大小设置成一个更小的值通知给发送端;
4、发送端接受到这个窗口之后,就会减慢自己的发送速度;
5、如果接收端缓冲区满了,就会将窗口置为0;这时发送方不再发送数据,但是需要定期发送一个窗口探测数据段,使接收端把窗口大小告诉发送端。

网络原理之TCP/IP协议_第39张图片
窗口探测包:不传输实际的数据,只是为了触发ACK,只是为了知道当前的窗口大小是多少。
接收端如何把窗口大小告诉发送端呢?回忆我们的TCP首部中,有一个16位窗口字段,就是存放了窗口大小信息;
那么问题来了,16位数字最大表示65535,那么TCP窗口最大就是65535字节么?
实际上,TCP首部40字节选项中还包含了一个窗口扩大因子M,实际窗口大小是 窗口字段的值左移 M 位;
流量控制的关键:
能够衡量接收方的处理速度,直接使用接收方缓冲区的剩余空间大小,来衡量当前处理能力。
网络原理之TCP/IP协议_第40张图片
这样的数据传输过程,可以理解成“生产者消费者模型”
A就是生产者
B的应用程序就是消费者,接受缓冲区就是交易场所,接收缓冲区肯定有一个大小,随着A发送数据,接受缓冲区里就会逐渐放入一些数据,剩余空间就会逐渐缩小。剩余空间大,B的处理能力就强,另外相反。

5.3.6 拥塞控制(安全机制)

拥塞控制衡量的是,发送方到接收方,这整个链路之间,拥堵情况(处理能力)

虽然TCP有了滑动窗口这个大杀器,能够高效可靠的发送大量的数据。但是如果在刚开始阶段就发送大量的数据,仍然可能引发问题。
因为网络上有很多的计算机,可能当前的网络状态就已经比较拥堵。在不清楚当前网络状态下,贸然发送大量的数据,是很有可能引起雪上加霜的。
TCP引入 慢启动 机制,先发少量的数据,探探路,摸清当前的网络拥堵状态,再决定按照多大的速度传输数据;
网络原理之TCP/IP协议_第41张图片

1、此处引入一个概念程为拥塞窗口.
2、发送开始的时候,定义拥塞窗口大小为13、每次收到一个ACK应答,拥塞窗口加14、每次发送数据包的时候,将拥塞窗口和接收端主机反馈的窗口大小做比较,取较小的值作为实际发送的窗口;

像上面这样的拥塞窗口增长速度,是指数级别的。“慢启动” 只是指初使时慢,但是增长速度非常快。

1、为了不增长的那么快,因此不能使拥塞窗口单纯的加倍。
2、此处引入一个叫做慢启动的阈值
3、当拥塞窗口超过这个阈值的时候,不再按照指数方式增长,而是按照线性方式增长

网络原理之TCP/IP协议_第42张图片
1、当TCP开始启动的时候,慢启动阈值等于窗口最大值;
2、在每次超时重发的时候,慢启动阈值会变成原来的一半,同时拥塞窗口置回1;
少量的丢包,我们仅仅是触发超时重传;大量的丢包,我们就认为网络拥塞;
当TCP通信开始后,网络吞吐量会逐渐上升;随着网络发生拥堵,吞吐量会立刻下降;
拥塞控制,归根结底是TCP协议想尽可能快的把数据传输给对方,但是又要避免给网络造成太大压力的折中方案。
TCP拥塞控制这样的过程,就好像 热恋的感觉。
网络原理之TCP/IP协议_第43张图片
A能够发多块,不光取决于B的处理能力,也取决于中间链路的处理能力。
如何判断处理能力?
A开始的时候以比较小的窗口来发送数据,如果数据很流畅的到达了,逐渐加大窗口大小,如果加大到一个程度之后,出现了丢包(丢包就意味着通信链路出现拥堵了),这个时候再减小窗口,通过反复增大减小过程就会找到一个合适的范围,拥塞窗口就在这个范围中不断变化,达到动态平衡。
网络原理之TCP/IP协议_第44张图片

5.3.7 延迟应答(效率机制)

相当于流量控制的延伸,流量控制是踩了下刹车,使发送方,发的不要太快,延时应答就想在这个基础上,能够尽量的再让窗口更大一些。
如果接收数据的主机立刻返回ACK应答,这时候返回的窗口可能比较小。

1、假设接收端缓冲区为1M。一次收到了500K的数据;如果立刻应答,返回的窗口就是500K;
2、但实际上可能处理端处理的速度很快,10ms之内就把500K数据从缓冲区消费掉了;
3、在这种情况下,接收端处理还远没有达到自己的极限,即使窗口再放大一些,也能处理过
来;
4、如果接收端稍微等一会再应答,比如等待200ms再应答,那么这个时候返回的窗口大小就是
1M;

一定要记得,窗口越大,网络吞吐量就越大,传输效率就越高。我们的目标是在保证网络不拥塞的情况下尽量提高传输效率;
那么所有的包都可以延迟应答么?肯定也不是;

数量限制:每隔N个包就应答一次;
时间限制:超过最大延迟时间就应答一次;

具体的数量和超时时间,依操作系统不同也有差异;一般N取2,超时时间取200ms;
网络原理之TCP/IP协议_第45张图片
举例:
网络原理之TCP/IP协议_第46张图片

5.3.8 捎带应答(效率机制)

在延迟应答的基础上,我们发现,很多情况下,客户端服务器在应用层也是 “一发一收” 的。意味着客
户端给服务器说了 “How are you”,服务器也会给客户端回一个 “Fine, thank you”;
那么这个时候ACK就可以搭顺风车,和服务器回应的 “Fine,thank you” 一起回给客户端
网络原理之TCP/IP协议_第47张图片

其他特性:面向字节流
其他特性:缓冲区
其他特性:大小限制

创建一个TCP的socket,同时在内核中创建一个 发送缓冲区 和一个 接收缓冲区;

1、调用write时,数据会先写入发送缓冲区中;
2、如果发送的字节数太长,会被拆分成多个TCP的数据包发出;
3、如果发送的字节数太短,就会先在缓冲区里等待,等到缓冲区长度差不多了,或者其他合适的时机发送出去;
4、接收数据的时候,数据也是从网卡驱动程序到达内核的接收缓冲区;
5、然后应用程序可以调用read从接收缓冲区拿数据;
6、另一方面,TCP的一个连接,既有发送缓冲区,也有接收缓冲区,那么对于这一个连接,既可以读数据,也可以写数据。这个概念叫做 全双工

由于缓冲区的存在,TCP程序的读和写不需要一一匹配,例如:

1、写100个字节数据时,可以调用一次write写100个字节,也可以调用100次write,每次写一个字节;
2、读100个字节数据时,也完全不需要考虑写的时候是怎么写的,既可以一次read 100个字节,也可以一次read一个字节,重复100次;

网络原理之TCP/IP协议_第48张图片

5.3.9 面向字节流=>粘包问题

1、首先要明确,粘包问题中的 "包" ,是指的应用层的数据包。
2、在TCP的协议头中,没有如同UDP一样的 "报文长度" 这样的字段,但是有一个序号这样的字段。
3、站在传输层的角度,TCP是一个一个报文过来的。按照序号排好序放在缓冲区中。
4、站在应用层的角度,看到的只是一串连续的字节数据。
5、那么应用程序看到了这么一连串的字节数据,就不知道从哪个部分开始到哪个部分,是一个完整的应用层数据包。

那么如何避免粘包问题呢?归根结底就是一句话,明确两个包之间的边界。

1、对于定长的包,保证每次都按固定大小读取即可;例如上面的Request结构,是固定大小的,那么就从缓冲区从头开始按sizeof(Request)依次读取即可;
2、对于变长的包,可以在包头的位置,约定一个包总长度的字段,从而就知道了包的结束位置;
3、对于变长的包,还可以在包和包之间使用明确的分隔符(应用层协议,是程序猿自己来定的,只要保证分隔符不和正文冲突即可);

思考:对于UDP协议来说,是否也存在 “粘包问题” 呢?

1、对于UDP,如果还没有上层交付数据,UDP的报文长度仍然在。同时,UDP是一个一个把数据交付给应用层。就有很明确的数据边界。
2、站在应用层的站在应用层的角度,使用UDP的时候,要么收到完整的UDP报文,要么不收。不会出现"半个"的情况。

5.3.10 TCP异常情况

进程终止:进程终止会释放文件描述符,仍然可以发送FIN。和正常关闭没有什么区别。

机器重启:和进程终止的情况相同。

机器掉电/网线断开:接收端认为连接还在,一旦接收端有写入操作,接收端发现连接已经不在了,就会进行reset。即使没有写入操作,TCP自己也内置了一个保活定时器,会定期询问对方是否还在。如果对方不在,也会把连接释放。
另外,应用层的某些协议,也有一些这样的检测机制。例如HTTP长连接中,也会定期检测对方的状态。例如QQ,在QQ断线之后,也会定期尝试重新连接。

5.3.11 TCP小结

为什么TCP这么复杂?因为要保证可靠性,同时又尽可能的提高性能。
可靠性:
校验和
序列号(按序到达)
确认应答
超时重发
连接管理
流量控制
拥塞控制
提高性能:
滑动窗口
快速重传
延迟应答
捎带应答
其他:
定时器(超时重传定时器,保活定时器,TIME_WAIT定时器等)

5.3.12 基于TCP应用层协议

HTTP
HTTPS
SSH
Telnet
FTP
SMTP
当然,也包括你自己写TCP程序时自定义的应用层协议;

6、UDP协议

6.1 UDP协议端格式

网络原理之TCP/IP协议_第49张图片
16位UDP长度,表示整个数据报(UDP首部+UDP数据)的最大长度;
如果校验和出错,就会直接丢弃;

6.2 UDP的特点

UDP传输的过程类似于寄信。

6.2.1 无连接

知道对端的IP和端口号就直接进行传输,不需要建立连接;

6.2.2 不可靠

没有任何安全机制,发送端发送数据报以后,如果因为网络故障该段无法发到对方,UDP协议层也不会给应用层返回任何错误信息;

6.2.3 面向数据报

应用层交给UDP多长的报文,UDP原样发送,既不会拆分,也不会合并;
用UDP传输100个字节的数据:
如果发送端一次发送100个字节,那么接收端也必须一次接收100个字节;而不能循环接收10次,
每次接收10个字节。

6.2.4 缓冲区

UDP只有接收缓冲区,没有发送缓冲区:
UDP没有真正意义上的 发送缓冲区。发送的数据会直接交给内核,由内核将数据传给网络层协议。
进行后续的传输动作;
UDP具有接收缓冲区,但是这个接收缓冲区不能保证收到的UDP报的顺序和发送UDP报的顺序一致;如果缓冲区满了,再到达的UDP数据就会被丢弃。
UDP的socket既能读,也能写,这个概念叫做 全双工。

6.2.5 大小受限

UDP协议首部中有一个16位的最大长度。也就是说一个UDP能传输的数据最大长度是64K(包含UDP首部)。

6.3 基于UDP的应用层协议

NFS:网络文件系统
TFTP:简单文件传输协议
DHCP:动态主机配置协议
BOOTP:启动协议(用于无盘设备启动)
DNS:域名解析协议
当然,也包括你自己写UDP程序时自定义的应用层协议。

6.4 扩展问题

这是一个经典面试题:

  1. UDP本身是无连接,不可靠,面向数据报的协议,如果要基于传输层UDP协议,来实现一个可靠
    传输,应该如何设计?
  2. UDP大小是受限的,如果要基于传输层UDP协议,传输超过64K的数据,应该如何设计?
    以上两个问题答案类似,都可以参考TCP的可靠性机制在应用层实现类似的逻辑:
    例如:
    引入序列号,保证数据顺序;
    引入确认应答,确保对端收到了数据;
    引入超时重传,如果隔一段时间没有应答,就重发数据;

6.5 TCP/UDP对比

我们说了TCP是可靠连接,那么是不是TCP一定就优于UDP呢?TCP和UDP之间的优点和缺点,不能简单,绝对的进行比较:
1、TCP用于可靠传输的情况,应用于文件传输,重要状态更新等场景;
2、UDP用于对高速传输和实时性要求较高的通信领域,例如,早期的QQ,视频传输等。另外UDP可以用于广播;
归根结底,TCP和UDP都是程序员的工具,什么时机用,具体怎么用,还是要根据具体的需求场景去判定。

7、网络层重点协议

在复杂的网络环境中确定一个合适的路径。

7.1 IP协议

完成两方面工作:
1、地址管理
2、路由选择

协议头格式如下:
网络原理之TCP/IP协议_第50张图片

14位版本号(version):指定IP协议的版本,对于IPv4来说,就是424位头部长度(header length):IP头部的长度是多少个32bit,也就是 length * 4 的字节数。4bit表示最大的数字是15,因此IP头部最大长度是60字节。
38位服务类型(Type Of Service):3位优先权字段(已经弃用),4位TOS字段,和1位保留字段(必须置为0)。4位TOS分别表示:最小延时,最大吞吐量,最高可靠性,最小成本。这四者相互冲突,只能选择一个。对于ssh/telnet这样的应用程序,最小延时比较重要;对于ftp这样的程序,最大吞吐量比较重要。
416位总长度(total length):IP数据报整体占多少个字节。
516位标识(id):唯一的标识主机发送的报文。如果IP报文在数据链路层被分片了,那么每一个片里面的这个id都是相同的。
63位标志字段:第一位保留(保留的意思是现在不用,但是还没想好说不定以后要用到)。第二位置为1表示禁止分片,这时候如果报文长度超过MTU,IP模块就会丢弃报文。第三位表示"更多分片",如果分片了的话,最后一个分片置为1,其他是0。类似于一个结束标记。
713位分片偏移(framegament offset):是分片相对于原始IP报文开始处的偏移。其实就是在表示当前分片在原报文中处在哪个位置。实际偏移的字节数是这个值 * 8 得到的。因此,除了最后一个报文之外,其他报文的长度必须是8的整数倍(否则报文就不连续了)。
88位生存时间(Time To Live,TTL):数据报到达目的地的最大报文跳数。一般是64。每次经过一个路由,TTL -= 1,一直减到0还没到达,那么就丢弃了。这个字段主要是用来防止出现路由循环。
8位协议:表示上层协议的类型。
916位头部校验和:使用CRC进行校验,来鉴别头部是否损坏。
1032位源地址和32位目标地址:表示发送端和接收端。
11、选项字段(不定长,最多40字节):

8、数据链路层重点协议

8.1 认识以太网

1"以太网" 不是一种具体的网络,而是一种技术标准;既包含了数据链路层的内容,也包含了一些物理层的内容。例如:规定了网络拓扑结构,2、访问控制方式,传输速率等;
例如以太网中的网线必须使用双绞线;传输速率有10M,100M,1000M等;
2、以太网是当前应用最广泛的局域网技术;和以太网并列的还有令牌环网,无线LAN等;

8.2 以太网帧格式

以太网的帧格式如下所示:
网络原理之TCP/IP协议_第51张图片
1、源地址和目的地址是指网卡的硬件地址(也叫MAC地址),长度是48位,是在网卡出厂时固化的;
2、帧协议类型字段有三种值,分别对应IP、ARP、RARP;
3、帧末尾是CRC校验码。

8.3 认识MTU

MTU相当于发快递时对包裹尺寸的限制。这个限制是不同的数据链路对应的物理层,产生的限制。

1、以太网帧中的数据长度规定最小46字节,最大1500字节,ARP数据包的长度不够46字节,要在后面补填充位;
2、最大值1500称为以太网的最大传输单元(MTU),不同的网络类型有不同的MTU;
3、如果一个数据包从以太网路由到拨号链路上,数据包长度大于拨号链路的MTU了,则需要对数据包进行分片(fragmentation);
4、不同的数据链路层标准的MTU是不同的;

8.3.1 MTU对IP协议的影响

由于数据链路层MTU的限制,对于较大的IP数据包要进行分包。

1、将较大的IP包分成多个小包,并给每个小包打上标签;
2、每个小包IP协议头的 16位标识(id) 都是相同的;
3、每个小包的IP协议头的3位标志字段中,第2位置为0,表示允许分片,第3位来表示结束标记(当前是否是最后一个小包,是的话置为1,否则置为0);
4、到达对端时再将这些小包,会按顺序重组,拼装到一起返回给传输层;
5、一旦这些小包中任意一个小包丢失,接收端的重组就会失败。但是IP层不会负责重新传输数
据;

网络原理之TCP/IP协议_第52张图片

8.3.2 MTU对UDP协议的影响

1、一旦UDP携带的数据超过1472(1500 - 20(IP首部) - 8(UDP首部)),那么就会在网络层分成多个IP数据报。
2、这多个IP数据报有任意一个丢失,都会引起接收端网络层重组失败。那么这就意味着,如果UDP数据报在网络层被分片,整个数据被丢失的概率就大大增加了。

8.3.3 MTU对于TCP协议的影响

1、TCP的一个数据报也不能无限大,还是受制于MTU。TCP的单个数据报的最大消息长度,称为MSS(Max Segment Size);
2、TCP在建立连接的过程中,通信双方会进行MSS协商。
3、最理想的情况下,MSS的值正好是在IP不会被分片处理的最大长度(这个长度仍然是受制于数据链路层的MTU)。
4、双方在发送SYN的时候会在TCP头部写入自己能支持的MSS值。
5、然后双方得知对方的MSS值之后,选择较小的作为最终MSS。
6、MSS的值就是在TCP首部的40字节变长选项中(kind=2);
网络原理之TCP/IP协议_第53张图片

8.4 ARP协议

虽然我们在这里介绍ARP协议,但是需要强调,ARP不是一个单纯的数据链路层的协议,而是一个介于数据链路层和网络层之间的协议;

8.4.1 ARP协议的作用

ARP协议建立了主机 IP地址 和 MAC地址 的映射关系。
1、在网络通讯时,源主机的应用程序知道目的主机的IP地址和端口号,却不知道目的主机的硬件地址;
2、数据包首先是被网卡接收到再去处理上层协议的,如果接收到的数据包的硬件地址与本机不符,则直接丢弃;
3、因此在通讯前必须获得目的主机的硬件地址;

8.4.2 ARP协议的工作流程

网络原理之TCP/IP协议_第54张图片

1、源主机发出ARP请求,询问“IP地址是192.168.0.1的主机的硬件地址是多少”,并将这个请求广播到本地网段(以太网帧首部的硬件地址填FF:FF:FF:FF:FF:FF表示广播);
2、目的主机接收到广播的ARP请求,发现其中的IP地址与本机相符,则发送一个ARP应答数据包给源主机,将自己的硬件地址填写在应答包中;
3、每台主机都维护一个ARP缓存表,可以用arp -a命令查看。缓存表中的表项有过期时间(一般为20分钟),如果20分钟内没有再次使用某个表项,则该表项失效,下次还要发ARP请求来获得目的主机的硬件地址

9 总结

9.1 数据链路层

1、数据链路层的作用:两个设备(同一种数据链路节点)之间进行传递数据
2、以太网是一种技术标准;既包含了数据链路层的内容,也包含了一些物理层的内容。例如:规定了网络拓扑结构,访问控制方式,传输速率等;
3、以太网帧格式
4、理解mac地址
5、理解arp协议
6、理解MTU

9.2 网络层

1、网络层的作用:在复杂的网络环境中确定一个合适的路径。
2、理解IP地址,理解IP地址和MAC地址的区别。
3、理解IP协议格式。
4、了解网段划分方法
5、理解如何解决IP数目不足的问题,掌握网段划分的两种方案。理解私有IP和公网IP
6、理解网络层的IP地址路由过程。理解一个数据包如何跨越网段到达最终目的地。
7、理解IP数据包分包的原因。
8、了解NAT设备的工作原理。

9.3 传输层

1、传输层的作用:负责数据能够从发送端传输接收端。
2、理解端口号的概念。
3、认识UDP协议,了解UDP协议的特点。
4、认识TCP协议,理解TCP协议的可靠性。5、理解TCP协议的状态转化。
掌握TCP的连接管理,确认应答,超时重传,滑动窗口,流量控制,拥塞控制,延迟应答,捎带应答特性。
6、理解TCP面向字节流,理解粘包问题和解决方案。
7、能够基于UDP实现可靠传输。
8、理解MTU对UDP/TCP的影响。

9.4 应用层

1、应用层的作用:满足我们日常需求的网络程序,都是在应用层
2、能够根据自己的需求,设计应用层协议。
3、了解HTTP协议。
4、理解DNS的原理和工作流程。

你可能感兴趣的:(JavaEE,java)