OSI是七层协议模型,五层协议只是OSI和TCP/IP的综合。实际应用还是TCP/IP的四层结构,为了方便可以把最下面两层称为网络接口层。
Note:最下层(物理层)是第一层,最上层(应用层)为第五层,不要搞反顺序。
网络接口层的传输单位是帧(frame),IP 层的传输单位是包(packet),TCP 层的传输单位是段(segment),HTTP 的传输单位则是消息或报文(message)。但这些名词并没有什么本质的区分,可以统称为数据包。
应用层直接为用户的应用进程提供服务,只需专注于为用户提供应用功能,无需关心数据是如何传输的。
目前绝大部分采用的都是HTTP 1.1版本,默认开启长连接(connections: Keep-Alive)。
HTTP协议是“无状态”的协议,一般通过Session来记录客户端的状态。
SMTP协议是邮件发送协议,接收邮件的协议并不是SMTP,而是POP3或IMAP。
负责接收邮件的协议是POP3/IMAP,后者更新一点。
FTP协议用于文件传输,是基于客户端/服务器(C/S)模式设计的,在客户端和服务器之间建立两个连接。该协议的优点是可以屏蔽操作系统和文件存储方式。
FTP协议的独特优势:(与其他C/S程序最大的不同点)
它在两个主机之间使用了两条TCP连接,而其他C/S应用程序一般只有一条TCP连接:
Telnet是远程登录协议,通过一个终端登录到其他服务器。
Telnet最大的缺点之一是所有数据(包括用户名和密码)均以明文形式发送,有着安全风险。这也是为什么SSH协议取代Telnet协议的主要原因。
SSH是安全的网络传输协议,专为远程登录会话和其他网络服务提供安全性的协议。
SSH相比于Telnet的区别在于SSH会对数据进行加密。利用SSH协议可以有效防止远程管理过程中的信息泄漏问题。
运输层负责向两个主机中进程之间的通信提供通用的数据传输服务。由于一个主机可以同时运行多个进程,因此运输层有复用和分用的功能。
复用:多个应用层进程可同时使用下面运输层的服务。
分用:把收到的信息分别交付给上面应用层中相应的进程。
运输层并不负责将数据从一个设备传输到另一个设备,这是网络层的任务,不要混淆。
“通用的”是指并不针对某一个特定的网络应用,而是多种应用可以使用同一个运输层服务。
大部分应用使用的正是 TCP传输层协议,比如 HTTP应用层协议。TCP相比 UDP多了很多特性,比如流量控制、超时重传、拥塞控制等,这些都是为了保证数据包能可靠地传输给对方。
UDP相对来说就很简单,只负责发送数据包,不保证数据包是否能抵达对方,但UDP的实时性相对更好,传输效率也高。
应用传输的数据可能会非常大,如果直接传输不好控制,因此当传输层的数据包大小超过MSS(TCP最大报文段长度)时,就要将数据包分块,这样即使中途有一个分块丢失或者损坏了,只需要重新发送这一个分块,而不用重新发送整个数据包。在TCP协议中,把这样的分块叫做报文段。
运输层把数据包传给应用时,如果接收设备上有很多应用在接收或者传输数据,因此需要用一个编号将应用区分开来,这个编号就是端口。
比如 80 端口通常是 Web 服务器用的,22 端口通常是远程登录服务器用的。而对于浏览器(客户端)中的每个标签栏都是一个独立的进程,操作系统会为这些进程分配临时的端口号。
由于运输层的报文中会携带端口号,因此接收方可以识别出该报文是发送给哪个应用。
网络层作用(寻址+路由)
网络层协议
IP(Internet Protocol)、ICMP、IGMP、ARP、RARP
IP协议会将运输层传输下来的报文作为数据部分,再加上IP包头组装成IP报文,如果IP报文大小超过MTU(以太网中一般为 1500 字节)就会再次进行分片,得到一个即将发送到网络的IP报文。
网络层负责将数据从一个设备传输到另一个设备,世界上那么多设备,又该如何找到对方呢?因此,网络层需要有区分设备的编号。
我们一般用 IP 地址给设备进行编号,对于 IPv4 协议, IP 地址共 32 位,分成了四段(比如,192.168.100.1),每段是 8 位。
只有一个单纯的 IP 地址虽然做到了区分设备,但是寻址起来就特别麻烦,全世界那么多台设备,难道一个一个去匹配?这显然不科学。
因此,需要将IP地址分成两种意义:
在寻址过程中,先匹配到相同的网络号(表示要找到同一子网),才会去找对应的主机。
将IP地址10.100.122.2
和子网掩码255.255.255.0
进行按位与运算,就可以得到网络号和主机号。
10.100.122.0/24
,斜杠后面的数字表示32位子网掩码从左数共有多少个连续的1,/24
就是代表子网掩码的二进制为「11111111-11111111-11111111-00000000」
,那么对应的十进制子网掩码为 255.255.255.0
。
IP协议除了寻址作用,还有另一个作用——路由。
实际场景中,两台设备并不是用一条网线连接起来的,而是通过很多网关、路由器、交换机等众多网络设备连接起来的,那么就会形成很多条网络的路径,因此当数据包到达一个网络节点,就需要通过路由算法决定下一步走哪条路径。
路由器寻址工作中,就是要找到目标地址的子网,找到后进而把数据包转发给对应的网络内。
IP寻址是告诉我们去往下一个目的地该朝哪个方向走,路由则是根据【下一个目的地】选择路径。寻址像是在导航,路由像是在操作方向盘。
ARP(Address Resolution Protocol),地址解析协议,用于实现从IP地址到MAC地址的映射,即询问目标IP对应的MAC地址。
大部分的广播包,它们有一个共同特征:二层封装时目的MAC是全f(ffff.ffff.ffff)或三层封装时目的IP是全1(255.255.255.255)。可以这样更方便的记住:目的地址最大的,就是广播。
路由器收到数据包后,报文送到数据链路层,数据链路层解封以太网帧头部,提取目的MAC地址,查看目的MAC地址是不是自己本身的MAC地址。这个时候出现两种情况,具体如下:
假设是情况1,目的MAC是自己的MAC,把报文送到网络层解析。送到网络层后,网络层解析,提取目的IP地址,判断目的IP地址是不是本机的IP地址。这个时候再次出现两种情况,具体如下:
假设是情况2,不是本机IP,查路由表根据路由的最长掩码匹配原则,匹配路由表,找到出接口。查路由的时候会出现四种情况,具体如下:
假设匹配到路由,去ARP表,匹配目的IP对应的MAC地址。这个时候出现两种情况,具体如下:
假设没有匹配到对应的MAC地址,发送ARP请求,这个时候会遇到两种情况。具体如下:
我们可以把网络接口层看成是数据链路层和物理层的合体。
PPP协议
IP头部中的接收方IP地址表示数据包的目的地,通过这个地址我们可以判断要将数据包发到哪里,但是在以太网中,这个思路是行不通的。
因为以太网是一种在【局域网】内,把附近的设备连接起来,使他们之间可以通讯的技术。电脑上的以太网接口,Wi-Fi接口,以太网交换机、路由器上的千兆,万兆以太网口,还有网线,它们都是以太网的组成部分。
以太网在判断数据包目的地时和IP的方式不同,因此必须采用相匹配的方式才能在以太网中将数据包发送到目的地。而MAC头部就是实现这个的。
MAC头部是以太网使用的头部,它包含了接收方和发送方的MAC地址等信息,我们可以通过ARP协议获取对方的MAC地址。