本章节概述数据链路层和ARP协议。实际上ARP协议被用在IP协议里,但是ARP确实是对IP与MAC地址的转换,更贴近数据链路层的协议。无论将ARP归属于哪层协议都可以。
数据链路层主要是规定数据传输的方式,并非指双绞线等传输媒介。一般来说,数据在信道中传输有两种方式:
我们本章是基于数据链路层的,因此暂时不关心物理层和网络层数据的流向。
链路≠数据链路
所以我们的数据链路层,说的就是相邻接点间的可靠传输。
点对点数据链路层在进行通信时主要步骤如下:
所以,一切的一切都是三点:
在一段数据前后分别添加首部和尾部,便构成了一个帧。接收方收到帧后,通过首部和尾部信息,就可以知道一个帧的开始与结束。
SOH十六进制编码是01,二进制是00000001
EOT十六进制编码是04,二进制是00000100
只有一个帧同时存在SOH和EOT,才认为指可用的。
我们之前说,EOT是结束符,但是如果帧中间意外的出现了一个帧结束符,那么后续部分就会被丢弃,这样帧数据便不是我们需要的帧。那我们怎么解决这个问题,就是透明传输要解决。
具体的方法是:发送端的数据链路层在数据中出现控制字符SOH或者EOT的前面加一个转义字符“ESC”,其十六进制编码是1B,二进制为00011011。接收端的数据链路层在网上传递信息时丢弃该字符。如果接收端收到两个转义字符,则丢弃前面的一个。
这种方法被称为字节填充。
本章节说的差错都是比特差错。所谓比特差错,就是0变成了1,1变成了0。传输错误的比特占总传输比特的比率叫做误码率。
实际上的信道不是理想的,会出现噪音来导致比特差错。为了缓解比特差错,链路层使用CRC校验(循环冗余校验)。其基本原理如下:
发送端:
二进制除法不作详解。
接收方:
当数据部分含有0x7E这个数据段时,会被误认为是帧结束符。因此我们需要避免这种情况:
当PPP协议采用同步传输(上面是异步传输),同步传输发来的就是一串比特序列,就会用零比特传输防止出现连续6个1。具体做法是,在出现连续6个1时,在第五个1后添加一个0。
我们把广播信道分为局域网和以太网,重点是局域网的广播信道,就是一对多的通信。
什么是局域网,简单说来,就是一个地理范围,站点数目受限的单位网络。通常说来,局域网比广域网有更低的延迟和较小的误码率。局域网的有点如下:
这里不对局域网类型(星型网、环形网、总线网等)做详述。
现在有一个问题,那就是局域网内终端可能会发生冲突,这怎么办?在广域网上,有信道复用技术,但是这不适用于局域网,因为代价比较高,我们在局域网中选择了另一种技术:动态媒体接入控制,又称为多点接入,它并非在用户通信时固定分配给用户的。它有两种分类:
这里多提一句,我们现在在做商业开发的时候,会对节点做负载均衡,实际上令牌和轮询都是负载均衡的方法之一。其实计算机这个东西,看起来比较新的东西都是老概念的新运用,程序员文化水平不高,总是弄些新名词唬人,其实深入了解下去,大部分在计算机其他方向中早有运用。
受控接入在实际应用中比较少,所以这里只描述随机接入型。
一个计算机想要和局域网传输数据,那么就要用到网络适配器(network adapter)。最原始的电脑都是在主板上插入网络接口卡(NIC, Network Interface Card),现在都是嵌入的了,所以都叫适配器更贴切。
目前芯片集成度非常高,一个适配器会和CPU进行数据交互,还要和内存进行交互,因此也就不可避免的包括下一层——物理层的属性。所以我们没必要严格对适配器进行分类。了解这个之后,也就大概了解了一个很重要的知识点,在我前面的文章有:linux系统的零拷贝技术,具体是在讲Kafka为什么快那一节。
我们之前说了,随机接入不可避免的会有数据碰撞,如何避免碰撞或者如何在碰撞之后依旧可以传达数据,就要靠这个协议。互联网的设计是最简化的,意思是互联网不考虑数据传输的稳定性,也就是UDP的不可靠交付。所以底层并不会对数据进行校验与排序,这些都是高层协议处理的问题。但是在数据链路层,我们也需要一个协议保证数据可以“尽最大可能交付”,即使不用完美交付,也需要至少能做到尽力。于是CSMA/CD技术出来了,又叫载波监听多点接入/碰撞检测。
现在假设我们都是绅士,我们在聊天的时候,不会打断别人,我们希望自己的意见呗别人听取,我们又希望听到别人在说什么,怎么办?很简单,你说的时候我听,我说的时候你听,咱俩一起说的时候就都停止说,等到对方说完你再说。这就是CSMA/CD协议。
要点:
不再讨论监听时间(5μs),考研的同学请另找文章学习。由于我不是偏底层的网络工程师,所以这里只谈上面这些算法问题即可。
FCS是利用CRC进行校验。
MAC地址是物理地址,是一个唯一的地址信息,标志着唯一的硬件ID。MAC地址占6字节。我记得本科时有一个同学问,既然有了MAC地址为什么还要IP地址?老师表示教了这么多年,没听过这样的问题hhh。
这个问题很好解决:为什么我们每个人都有身份证号,还要有家庭住址?一个是为了知道你是谁,一个是为了找到你。
最后一个重要的知识点,就是不同的网络是由路由器连接的,同一个网络不同主机使用桥接器或者集线器连接,构成一个局域网。
啥是ARP协议呢?这是一个地址解析协议,就是从IP地址转换成MAC地址。ARP协议并不是一个算法协议,而是规定了一个数据表可以查询。在原始的ARP中,只有IP转MAC,MAC转IP的过程是RARP协议,但是现在ARP中既有IP转MAC,也有MAC转IP。
ARP协议被用在IP协议中,因此有些教科书将其划分在网络层协议;然而ARP协议又是解析MAC地址的协议,它又可以被划分成数据链路层协议。这种分类不重要。
我们之前说,ARP协议不是一个算法协议,因为IP地址与MAC地址并不存在简单的逻辑转换。ARP协议说的是,在主机ARP高速缓存中存放一个从IP地址到MAC地址的映射表,该表会动态的增加或者删除。在发送IP包的时候,会从ARP表中找到IP地址,并查看其MAC地址,封装成MAC帧。如果找不到,比方说某主机刚插电,ARP是空的,就会向局域网发送ARP请求分组。这个ARP请求分组是广播的,但是ARP回应是单播的。那么谁回应的?找谁谁回应。A找B,会向同局域网的B,C,D,E,F发送广播,找到MAC地址为B的主机,然后只有B回应。
也就是说,ARP协议解决的是同局域网的的地址解析问题,而非广域网。因此,在广域网上需要使用路由协议结合ARP使用。