做为网络设备,二层转发是最基本的功能。要想继续学习linux 内核协议栈,必须明白二层转发的流程。这篇文章举例讲一讲二层转发的流程。
二层转发是根据报文的目的MAC直接进行转发,转发过程中不用对报文的头部做任何的修改。
三层转发则是根据报文的ip 地址来进行转发,并且要对报文的二层头部进行相应的修改。
进行二层转发的设备一般叫做网桥(bridge)。桥可以是一个单独的一台网桥设备,也可以是运行在设备内的软件实例,即虚拟桥,又叫软桥。这里我们的桥指的是软桥。
桥接是指报文经过桥后直接根据桥内维护的转发信息表把报文原封不动的转发出去,因为报文经过桥转发后报文不被修改,所以桥设备在整个链路上是透明的。
每个桥内都会维护一张转发信息表,转发表项包含如下信息:
MAC:设备的MAC地址
port:该设备连接在交换机的哪个端口。
所以桥收到报文后根据目的MAC查到表项就知道报文的出端口,直接转发出去即可。
下面就以同一网段内两台PC之间 ping 报文的通信流程来讲一下二层转发中报文的处理流程:
如上图所示:
交换机上运行一个软桥的实例,eth0 和eth1 两个物理口加入到软桥中。这时eth0 和 eth1 接口上都不需要配置ip 地址,并且被配置为混杂模式。
PC1 和 PC2通过交换机组成一个局域网。我们以PC1 ping PC2 为例来说明二层转发时报文的处理。
交换机一起动时,桥内部维护的转发信息表(FDB表)是空的。
1、PC1 上ping PC2,PC1需要封装一个ICMP 的requset 报文。三层报文头信息为
dip:192.168.2.3
sip:192.168.2.2
封装完三层报文头后,开始封装二层报文头,这里是以太网的二层头。封装二层头时需要知道目的ip 对应的MAC地址。PC1 发现目的IP 和自己的IP在同一网段,PC机即知道目的主机和自己在同一个局域网里。PC1发送arp 请求来请求PC2的MAC地址。
2、arp request 是个广播报文,到达交换机时,进入软桥进行处理。首先桥会进行MAC地址的学习,取得报文的源MAC,在桥维护的转发表(FDB表)中查找,发现没有该MAC的记录信息,然后把该MAC及该MAC对应的端口添加到转发表中。交换机的桥维护的转发表中现在有如下表项:
0001.0002.000a eth0
3、经过2步地址学习后,软桥发现该报文是广播报文,会在整个桥内进行广播,即从桥内每个端口往外发送一份,但该报文的入端口除外。
4、报文经过桥广播,也从eth1 口转发出来,被PC2收到。PC2发现是请求自己的MAC地址,PC2首先会进行arp学习。根据arp 请求报文中源MAC 和源IP ,PC2把arp 表项添加到自己的arp 表中。现在PC2的arp 表中有如下表项:
192.168.2.2 0001.0002.000a
5、PC2封装arp 回应报文发送出去
6、PC2的arp 回应报文通过eth1 口进入交换机的软桥中进行处理。软桥首先进行地址学习,这时在交换机的桥维护的转发表中添加如下表项:
0001.0002.000b eth1
7、然后根据arp 回应报文的目的MAC在转发表中查找,找到最初学习的转发表项
0001.0002.000a eth0
根据该表项知道该报文应该从eth0 口上转发出去,桥进行转发。
8、PC1 收到从交换机转发出来的arp 回应报文,首先进行arp 学习,现在PC1的arp 表中有如下表项:
192.168.2.3 0001.0002.000b
9、这时PC1可以封装ping 请求报文的二层头了。
Dmac: 0001.0002.000b
Smac: 0001.0002.000a
Dip :192.168.2.3
Sip: 192.168.2.2
发送给交换机
10、交换机根据转发表中的信息把报文从eth1口发送出来。
11、PC2收到ping 的请求报文后,发现时请求自己的,自己封装ping 的回应报文,发送给交换机。
12、交换机根据转发表中的信息从eth0口发送出来。PC1收到回应,ping过程结束。
总结:
如上所述,桥会自己进行MAC学习,来维护一张转发信息表。收到报文后用报文的目的MAC来进行查找,找到相应出端口直接把报文从出端口转发出去。如果是广播报文,就会在整个桥内进行广播,从桥中每个端口发送一份出去(报文源端口除外)。如果查找转发信息表后没找到相应的表项,就在桥内进行泛洪,即从桥中每个端口发送一份出去(报文源端口除外)。这样使连接在每个端口的设备都能收到一份报文,如果相应设备发现是到本节设备的报文,就进行处理。其他设备发现不是到本机的报文,就直接丢弃了。
一般连接在端口上的设备都会发送一些报文出来,所以只要设备有报文发送出来,桥就能学习到转发信息。所以桥内的转发信息表会很快的建立起来。出现泛洪的报文不会太多。
二层转发的一些概念:
未知单播:报文进入桥里,在FDB表中没有查到该报文的目的MAC,这时桥就不知道把该报文从哪个具体的端口转发出去。这样的报文就称作未知单播。
未知单播的处理:未知单播在桥内采用泛洪的转发处理,即把该未知单播报文从桥里的每个端口发送一份出去,但不往该报文的源端口发送。如果桥里划分了vlan,就从vlan内进行泛洪。
混杂模式:端口的一种状态,端口可以接收目的MAC不是该端口MAC的报文。一般端口默认是只接收目的MAC是该端口MAC的报文,但要进行转发,端口是要求接收目的MAC不是该端口的MAC,这时就要把端口模式设置为混杂模式。
二层口:二层口是指只具有二层转发功能的端口。从开发者角度来说,二层口和三层口在内核中都对应了一个net_device,但二层口是没有配置ip地址并且端口设置为混杂模式,并且加入网桥的端口。
带VLAN的二层转发:
上面我们没提到VLAN ,VLAN在整个二层转发来说是很重要的。上面没配置VLAN时,整个桥是一个广播域。如果桥里面有多个端口,这样每个广播报文都会从桥里每个端口转发一份出去,造成网络带宽资源的浪费,同时也造成了连接在端口设备的负担。在组网上也不利于网络的管理。这样就产生了VLAN的技术。
一般设备都使用按端口来进行VLAN的划分。我们可以在一个桥里划分多个VLAN,每个VLAN 里添加多个端口。
这样一个VLAN 是一个广播域,同VLAN 内的端口通过二层转发是可以互通的,不同VLAN 内的端口通过二层转发是不通的。不同VLAN内的转发只能通过三层转发来进行互通。