《LwIP协议栈源码详解——TCP/IP协议的实现》ARP表

姓名:朱小鹏    学号:16010130023

转载:

http://blog.sina.com.cn/s/blog_62a85b950101am9z.html

【嵌牛导读】:ARP,全称Address Resolution Protocol,译作地址解析协议,是位于TCP/IP协议栈底层的协议。

【嵌牛鼻子】:ARP

【嵌牛提问】:LWIP中的ARP结构是怎么样的?

【嵌牛正文】:

ARP,全称Address Resolution Protocol,译作地址解析协议,是位于TCP/IP协议栈底层的协议。任何网络的通信都是基于底层硬件链路的,底层的数据链路有着自己的一套寻址机制,在以太网中,往往是通过一个48位的MAC地址来标示不同的网络通信设备的。而TCP/IP协议的上层是使用IP地址作为各个主机间通信寻址机制的。当源主机上层要向目标主机发送数据时,它只知道目标主机的IP地址,此时,源主机需要将该IP地址转换为目的主机对应的MAC地址,这样才能在数据链路上选择正确的通道将数据传送出去,这就是ARP的作用。哎,复杂了!

协议里面的一段描述可能更明了:在ARP背后有一个基本概念,那就是每个网络接口有一个硬件地址(一个48 bit的值,标识不同的以太网或令牌环网络接口),在硬件层次上进行的数据帧交换必须有正确的硬件接口地址。但是,TCP/IP有自己的地址:32bit的IP地址。知道主机的I P地址并不能让内核发送一帧数据给主机。内核(如以太网驱动程序)必须知道目的端的硬件地址才能发送数据。ARP的功能是在32 bit的I P地址和采用不同网络技术的硬件地址之间提供动态映射。ARP协议的基本功能就是通过目标设备的IP地址,查询目标设备的MAC地址,以保证通信的进行。

ARP协议实现的核心是ARP缓存表,ARP的实质就是对缓存表的建立、更新、查询等操作。ARP缓存表是由一个个的缓存表项(entry)组成的,LWIP中描述缓存表项的数据结构叫etharp_entry,上源代码:

struct etharp_entry {

#if ARP_QUEUEING

struct etharp_q_entry *q;//数据包缓冲队列指针

#endif

struct ip_addr ipaddr;//目标IP地址

struct eth_addr ethaddr;//MAC地址

enum etharp_state state;//描述该entry的状态

u8_t ctime;//描述该entry的时间信息

struct netif *netif;//相应网络接口信息

};

ARP_QUEUEING是编译选项,表示是否允许缓存表项有数据包缓冲队列,在opt.h里面设置。为什么要用数据包缓冲队列指针,随后慢慢道来。ipaddr和ethaddr字段就是分别用于存储IP地址和MAC地址的,它们是ARP缓存表项的核心部分了。state是个枚举类型,它表示该缓存表项的状态,一个表项有三个可能的状态,我们用枚举型etharp_state进行描述。

enum etharp_state {

ETHARP_STATE_EMPTY = 0,

ETHARP_STATE_PENDING,

ETHARP_STATE_STABLE

};

LWIP内核通过数组的方式来创建ARP缓存表,如下,

static struct etharp_entry arp_table[ARP_TABLE_SIZE];

初始化缓存表中的各个缓存表项都处于初始状态,没有记录任何信息,此时每个表项都处于ETHARP_STATE_EMPTY状态,ETHARP_STATE_PENDING状态表示该表项处于不稳定状态,很可能的情况是,该表项只记录到了IP地址,但是还为记录到对应该IP地址的MAC地址,此时就该表项就处于ETHARP_STATE_PENDING状态。在该状态下,LWIP内核会发出一个广播ARP请求到数据链路上,以让对应IP地址的主机回应其MAC地址,当源主机接收到MAC地址时,它就更新对应的ARP表项。当ARP表项得到更新后,它就完全记录了一对IP地址和MAC地址,此时该表项就处于ETHARP_STATE_STABLE状态。注意当某表项处在PENDING状态时,要发往该表项中IP地址处的数据包会被连接在表项对应的数据包缓冲队列上,当等到该表项稳定后,这些数据包才会被发送出去。这就是为什么每个表项需要有数据包缓冲队列指针了。

ctime字段记录表项处于某个状态的时间,当某表项的ctime值大于规定的表项最大生存值时,该表项会被内核删除。在第一讲中,我们就说到了关于LWIP的超时事件,要使用ARP功能,就必须设置一个ARP超时事件,该超时事件的基本功能就是对每个表项的ctime字段值加1,然后删除那些生存时间大于最大生存值的表项。

好了,下面讲讲能够正确建立ARP缓存的基础:ARP数据包。要在源主机上建立关于目标主机的IP地址与MAC地址对应表项,则源主机和目的主机间的基本信息交互是必须的,简单的说就是,源主机如何告诉目的主机:我需要你的MAC地址;而目的主机如何回复:这就是我的MAC地址。ARP数据包,这就派上用场了。

ARP数据包可以分为ARP请求数据包和ARP应答数据包,ARP数据包到达底层链路时会被加上以太网数据包头发送出去,最终呈现在链路上的数据报头格式如下图,

《LwIP协议栈源码详解——TCP/IP协议的实现》ARP表_第1张图片

以太网包头中的前两个字段是以太网的目的MAC地址和源MAC地址,在前面一章已经有讲解。目的地址为全1的特殊地址是广播地址。在ARP表项建立前,源主机只知道目的主机的IP地址,并不知道其MAC地址,所以在数据链路上,源主机只有通过广播的方式将ARP请求数据包发送出去。电缆上的所有以太网接口都要接收广播的数据包,并检测数据包是否是发给自己的,这点通过对照目的IP地址来实现,如果是发给自己的,目的主机需要回复一个ARP应答数据包给源主机,以告诉源主机自己的MAC地址。

两个字节长的以太网帧类型表示后面数据的类型。对于ARP请求或应答数据包来说,该字段的值为0x0806,对于IP数据包来说,该字段的值为0x0800。

以太网数据报头说完,来说ARP数据报头。

硬件类型字段表示硬件地址的类型,它的值为1即表示以太网MAC地址,长度为6个字节。协议类型字段表示要映射的协议地址类型。它的值为0x0800即表示要映射为IP地址。它的值与包含I P数据报的以太网数据帧头中的类型字段的值相同。

接下来的两个1字节的字段,硬件地址长度和协议地址长度分别指出硬件地址和协议地址的长度,以字节为单位。对于以太网上A R P请求或应答来说,它们的值分别为6和4。

操作字段op指出四种操作类型,它们是A R P请求(值为1)、A R P应答(值为2)、R A R P请求(值为3)和R A R P应答(值为4),这里我们只关心前两个类型。这个字段必需的,因为A R P请求和A R P应答的帧类型字段值是相同的。

接下来的四个字段是发送端的以太网MAC地址、发送端的I P地址、目的端的以太网MAC地址和目的端的I P地址。

注意,这里有一些重复信息:在以太网的数据帧报头中和A R P请求数据帧中都有发送端的以太网MAC地址。对于一个ARP请求来说,除目的端MAC地址外的所有其他的字段都有填充值。当目的主机收到一份给自己的ARP请求报文后,它就把自己的硬件地址填进去,然后将该请求数据包的源主机信息和目的主机信息交换位置,并把操作字段op置为2,最后把该新构建的数据包发送回去,这就是ARP响应。

最后,用源码来看看LWIP是如何描述上面的这个数据报头的:

struct etharp_hdr {

PACK_STRUCT_FIELD(struct eth_hdr ethhdr);// 14字节的以太网数据报头

PACK_STRUCT_FIELD(u16_t hwtype);// 2字节的硬件类型

PACK_STRUCT_FIELD(u16_t proto);// 2字节的协议类型

PACK_STRUCT_FIELD(u16_t _hwlen_protolen);//两个1字节的长度字段

PACK_STRUCT_FIELD(u16_t opcode);// 2字节的操作字段op

PACK_STRUCT_FIELD(struct eth_addr shwaddr);// 6字节源MAC地址

PACK_STRUCT_FIELD(struct ip_addr2 sipaddr);// 4字节源IP地址

PACK_STRUCT_FIELD(struct eth_addr dhwaddr);// 6字节目的MAC地址

PACK_STRUCT_FIELD(struct ip_addr2 dipaddr);// 4字节目的IP地址

} PACK_STRUCT_STRUCT;

不唐僧了,和前面的各个描述完全相符。PACK_STRUCT_FIELD()是防止编译器字对齐的宏定义,讲过了的。

你可能感兴趣的:(《LwIP协议栈源码详解——TCP/IP协议的实现》ARP表)