UNIX网络编程——原始套接字的魔力【续】

如何从链路层直接发送数据帧

       上一篇里面提到的是从链路层“收发”数据,该篇是从链路层发送数据帧。

       上一节我们主要研究了如何从链路层直接接收数据帧,可以通过bind函数来将原始套接字绑定到本地一个接口上,然后该套接字就只接收从该接口收上来的对应的数据包。今天我们用原始套接字来手工实现链路层ARP报文的发送和接收,以便大家对原始套接字有更深刻的掌握和理解。

 

      ARP全称为地址解析协议,是链路层广泛使用的一种寻址协议,完成32比特IP地址到48比特MAC地址的映射转换。在以太网中,当一台主机需要向另外一台主机发送消息时,它会首先在自己本地的ARP缓存表中根据目的主机的IP地址查找其对应的MAC地址,如果找到了则直接向其发送消息。如果未找到,它首先会在全网发送一个ARP广播查询,这个查询的消息会被以太网中所有主机接收到,然后每个主机就根据ARP查询报文中所指定的IP地址来检查该报文是不是发给自己的,如果不是则直接丢弃;只有被查询的目的主机才会对这个消息进行响应,然后将自己的MAC地址通告给发送者。

       也就是说,链路层中是根据MAC地址来确定唯一一台主机。以太帧格式如下:

           UNIX网络编程——原始套接字的魔力【续】_第1张图片

       以太帧首部中2字节的帧类型字段指定了其上层所承载的具体协议,常见的有0x0800表示是IP报文、0x0806表示RARP协议、0x0806即为我们将要讨论的ARP协议。

  •  硬件类型: 1表示以太网。
  •  协议类型: 0x0800表示IP地址。和以太头部中帧类型字段相同。
  •  硬件地址长度和协议地址长度:对于以太网中的ARP协议而言,分别为6和4;
  •  操作码1表示ARP请求;2表示ARP应答;3表示RARP请求;4表示RARP应答。

       我们这里只讨论硬件地址为以太网地址、协议地址为IP地址的情形,所以剩下四个字段就分别表示发送方的MAC和IP地址、接收方的MAC和IP地址了。

       注意对于一个ARP请求报文来说,除了接收方硬件地址外,其他字段都要填充。当系统收到一个ARP请求时,会查询该请求报文中接收方的协议地址是否和自己的IP地址相等,如果相等,它就把自己的硬件地址和协议地址填充进去,将发送和接收方的地址互换,然后将操作码改为2,发送回去。


       格外需要留心一点的就是,发送数据的时候需要自己组织整个以太网数据帧。和地址相关的结构体就不能再用前面的struct sockaddr_in{}了,而是struct sockaddr_ll{},如下:

struct sockaddr_ll{ 
    unsigned short sll_family; /* 总是 AF_PACKET */ 
    unsigned short sll_protocol; /* 物理层的协议 */ 
    int sll_ifindex; /* 接口号 */ 
    unsigned short sll_hatype; /* 报头类型 */ 
    unsigned char sll_pkttype; /* 分组类型 */ 
    unsigned char sll_halen; /* 地址长度 */ 
    unsigned char sll_addr[8]; /* 物理层地址 */ 
};

       下面看一个使用原始套接字发送ARP请求的例子:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <errno.h>
#include <sys/socket.h>
#include <sys/ioctl.h>
#include <sys/types.h>
#include <netinet/in.h>
#include <netinet/ip.h>
#include <netinet/if_ether.h>
#include <net/if_arp.h>
#include <netpacket/packet.h>
#include <net/if.h>
#include <net/ethernet.h>

#define BUFLEN 42

int main(int argc,char** argv){
    int skfd,n;
    char buf[BUFLEN]={0};
    struct ether_header *eth;
    struct ether_arp *arp;
    struct sockaddr_ll toaddr;
    struct in_addr targetIP,srcIP;
    struct ifreq ifr;

    unsigned char src_mac[ETH_ALEN]={0};
    unsigned char dst_mac[ETH_ALEN]={0xff,0xff,0xff,0xff,0xff,0xff}; //全网广播ARP请求
    if(3 != argc){
            printf("Usage: %s netdevName dstIP\n",argv[0]);
            exit(1);
    }

    if(0>(skfd=socket(PF_PACKET,SOCK_RAW,htons(ETH_P_ALL)))){
            perror("Create Error");
            exit(1);
    }

    bzero(&toaddr,sizeof(toaddr));
    bzero(&ifr,sizeof(ifr));
    strcpy(ifr.ifr_name,argv[1]);

    //获取接口索引
    if(-1 == ioctl(skfd,SIOCGIFINDEX,&ifr)){
           perror("get dev index error:");
           exit(1);
    }
    toaddr.sll_ifindex = ifr.ifr_ifindex;
    printf("interface Index:%d\n",ifr.ifr_ifindex);
    //获取接口IP地址
    if(-1 == ioctl(skfd,SIOCGIFADDR,&ifr)){
           perror("get IP addr error:");
           exit(1);
    }
    srcIP.s_addr = ((struct sockaddr_in*)&(ifr.ifr_addr))->sin_addr.s_addr;
    printf("IP addr:%s\n",inet_ntoa(((struct sockaddr_in*)&(ifr.ifr_addr))->sin_addr));

    //获取接口的MAC地址
    if(-1 == ioctl(skfd,SIOCGIFHWADDR,&ifr)){
           perror("get dev MAC addr error:");
           exit(1);
    }

    memcpy(src_mac,ifr.ifr_hwaddr.sa_data,ETH_ALEN);
    printf("MAC :%02X-%02X-%02X-%02X-%02X-%02X\n",src_mac[0],src_mac[1],src_mac[2],src_mac[3],src_mac[4],src_mac[5]);


    //开始填充,构造以太头部
    eth=(struct ether_header*)buf;
    memcpy(eth->ether_dhost,dst_mac,ETH_ALEN);  //目的硬件地址,这里是全网广播ARP请求

    memcpy(eth->ether_shost,src_mac,ETH_ALEN);  //源硬件地址
    eth->ether_type = htons(ETHERTYPE_ARP);  //帧类型:0x0800表示是IP报文、0x0806表示RARP协议、0x0806表示ARP协议

    //手动开始填充用ARP报文首部
    arp=(struct arphdr*)(buf+sizeof(struct ether_header));
    arp->arp_hrd = htons(ARPHRD_ETHER); //硬件类型为以太,硬件类型: 1表示以太网。
    arp->arp_pro = htons(ETHERTYPE_IP); //协议类型为IP, 协议类型: 0x0800表示IP地址。和以太头部中帧类型字段相同。

    //硬件地址长度和IPV4地址长度分别是6字节和4字节
    arp->arp_hln = ETH_ALEN;  //硬件地址长度对于以太网中的ARP协议而言为6
    arp->arp_pln = 4; //协议地址长度:对于以太网中的ARP协议而言为4

    //操作码,这里我们发送ARP请求
    arp->arp_op = htons(ARPOP_REQUEST); // 操作码:1表示ARP请求;2表示ARP应答;3表示RARP请求;4表示RARP应答。
      
    //填充发送端的MAC和IP地址
    memcpy(arp->arp_sha,src_mac,ETH_ALEN); //发送方的硬件地址即源硬件地址
    memcpy(arp->arp_spa,&srcIP,4);  //发送发协议地址

    //填充目的端的IP地址,MAC地址不用管,对于一个ARP请求报文来说,除了接收方硬件地址外,其他字段都要填充。
    inet_pton(AF_INET,argv[2],&targetIP); 
    memcpy(arp->arp_tpa,&targetIP,4);//接收方协议地址,即目的端的IP地址;在这里路由器的MAC地址未知,就没有填写。


    toaddr.sll_family = PF_PACKET;
    n=sendto(skfd,buf,BUFLEN,0,(struct sockaddr*)&toaddr,sizeof(toaddr));

    close(skfd);
    return 0;
}
结果如下:



UNIX网络编程——原始套接字的魔力【续】_第2张图片

       可以看到,我向网关(192.168.2.1路由器的IP地址)发送一个ARP查询请求,报文中携带了网关的IP地址以及我本地主机的IP和MAC地址。网关收到该请求后,对我的这个报文进行了回应,将它的MAC地址在ARP应答报文中发给我了。

       在这个示例程序中,我们完全自己手动构造了以太帧头部,并完成了整个ARP请求报文的填充,最后用sendto函数,将我们的数据通过eth0接口发送出去。这个程序的灵活性还在于支持多网卡,使用时只要指定网卡名称(如eth0或eth1),程序便会自动去获取指定接口相应的IP和MAC地址,然后用它们去填充ARP请求报文中对应的各字段。

       在头文件<net/thernet.h>里,主要对以太帧首部进行了封装:

struct ether_header
{
   u_int8_t ether_dhost[ETH_ALEN]; /* destination eth addr */
   u_int8_t ether_shost[ETH_ALEN]; /* source ether addr */
   u_int16_t ether_type; /* packet type ID field */
} __attribute__ ((__packed__));

      在头文件<net/if_arp.h>中,对ARP首部进行了封装:

struct arphdr
{
    unsigned short ar_hrd; /* format of hardware address */
    unsigned short ar_pro; /* format of protocol address */
    unsigned char ar_hln; /* length of hardware address */
    unsigned char ar_pln; /* length of protocol address */
    unsigned short ar_op; /* ARP opcode (command) */
}
       而头文件 <netinet/if_ether.h> 里,又对 ARP 整个报文进行了封装:

struct ether_arp {
    struct arphdr ea_hdr; /* fixed-size 8 bytes header */
    u_int8_t arp_sha[ETH_ALEN]; /* sender hardware address */
    u_int8_t arp_spa[4]; /* sender protocol address */
    u_int8_t arp_tha[ETH_ALEN]; /* target hardware address */
    u_int8_t arp_tpa[4]; /* target protocol address */
};

#define arp_hrd ea_hdr.ar_hrd
#define arp_pro ea_hdr.ar_pro
#define arp_hln ea_hdr.ar_hln
#define arp_pln ea_hdr.ar_pln
#define arp_op ea_hdr.ar_op
 

      最后再看一个简单的接收ARP报文的小程序:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <errno.h>
#include <sys/socket.h>
#include <sys/ioctl.h>
#include <sys/types.h>
#include <netinet/in.h>
#include <netinet/ip.h>
#include <netinet/if_ether.h>
#include <net/if_arp.h>
#include <netpacket/packet.h>
#include <net/if.h>
#define BUFLEN 60

int main(int argc,char** argv){
    int i,skfd,n;
    char buf[ETH_FRAME_LEN]={0};
    struct ethhdr *eth;
    struct ether_arp *arp;
    struct sockaddr_ll fromaddr;
    struct ifreq ifr;

    unsigned char src_mac[ETH_ALEN]={0};

    if(2 != argc){
        printf("Usage: %s netdevName\n",argv[0]);
        exit(1);
    }

    //只接收发给本机的ARP报文
    if(0>(skfd=socket(PF_PACKET,SOCK_RAW,htons(ETH_P_ARP)))){
        perror("Create Error");
        exit(1);
    }

    bzero(&fromaddr,sizeof(fromaddr));
    bzero(&ifr,sizeof(ifr));
    strcpy(ifr.ifr_name,argv[1]);

    //获取接口索引
    if(-1 == ioctl(skfd,SIOCGIFINDEX,&ifr)){
        perror("get dev index error:");
        exit(1);
    }
    fromaddr.sll_ifindex = ifr.ifr_ifindex;
    printf("interface Index:%d\n",ifr.ifr_ifindex);

    //获取接口的MAC地址
    if(-1 == ioctl(skfd,SIOCGIFHWADDR,&ifr)){
        perror("get dev MAC addr error:");
        exit(1);
    }

    memcpy(src_mac,ifr.ifr_hwaddr.sa_data,ETH_ALEN);
    printf("MAC :%02X-%02X-%02X-%02X-%02X-%02X\n",src_mac[0],src_mac[1],src_mac[2],src_mac[3],src_mac[4],src_mac[5]);

    fromaddr.sll_family = PF_PACKET;
    fromaddr.sll_protocol=htons(ETH_P_ARP);
    fromaddr.sll_hatype=ARPHRD_ETHER;
    fromaddr.sll_pkttype=PACKET_HOST;
    fromaddr.sll_halen=ETH_ALEN;
    memcpy(fromaddr.sll_addr,src_mac,ETH_ALEN);

    bind(skfd,(struct sockaddr*)&fromaddr,sizeof(struct sockaddr));

    while(1){
        memset(buf,0,ETH_FRAME_LEN);
        n=recvfrom(skfd,buf,ETH_FRAME_LEN,0,NULL,NULL);
        eth=(struct ethhdr*)buf;
        arp=(struct ether_arp*)(buf+14);

        printf("Dest MAC:");
        for(i=0;i<ETH_ALEN;i++){
            printf("%02X-",eth->h_dest[i]);
        }
        printf("Sender MAC:");
        for(i=0;i<ETH_ALEN;i++){
            printf("%02X-",eth->h_source[i]);
        }

        printf("\n");
        printf("Frame type:%0X\n",ntohs(eth->h_proto));

        if(ntohs(arp->arp_op)==2){
            printf("Get an ARP replay!\n");
        }
    }
    close(skfd);
    return 0;
}
        该示例程序中,调用recvfrom之前我们调用了bind系统调用,目的是仅从指定的接口接收ARP报文(由socket函数的第三个参数“ETH_P_ARP”决定)。可以对比一下,该程序与博文“ UNIX网络编程——原始套接字的魔力【下】 ”里介绍的抓包程序的区别。
                                  
   UNIX网络编程——原始套接字的魔力【续】_第3张图片
        小结:通过这几个章节的热身,相信大家对网络编程中常见的一系列API函数socket、bind、listen、connect、sendto、recvfrom、close等的认识应该会有一个较高的突破。

你可能感兴趣的:(UNIX网络编程——原始套接字的魔力【续】)