套接字的秘密—socket与sock

  那么如何把套接字和文件联系起来呢? 答案就是通过下面这张图。

套接字的秘密—socket与sock_第1张图片
image.png

其中 task_struct表示一个进程, files_struct中的 fd_array[]表示该进程打开的所有描述符,对于套接字来说,与其他类型文件的区别就是最终 f_op指向的是 socket_file_ops。不过,可以看到,这里的 socket_file_ops只有一些通用的操作,并没有 sendrecv。特有的操作通过 socketcall() 区分的。

socket和sock

  终于到今天的主角了。实际上,对每一个新创建的套接字,内核协议栈都会创建struct socketstruct sock两个数据结构。这两个结构就像孪生兄弟,struct socket面向用户空间,struct sock面向内核空间。
struct socket简化版的结构如下:

struct socket {
    unsigned long flags;
    const struct proto_ops *ops;
    struct file *file;
    struct sock *sk;
    short type;
 };

  其中type表示协议,这是在创建套接字的时候的protocol参数确定的,

int socket(int domain, int type, int protocol);

  file指针指向上面那张图中的struct file结构,通过它,socket便与文件系统关联了起来。
  sk指向孪生的兄弟sock结构。
  socket结构中最重要的要数ops指针了,根据协议类型,它指向一种特定协议的实现。比如TCP的就是inet_stream_ops; ICMP、UDP协议对应inet_dgram_ops;RAWIP对应的是inet_sockraw_ops同样地,这些也都在创建套接字的时候就决定了。
  struct proto_ops的简化版本的结构如下

struct proto_ops{ int family;
                  int (*bind)(struct socket *sock, struct sockaddr *myaddr, int sockaddr_len);
                  int (*connect)(struct socket *sock,struct sockaddr *vaddr,int sockaddr_len, int flags);
                  int (*accept)(struct socket *sock, struct socket *newsock, int flags);
                  int (*sendmsg)(struct socket *sock, struct msghdr *m, size_t total_len);
}

其中的接口名字是不是很熟悉?是的,它们和进行网络编程时调用的C库中函数名字是一样的。以sendmsg为例,真实的调用过程是这样

套接字的秘密—socket与sock_第2张图片
image.png

即当用户调用 sendmsg时,内核会找到描述符 fd对应的 struct socket结构,然后调用 sock->ops->sendmsg执行特定协议的发送。那么, ops字段什么时候被赋值呢?
  答案是,在创建 struct sock结构前。 struct sock的简化结构如下图所示

struct sock_common {
      struct proto *skc_prot;
};

struct sock {
      struct sock_common __sk_common;
      struct sk_buff_head sk_receive_queue;
      struct sk_buff_head sk_write_queue;
};

其中最重要的字段就是skc_prot,它也是协议相关的。作为struct socket结构的孪生兄弟,struct sock结构也是在用户创建套接字时就创建的。

套接字的秘密—socket与sock_第3张图片
image.png

sock_alloc创建了 struct socket结构,随后,根据用户传入的 family,查询数组 net_families,找到对应的函数指针,调用 create函数。 net_families保存着内核启动时注册(通过 sock_register)的 socket protocol handler,比如以下几种

static const struct net_proto_family inet_family_ops = { 
      .family = PF_INET, 
      .create = inet_create, 
      .owner = THIS_MODULE, 
}; 
static const struct net_proto_family netlink_family_ops = { 
     .family = PF_NETLINK,
     .create = netlink_create,
     .owner = THIS_MODULE, /* for consistency 8) */ 
};
static const struct net_proto_family packet_family_ops = { 
     .family = PF_PACKET, 
     .create = packet_create,
     .owner = THIS_MODULE,
}; 
static const struct net_proto_family unix_family_ops = { 
      .family = PF_UNIX, 
      .create = unix_create, 
      .owner = THIS_MODULE,
};

套接字的秘密—socket与sock_第4张图片
image.png

inetsw中注册的每种协议都有 opsprot两个字段,前者与 struct socket结构关联到一起,后者与 struct sock关联到一起。在 inet_create中, struct socketops字段和 struct socksk_prot字段被赋值。


本文全部内容转载自:套接字的秘密—socket与sock

待整理文章:Linux 网络栈剖析

你可能感兴趣的:(套接字的秘密—socket与sock)