今天给大家讲解网络编程中的一个内容——Unix 本地套接字。
发现很多人不知道或者不太了解 Unix 本地套接字这个概念,这也难怪,socket API 原本就是为多台主机之间网络通信设计的,并且这种网络 socket 同样支持单台主机上的进程间通信,当然这样做的话,仍然需要 IP 地址和端口号(通过 loopback 地址 127.0.0.1)。Unix本地套接字,其实就是一种专门用于本地(也就是单个主机上的)网络通信的一种方法,它所用的 API 跟我们之前用的网络 socket API 是一样的。
本文要介绍的 Unix 本地套接字是在 socket 的框架上发展出一种 IPC 机制,即 UNIX Domain Socket,也就是 UNIX 本地套接字,或者称为 UNIX 域套接字。相比于网络 socket 和 IPC,Unix本地套接字有其自身的特点和优势,下面我们就来看一下吧。
虽然在很多教材中经常把Unix本地套接字放在网络编程里面进行讲解,但实际上,这种通信方式更类似于我们之前所学的IPC(进程间通信)的方式,比如无名管道(pipe)、有名管道(mkfifo)。但是,Unix域套接字所提供的控制方式会更多一些,比如说TCP(字节流套接字)提供等待连接的功能,UDP(数据报套接字)提供帧同步功能,同时也是全双工的(比如使用 socketpair 创建的流管道中的两个描述符都是既可读又可写的)。
首先,我们回顾一下,TCP 和 UDP 套接字的服务端和客户端,从 socket 的创建,到连接,到数据传输,再到关闭 socket 的整个流程。
TCP 是一种面向连接的字节流套接字,所以服务端需要通过 listen() 转变为被动 socket,通过 accept() 等待连接。
而对于 UDP 来说,就比较简单了,因为它是一种无连接的数据报套接字,实际上,客户/服务端的概念也弱化了。
前面我们说过,Unix 域套接字所使用的 API 其实跟我们之前用的 socket API 是一样的,并且对于 TCP 和 UDP,其工作流程跟上图的网络 socket 完全一样。
那么,下面我们就来看一下如何通过这些 API 来创建并使用我们的 Unix 本地套接字,以及它们之间有什么区别,然后再通过一个简单的示例程序来体验一下。
首先是 socket 的创建。同样使用 socket() 这个函数。
但是它的第一个参数 domain 不再是 AF_INET
或者 PF_INET
,而是 AF_UNIX
,表示的就是 Unix 域本地套接字。那 AF_LOCAL
又是什么呢?这其实是历史原因造成的,我们的主题是“Unix本地套接字”或者“Unix域套接字”,但实际上我们用是Linux,对吧。那其实,为了消除它对 Unix 操作系统的依赖,在 POSIX 标准中,早就已经将 AF_UNIX
变成 AF_LOCAL
了,但是尽管如此,我们依然习惯使用“Unix域”这个称谓,因此,更推荐大家使用 AF_LOCAL
。
第二个参数的话,跟 Internet 域套接字一样,可以是 SOCK_STREAM
、SOCK_DGRAM
和 SOCK_RAW
,但实际上,几乎没见过使用原始套接字的。所以一般来说 Unix 提供两类套接字,也就是字节流套接字(类似于TCP)和数据报套接字(类似于UDP)。
第三个参数 Protocol,显然,因为第二个参数 type 不是原始套接字,所以 protocol 一般填 0 就可以了。
创建完套接字,接下来就是通过 bind() 函数绑定地址,但对于 Unix 本地套接字来说,绑定的地址就不是原来的“IP地址 + 端口号”了,而是一个有效的路径。
本地套接字的地址结构体 sockaddr_un
的后缀是 _un
,表示 Unix,而不是原来的 sockaddr_in
(Internet)。我们来看一下这个Unix域套接字的地址结构体中包含哪些内容:
Unix 本地套接字的地址结构体中包含两个成员,其中 sun_family 表示协议族,填 AF_LOCAL
或 AF_UNIX
即可;sun_path 表示一个路径名。
从这里面可以很明显得看出 Unix 域套接字与原来的 网络套接字的区别,Unix 域中用于标识客户和服务器的协议地址是普通文件系统中的路径名,而这个文件就称为套接字文件。
这里要强调一下的是,Unix 本地套接字关联的这个路径名应该是一个绝对路径名,而不是一个相对路径名。为什么呢?因为解析相对路径依赖于调用者的当前工作目录,也就是说,要是服务器绑定了一个相对路径名,那么客户端也得在与服务端相同的目录中才能成功调用connect(连接)或者sendto(发送)这样一些函数。显然,这样就会导致程序出现异常情况,所以建议大家最好使用一个绝对路径名。
这个路径名,其实还要分为两种,一种是我们上面所提到的普通路径名,另一种是抽象路径名。普通路径名是一个正常的字符串,也就是说,sun_path
字段是以空字符(’\0’)结尾的。而抽象路径名,sun_path
字段的第一个字节需要设置成 NULL(’\0’),所以在计算抽象路径名的长度的时候就要特别小心了,否则在解析抽象路径名时就有可能出现异常情况,因为抽象路径名不是像解析普通路径名那样,解析到第一个 NULL 就可以停止了。
使用抽象路径名的好处是,因为不会再在文件系统中创建文件了,所以对于抽象路径名来说,就不需要担心与文件系统中已存在的文件产生名字冲突的问题了,也不需要在使用完套接字之后删除附带产生的这个文件了,当套接字被关闭之后会自动删除这个抽象名。
其他的一些 API,比如 listen()、accept()、connect(),以及数据通信用的 read()、write()、recv()、send()、recvfrom()、sendto()、recvmsg()、sendmsg(),用法跟网络 socket 基本一样,主要是地址结构体需要注意一下。
另外,在 Unix 本地套接字的使用中,还经常用到这些 API:
(1)用于创建类似于无名管道(pipe)的本地套接字
int socketpair(int domain, int type, int protocol, int sv[2]);
(2)当不再需要这个 Unix 域套接字时,应删除路径名对应的文件
int unlink(const char *pathname);
int remove(const char *pathname);
注意,如果是抽象路径名,就不需要在使用完本地套接字后手动删除对应的套接字文件,因为当本地套接字被关闭之后,内核会自动删除这个抽象名。
(3)获取本地套接字的地址信息
int getsockname(int sockfd, struct sockaddr *addr, socklen_t *addrlen);
在这个例子中,我们使用绝对路径名”/tmp/unix.str”来实现一个字节流的本地套接字,服务端接收数据,客户端发送数据。
【unixstr_serv.c】
#include
#include
#include
#include
#include
#include
#define UNIXSTR_PATH "/tmp/unix.str"
#define LISTENQ 5
#define BUFFER_SIZE 256
int main(void)
{
int listenfd, connfd;
socklen_t len;
struct sockaddr_un servaddr, cliaddr;
if(-1 == (listenfd = socket(AF_LOCAL, SOCK_STREAM, 0)))
{
perror("socket");
exit(EXIT_FAILURE);
}
unlink(UNIXSTR_PATH);
bzero(&servaddr, sizeof(servaddr));
servaddr.sun_family = AF_LOCAL;
strcpy(servaddr.sun_path, UNIXSTR_PATH);
if(-1 == bind(listenfd, (struct sockaddr *)&servaddr, sizeof(servaddr)))
{
perror("bind");
exit(EXIT_FAILURE);
}
listen(listenfd, LISTENQ);
len = sizeof(cliaddr);
if(-1 == (connfd = accept(listenfd, (struct sockaddr *)&cliaddr, &len)))
{
perror("accept");
exit(EXIT_FAILURE);
}
char buf[BUFFER_SIZE];
while(1)
{
bzero(buf, sizeof(buf));
if(read(connfd, buf, BUFFER_SIZE) == 0) break;
printf("Receive: %s", buf);
}
close(listenfd);
close(connfd);
unlink(UNIXSTR_PATH);
return 0;
}
【unixstr_cli.c】
#include
#include
#include
#include
#include
#include
#define UNIXSTR_PATH "/tmp/unix.str"
#define LISTENQ 5
#define BUFFER_SIZE 256
int main(void)
{
int sockfd;
struct sockaddr_un servaddr;
sockfd = socket(AF_LOCAL, SOCK_STREAM, 0);
bzero(&servaddr, sizeof(servaddr));
servaddr.sun_family = AF_LOCAL;
strcpy(servaddr.sun_path, UNIXSTR_PATH);
connect(sockfd, (struct sockaddr *)&servaddr, sizeof(servaddr));
char buf[BUFFER_SIZE];
while(1)
{
bzero(buf, sizeof(BUFFER_SIZE));
printf(">> ");
if(fgets(buf, BUFFER_SIZE, stdin) == NULL)
{
break;
}
write(sockfd, buf, strlen(buf));
}
close(sockfd);
return 0;
}
有兴趣的童鞋可以自己编译、执行,看看运行效果,我们这里来看一下 /tmp/unix.str 这个文件吧。
rudy@ubuntu12:/tmp$ ls -l unix.str
srwxrwxr-x 1 rudy rudy 0 10月 26 11:58 unix.str
显然,文件类型为“s”,代表套接字文件,也就是 S_IFSOCK 类型。
类似于上面 TCP 的例子,我们使用绝对路径名”/tmp/unix.dg”来实现一个数据报的本地套接字,一端接收数据,一端发送数据。
【unixdg_serv.c】
#include
#include
#include
#include
#include
#include
#define UNIXDG_PATH "/tmp/unix.dg"
#define BUFFER_SIZE 256
int main(void)
{
int sockfd;
struct sockaddr_un servaddr, cliaddr;
sockfd = socket(AF_LOCAL, SOCK_DGRAM, 0);
unlink(UNIXDG_PATH);
bzero(&servaddr, sizeof(servaddr));
servaddr.sun_family = AF_LOCAL;
strcpy(servaddr.sun_path, UNIXDG_PATH);
bind(sockfd, (struct sockaddr *)&servaddr, sizeof(servaddr));
socklen_t len = sizeof(cliaddr);
char buf[BUFFER_SIZE];
while(1)
{
bzero(buf, BUFFER_SIZE);
if(0 == recvfrom(sockfd, buf, BUFFER_SIZE, 0, (struct sockaddr *)&cliaddr, &len))
{
break;
}
printf("recvfrom: %s", buf);
}
close(sockfd);
unlink(UNIXDG_PATH);
return 0;
}
【unixdg_cli.c】
#include
#include
#include
#include
#include
#include
#define UNIXDG_PATH "/tmp/unix.dg"
#define BUFFER_SIZE 256
int main(void)
{
int sockfd;
struct sockaddr_un servaddr, cliaddr;
socklen_t len;
sockfd = socket(AF_LOCAL, SOCK_DGRAM, 0);
/* local address */
bzero(&cliaddr, sizeof(cliaddr));
cliaddr.sun_family = AF_LOCAL;
strcpy(cliaddr.sun_path, UNIXDG_PATH);
bind(sockfd, (struct sockaddr *)&cliaddr, sizeof(cliaddr));
/* remote address */
bzero(&servaddr, sizeof(servaddr));
servaddr.sun_family = AF_LOCAL;
strcpy(servaddr.sun_path, UNIXDG_PATH);
len = sizeof(servaddr);
char buf[BUFFER_SIZE];
while(1)
{
bzero(buf, BUFFER_SIZE);
printf(">> ");
if(fgets(buf, BUFFER_SIZE, stdin) == NULL)
{
break;
}
sendto(sockfd, buf, strlen(buf), 0, (struct sockaddr *)&servaddr, len);
}
close(sockfd);
return 0;
}
需要注意的是,跟网络套接字不一样,对于 Unix 域套接字的 UDP 客户端,必须 bind 一个路径名到 UDP 套接字,以使得 UDP 服务器有发送应答的目的地。
通过上面简单的示例,我们可以看到 Unix 本地套接字跟 Internet 套接字虽然使用相同的 API,但用法上又有些不同,跟IPC(比如管道、消息队列、共享内存等)相比,也有不同。我们可以简单地把 Unix 本地套接字看成是 socket 和管道的混合体。
可以这么说,Unix 本地套接字的优势体现在它所使用的 API 几乎等同于网络 socket(客户/服务器)使用的 API,但是与客户端和服务端都在同一主机上的 TCP 相比,Unix 本地字节流套接字有性能上的优势。在单个主机,使用 Unix 域套接字来替代 Internet 域套接字是有好处的。
最后,总结一下:
(1)Socket 同样可以用于本地通信。
(2)创建套接字时使用本地协议 AF_LOCAL
。
(3)分为流式套接字(SOCK_STREAM
)和数据报套接字(SOCK_DGRAM
) 。
(4)和其他进程间通信方式相比,Unix 本地套接字使用方便,效率也高 。因为它不需要经过网络协议栈、不需要打包拆包、不需要计算校验和、不需要维护序号和应答等、只是将应用层数据从一个进程拷贝到另一个进程……
(5)常用于前后台进程通信,比如 X Window。
(6)另外,Unix 本地套接字可用于传递文件描述符、传递用户凭证等场景。