进程间通信(IPC) 分为 PIPE(管道)、Socket(套接字) 和 XSI(System V)。XSI 又分为 msg(消息队列)、sem(信号量数组) 和 shm(共享内存)。
这些手段都是用于进程间通讯的,只有进程间通讯才需要借助第三方机制,线程之间的通讯是不需要借助第三方机制的,因为线程之间的地址空间是共享的。
管道分为命名管道(FIFO)和匿名管道(PIPE),无论是哪种管道,都是由内核帮你创建和维护的,有以下特点:
pipe(2) 函数
pipe - create pipe
#include
int pipe(int pipefd[2]);
pipe(2) 用于创建管道,pipefd 是一个数组,表示管道的两端文件描述符,pipefd[0] 端作为读端,pipefd[1] 端作为写端。
pipe(2) 产生的是匿名管道,在磁盘的任何位置上找不到这个管道文件,而且匿名管道只能用于具有亲缘关系的进程之间通信。
一般情况有亲缘关系的进程之间使用管道进行通信时,会把自己不用的一端文件描述符关闭。
下面是创建匿名管道在父子进程之间传送了一个字符串“Hello”的小栗子。
#include
#include
#include
#include
#include
#define BUFSIZE 1024
int main()
{
int pd[2];
char buf[BUFSIZE];
pid_t pid;
int len;
// 创建匿名管道
if (pipe(pd) < 0) {
perror("pipe()");
exit(1);
}
// 创建子进程
pid = fork();
if (pid < 0) {
perror("fork()");
exit(1);
}
if (pid == 0) { // 子进程 读取管道数据
// 关闭写端
close(pd[1]);
// 从管道中读取数据,如果子进程比父进程先被调度会阻塞等待数据写入
len = read(pd[0],buf,BUFSIZE);
puts(buf);
/* 管道是 fork(2) 之前创建的,
* 父子进程里都有一份,
* 所以退出之前要确保管道两端都关闭
*/
close(pd[0]);
exit(0);
} else { // 父进程 向管道写入数据
close(pd[0]);
write(pd[1],"Hello!",6);
close(pd[1]);
wait(NULL);
exit(0);
}
}
在上面的栗子中,父进程创建了一个匿名管道,在 pd[2] 数组中凑齐了读写双方,子进程同样继承了具有读写双方的数组 pd[2]。
父进程先关闭管道的读端然后向管道中写入数据,然后将用完的写端也关闭,等待子进程消亡并为其收尸。
子进程先关闭管道的写端然后读取父进程写入管道的字符串,把它打印到控制台之后再关闭用完的读端,然后退出。
这个程序在 fork(2) 之后如果是子进程先运行,那么会阻塞在 read(2) 阶段,等待父进程被调度并向管道中写入数据。
如果在 fork(2) 之后是父进程先运行,那么父进程会阻塞在 wait(2) 阶段等待子进程运行结束。
所以无论是谁先运行,只要没有出现异常运行的结果都是我们预期之内的。
mkfifo(3) 函数
mkfifo - make a FIFO special file (a named pipe)
#include
#include
int mkfifo(const char *pathname, mode_t mode);
mkfifo(3) 函数用于创建命名管道,作用与匿名管道相同,不过可以在不同的进程之间使用,相当于对一个普通文件进行读写操作就可以了。
这个管道文件是任何有权限的进程都可以使用的,两端都像操作一个普通文件一样对它进行打开、读写、关闭动作就可以了,只要一端写入数据另一端就可以读出来。
但是最好一端只读一端只写,否则在实际项目中你很难保证拿出的不是脏数据(自己写进去数据的混合着另一端写进去的数据被其中一端读了出来),除非像下面那个栗子那样结构简单清晰。
参数列表:
pathname:管道文件的路径和文件名。
mode:创建管道文件的权限。老规矩,传入的 mode 值要与系统的 umask 值做运算:(mode & ~umask)
返回值:成功返回 0,失败返回 -1 并设置 errno。
我们看下面的栗子是如何使用命名管道通讯的:
#include
#include
#include
#include
#include
#include
#define PATHNAME "/tmp/myfifo"
int main (void)
{
pid_t pid;
int fd = -1;
char buf[BUFSIZ] = "";
// 创建一个命名管道,大家可以用 ls -l 命令查看这个管道文件的属性
if (mkfifo(PATHNAME, 0644) < 0) {
perror("mkfifo()");
exit(1);
}
fflush(NULL);
pid = fork();
if (pid < 0) {
perror("fork()");
exit(1);
}
if (!pid) { // parent
pid = fork();
if (pid < 0) {
perror("fork()");
exit(1);
}
if (!pid) { // parent
// 两个子进程都创建完之后父进程直接退出,使两个子进程不具有亲缘关系。
exit(0);
}
/* child 2 */
/* 像操作普通文件一样对这个管道进行 open(2)、read(2)、write(2)、close(2) */
fd = open(PATHNAME, O_RDWR);
if (fd < 0) {
perror("open()");
exit(1);
}
read(fd, buf, BUFSIZ);
printf("%s", buf);
write(fd, " World!", 8);
close(fd);
exit(0);
} else { // child 1
fd = open(PATHNAME, O_RDWR);
if (fd < 0) {
perror("open()");
exit(1);
}
write(fd, "Hello", 6);
sleep(1); // 刚写完管道不要马上读,等第二个进程读取完并且写入新数据之后再读。
read(fd, buf, BUFSIZ);
close(fd);
puts(buf);
// 肯定是这个进程最后退出,所以把管道文件删除,不然下次再创建的时候会报文件已存在的错误
remove(PATHNAME);
exit(0);
}
return 0;
}
父进程首先在磁盘上创建一个命名管道文件,然后创建两个子进程后退出。每个子进程都对管道文件进行一次读和一次写的动作,然后子进程退出,整个过程就结束了。
第一个子进程在写完管道之后要先休眠,等待第二个子进程从管道的另一端把数据读入并写入新的数据,第一个子进程再醒来读出管道的内容。如果第一个子进程不休眠而是在写完之后马上读管道,很可能在它写完管道之后第二个子进程还没来得及调度,它自己就又把管道里的数据读出来了,这样不仅读出来的不是第二个子进程写入的数据,还会导致第二个子进程永远阻塞在 read(2) 阶段,因为管道中不会再有数据写入。
协同进程
主要是说管道是半双工的,两个进程一个只能对它读,另一个只能对它写,否则会出现脏数据,也就是无法区分出读出来的数据是来自于自己的还是来自于另一个进程的。
如果想要实现双工,必须采用两个管道,一个进程对一个管道只读,对另一个管道只写。
明白了这个原理,可以利用上面的 pipe(2) 或 mkfifo(3) 函数利用两个半双工管道实现进程之间的全双工通讯。
消息队列可以让通信双方传送结构体数据,这样也提高了传送数据的灵活性。
既然是通讯,那么在通信之前就要先在通信双方约定通信协议,协议就是通信双方约定的数据交换格式。
从消息队列开始一直到 Socket,我们都会看到比较类似的程序架构,因为无论是消息队列还是 Socket,它们都需要约定通信协议,而且都是按照一定的步骤才能实现通讯。
消息队列在约定协议的时候,在我们自己定义的结构体里要强制添加一个 long mtype 成员。这个成员的作用是用于区分多种消息类型中的不同类型的数据包,当只有一种类型的包时这个成员没什么用,但是也必须得带上。
既然是通讯,就要区分主动端(先发包的一方)和被动端(先收包的一方,先运行),它们运行的时机不同,作用不同,甚至调用的函数也不同,所以后面的每个例子几乎都要编译出 2 个不同的可执行程序来测试。
msg、sem 和 shm 都有一系列函数遵循下面的命名规则:
xxxget() // 创建
xxxop() // 相关操作
xxxctl() // 其它的控制或销毁
消息队列的创建函数:msgget(2)
msgget - get a System V message queue identifier
#include
#include
#include
int msgget(key_t key, int msgflg);
msgget(2) 函数的作用是创建一个消息队列,消息队列是双工的,两边都可以读写。
参数列表:
key 相当于通信双方的街头暗号,拥有相同 key 的双方才可以通信。
key 值必须是唯一的,系统中有个 ftok(3) 函数可以用于获取 key,通过文件 inode 和 salt 进行 hash 运算来生成唯一的 key,只要两个进程使用相同的文件和 salt 就可以生成一样的 key 值了。
msgflg:特殊要求。无论有多少特殊要求,只要使用了 IPC_CREAT,就必须按位或一个权限,权限也不是你想指定多大就能多大的,还是老规矩,要用它 &= ~umask,前面提到过。
同一个消息队列只需要创建一次,所以谁先运行起来谁有责任创建消息队列,后运行起来的就不需要创建了。
同理,对于后启动的进程来说,消息队列不是它创建的,那么它也没有必要销毁了。
msgrcv(2) 函数和 msgsnd(2) 函数
msgrcv, msgsnd - message operations
#include
#include
#include
int msgsnd(int msqid, const void *msgp, size_t msgsz, int msgflg);
ssize_t msgrcv(int msqid, void *msgp, size_t msgsz, long msgtyp,
int msgflg);
/* msgp 成员的定义要类似 msgbuf 这个结构体,第一个成员必须是 long 类型的 mtype,并且必须是 > 0 的值 */
struct msgbuf {
long mtype; /* 消息类型,必须 > 0 */
char mtext[1]; /* 消息数据字段 */
};
msgrcv(2) 函数从 msgid 这个消息队列中接收数据,并将接收到的数据放到 msgp 结构体中,这段空间有 msgz 个字节大小,msgz 的值要减掉强制的成员 mtype 的大小(sizeof(long))。
msgtyp 是 msgp 结构体中的 mtype 成员,表示要接收哪种类型的消息。虽然 msg 是消息队列,但是它并不完全遵循队列的形式,可以让接收者挑消息接收。如果不挑消息可以填写 0,这样就按照队列中的消息顺序返回。
msfglg 是特殊要求位图,没有写0。
msgsnd(2) 函数向 msgid 这个消息队列发送 msgp 结构体数据,msgp 的大小是 msgsz,msgflg 是特殊要求,没有特殊要求可以写 0。
msgctl(2) 函数
msgctl - message control operations
#include
#include
#include
int msgctl(int msqid, int cmd, struct msqid_ds *buf);
msgctl(2) 函数跟 iocrtl(2)、fcntl(2) 这种函数的用法类似。通过 cmd 指定具体的命令,然后通过 buf 为 cmd 命令设定参数,当然有些命令是需要参数的,有些命令则不需要参数。
最常用的 cmd 就是 IPC_RMID,表示删除(结束)某个 IPC 通信,并且这个命令不需要 buf 参数,直接传入 NULL 即可。
buf 结构体里面的成员很多,由于 cmd 一般只有 IPC_RMID 比较常用,所以就不把 buf 结构体拿出来挨个成员解释了,具体内容自行查阅 man 手册。
看下面的例子,在两个进程之间实现简单的通讯。
/* proto.h 定义双方都需要使用的数据或对象 */
#ifndef PROTO_H__
#define PROTO_H__
#define NAMESIZE 32
/* 通讯双方生成 key 值共同使用的文件 */
#define KEYPATH "/tmp/out"
/* 通讯双方生成 key 值共同使用的 salt 值 */
#define KEYPROJ 'a'
/* 消息类型,只要是大于 0 的合法整数即可 */
#define MSGTYPE 10
/* 通讯双方约定的协议 */
struct msg_st
{
long mtype;
char name[NAMESIZE];
int math;
int chinese;
};
#endif
/******************** rcver.c 接收方 ********************/
#include
#include
#include
#include
#include
#include "proto.h"
int main()
{
key_t key;
int msgid;
struct msg_st rbuf;
// 通过 /tmp/out 文件和字符 'a' 生成唯一的 key,注意文件必须是真实存在的
key = ftok(KEYPATH,KEYPROJ);
if (key < 0) {
perror("ftok()");
exit(1);
}
// 接收端应该先启动,所以消息队列由接收端创建
msgid = msgget(key,IPC_CREAT|0600);
if (msgid < 0) {
perror("msgget()");
exit(1);
}
// 不停的接收消息
while(1) {
// 没有消息的时候会阻塞等待
if (msgrcv(msgid, &rbuf, sizeof(rbuf)-sizeof(long), 0, 0) < 0) {
perror("msgrcv");
exit(1);
}
/* 用结构体中强制添加的成员判断消息类型,
* 当然在这个例子中只有一种消息类型,所以不判断也可以。
* 如果包含多种消息类型这里可以写一组 switch...case 结构
*/
if (rbuf.mtype == MSGTYPE) {
printf("Name = %s\n",rbuf.name);
printf("Math = %d\n",rbuf.math);
printf("Chinese = %d\n",rbuf.chinese);
}
}
/* 谁创建谁销毁。
* 当然这个程序是无法正常结束的,只能通过信号杀死。
* 使用信号杀死之后大家可以用 ipcs(1) 命令查看一下,消息队列应该是没有被销毁的,
* 大家可以使用上面我们提到的 ipcrm(1) 命令把它删掉。
*/
msgctl(msgid, IPC_RMID, NULL);
exit(0);
}
/******************** snder.c 发送方 ********************/
#include
#include
#include
#include
#include
#include
#include
#include
#include "proto.h"
int main()
{
key_t key;
int msgid;
struct msg_st sbuf;
// 设置随机数种子
srand(time(NULL));
// 用与接收方相同的文件和 salt 生成一样的key,这样才可以通讯
key = ftok(KEYPATH,KEYPROJ);
if (key < 0) {
perror("ftok()");
exit(1);
}
// 取得消息队列
msgid = msgget(key,0);
if (msgid < 0) {
perror("msgget()");
exit(1);
}
// 为要发送的结构体赋值
sbuf.mtype = MSGTYPE;
strcpy(sbuf.name,"Alan");
sbuf.math = rand()%100;
sbuf.chinese = rand()%100;
// 发送结构体
if (msgsnd(msgid, &sbuf, sizeof(sbuf)-sizeof(long), 0) < 0) {
perror("msgsnd()");
exit(1);
}
puts("ok!");
// 消息队列不是发送方创建的,所以发送方不用负责销毁
exit(0);
}
这段程序的源文件有三个:proto.h、rcver.c 和 snder.c。
proto.h 中的 KEYPROJ (salt 值)用一个字符来替代整形数,为什么不直接写数字呢?因为宏定义是没有数据类型的,没有单位的数字是不靠谱的,而字符的 ASCII 码一定是一个 0-255 之间的整形数。
接收方要先运行,所以由接收方创建消息队列。发送方要使用相同的文件和 salt 生成与接收方相同的 key 值,这样它们才能使用同一个消息队列。
发送方生成一个结构体,用随机数为结构体中的两个成员赋值,分别模拟学生的数学和语文成绩,接收方在接收到数据之后把每个成员解析出来,并打印到控制台上。
可以看出来,发送方和接收方必须使用相同的结构体才能保证数据能够正常被解析,所以这个结构体就是我们上面所说的“协议”。既然是协议,我们就要把它定义在一个公用的结构体(proto.h)中,让发送方和接收方都引用这个头文件,这样就能保证它们可以使用相同的结构体通讯了。
semget - get a semaphore set identifier
#include
#include
#include
int semget(key_t key, int nsems, int semflg);
semget(2) 函数用于创建信号量。
成功返回 sem ID,失败返回 -1 并设置 errno。
参数列表:
key:具有亲缘关系的进程之间可以使用一个匿名的 key 值,key 使用宏 IPC_PRIVATE 即可。
nsems:表示到底有多少个 sem。信号量实际上是一个计数器,所以如果设置为 1 可以用来模拟互斥量。
semflg:IPC_CREAT 表示创建 sem,同时需要按位或一个权限,如果是匿名 IPC 则无需指定这个宏,直接给权限就行了。
semctl (2)
semctl - semaphore control operations
#include
#include
#include
int semctl(int semid, int semnum, int cmd, ...);
semctl(2) 函数用来控制或销毁信号量。
参数列表:
semnum:信号量素组下标;
cmd:可选的宏参见《APUE》第三版 P457。常用的有 IPC_RMID,表示从系统中删除该信号量集合。SETVAL 可以为第几个成员设置值。关于这两个宏的用法,我们在下面的例子中会见到。
…:根据不同的命令设置不同的参数,所以后面的参数是变长的。
semop(2)
semop - semaphore operations
#include
#include
#include
int semop(int semid, struct sembuf *sops, unsigned nsops);
struct sembuf {
unsigned short sem_num; /* 对第几个资源(数组下标)操作 */
short sem_op; /* 取几个资源写负数几(不要写减等于),归还几个资源就写正数几 */
short sem_flg; /* 特殊要求 */
};
这个函数用来操作信号量,由于多个信号量可以组成数组,所以我们又看到了熟悉的函数定义方式,一个参数作为数组的起始位置,另一个参数指定数组的长度。
参数列表:
sops:结构体数组起始位置;
nsops:结构体数组长度;
返回值:成功返回0,失败返回-1并设置 errno。
前面说了,信号量实际上就是计数器,所以每次在使用资源之前,我们需要扣减信号量,当信号量被减到 0 时会阻塞等待。每次使用完成资源之后,需要归还信号量,也就是增加信号量的数值。
下面我们使用上面操作信号量的函数实现一个通过信号量实现互斥量的栗子。大家还记得以前我们写的用 20 个进程同时向一个文件中写入累加的数值吗?还是这个程序,这次使用信号量来实现它们之间的互斥效果。
#include
#include
#include
#include
#include
#include
#include
#include
#include
#define PROCNUM 20
#define FNAME "/tmp/out"
#define BUFSIZE 1024
// 多个函数都要使用这个信号量 ID,所以定义为全局变量
static int semid;
static void P(void)
{
struct sembuf op;
op.sem_num = 0; // 只有一个资源,所以数组下标是 0
op.sem_op = -1; // 取一个资源就减1
op.sem_flg = 0; // 没有特殊要求
while (semop(semid,&op,1) < 0) {
// 出现假错就重试
if (errno != EINTR && errno != EAGAIN) {
perror("semop()");
exit(1);
}
}
}
static void V(void)
{
struct sembuf op;
op.sem_num = 0;
op.sem_op = 1; // 归还一个资源
op.sem_flg = 0;
while (semop(semid,&op,1) < 0)
{
if (errno != EINTR && errno != EAGAIN) {
perror("semop()");
exit(1);
}
}
}
static void func_add()
{
FILE *fp;
char buf[BUFSIZE];
fp = fopen(FNAME,"r+");
if (fp == NULL) {
perror("fopen()");
exit(1);
}
// 先取得信号量在操作文件,取不到就阻塞等待,避免发生竞争
P();
fgets(buf,BUFSIZE,fp);
rewind(fp);
sleep(1); // 调试用,为了放大竞争,更容易看出来互斥量发挥了作用
fprintf(fp,"%d\n",atoi(buf)+1);
fflush(fp);
// 操作结束之后归还信号量,让其它进程可以取得信号量
V();
fclose(fp);
return ;
}
int main()
{
int i;
pid_t pid;
// 在具有亲缘关系的进程之间使用,所以设置为 IPC_PRIVATE 即可。
// 另外想要实现互斥量的效果,所以信号量数量设置为 1 个即可。
semid = semget(IPC_PRIVATE,1,0600);
if (semid < 0) {
perror("semget()");
exit(1);
}
// 将 union semun.val 的值设置为 1
if (semctl(semid,0,SETVAL,1) < 0) {
perror("semctl()");
exit(1);
}
// 创建 20 个子进程
for (i = 0 ; i < PROCNUM ; i++) {
pid = fork();
if(pid < 0)
{
perror("fork()");
exit(1);
}
if(pid == 0) // child
{
func_add();
exit(0);
}
}
for (i = 0; i < PROCNUM; i++)
wait(NULL);
// 销毁信号量
semctl(semid, 0, IPC_RMID);
exit(0);
}
类似于之前在《高级 IO》部分,我们利用 mmap(2) 函数实现的共享内存,这次我们使用的是 XSI 的共享内存,比使用 mmap(2) 实现的共享内存稍微麻烦一点。
第一个函数是 shmget(2),看一下它的函数原型:
shmget - allocates a shared memory segment
#include
#include
int shmget(key_t key, size_t size, int shmflg);
参数列表:
key:共享内存的唯一标识,具有亲缘关系的进程之间使用共享内存可以使用 IPC_PRIVATE 宏代替。
size:是共享内存的大小。
shmflg:IPC_CREAT 表示创建 shm,同时需要按位或一个权限,如果是匿名 IPC 则无需指定这个宏,直接给权限就行了。
返回值:成功返回 shm ID;失败返回 -1,man 手册里没说是否设置 errno,这个需要大家根据自己的环境测试一下,或者查阅自己环境下的 man 手册。
shmat(2) 函数和 shmdt(2) 函数
shmat - shared memory operations
#include
#include
void *shmat(int shmid, const void *shmaddr, int shmflg);
int shmdt(const void *shmaddr);
虽然函数名叫做 shmat,根据上面说过的约定,用 man 手册查 shmap 也可以查到这个命令。
shmat(2) 函数使进程与共享内存关联起来。
shmat(2)函数中的 shmaddr 参数是共享内存的起始地址,传入 NULL 由内核帮我们寻找合适的地址,一般情况下传入 NULL 值。
shmdt(2) 函数用于使进程分离共享内存,共享内存使用完毕之后需要用这个函数分离。分离不带表释放了这块空间,使用共享内存的双方依然要遵守“谁申请,谁释放”的原则,所以没有申请的一方是不需要释放的,但是双方都需要分离。
shmctl(2)
shmctl - shared memory control
#include
#include
int shmctl(int shmid, int cmd, struct shmid_ds *buf);
与消息队列和信号量一样,这个函数用于控制或删除共享内存,cmd 参数设置为 IPC_RMID 并且 buf 参数设置为 NULL 就可以删除共享内存了。
共享内存实现进程间通讯
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
// 申请的共享内存大小,单位是字节
#define MEMSIZE 1024
int main()
{
char *str;
pid_t pid;
int shmid;
// 有亲缘关系的进程 key 参数可以使用 IPC_PRIVATE 宏,并且创建共享内存 shmflg 参数不需要使用 IPC_CREAT 宏
shmid = shmget(IPC_PRIVATE,MEMSIZE,0600);
if (shmid < 0) {
perror("shmget()");
exit(1);
}
pid = fork();
if (pid < 0) {
perror("fork()");
exit(1);
}
if (pid == 0) // 子进程
{
// 关联共享内存
str = shmat(shmid,NULL,0);
if (str == (void *)-1) {
perror("shmat()");
exit(1);
}
// 向共享内存写入数据
strcpy(str,"Hello!");
// 分离共享内存
shmdt(str);
// 无需释放共享内存
exit(0);
}
else // 父进程
{
// 等待子进程结束再运行,因为需要读取子进程写入共享内存的数据
wait(NULL);
// 关联共享内存
str = shmat(shmid,NULL,0);
if (str == (void *)-1) {
perror("shmat()");
exit(1);
}
// 直接把共享内存中的数据打印出来
puts(str);
// 分离共享内存
shmdt(str);
// 释放共享内存
shmctl(shmid,IPC_RMID,NULL);
exit(0);
}
exit(0);
}
最后父进程要在父子进程用完共享内存之后调用 shmctl(2) 使用 IPC_RMID 宏来回收资源,参数为 NULL。