Linux环境下,进程地址空间相互独立,每个进程各自有不同的用户地址空间。任何一个进程的全局变量在另一个进程中都看不到,所以进程和进程之间不能相互访问。
要交换数据必须通过内核,在内核中开辟一块缓冲区,进程1把数据从用户空间拷到内核缓冲区,进程2再从内核缓冲区把数据读走,内核提供的这种机制称为 进程间通信(IPC,InterProcess Communication)。
在进程间完成数据传递需要借助操作系统提供特殊的方法,如:文件、管道、信号、共享内存、消息队列、套接字、命名管道等。随着计算机的蓬勃发展,一些方法由于自身设计缺陷被淘汰或者弃用。
现今常用的进程间通信方式有:
1)管道 (使用最简单)
2)信号 (开销最小)
3)共享映射区 (无血缘关系)
4)本地套接字 (最稳定)
进程间通信方法介绍
管道是一种最基本的IPC机制,作用于 有血缘关系的进程之间,完成数据传递。调用pipe系统函数即可创建一个管道。
有如下特质:
1) 其本质是一个伪文件(实为内核缓冲区)
2)由两个文件描述符引用,一个表示读端,一个表示写端。
3) 规定数据从管道的写端流入管道,从读端流出。
管道的原理: 管道实为内核使用环形队列机制,借助内核缓冲区(4k)实现。
管道的局限性:
1) 数据一旦被读走,便不在管道中存在,不可反复读取。
2) 由于管道采用半双工通信方式。因此,数据只能在一个方向上流动。
3) 只能在有公共祖先的进程间使用管道。
常见的通信方式有,单工通信、半双工通信、全双工通信。
创建管道 int pipe(int pipefd[2]); 成功:0;失败:-1,设置errno
函数调用成功,返回r/w两个文件描述符。无需open,但需手动close。
规定:fd[0] → r; fd[1] → w,就像0对应标准输入,1对应标准输出一样。
向管道文件读写数据其实是在读写内核缓冲区。管道创建成功以后,创建该管道的进程(父进程)同时掌握着管道的读端和写端。
如何实现父子进程间通信呢?
1)父进程调用pipe函数创建管道,得到两个文件描述符fd[0]、fd[1]指向管道的读端和写端。
2)父进程调用fork创建子进程,那么子进程也有两个文件描述符指向同一管道。
3)父进程关闭管道读端,子进程关闭管道写端。父进程可以向管道中写入数据,子进程将管道中的数据读出。由于管道是利用环形队列实现的,数据从写端流入管道,从读端流出,这样就实现了进程间通信。
使用管道需要注意以下4种特殊情况(假设都是阻塞I/O操作,没有设置O_NONBLOCK标志):
1)如果所有指向管道写端的文件描述符都关闭了(管道写端引用计数为0),而仍然有进程从管道的读端读数据,那么管道中剩余的数据都被读取后,再次read会返回0,就像读到文件末尾一样。
2) 如果有指向管道写端的文件描述符没关闭(管道写端引用计数大于0),而持有管道写端的进程也没有向管道中写数据,这时有进程从管道读端读数据,那么管道中剩余的数据都被读取后,再次read会阻塞,直到管道中有数据可读了才读取数据并返回。
3)如果所有指向管道读端的文件描述符都关闭了(管道读端引用计数为0),这时有进程向管道的写端write,那么该进程会收到信号SIGPIPE,通常会导致进程异常终止。当然也可以对SIGPIPE信号实施捕捉,不终止进程。具体方法信号章节详细介绍。
4)如果有指向管道读端的文件描述符没关闭(管道读端引用计数大于0),而持有管道读端的进程也没有从管道中读数据,这时有进程向管道写端写数据,那么在管道被写满时再次write会阻塞,直到管道中有空位置了才写入数据并返回。
总结:
1)读管道:
2)写管道:
练习1:使用管道实现父子进程间通信,完成:
ls | wc -l
。假定父进程实现ls,子进程实现wc?
注意:
- ls命令正常会将结果集写出到stdout,但现在会写入管道的写端;
- wc -l 正常应该从stdin读取数据,但此时会从管道的读端读。
练习2:使用管道实现兄弟进程间通信。 兄:ls 弟: wc -l 父:等待回收子进程?要求,使用“循环创建N个子进程”模型创建兄弟进程,使用循环因子i标示。
注意管道读写行为。
实现思路:父进程关闭读写端,两个子进程,一个关闭管道的读端去写,一个关闭管道的写端去读。
兄弟进程间实现ls | wc -l
兄弟进程实现ps aux | grep bash
测试:是否允许,一个pipe有一个写端多个读端呢?是否允许有一个读端多个写端呢?
可以使用ulimit -a 命令来查看当前系统中创建管道文件所对应的内核缓冲区大小。
通常为:
也可以使用fpathconf函数,借助参数选项来查看。
FIFO常被称为有名管道,以区分管道(pipe)。
FIFO是Linux基础文件类型中的一种。但FIFO文件在磁盘上没有数据块,仅仅用来标识内核中一条通道。各进程可以打开这个文件进行read/write,实际上是在读写内核通道,这样就实现了进程间通信。
创建方式:
int mkfifo(const char *pathname, mode_t mode); 成功:0; 失败:-1
一旦使用mkfifo创建了一个FIFO,就可以使用open打开它,常见的文件I/O函数都可用于fifo,如:close、read、write、unlink等。
注意:
Opening the read or write end of a FIFO blocks until the other end is also opened (by another process or thread). See fifo(7) for further details.
open注意事项,打开fifo文件的时候,read端会阻塞等待write端open,write端同理,也会阻塞等待另外一端打开。
(1)文件进程间通信
使用文件也可以完成IPC,理论依据是,fork后,父子进程共享文件描述符,也就共享打开的文件。
(2)存储映射IO
存储映射I/O (Memory-mapped I/O) 使一个磁盘文件与存储空间中的一个缓冲区相映射。于是当从缓冲区中取数据,就相当于读文件中的相应字节。于此类似,将数据存入缓冲区,则相应的字节就自动写入文件。这样,就可在不适用read和write函数的情况下,使用地址(指针)完成I/O操作。
使用这种方法,首先应通知内核,将一个指定文件映射到存储区域中。这个映射工作可以通过mmap函数来实现。
参数:
同malloc函数申请内存空间类似的,mmap建立的映射区在使用结束后也应调用类似free的函数来释放。
执行结果:
执行map.c之前,mem.txt大小为30,代码中 ftruncate(fd,8);
将文件截断为8个字节大小,共享映射为20个字节,虽然文件大小(8) < 映射区大小(20),映射区可以存储helloworld(10),同时修改文件mem.txt内容。
借鉴malloc和free函数原型,尝试装自定义函数smalloc,sfree来完成映射区的建立和释放。思考函数接口该如何设计?
总结:使用mmap时务必注意以下事项:
父子等有血缘关系的进程之间也可以通过mmap建立的映射区来完成数据通信。但相应的要在创建映射区的时候指定对应的标志位参数flags:
练习:父进程创建映射区,然后fork子进程,子进程修改映射区内容,而后,父进程读取映射区内容,查验是否共享。
结论:
父子进程共享:1. 打开的文件 2. mmap建立的映射区(但必须要使用MAP_SHARED)
通过使用我们发现,使用映射区来完成文件读写操作十分方便,父子进程间通信也较容易。但缺陷是,每次创建映射区一定要依赖一个文件才能实现。通常为了建立映射区要open一个temp文件,创建好了再unlink、close掉,比较麻烦。
可以直接使用匿名映射来代替。其实Linux系统给我们提供了创建匿名映射区的方法,无需依赖一个文件即可创建映射区。同样需要借助标志位参数flags来指定。
使用MAP_ANONYMOUS (或MAP_ANON), 如:
int *p = mmap(NULL, 4, PROT_READ|PROT_WRITE, MAP_SHARED|MAP_ANONYMOUS, -1, 0);
需注意的是,MAP_ANONYMOUS和MAP_ANON这两个宏是Linux操作系统特有的宏。在类Unix系统中如无该宏定义,可使用如下两步来完成匿名映射区的建立。
1)fd = open("/dev/zero", O_RDWR);
2)p = mmap(NULL, size, PROT_READ|PROT_WRITE, MMAP_SHARED, fd, 0);
实质上mmap是内核借助文件帮我们创建了一个映射区,多个进程之间利用该映射区完成数据传递。由于内核空间多进程共享,因此无血缘关系的进程间也可以使用mmap来完成通信。只要设置相应的标志位参数flags即可。若想实现共享,当然应该使用MAP_SHARED了。
1 #include <stdio.h>
2 #include <unistd.h>
3 #include <sys/types.h>
4 #include <fcntl.h>
5 #include <sys/mman.h>
6 #include <stdlib.h>
7 #include <string.h>
8 #include <sys/stat.h>
9 #include <wait.h>
10 int main(int argc, char *argv[])
11 {
12 //拷贝文件起的进程数,通过参数输入,默认是5个
13 int n = 5;
14 //输入参数至少是3,第4个参数是进程个数
15 if (argc < 3)
16 {
17 printf("./a.out src dst [n]\n");
18 return -1;
19 }
20 if (argc == 4)
21 {
22 n = atoi(argv[3]);
23 }
24
25 //打开源文件
26 int srcfd = open(argv[1], O_RDONLY);
27 if (srcfd < 0)
28 {
29 perror("open src err:");
30 exit(1);
31 }
32
33 //打开目标文件
34 int dstfd = open(argv[2], O_RDWR|O_CREAT|O_TRUNC, 0644);
35 if (dstfd < 0)
36 {
37 perror("open dst err:");
38 exit(1);
39 }
40
41 //目标拓展,从源文件获得文件大小,stat
42 struct stat sb;
43 stat(argv[1], &sb);
44 //将目标文件设置为和源文件大小相同
45 int len = sb.st_size;
46 truncate(argv[2], len);
47
48 //将源文件映射到缓冲区
49 char *psrc = mmap(NULL, len, PROT_READ, MAP_SHARED, srcfd, 0);
50 if (psrc == MAP_FAILED)
51 {
52 perror("mmap src err:");
53 exit(1);
54 }
55
56 //将目标文件映射
57 char *pdst = mmap(NULL, len, PROT_READ|PROT_WRITE,
MAP_SHARED, dstfd, 0);
58 if (pdst == MAP_FAILED)
59 {
60 perror("mmap pdst err:");
61 exit(1);
62 }
63 //创建多个子进程
64 int i = 0;
65 for (i = 0; i < n; i++)
66 {
67 if (fork() == 0)
68 {
69 break;
70 }
71 }
72 //计算子进程需要拷贝的起点大小
73 int cpsize = len/n;
74 int mod = len%n;
75 //数据拷贝,memcpy
76 if (i < n)
77 {
78 //最后一个子进程
79 if (i == n-1)
80 {
81 memcpy(pdst+i*cpsize, psrc+i*cpsize, cpsize+mod);
82 }
83 else
84 {
85 memcpy(pdst+i*cpsize, psrc+i*cpsize, cpsize);
86 }
87 }
88 else
89 {
90 for (i = 0; i < n; i++)
91 {
92 //回收子线程
93 wait(NULL);
94 }
95 }
96 //释放映射区
97 if (munmap(psrc, len) < 0)
98 {
99 perror("munmap src err:");
100 exit(1);
101 }
102
103 if (munmap(pdst, len) < 0)
104 {
105 perror("munmap dst err:");
106 exit(1);
107 }
108
109 //关闭文件
110 close(srcfd);
111 close(dstfd);
112
113 return 0;
114 }