管道是Linux中很重要的一种通信方式,是把一个程序的输出直接连接到另一个程序的输入。常说的管道多是指无名管道,
无名管道只能用于具有亲缘关系的进程之间,这是它与有名管道的最大区别。
有名管道叫named pipe或者FIFO(先进先出),可以用函数mkfifo()创建。
Linux管道的实现机制
在Linux中,管道是一种使用非常频繁的通信机制。从本质上说,管道也是一种文件,但它又和一般的文件有所不同,管道可以克服使用文件进行通信的两个问题,具体表现为:
· 限制管道的大小。实际上,管道是一个固定大小的缓冲区。在Linux中,该缓冲区的大小为1页,即
4K字节,使得它的大小不象文件那样不加检验地增长。使用单个固定缓冲区也会带来问题,比如:
在写管道时可能变满,当这种情况发生时,
随后对管道的write()调用将默认地被阻塞,等待某些数据被读取,以便腾出足够的空间供write()调用写。
· 读取进程也可能工作得比写进程快。当所有当前进程数据已被读取时,
管道变空。当这种情况发生时,
一个随后的read()调用将默认地被阻塞,等待某些数据被写入,这解决了read()调用返回文件结束的问题。
注意:
从管道读数据是一次性操作,数据一旦被读,它就从管道中被抛弃,释放空间以便写更多的数据。
1. 管道的结构
在 Linux 中,管道的实现并没有使用专门的数据结构,而是借助了文件系统的file结构和VFS的索引节点inode。通过将两个 file 结构指向同一个临时的 VFS 索引节点,而这个 VFS 索引节点又指向一个物理页面而实现的。
2.管道的读写
管道实现的源代码在fs/pipe.c中,在pipe.c中有很多函数,其中有两个函数比较重要,即管道读函数pipe_read()和管道写函数 pipe_wrtie()。管道写函数通过将字节复制到 VFS 索引节点指向的物理内存而写入数据,而管道读函数则通过复制物理内存中的字节而读出数据。当然,
内核必须利用一定的机制同步对管道的访问,为此,内核使用 了锁、等待队列和信号。
当写进程向管道中写入时,它利用标准的库函数write(),系统根据库函数传递的文件描述符,可找到该文件的 file 结构。file 结构中指定了用来进行写操作的函数(即写入函数)地址。于是,内核调用该函数完成写操作。写入函数在向内存中写入数据之前,必须首先检查 VFS 索引节点中的信息,同时满足如下条件时,才能进行实际的内存复制工作:
·内存中有足够的空间可容纳所有要写入的数据;
·内存没有被读程序锁定。
如 果同时满足上述条件,写入函数首先锁定内存,然后从写进程的地址空间中复制数据到内存。否则,写入进程就休眠在 VFS 索引节点的等待队列中,接下来,内核将调用调度程序,而调度程序会选择其他进程运行。
写入进程实际处于可中断的等待状态,当内存中有足够的空间可以容纳写 入数据,或内存被解锁时,读取进程会唤醒写入进程,这时,写入进程将接收到信号。当数据写入内存之后,内存被解锁,而所有休眠在索引节点的读取进程会被唤醒。
管道的读取过程和写入过程类似。但是,进程可以在没有数据或内存被锁定时立即返回错误信息,而不是阻塞该进程,这依赖于文件或管道的打开模式。反之,进程可以休眠在索引节点的等待队列中等待写入进程写入数据。当所有的进程完成了管道操作之后,管道的索引节点被丢弃,而共享数据页也被释放。
因为管道的实现涉及很多文件的操作,因此,当读者学完有关文件系统的内容后来读pipe.c中的代码,你会觉得并不难理解。
Linux 管道的创建和使用都要简单一些,唯一的原因是它需要更少的参数。实现与 Windows 相同的管道创建目标,Linux 和 UNIX 使用下面的代码片段:
int fd1[2];
if(pipe(fd1))
{ printf("pipe() FAILED: errno=%d",errno);
return 1;
}
Linux 管道对阻塞之前一次写操作的大小有限制。 专门为每个管道所使用的内核级缓冲区确切为 4096 字节。 除非阅读器清空管道,否则一次超过 4K 的写操作将被阻塞。 实际上这算不上什么限制,因为读和写操作是在不同的线程中实现的。
Linux 还支持命名管道。对这些数字的早期评论员建议我,为公平起见,应该比较 Linux 的命名管道和 Windows 的命名管道。我写了另一个在 Linux 上使用命名管道的程序。我发现对于 Linux 上命名的和未命名的管道,结果是没有区别。
Linux 管道比 Windows 2000 命名管道快很多,而 Windows 2000 命名管道比 Windows XP 命名管道快得多。
管道编程
一个匿名管道或者说单向管道,为一个进程提供了和它的一个子进程进行通信(有亲缘关系的进程间通信)的方法。这是因为没有可以在操作系统当中找到一个匿名管道的方法。它的最通常的用法是在父进程建立一个匿名管道,然后将这个管道传递给它的子进程,然后父子进程就可以进行通信了。注意,如果需要双向通信的话,我们考虑使用的API就应该是套接字(sockets)API了。如果要使用管道进行全双工通信,那么就要建立两个管道,通过管道通信的两个进程,一个进程向管道写数据,而另一个进程从管道读数据。
管道的另一种类型是有名管道。一个有名管道其功能和匿名管道差不多,差别就在于它是可以在文件系统中存在的,并且所有进程都可以找到它。这意味着没有亲缘关系的进程之间可以使用它来进行通信。
管道是Linux支持的最初Unix IPC形式之一,具有以下特点:
管道是半双工的,数据只能向一个方向流动;需要双工通信时,需要建立起两个管道;
只能用于父子进程或者兄弟进程之间(具有亲缘关系的进程);
单独构成一种独立的文件系统:管道对于管道两端的进程而言,就是一个文件,但它不是普通的文件,它不属于某种文件系统,而是自立门户,单独构成一种文件系统,并且只存在于内存中。
数据的读出和写入:一个进程向管道中写的内容被管道另一端的进程读出。写入的内容每次都添加在管道缓冲区的末尾,并且每次都是从缓冲区的头部读出数据(FIFO)。
这里的亲缘关系指的是具有共同的祖先。
管道创建的原型函数为:
int pipe(int fd[2]);
其中fd[2]为用于创建的管道的两端,其中fd[0]为读端,fd[1]为写端,这两端任务是固定的,不能混乱,如果混乱,将会导致错误出现。
管道一旦创建就作为一般的文件来使用,所以对一般文件的操作函数如read(),write()等都适用与管道。
从管道中读取数据:
如果管道的写端不存在,则认为已经读到了数据的末尾,读函数返回的读出字节数为0;
当管道的写端存在时:如果请求的字节数目大于PIPE_BUF,则返回管道中现有的全部数据字节数;如果请求的字节数目不大于 PIPE_BUF,则返回管道中现有全部数据字节数(此时,管道中数据量小于请求的数据量);或者返回请求的字节数(此时,管道中数据量不小于请求的数据量)。注:(PIPE_BUF在include/linux/limits.h中定义,不同的内核版本可能会有所不同。Posix.1要求 PIPE_BUF至少为512字节,red hat 7.2中为4096)。
管道写端关闭后,写入的数据将一直存在,直到读出为止。
向管道中写入数据:
向管道中写入数据时,linux将不保证写入的原子性,管道缓冲区一有空闲区域,写进程就会试图向管道写入数据。如果读进程不读走管道缓冲区中的数据,那么写操作将一直阻塞。
只有在管道的读端存在时,向管道中写入数据才有意义。否则,向管道中写入数据的进程将收到内核传来的 SIFPIPE信号,应用程序可以处理该信号,也可以忽略(默认动作则是应用程序终止)。
例子:
#include
#include
#include
#include
#define MSG "hello word1\n"
int main()
{
// 这里的fd是文件描述符的数组,用于创建管道做准备的
int i_fd[2];
int i_len;
char psz_line[100] = {0};
if ( pipe( i_fd ) < 0 ) // 创建管道
printf( "pipe create error\n" );
write( i_fd[1], MSG, strlen( MSG ) );
close( i_fd[1] );
i_len= read( i_fd[0], psz_line, sizeof( psz_line ) );
write( STDOUT_FILENO, psz_line, i_len );
close( i_fd[0] );
exit( 0 );
}输出:
hello word1
#include
#include
#include
#include
#define MSG "hello word1\n"
int main()
{
// 这里的fd是文件描述符的数组,用于创建管道做准备的
int i_fd[2];
int i_len;
pid_t pid;
char psz_line[100] = {0};
if ( pipe( i_fd ) < 0 ) // 创建管道
printf( "pipe create error\n" );
//利用fork()创建新进程
if ( ( pid = fork() ) < 0 )
printf( "fork error\n" );
else if ( pid > 0 )
{
// 这里是父进程,先关闭管道的读出端,然后在管道的写端
// 写入“hello world"
close( i_fd[0] );
write( i_fd[1], MSG, strlen( MSG ) );
close( i_fd[1] );
sleep(3);
}
else
{
// 这里是子进程,先关闭管道的写入端,
// 然后在管道的读出端读出数据
close( i_fd[1] );
i_len= read( i_fd[0], psz_line, sizeof( psz_line ) );
write( STDOUT_FILENO, psz_line, i_len );
close( i_fd[0] );
}
exit( 0 );
}
程序中sleep(3);这一句不要也可以。
输出:
hello word1
有名管道
上面的管道我们很容易看得出它的局限性,那么有名管道就会解决那种问题,即他可以使任意两个进程之间通信。有名管道是一个存在于硬盘上的文件。
有两个函数可以创建有名管道:
int mknod(const char *path,mode_t mod,dev_t dev);
int mkfifo(const char *path,mode_t mode);
有名管道和管道的使用方法相同,只是使用有名管道时必须使用open()函数将其打开。
值得注意的是:调用open()打开有名管道的进程可能会被阻塞:如果同时用读写方式(O_RDWR)打开,则一定不会阻塞,如果以只读方式打开,则一定会阻塞直到有写的进程打开管道,同样以写的方式打开的时候也会被阻塞,直到有读的进程打开管道。
下面我们通过一个具体的例子更深一步的了解有名管道的使用方法:
#include
#include
#include
#include
#include
#include
#include
#define FIFO_NAME "myfifo"
#define BUF_SIZE 1024
int main()
{
int i_fd = -1;
char psz_buf[BUF_SIZE] = "hello procwrite,i come from process named pipe";
if ( mkfifo( FIFO_NAME, S_IFIFO|0666 ) == -1 )
{
perror("mkfifo error!");
exit(0);
}
if ( ( i_fd = open( FIFO_NAME, O_WRONLY ) ) == -1 )
{
perror("open fifo error!");
exit(0);
}
write( i_fd, psz_buf, strlen( psz_buf ) + 1 );
close( i_fd );
exit(0);
}
#include
#include
#include
#include
#include
#include
#define FIFO_NAME "myfifo"
#define BUF_SIZE 1024
int main(void)
{
int i_fd = -1;
char psz_buf[BUF_SIZE];
i_fd = open( FIFO_NAME, O_RDONLY );
read( i_fd, psz_buf, BUF_SIZE );
printf( "read content:%s\n", psz_buf );
exit(0);
}先运行写程序,再运行读程序,写程序要等到数据读完才退出。