Linux 高级IO

[TOC]


Linux 高级IO

涉及到一些IO的高级用法

文件描述符重定向

dup 函数从当前可用的文件描述符中找一个最小的返回
dup2 用filedes2指定新文件描述符的值。

#include 
int dup(int filedes);
int dup2(int fileds, int filedes2);
/* 成功则返回新的文件描述符,出错返回-1 */

文件描述符之间传递数据

sendfile,splice,tee

#include 
int sendfile(int out_fd, int in_fd, off_t *offset, size_t count);
/* 成功时返回写到out_fd的数据的字节数,出错时返回-1并设置errno */

参数如下:

  • out_fd 数据将要写入的那个文件描述符
  • in_fd 数据从这个描述符取出,必须是一个真实存在的文件,或者是能够mmap的设备
  • offset 从文件的哪里开始传输
  • count 要传输的字节数

对于像web服务器这样的应用,经常需要把某个文件的内容传输到客户端,也就是写到与客 户端通信的socket上,基本的操作类似于这样:

open source (disk file)
open destination (network connection)
while there is data to be transferred:
    read data from source to a buffer
    write data from buffer to destination
close source and destination

数据的读取和写入需要调用read和write系统调用。 在一个read系统调用中,数据的传输主要经过了如下几个路径:

从硬盘中取出数据 --传输到--> 内核缓冲区 --复制到--> 程序的缓冲区

而在write系统调用中中,数据传输的路径则是:

程序的缓冲区 --复制到--> 内核缓冲区 --传输到--> 文件或设备(比如网卡)

进程每次使用系统调用,都会出现一次在用户态和内核态的上下文切换,大量的系统调用 消耗的资源是非常可观的。为了处理这种情况, sendfile 出现了,使用 sendfile 时, 数据传输的路径是:

从硬盘中取出数据 --传输到--> 内核缓冲区 --传输到--> 文件或设备(比如网卡)

省去了数据在内核空间和用户空间的两次传输,称为零拷贝

进程间传递文件描述符

socketpair,使用得Unix原始套接字

由于,父进程中打开的文件描述符,在fork调用之后,子进程中仍然打开,并共享同一个文件表项。所以,文件描述符可以很方便地从父进程传递到子进程。

需要注意:传递一个文件描述符并不是传递文件描述符的值,而是要在教授进程中穿件一个新的文件描述符,并且该文件描述符和发送进程中被传递的文件描述符指向内核中相同的文件表项。

那么如何在两个不相关的进程间传递文件描述符?那就得用到Unix域的原始套接字在进程间传递特殊的辅助数据,以实现文件描述符的传递。

在Linux中使用socketpair函数创造一对未命名的、相互连接的UNIX域套接字。
完全可以把这一对socket当成pipe返回的文件描述符一样使用,唯一的区别就是这一对文件描述符中的任何一个都可读和可写

#include 
#include 
int socketpair(int domain, int type, int protocol, int sv[2]);
  • 第1个参数domain,表示协议族,只能为AF_LOCAL或者AF_UNIX;
  • 第2个参数type,表示类型,只能为0。
  • 第3个参数protocol,表示协议,可以是SOCK_STREAM或者SOCK_DGRAM。用SOCK_STREAM建立的套接字对是管道流,与一般的管道相区别的是,套接字对建立的通道是双向的,即每一端都可以进行读写。参数sv,用于保存建立的套接字对。

一次读多个缓冲区

readv和writev函数用于在一次函数调用中读、写多个非连续缓冲区。有时也将这两个函数 成为 散布读(scatter read)聚集写(gather write) 。如果使用read或者 write,完成同样的功能需要多次的系统调用。现在用readv和writev主要调用一次就OK。

#include 
ssize_t readv(int filedes, const struct iovec *iov, int iovcnt);
ssize_t writev(int filedes, const struct iovec *iov, int iovcnt);
/* 成功时返回已读、写的字节数,出错返回-1 */

控制文件描述属性和行为

fcntl,ioctl

#include 
int fcntl(int filedes, int cmd, ... /* struct flock *flockptr */ );
/* 成功的返回依赖cmd,出错返回-1 */

存储映射IO

存储映射IO(Memory-mapped IO) 使一个磁盘文件与存储空间中的一个缓冲区映射。 操作缓冲区就相当于操作磁盘上的文件。 mmap 函数实现这个功能。

#include 
void *mmap(void *addr, size_t len, int prot, int flag, int filedes,
           off_t off);
/* 若成功则返回映射区的起始地址,若出错则返回MAP_FAILED */

你可能感兴趣的:(Linux 高级IO)