目录
一. IO的概述
1.1 什么是IO
1.2 IO的效率问题
1.3 同步IO和异步IO的概念
二. 阻塞式IO
三. 非阻塞式IO
四. 信号驱动式IO
五. IO多路复用
六. 异步IO
七. 总结
IO,表示输入输出,即:InPut / OutPut,访问外部设备读取数据或者向外部设备写数据。常见的文件读写操作、网络通信操作,其实都是IO的过程。、
在Linux操作系统下,我们认为一切皆是文件,只有操作系统有权利对文件进行读和写的操作,用户如果要读写文件,本质上都是使用操作系统的文件读写接口来实现的。
这里以阻塞式读取为例,分析IO操作所进行的工作:
因此,我们可以认为,IO = 等待 + 拷贝。只要执行流(进程/线程)参与了等待和拷贝其中之一,那么就认为这个执行流进行了IO操作。
图1.1展示了在进行文件写文件操作(input)时系统所进行的工作,可分为三步:
由于IO要从外设读取数据或者向外设写数据,而在计算机体系中,硬件的效率由高到低的排序是:CPU寄存器 > 高速缓存 > 内存 > 磁盘 > 网卡,对于任意的IO操作,其实大部分时间都是在等待外设数据就绪,因此效率十分低下。
结论:由于IO操作消耗大量时间在等待数据就绪,因此IO的效率很低。
在互联网行业中,提高IO效率是备受关注的,结合上面的分析,高效IO和低效IO的特点为:
因此,设法降低等待时间的占比,是提高IO效率的关键所在。
在了解同步IO和异步IO之前,首先了解同步和异步的概念:
推而广之,我们这样这样理解同步IO和异步IO:
阻塞式IO,就是当进行读数据或写数据时,如果外设条件没有就绪,就阻塞式的等待条件就绪。如:在read/recv时,如果缓冲区中没有数据,该进程/线程就自动被添加到特定的等待队列中去等待缓冲区中被写入数据,在等待的过程中,进程/线程 不执行其它的工作。
所有的IO操作,默认都是阻塞式的,非阻塞IO需要人为进行设置。
如果一个进程/线程在进行IO操作时,数据尚未就绪,那么读取接口不会阻塞,先返回执行其他的工作,数据就绪才进行读取。
非阻塞式IO,一般采用轮询检查的方法进行IO操作,即:通过循环,不断检查IO资源是否已经就绪,就绪就读取,不就绪就执行其他的工作。
IO操作默认是阻塞式的,有两种方法可以实现非阻塞式IO:
这里重点介绍如图通过调用fcntl函数来设置非阻塞式的IO。
fcntl函数 -- 对特定fd设置非阻塞IO
函数原型:int fcntl(int fd, int cmd, .../*args*/)
函数参数:
- fd:进行操作的文件描述符。
- cmd:F_GETFL -- 获取文件状态、F_SETFL -- 设置文件状态
- 缺省参数:当cmd为F_SETFL时,传入O_NONBLOCK可以设置非阻塞。
返回值:当cmd为F_SETFL时,返回当前的文件状态,当cmd为F_SETFL时,应当返回0,如果函数调用失败,则返回-1。
代码3.1通过提供SetNonBlock接口,对标准输入(fd = 0)进行非阻塞式读取,在SetNonBlock内部调用fcntl函数将指定的fd设置为非阻塞。但在使用read进行非阻塞读取时,有以下几点问题需要注意:
其中 EWOULDBLOCK 和 EAGAIN 对应的错误码都是11,描述信息为:Resource temporarily unavailable,就是资源尚未就绪的意思。
代码3.1:非阻塞式IO
#include
#include
#include
#include
#include
// 设置非阻塞IO函数
bool SetNonBlockIO(int fd)
{
// 获取文件状态
int fd_status = fcntl(fd, F_GETFL);
if(fd_status < 0)
{
// 如果失败返回false,表示设置非阻塞失败
return false;
}
// 在原有的文件状态下添加非阻塞状态
fcntl(fd, F_SETFL, fd_status | O_NONBLOCK);
return true;
}
int main()
{
// 对标准输入设置非阻塞
bool ret = SetNonBlockIO(0);
if(!ret)
{
exit(1);
}
// 开始进行非阻塞IO操作
char buffer[1024] = { 0 };
while(1)
{
ssize_t sz = read(0, buffer, 1024);
// 如果正常读取
if(sz > 0)
{
buffer[sz - 1] = '\0'; // 设置字符串结束标识
std::cout << "echo# " << buffer << ", [errno:" << errno << ", errorMsg:" << strerror(errno) << "]" << std::endl;
}
else // 读取失败
{
// 如果是因为资源没有就绪而读取失败
if(errno == EWOULDBLOCK || errno == EAGAIN)
{
std::cout << "errno:" << errno << ", errorMsg:" << strerror(errno) << std::endl;
}
else if(errno == EINTR) // 因为进程收到信号而终止read
{
std::cout << "Interrupt because of signal, errno:" << errno << ", errorMsg:" << strerror(errno) << std::endl;
}
sleep(1);
}
}
return 0;
}
通过自定义对29号SIGIO信号的处理函数来实现信号驱动式IO,当进程收到SIGIO信号的时候,就调用对应的处理函数来进行IO操作,这样保证在调用IO接口的时候数据一定是就绪的,在没有收到信号时不影响进程进行其他的工作,信号驱动式IO避免了阻塞等待资源就绪,提高了IO效率。
一个进程能够同时等待多个文件描述符的资源是否就绪,只要其中一个文件描述符的资源就绪变为可读,那么进程就会去读取这个文件描述符对应的数据。由于可以同时等待多个文件描述符,只要其中一个资源就绪,就可以进行读取,这样就大大提高了IO的效率。
异步IO,就是发起IO的执行流本身不参与IO工作,而是有另外一个执行流来进行IO操作,发起IO的线程只需要等待进行IO的执行流反馈回结果。这样发起IO的执行流就不需要等到,可以处理其他的工作。