目录
文章目录
一、五种IO模型
1.阻塞IO:
2.非阻塞IO
3.信号驱动IO
4.IO多路转接
5.异步IO
二、高级IO的一些重要概念
1.同步通信和异步通信
2.阻塞和非阻塞
三、其他高级IO
四、非阻塞IO
1.fctl函数
2.实现setNoBlock函数,将文件描述符设置为非阻塞
3.轮询方式读取标准输入
五、IO多路转接之select
1.初始select
2.select函数原型
3.理解select执行过程
4.select的特点
5.select的缺点
6.select使用示例:检测标准输入输出
7.select使用实例
六、IO多路转接之poll
1.poll函数接口
2.参数说明
3.返回结果
4.poll的优点
5.poll的缺点
6.poll使用实例:使用poll监控标准输入
总结
在内核将数据准备好之前,系统调用会一直等待。所有的套接字,默认都是阻塞方式。阻塞是最常见的IO模型。
如果内核还未将数据准备好,系统调用仍然会直接返回,并返回EWOULDBLOCK错误码。非阻塞IO往往需要程序员循环的方式反复尝试读写文件描述符,这个过程称为轮询。这对cpu来说是较大的浪费,一般只有特定的场景下才使用。
内核将数据准备好的时候,使用SIGIO信号通知应用程序进行IO操作
虽然从图上看和阻塞IO类似,实际上最核心在于IO多路转接能够同时等待多个文件描述符的就绪状态。
由内核在数据拷贝完成时,通知应用程序(而信号驱动是告诉应用程序何时可以开始拷贝数据)
在任何IO过程中,都包含两个步骤,第一是等待,第二是拷贝。而且在实际的应用场景中,等待消耗的时间往往都高于拷贝的时间,让IO高效,最核心的办法就是让等待的时间尽量减少。
同步和异步关注的是消息通信机制
- 同步,就是在发出一个调用的时候,在没有得到结果之前,该调用就不返回。但是一旦调用返回,就得到了返回值。换句话说,就是由调用者主动等待这个调用的结果。
- 异步则相反,调用在发出后,这个调用结果就直接返回,所以没有返回结果。换句话说,当一个异步调用发出后,调用者不会立刻得到返回结果;而是在调用发出后,被调用者通过状态、通知来通知调用者,或者通过回调函数处理这个调用。
在多进程多线程的时候,也有提到同步和互斥。这里的是完全不同的概念。
进程/线程同步也是进程/线程之间直接的制约关系,是为完成某种任务而建立的两个或多个线程,这个线程需要在某些位置上协调他们的工作次序而等待、传递信息所产生的制约关系,尤其是在访问临界资源的时候。
阻塞和非阻塞关注的是等待调用结果(消息,返回值)时的状态
- 阻塞调用的指调用结果返回之前,当前线程会被挂起,调用线程只有在得到结果之后才会返回。
- 非阻塞调用是指在不能立刻得到结果之前,该调用者不会阻塞当前线程。
非阻塞io,纪录锁,系统V流机制,io多路转接(io多路复用),readv和writev函数以及存储映射IO(MMAP),这些统称为高级IO
本文重点讨论IO多路转接
fcntl 一个文件描述符,默认都是阻塞IO
#include
#include
int fcntl(int fd,int cmd, .../*args */);
传入的cmd不同,后面追加的参数也不同
fcntl函数有5种功能:
此处使用第三个功能,获取/设置文件状态标记,就可以将一个文件描述符设置为非阻塞
基于fcntl实现一个SetNoBlock函数
void SetNoBlock(int fd)
{
int fl = fcntl(fd,F_GETFL);
if(fl <0)
{
perror("fcntl");
return;
}
fcntl(fd,F_SETFL,fl|O_NONBLOCK);
}
使用F_GETFL将当前的文件描述符的属性取出来(这是一个位图).
然后再使用F_SETFL将文件描述符设置回去. 设置回去的同时, 加上一个O_NONBLOCK参数.
#include
#include
#include
void SetNoBlock(int fd)
{
int fl = fcntl(fd,F_GETFL);
if(fl <0)
{
perror("fcntl");
return;
}
fcntl(fd,F_SETFL,fl|O_NONBLOCK);
}
int main()
{
SetNoBlock(0);
while(1)
{
char buf[1024] = {0};
ssize_t read_size = read(0,buf,sizeof(buf)-1);
if(read_size <0)
{
sleep(1);
continue;
}
printf("input:%s\n",buf);
return 0;
}
系统提供select函数来实现多路复用输入/输出模型
#include
int select(int nfds,fd_set * readfds,fd_set * writefds,fd_set * exceptfds,struct timeval * timeout);
//nfd 是需要监视的最大文件描述符值+1
//rdset,wrset,exset分别对应需要检测的可读文件描述符的集合,可写文件描述符的集合,以及异常文件描述符的集合
//timeout为结构timeval,用来设置select的等待时间
参数timeout取值:
fd_set结构
这个结构就是一个整数数组,更严格的说,是一个位图,使用位图中对应的位来表示要监视的文件描述符,有一组fd_set接口,来比较方便操作位图
void FD_CLR(int fd, fd_set *set); // 用来清除描述词组set中相关fd 的位
int FD_ISSET(int fd, fd_set *set); // 用来测试描述词组set中相关fd 的位是否为真
void FD_SET(int fd, fd_set *set); // 用来设置描述词组set中相关fd的位
void FD_ZERO(fd_set *set); // 用来清除描述词组set的全部位
关于timeval结构
timeval结构用于描述一段时间长度,如果在这个时间内,需要监视的描述符没有事件发生则函数返回,返回值为0
strcut timeval
{
__time_t tv_sec; //seconds
__suseconds_t tv_usec; //microseconds
};
函数返回值:
错误值可能为:
常见使用场景:
fs_set readset;
FD_SET(fd,&readset);
select(fd+1,&readset,NULL,NULL,NULL);
if(FD_ISSET(fd,readset)){...}
理解select模型的关键在于理解ds_set,这里取fd_set长度为1字节,fd_set中的每一个bit可以对应一个文件描述符fd,则1字节长的fd_set最大可以对应8个fd
#include
#include
#include
int main()
{
fd_set read_fds;
FD_ZERO(&read_fds);
FD_SET(0,&read_fds);
for(;;)
{
printf("> ");
fflush(stdout);
int ret = select(1,&read_fds,NULL,NULL,NULL);
if(ret <0)
{
perror("select");
continue;
}
if(FD_ISSET(0,&read_fds))
{
char buf[1024] = {0};
read(0,buf,sizeof(buf)-1);
printf("input:%s",buf);
}
else
{
printf("invalid fd");
continue;
}
FD_ZERO(&read_fds);
FD_SET(0,&read_fds);
}
return 0;
}
参照gitee,实现select字典服务器
#include
int poll(struct pollfd * fds,nfds_t nfds, int timeout);
//pollfd结构
struct pollfd{
int fd;
short events; //requested events
short revents; // returned events
};
返回值小于0,表示出错
返回值等于0,表示poll函数等待超时
返回值大于0,表示poll由于监听的fd就绪而返回
不同与select使用三个位图来表示fdset的方式,poll使用一个pollfd指针实现
poll中监听的文件fd增多时
#include
#include
#include
int main() {
struct pollfd poll_fd;
poll_fd.fd = 0;
poll_fd.events = POLLIN;
for (;;) {
int ret = poll(&poll_fd, 1, 1000);
if (ret < 0) {
perror("poll");
continue;
}
if (ret == 0) {
printf("poll timeout\n");
continue;
}
if (poll_fd.revents == POLLIN) {
char buf[1024] = {0};
read(0, buf, sizeof(buf) - 1);
printf("stdin:%s", buf);
}
}
}
本文主要介绍了select和poll,下一篇文章详解epoll