目录
一、阻塞与非阻塞IO简介
1.阻塞IO
2.非阻塞IO
二、应用程序阻塞与非阻塞
1.阻塞
2.查询(非阻塞)
①select
②poll
③epoll
三、驱动程序阻塞与非阻塞
1.等待队列(阻塞)
①等待队列头
②等待队列项
③添加/删除队列
④等待唤醒
⑤等待事件
2.poll(非阻塞)
四、结尾
阻塞和非阻塞 IO 是 Linux 驱动开发里面很常见的两种设备访问模式, 在编写驱动的时候一定要考虑到阻塞和非阻塞。
注意:这里的 IO 指的是 Input/Output(输入/输出):是应用程序对驱动设备的输入/输出操作。
阻塞IO操作是指在执行设备操作时, 若不能获得资源, 则挂起进程直到满足可操作的条件后再进行操作。被挂起的进程进入睡眠状态, 被从调度器的运行队列移走, 直到等待的条件被满足该进程会唤醒。
在阻塞访问时, 不能获取资源的进程将进入休眠, 它将 CPU 资源让给其他进程。 因为阻塞的进程会进入休眠状态, 所以必须确保有一个地方能够唤醒休眠的进程。唤醒进程最大可能发生在中断里面, 因为在硬件资源获得的同时往往伴随着一个中断。
如图,应用程序调用 read 函数从设备中读取数据,当设备不可用或数据未准备好的时候就会进入到休眠态。等设备可用的时候就会从休眠态唤醒,然后从设备中读取数据返回给应用程序。
应用程序可以使用如下所示示例代码来实现阻塞访问:
int fd;
int data = 0;
fd = open("/dev/xxx_dev", O_RDWR); /* 阻塞方式打开 */
ret = read(fd, &data, sizeof(data)); /* 读取数据 */
对于设备驱动文件的默认读取方式就是阻塞式的。
非阻塞IO操作是在不能进行设备操作时, 并不挂起, 它要么放弃, 要么不停地查询, 直至可以进行操作为止。非阻塞的进程则不断尝试, 直到可以进行 I/O。
应用程序使用非阻塞访问方式从设备读取数据,当设备不可用或数据未准备好的时候会立即向内核返回一个错误码,表示数据读取失败。应用程序会再次重新读取数据,一直往复循环,直到数据读取成功。
若用户以非阻塞的方式访问设备文件, 则当设备资源不可获取时, 设备驱动的 xxx_read() 、 xxx_write( ) 等操作应立即返回, read( ) 、 write( ) 等系统调用也随即被返回, 应用程序收到-EAGAIN 返回值。
应用程序要采用非阻塞的方式来访问驱动设备文件
int fd;
int data = 0;
fd = open("/dev/xxx_dev", O_RDWR | O_NONBLOCK); /* 非阻塞方式打开 */
ret = read(fd, &data, sizeof(data)); /* 读取数据 */
使用 open 函数打开设备文件的时添加参数 O_NONBLOCK, 表示以非阻塞方式打开设备。应用程序可用poll、 epoll 和 select来处理非阻塞。
对于设备驱动文件的默认读取方式是阻塞式的,应用程序可以使用如下所示示例代码来实现阻塞访问:
int fd;
int data = 0;
fd = open("/dev/xxx_dev", O_RDWR); /* 阻塞方式打开 */
ret = read(fd, &data, sizeof(data)); /* 读取数据 */
如果用户应用程序以非阻塞的方式访问设备,设备驱动程序就要提供非阻塞的处理方式,即轮询。 poll、 epoll 和 select 可以用于处理轮询。
应用程序通过 select、 epoll 或 poll 函数来查询设备是否可以操作,如果可以操作的话就从设备读取或者向设备写入数据。当应用程序调用 select、 epoll 或 poll 函数的时,设备驱动程序中的 poll 函数就会执行,因此需要在设备驱动程序中编写 poll 函数。
int select(int nfds,
fd_set *readfds,
fd_set *writefds,
fd_set *exceptfds,
struct timeval *timeout)
nfds: 所要监视的这三类文件描述集合, 最大文件描述符加 1
readfds、 writefds 和 exceptfds:指向描述符集合
timeout:超时时间,当调用 select 函数等待某些文件描述符可以设置超时时间
返回值: 0: 超时发生,没有文件描述符可以进行操作; -1:发生错误;其他值: 可以进行操作的文件描述符个数
readfds、 writefds 和 exceptfds这三个指针指向描述符集合,这三个参数指明了关心哪些描述符.这三个参数都是 fd_set 类型的, fd_set 类型变量的每一个位都代表了一个文件描述符。
readfds 用于监视指定描述符集的读变化,监视这些文件是否可以读取,只要这些集合里面有一个文件可以读取, seclect 就会返回一个大于 0 的值表示文件可以读取。如果没有文件可以读取,会根据 timeout 参数来判断是否超时。若将 readfs设置为 NULL,表示不关心任何文件的读变化。
writefs 用于监视文件是否可以进行写操作。 exceptfds 用于监视文件的异常。
从一个设备文件中读取数据,要定义一个 fd_set 变量,这个变量要传递给参数 readfds。当定义好一个 fd_set 变量以后可以使用如下所示几个宏进行操作:
void FD_ZERO(fd_set *set)
void FD_SET(int fd, fd_set *set)
void FD_CLR(int fd, fd_set *set)
int FD_ISSET(int fd, fd_set *set)
FD_ZERO:将 fd_set 变量的所有位都清零
FD_SET:将 fd_set 变量的某个位置 1,向 fd_set 添加fd文件描述符
FD_CLR:将 fd_set变量的某个位清零,将fd文件描述符从 fd_set 中删除
FD_ISSET: 测试文件描述符 fd是否属于某个集合
超时时间使用结构体 timeval 表示
struct timeval {
long tv_sec; /* 秒 */
long tv_usec; /* 微妙 */
};
当 timeout 为 NULL 的时候就表示无限期的等待。
使用 select 函数对某个设备驱动文件进行读非阻塞访问的操作模板
void main(void)
{
int ret, fd; /* 要监视的文件描述符 */
fd_set readfds; /* 读操作文件描述符集 */
struct timeval timeout; /* 超时结构体 */
fd = open("dev_xxx", O_RDWR | O_NONBLOCK); /* 非阻塞式访问 */
FD_ZERO(&readfds); /* 清除 readfds */
FD_SET(fd, &readfds); /* 将 fd 添加到 readfds 里面 */
/* 构造超时时间 */
timeout.tv_sec = 0;
timeout.tv_usec = 500000; /* 500ms */
ret = select(fd + 1, &readfds, NULL, NULL, &timeout);
switch (ret)
{
case 0: /* 超时 */
printf("timeout!\r\n");
break;
case -1: /* 错误 */
printf("error!\r\n");
break;
default: /* 可以读取数据 */
if(FD_ISSET(fd, &readfds)) /* 判断fd 文件描述符是否在readfds里面 */
{
/* 使用 read 函数读取数据 */
}
break;
}
}
在单个线程中, select 函数能够监视的文件描述符数量有最大的限制,一般为 1024。可以修改内核将监视的文件描述符数量改大。这时可以使用 poll 函数,poll 函数本质上和 select 没有太大的差别,但是 poll 函数没有最大文件描述符限制。
int poll(struct pollfd *fds,
nfds_t nfds,
int timeout)
fds: 要监视的文件描述符集合以及要监视的事件, 为一个数组,数组元素都是结构体 pollfd类型的。
nfds: poll 函数要监视的文件描述符数量
timeout: 超时时间,单位为 ms
返回值:返回 revents 域中不为 0 的 pollfd 结构体个数,发生事件或错误的文件描述符数量; 0:超时; -1:发生错误,并且设置 errno 为错误类型
pollfd 结构体
struct pollfd {
int fd; /* 文件描述符 */
short events; /* 请求的事件 */
short revents; /* 返回的事件 */
};
fd 是要监视的文件描述符,如果 fd 无效,则events 监视事件也无效,并且 revents返回 0。
events 是要监视的事件,可监视的事件类型如下:
POLLIN 有数据可以读取。
POLLPRI 有紧急的数据需要读取。
POLLOUT 可以写数据。
POLLERR 指定的文件描述符发生错误。
POLLHUP 指定的文件描述符挂起。
POLLNVAL 无效的请求。
POLLRDNORM 等同于 POLLIN
revents 是返回的事件, 由 Linux 内核设置具体的返回事件。
使用 poll 函数对某个设备驱动文件进行读非阻塞访问的操作模板
void main(void)
{
int ret;
int fd; /* 要监视的文件描述符 */
struct pollfd fds;
fd = open(filename, O_RDWR | O_NONBLOCK); /* 非阻塞式访问 */
/* 构造结构体 */
fds.fd = fd;
fds.events = POLLIN; /* 监视数据是否可以读取 */
ret = poll(&fds, 1, 500); /* 轮询文件是否可操作,超时 500ms */
if (ret) /* 数据有效 */
{
......
/* 读取数据 */
......
}
else if (ret == 0) /* 超时 */
{
......
}
else if (ret < 0) /* 错误 */
{
......
}
}
selcet 和 poll 函数都会随着所监听的 fd 数量的增加,出现效率低下的问题,而且poll 函数每次必须遍历所有的描述符来检查就绪的描述符,这个过程很浪费时间。
epoll 就是为处理大并发而准备的,一般常常在网络编程中使用 epoll 函数。应用程序需要先使用 epoll_create 函数创建一个 epoll 句柄
int epoll_create(int size)
size:从 Linux2.6.8 开始此参数已经没有意义了,填写一个大于 0 的值就可以
返回值: epoll 句柄,如果为-1 的话表示创建失败
epoll 句柄创建成功以后使用 epoll_ctl 函数向其中添加要监视的文件描述符以及监视的事件
int epoll_ctl(int epfd,
int op,
int fd,
struct epoll_event *event)
epfd: 要操作的 epoll 句柄,使用 epoll_create 函数创建的 epoll 句柄
op: 要对epoll 句柄进行的操作,可以设置为:
EPOLL_CTL_ADD 向 epfd 添加文件参数 fd 表示的描述符
EPOLL_CTL_MOD 修改参数 fd 的 event 事件。
EPOLL_CTL_DEL 从 epfd 中删除 fd 描述符
fd:要监视的文件描述符
event: 要监视的事件类型,为 epoll_event 结构体类型指针
返回值: 0:成功; -1:失败,并且设置 errno 的值为相应的错误码。
监视的事件类型为 epoll_event 结构体类型指针
struct epoll_event {
uint32_t events; /* epoll 事件 */
epoll_data_t data; /* 用户数据 */
};
events 表示要监视的事件,可选的事件如下
EPOLLIN 有数据可以读取
EPOLLOUT 可以写数据
EPOLLPRI 有紧急的数据需要读取
EPOLLERR 指定的文件描述符发生错误
EPOLLHUP 指定的文件描述符挂起
EPOLLET 设置 epoll 为边沿触发,默认触发模式为水平触发
EPOLLONESHOT 一次性的监视,当监视完成以后还需要再次监视某个 fd,就需要将fd 重新添加到 epoll 里面
上面这些事件可以进行或操作,可以设置监视多个事件。
最后通过 epoll_wait 函数来等待事件的发生
int epoll_wait(int epfd,
struct epoll_event *events,
int maxevents,
int timeout)
epfd: 要等待的 epollevents: 指向epoll_event结构体的数组,当有事件发生的时Linux内核会填写 events,调
用者可以根据 events 判断发生了哪些事件maxevents: events 数组大小,必须大于 0
timeout: 超时时间,单位为 ms
返回值: 0:超时; -1:错误;其他值:准备就绪的文件描述符数量
epoll 更多的是用在大规模的并发服务器上,因为在这种场合下 select 和 poll 并不适合。当
设计到的文件描述符比较少的时候就适合用 selcet 和 poll。
当进程访问设备时, 经常需要等待有特定事件发生以后再继续往下运行, 这时就需要在驱动里面实现当条件不满足的时候进行休眠, 当条件满足的时候在由内核唤醒进程。 在 Linux 驱动程序中,使用等待队列( Wait Queue) 来实现阻塞进程的唤醒。
等待队列以队列为基础数据结构, 与进程调度机制紧密结合, 可以用来同步对系统资源的访问。 队列是一种特殊的线性表,它只允许在表的前端( front) 进行删除操作, 在表的后端( rear) 进行插入操作,队列是一种操作受限制的线性表。 进行插入操作的端称为队尾, 进行删除操作的端称为队头。 即满足先进先出的形式 FIFO。
Linux 内核的等待队列是以双循环链表为基础数据结构, 与进程调度机制紧密结合, 能够用于实现核心的异步事件通知机制。 它有两种数据结构: 等待队列头(wait_queue_head_t) 和等待队列项(wait_queue_t)。等待队列头和等待队列项中都包含一个 list_head 类型的域作为连接件。 它通过一个双链表和把等待 task的头, 和等待的进程列表链接起来。
如果要在驱动中使用等待队列,必须创建并初始化一个等待队列头。等待队列头使用结构体 wait_queue_head_t 来表示,定义在文件 include/linux/wait 里面
struct __wait_queue_head {
spinlock_t lock; //自旋锁
struct list_head task_list; //链表头
};
typedef struct __wait_queue_head wait_queue_head_t;
定义好等待队列头以后需要初始化, 使用 init_waitqueue_head 函数初始化等待队列头。
void init_waitqueue_head(wait_queue_head_t *q)
q:要初始化的等待队列头
可以使用宏 DECLARE_WAIT_QUEUE_HEAD(wait_queue_head_t *q) 来一次性完成等待队列头的定义的初始化。
等待队列头是一个等待队列的头部, 每个访问设备的进程都是一个队列项, 当设备不可用的时就要将这些进程对应的等待队列项添加到等待队列里面。
结构体 wait_queue_t 表示等待队列项
struct __wait_queue {
unsigned int flags;
void *private;
wait_queue_func_t func;
struct list_head task_list;
};
typedef struct __wait_queue wait_queue_t;
使用宏 DECLARE_WAITQUEUE 定义并初始化一个等待队列项
DECLARE_WAITQUEUE(name, tsk)
name:等待队列项的名字tsk:等待队列项属于哪个任务(进程), 一般设置为 current
在内核中 current 相当于全局变量 , 表 示 当 前 进 程 。所以DECLARE_WAITQUEUE是给当前正在运行的进程创建并初始化了一个等待队列项。
当设备不可访问的时就需要将进程对应的等待队列项添加到前面创建的等待队列头中, 只有添加到等待队列头中以后进程才能进入休眠态。
void add_wait_queue(wait_queue_head_t *q,wait_queue_t *wait)
q: 等待队列项要加入的等待队列头
wait:要加入的等待队列项
当设备可以访问后再将进程对应的等待队列项从等待队列头中移除即可。
void remove_wait_queue(wait_queue_head_t *q,wait_queue_t *wait)q: 要删除的等待队列项所处的等待队列头
wait:要删除的等待队列项
当设备可以使用的时就要唤醒进入休眠态的进程, 唤醒可以使用如下两个函数
void wake_up(wait_queue_head_t *q) //功能: 唤醒所有休眠进程
void wake_up_interruptible(wait_queue_head_t *q)//功能: 唤醒可中断的休眠进程
q :要唤醒的等待队列头
这两个函数会将这个等待队列头中的所有进程都唤醒。wake_up 函 数 可 以 唤 醒 处 于TASK_INTERRUPTIBLE 和 TASK_UNINTERRUPTIBLE 状 态 的 进 程 , 而wake_up_interruptible 函数只能唤醒处于 TASK_INTERRUPTIBLE 状态的进程。
除了主动唤醒以外, 也可以设置等待队列等待某个事件, 当这个事件满足以后就自动唤醒等待队列中的进程。
1.wait_event(wq, condition)不可中断的阻塞等待, 让调用进程进入不可中断的睡眠状态, 在等待队列里面睡眠直到 condition变成真, 被内核唤醒。
2.wait_event_interruptible(queue,condition)
可中断的阻塞等待, 让调用进程进入可中断的睡眠状态, 直到 condition 变成真被内核唤醒或被信号打断唤醒。
3.wait_event_timeout(queue,condition,timeout)
功能和 wait_event 类似,但是此函数可以添加超时时间,以 jiffies 为单位。 如果所给的睡眠时间为负数则立即返回 。如果在睡眠期间被唤醒,且condition 为真则返回剩余的睡眠时间, 否则继续睡眠直到到达或超过给定的睡眠时间,然后返回 0 。4.wait_event_interruptible_timeout(queue,condition,timeout)
与 wait_event_timeout 函数类似, 如果在睡眠期间被信号打断则返回 ERESTARTSYS 错误码。
注意: 调用的时要确认 condition 值是真还是假, 如果调用 condition 为真, 则不会休眠。
使用等待队列实现阻塞访问重点注意两点:
①、将任务或者进程加入到等待队列头,
②、在合适的点唤醒等待队列,一般都是中断处理函数里面。
阻塞访问好处:
当设备文件不可操作的时进程进入休眠态,将CPU 资源让出来。但是,当设备文件可以操作的时就必须唤醒进程,一般在中断函数里面完成唤醒工作。 Linux 内核提供了等待队列(wait queue)来实现阻塞进程的唤醒工作。
当应用程序调用 select 或 poll 函数来对驱动程序进行非阻塞访问,驱动程序file_operations 操作集中的 poll 函数就会执行。
unsigned int (*poll) (struct file *filp, struct poll_table_struct *wait)
filp: 要打开的设备文件(文件描述符)
wait: poll_table_struct 类型指针, 由应用程序传递进来的,将此参数传递给poll_wait()
返回值: 向应用程序返回设备或者资源状态
返回的资源状态如下
POLLIN 有数据可以读取。
POLLPRI 有紧急的数据需要读取。
POLLOUT 可以写数据。
POLLERR 指定的文件描述符发生错误。
POLLHUP 指定的文件描述符挂起。
POLLNVAL 无效的请求。
POLLRDNORM 等同于 POLLIN,普通数据可读
需要在驱动程序的 poll 函数中调用 poll_wait 函数, poll_wait 函数不会引起阻塞,只是将应用程序添加到 poll_table 中
void poll_wait(struct file * filp, wait_queue_head_t * wait_address, poll_table *p)
filp: 要打开的设备文件(文件描述符)
wait_address:要添加到 poll_table 中的等待队列头
p:file_operations 中 poll 函数的 wait 参数
驱动加载成功要用&,实现在后台模式运行进行测试。
./blockioApp /dev/blockio & //后台运行
top:查看CPU使用率
ps:查看进程PID
kill -9 PID :杀死进程为PID的进程
阻塞访问,驱动中没有实现等待队列
阻塞IO,驱动中实现等待队列,加入阻塞访问,应用程序的 CPU 使用率从 99.4%降低到了 0.0%。CPU 使用率可能为0.00001%,但只能显示出小数点后一位,因此就显示成了 0.0%。
以非阻塞访问cup的使用率也是比较低的。