Java NIO(一)select 和 epoll底层实现原理

一 内核接受网卡流量的整个流程

预备知识:

参考视频:https://www.bilibili.com/video/BV12i4y1G7UK?from=search&seid=12243469803670169476

网络编程的核心对象是socket,当创建socket时在底层会创建一个由文件系统管理的socket对象。这个对象包括了发送缓冲区,接收缓冲区,等待队列

recv函数用于从某一个socket中接受流量,但是这个函数在被调用入进程会一直处于阻塞状态,直到从该socket收到数据为止。

网卡接收流量的流程:

步骤一:进程中调用了recv函数请求接收指定socket的流量。

步骤二:操作系统将这个进程加入到对应socket的等待队列中,并从CPU工作队列中移除,经过这一步后,进程会处理阻塞状态。

计算机接收到对端传输的数据,网卡把数据写入到内存中。这一步不需要CPU参与(数据不经过CPU直接从IO设备写入内存的技术叫作DMA技术)

数据写完后网卡会发送一个中断信号,中断CPU,通知CPU有数据到达。

CPU中断程序响应中断,并把内存中的数据写入了对应socket的缓冲区里

CPU唤醒进程,把进程从socket的等待队列中移除,然后加入到工作队列等待系统调用。

上面的流程有一个问题:

revc函数只能监控一个socket,并且会导致进程一直阻塞在这个socket中,直到socket中有数据返回为止。如果有多个socket监控,则需要创建多个进程,非常浪费资源。

而select和epoll就解决了上面的问题,它们让一个进程可以监控多个socket,下面分别说一下两个函数的实现细节。

二 select的实现细节

select一次监控多个socket的原理很简单:

它会把进程加入到它需要监控的所有socket的等待队列中,然后将进程从CPU 工作队列中移除,进入阻塞状态。

当这些socket中有一个socket有数据返回时,中断程序会把进程从所以的socket等待队列中移除,并把进程重新加入到CPU工作队列中,让进程进就绪状态。

进程进入被CPU调用到,只需要遍历所有socket的状态,就可以知道哪些socket可以读取数据了。

操作完这些可读取数据的socket之后,又会重复第一步,把进程加入到所有的 socket中,然后让进程进入阻塞状态。

通过上述的方式,select函数实现了在一个进程中监控多个socket的方法。但是这函数的性能并不高,因为它需要重复把进程从所有的socket中加入/移除。因此它监控的socket数量不能太多,底层规定不能超过1024个。

epoll函数针对select的这个缺陷作了改进,接下来说说epoll函数的实现细节。

三 epoll函数的实现细节

当进程调用epoll监控多个socket时,会在底层创建一个eventpoll对象,这个对象中包含一个重要的队列:就绪队列

进程调用epoll函数后,epoll会把这个进程加入eventpoll对象的等待队列中

然后把eventpoll对象加入到所有socket的等待队列中,并让CPU阻塞住

当某一个socket有数据返回时,CPU中断程序会把这个socket加入到eventpoll对象的就绪队列中,并把eventpoll中等待的进程唤醒。

进程被唤醒后直接从就绪队列中获取socket读取数据

数据读取完成后,epoll又会把进程加入到eventpoll的等待队列中,然后让CPU阻塞住。

epoll针对select优化的点:

除了第一次外,epoll不需操作所有socket对象的等待队列,只需要操作eventpoll的等待队列即可

进程被唤醒后,不需要遍历即可直接知道哪些socket准备好了。


作者:清雨季

链接:https://www.jianshu.com/p/37a2bb9d1cae

来源:

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

你可能感兴趣的:(Java NIO(一)select 和 epoll底层实现原理)