muduo网络框架分析

muduo网络框架分析


概要

muduo是一个纯异步、多线程、多路复用网络框架,主线程负责监听网络连接事件,子线程负责处理已建立的连接的网络读写事件。采用eventfd实现父、子线程之间的通信。子线程之间是不能直接进行通信的,原因在于,子线程之间互相不知道对方是否已经析构,也就是一个子线程很有可能向另外一个已经退出的子线程递交任务,这样就会造成程序崩溃。

muduo网络框架是基于生产者消费者模型的。每一个线程都维护了自己的未决队列,当另外的线程或者线程自身递交一个任务到未决队列后,会向未决队列所在线程关联的eventfd写入任意的8字节数据。这样就激活了这个线程从未决队列中取出任务进行消费。

muduo网络框架默认是采用epoll多路复用,基于水平触发, 利用struct epoll_event结构中的data数据成员ptr指针存储Channel对象。

muduo网络框架是基于对象的,利用boost::function实现多态,用boost::shared_ptr,boost::scoped_ptr,boost::weak_ptr智能指针包装裸指针,尽可能的降低内存泄露风险。以安全牺牲性能。

线程池初始化

利用条件变量+互斥体实现线程池的初始化。EventLoopThreadPool对象维护了EventLoopThread线程对象池和EventLoop对象池。每一个EventLoop对象属于确切的某个线程。主线程通过调用EventLoopThread::startLoop()方法,利用条件变量和互斥体同步等待子线程创建,并初始化EventLoop对象。当子线程初始化EventLoop对象后,向条件变量发送唤醒信号。在该条件变量上睡眠的主线程被唤醒。接着主线程将得到的EventLoop对象,返回给EventLoopThreadPool::start()函数。最终在EventLoopThreadPool::start()函数中,EventLoop对象被存入vector向量。这样EventLoop对象池就创建好了。而子线程在向条件变量发送唤醒信号后,调用了EventLoop::loop()函数,进入主循环。一旦主循环退出,整个子线程就退出了。

muduo网络框架使用原子操作来避免EventLoopThreadPool对象被多次初始化。从这点可以看出,muduo网络框架的线程池是静态的,不可伸缩的。还有一点,这些子线程是无差别的,都将作为网络i/o线程。muduo网络框架使用了__thread 关键字用于标识线程独立的全局变量,也就是每个线程一个副本。

接收器acceptor

负责监听网络连接事件,从网络协议栈的全链接队列中取出完成三次握手的连接,并得到socket文件描述符。因为采用的是水平触发,所以muduo网络框架一次只从全连接队列中取出一个连接不会出问题。只要全连接队列不为空,那么监听文件描述符的可读事件将会一直响应。这样的设计并不符合高性能网络框架的要点。

Acceptor对象隶属于TcpServer。一个TcpServer拥有一个Acceptor对象。一个Acceptor对象只负责监听一个网络接口。muduo并不支持多个网络接口的监听。当Acceptor对象获取到一个已连接的文件描述符后,就会将这个连接设置成非阻塞和修改文件状态标识为closeonexec。接着调用TcpServer注册的newConnection回调函数。

框架核心TcpServer

TcpServer对象负责muduo网络框架的初始化,包括创建线程池和连接池,并且维护连接池。一个muduo网络框架只拥有一个TcpServer对象。TcpServer对象由主线程维护。TcpServer::newConnection()函数由acceptor调用,在TcpServer::newConnection函数中,首先调用EventLoopThreadPool::getNextLoop()函数,获取一个EventLoop对象,在多线程模式下,该EventLoop对象属于某个子线程。紧接着为新获取的socket文件描述符构造一个TcpConnection对象,并将该TcpConnection对象与获取的EventLoop对象关联。这个TcpConnection对象就属于某个子线程了。接着将TcpConnection对象插入到TcpServer维护的连接池中。muduo网络框架使用了智能指针,TcpServer对象维护的连接池中的成员是boost::shared_ptr对象,这样TcpConnection只要存在于连接池中,那么对象就不会被释放。

程序自此,TcpConnection关联的socket文件描述符还没有加入epoll。通过调用TcpConnection::connectEstablished()函数,将socket文件描述符加入epoll事件监听器。执行该函数的线程一定与该TcpConnection关联的EventLoop对象所属的线程保持一致。为了做到这一点,程序中使用EventLoop::runInLoop()函数包装TcpConnection::connectEstablished()函数。在多线程模式下,这将会发生线程切换,主线程对子线程关联的EventLoop对象的未决队列上锁。主线程上锁成功,将会把TcpConnection::connectEstablished()函数对象投递到子线程的未决队列中,并且向该EventLoop对象关联的eventfd写入8字节数据,用于唤醒与该EventLoop对象关联的子线程,以让子线程尽快处理未决队列中的任务。之所以要唤醒,是因为子线程很有可能阻塞在epoll_wait函数处。只有从epoll_wait返回,要么是超时时间到了,要么是接收到新的事件时,子线程才有机会处理在未决队列中的任务。那样的话,将会大大的影响,子线程处理未决队列中的任务的速率。通过向eventfd写入8字节数据,就是为了让子线程从epoll_wait中返回。因为子线程的epoll监听的eventfd产生了读事件,则epoll_wait就会返回。

TcpServer对象也控制TcpConnection的析构,TcpServer::removeConnection()函数由TcpConnection::handleClose()函数调用,执行TcpConnection::handleClose()函数的线程一定是TcpConnection对象关联的EventLoop对象所属的线程。这里将会发生一次线程切换,子线程对主线程的EventLoop对象的未决队列进行上锁,并且把函数对象TcpServer::removeConnectionInLoop()递交给主线程的EventLoop对象的未决队列中。子线程向主线程的EventLoop对象关联的eventfd写入8字节数据,唤醒主线程执行未决队列中的任务。在TcpServer::removeConnectionInLoop()函数中,主线程把boost::shared_ptr对象从连接池中移除,为TcpConnection对象的析构做好准备。紧接着主线程调用了EventLoop::queueInLoop()函数,该函数包装了TcpConnection::connectDestroyed()函数。不知道是否有读者仔细斟酌过这行代码,为什么不用EventLoop::runInLoop()函数来包装呢?在多线程模式下,能够很容易理解的。在单线程模式下,笔者花了好一阵工夫,才理解大牛陈硕的用意。这行代码是为了避免TcpConnection对象的析构发生在Channel::handleEvent的内部。因为一个Tcpconnection对象拥有一个Channel对象,如果在Channel::handleEvent内部造成了TcpConnection对象的析构,那么channel对象也一并被析构。也就会出现访问一个已经被析构的Channel对象的可能。

连接TcpConnection

一个socket文件描述符对应一个TcpConnection对象。一个TcpConnection对象包含一个Channel对象。Channel对象封装了与epoll或者poll的处理细节。在TcpConnection对象中,封装了读、写、关闭等事件响应的处理函数。一个TcpConnection对象拥有两个缓冲区,一个是输入缓冲区,一个是输出缓冲区。输入缓冲区负责接收网络协议栈中的数据,输出缓冲区负责接收待发送的应用层中的数据。输入、输出缓冲区是动态扩张的,直到内存耗尽。
默认情况下,socket文件描述符只监听读事件。当应用层数据不能够一次性的写入网络协议栈时,就会为该socket文件描述符添加写事件。应用层未写入的数据将会存入输出缓冲区。当可写事件产生时,框架自动从输出缓冲区中取出数据,写入网络协议栈。如果输出缓冲区没有更多数据可写时,需要取消写事件,否则cpu会出现100%现象。当发送数据的时候,需要首先检查输出缓冲区是否有数据,如果有数据,则不能立即发送到网络协议栈,只能将这些数据追加到输出缓冲区后面,否则可以立即发送。
应用层从Tcpconnection对象的输入缓冲区中获取数据,进行解析。笔者曾经在使用muduo的时候,出现过问题。每次只从输入缓冲区中提取一个完整的数据包,而没有连续处理,直到输入缓冲区中的剩余数据不足以构成一个完整数据包。当时笔者认为只要输入缓冲区中有数据,muduo网络框架就会不停的通知应用层处理,实则不然。

渠道Channel

在muduo网络框架中,Channel对象直接与epoll或者poll进行交互。一个Channel对象拥有一个文件描述符。这些文件描述符包括listenfd、connectfd、eventfd和timerfd。每一个线程拥有一个EventLoop对象,每个EventLoop对象包含一个Poller对象。每个Poller对象维护了一个Channel池。笔者看来Channel池对于poll有用,对epoll没有意义。以epoll为例,在为文件描述符添加事件的时候,把文件描述符关联的Channel对象的地址赋给了struct epoll_event结构的data成员的ptr。当特定的文件描述符产生事件时,就可以通过该ptr指针获取到Channel对象。网络框架必须保证Channel对象的生命周期,也就是析构Channel对象之前,文件描述符一定要从epoll的监听队列中移除。

框架核心EventLoop

一个线程拥有一个EventLoop对象。一个EventLoop对象包含一个eventfd,一个事件未决队列,一个Poller对象和一个定时器对象。eventfd用于线程间通信或者线程内部通信,主要确保监听该eventfd的线程不阻塞于epoll_wait函数,而立即处理未决队列中的事件。事件未决队列,把每个线程的任务和职责分的很清楚。这里用互斥体来保护临界资源,事件未决队列。muduo网络框架,处理十分巧妙,把临界区域限定得很小。在某些场景下,可以使用更加高效的自旋锁替代。Poller对象是对poll和epoll的抽象,对上层透明。系统默认使用更加高效的epoll,作为事件监听器。一个定时器对象拥有一个timerfd文件描述符,定时器相关信息见下文。整个线程将会一直在EventLoop::loop()函数中运行,直到退出。muduo网络框架并没有充分利用epoll_wait超时特点,而是固定的睡眠10毫秒。如果充分利用epoll_wait的超时特点,可以实现更加高效的定时器机制。整个线程除了epoll_wait这个阻塞点之外,不能有其他阻塞点。这也是为什么在muduo框架内部所有的文件描述都是以非阻塞模式运行的。

定时器timer

muduo网络框架利用linux kernel 2.6.29+的新特性timerfd来接收定时信号。当定时器事件出触发时,内核向timerfd写入8字节数据,以通知监听了timerfd可读事件的线程,处理定时任务。muduo网络框架并不是为每一个定时任务分配一个timerfd,而是利用了std::set有序集合,muduo网络框架总是为std::set集合中的第一个定时任务注册定时器。当定时器触发时,总是查找std::set集合中大于当前时间的最小值作为临界值。所有小于当前临界值的定时任务都可以认为已经到期了,则可以处理这些定时任务。处理完这些定时任务后,还要检查这些定时任务是否是重复执行的,如果是重复执行的,则将这些定时任务重新加入定时队列,并为std::set中的第一个定时任务设置定时器。采用timerfd写定时任务比用setitimer或者alrm函数写起来要简单,清晰。高效的网络框架应该利用epoll_wait+红黑树或者最小堆来实现定时器,这样可以减少系统调用。

缓冲Buffer

muduo网络框架利用std::vector容器作为动态伸缩的缓冲区。该缓冲区头部腾出固定大小的空间用于前向追加,这样当需要前向追加数据时,就省去移动整个缓冲区的代价。缓冲区可以自动复位。当缓冲区扩张很大时,就算调用clear()函数也不能释放被vector占用的内存,只能手动调用shrink函数,才能将缓冲区占用的内存释放掉。muduo网络框架也利用了分散读特性,将大量的数据分散读到多个缓冲区,这样可以充分利用内存碎片。不过,muduo网络框架并没有很好利用readv分散读特性,因为出现了重复内存拷贝。主流网络框架都是用固定大小的chunk串联成链表,形成自动扩张的缓冲区。采用这种设计的缓冲区,再结合readv分散读,不但会减少内存拷贝,还能避免std::vector以2倍空间增长的代价。

你可能感兴趣的:(学习muduo服务器)