在高性能的I/O设计中,有两个比较著名的模式Reactor和Proactor模式,其中Reactor模式用于同步I/O,而Proactor运用于异步I/O操作。
在比较这两个模式之前,我们首先的搞明白几个概念,
阻塞和非阻塞是针对于进程在访问数据的时候,根据IO操作的就绪状态来采取的不同方式,说白了是一种读取或者写入操作函数的实现方式。
阻塞方式下读取或者写入函数将一直等待。
非阻塞方式下,读取或者写入函数会立即返回一个状态值。
同步和异步是针对应用程序和内核的交互而言的。
同步指的是用户进程触发IO操作并等待或者轮询的去查看IO操作是否就绪。
异步是指用户进程触发IO操作以后便开始做自己的事情,而当IO操作已经完成的时候会得到IO完成的通知。
一般来说I/O模型可以分为:同步阻塞,同步非阻塞,异步阻塞,异步非阻塞。
让我们来看一下每种不同I/O模型的具体描述
在此种方式下,用户进程在发起一个IO操作以后,必须等待IO操作的完成,只有当真正完成了IO操作以后,用户进程才能运行。JAVA传统的IO模型属于此种方式!
在此种方式下,用户进程发起一个IO操作以后边可返回做其它事情,但是用户进程需要时不时的询问IO操作是否就绪,这就要求用户进程不停的去询问,从而引入不必要的CPU资源浪费。其中目前JAVA的NIO就属于同步非阻塞IO。
此种方式下,应用发起一个IO操作以后,不等待内核IO操作的完成,等内核完成IO操作以后会通知应用程序,这其实就是同步和异步最关键的区别,同步必须等待或者主动的去询问IO是否完成,那么为什么说是阻塞的呢?因为此时是通过select系统调用来完成的,而select函数本身的实现方式是阻塞的,而采用select函数有个好处就是它可以同时监听多个文件句柄,从而提高系统的并发性!
此种方式下,用户进程只需要发起一个IO操作然后立即返回,等IO操作真正的完成以后,应用程序会得到IO操作完成的通知,此时用户进程只需要对数据进行处理就好了,不需要进行实际的IO读写操作,因为真正的IO读取或者写入操作已经由内核完成了。目前Java中还没有支持此种IO模型。
阻塞型I/O意味着控制权只有到调用操作结束后才会回到调用者手里.结果调用者被阻塞了,这段时间了做不了任何其它事情。 更郁闷的是,在等待IO结果的时间里,调用者所在线程此时无法腾出手来去响应其它的请求,这真是太浪费资源了。拿read() 操作来说吧,调用此函数的代码会一直僵在此处直至它所读的socket缓存中有数据到来。
相比之下,非阻塞同步是会立即返回控制权给调用者的。调用者不需要等等,它从调用的函数获取两种结果:要么此次调用成功进行了;要么系统返回错误标识告诉调用者当前资源不可用,你再等等或者再试一次看吧。比如read()操作,如果当前socket无数据可读,则立即返回EWOULBLOCK/EAGAIN,告诉调用read()者"数据还没准备好,你稍后再试".。
在非阻塞异步调用中,稍有不同。调用函数在立即返回时,还告诉调用者,这次请求已经开始了。系统会使用另外的资源或者线程来完成这次调用操作,并在完成的时候知会调用者(比如通过回调函数)。拿Windows的ReadFile()或者POSIX的aio_read()来说,调用它之后,函数立即返回,操作系统在后台同时开始读操作。
在以上三种IO形式中,非阻塞异步是性能最高、伸缩性最好的。搞清楚了以上概念以后,我们再回过头来看看,Reactor模式和Proactor模式。
此文详细的阐述了基于TCP高性能的GOLDEN数据服务器模块的设计以及解决方案 ,我们在文章的后面就不再提及阻塞式的方案了,因为阻塞式I/O实在是缺少可伸缩性,性能也达不到高性能服务器的要求。
一般情况下,I/O复用机制需要事件分离器(event demultiplexor ). 事件分离器的作用,就是将那些读写事件源分发给各读写事件的处理者,就像送快递的在楼下喊:谁的什么东西送了,快来拿吧。开发人员在开始的时候需要在事件分离器那里注册感兴趣的事件,并提供相应的事件处理器(event handlers),或者是回调函数;事件分离器在适当的时候会将请求的事件分发给这些handler或者回调函数。
涉及到事件分离器的两种模式称为:Reactor和Proactor。Reactor模式是基于同步I/O的,而Proactor模式是和异步I/O相关的。在Reactor模式中,事件分离者等待某个事件或者是应用或者是某个操作的状态发生(比如文件描述符可读写,或者是socket可读写),事件分离者就把这个事件传给事先注册的事件处理器或者事件处理函数或者回调函数,由后者来做实际的读写操作。
而在Proactor模式中,事件处理器(或者由事件分离器代为)直接发起一个异步读写操作(相当于请求),而实际的工作是由操作系统来完成的。发起时,需要提供的参数包括用于存放读到数据的缓存区,读的数据大小,或者用于存放外发数据的缓存区,以及这个请求完后的回调函数等信息。事件分离器得知了这个请求,它默默等待这个请求的完成,然后转发完成事件给相应的事件处理器或者事件处理函数或者回调。举例来说,在Windows上事件处理器投递了一个异步IO操作(称有overlapped的技术),事件分离器等IOCompletion事件完成 ,这种异步模式的典型实现是基于操作系统底层异步API的,所以我们可称之为“系统级别”的或者“真正意义上”的异步,因为具体的读写是由操作系统代劳的。
举另外个例子来更好地理解Reactor与Proactor两种模式的区别。这里我们只关注read操作,因为write操作也是差不多的。下面是Reactor的做法:
某个事件处理器宣称它对某个socket上的读事件很感兴趣;
事件分离者等着这个事件的发生;
当事件发生了,事件分离器被唤醒,这负责通知先前那个事件处理器;
事件处理器收到消息,于是去那个socket上读数据了. 如果需要,它再次宣称对这个socket上的读事件感兴趣,一直重复上面的步骤;
下面再来看看真正意义的异步模式Proactor是如何做的:
事件处理器直接投递发一个读操作(当然,操作系统必须支持这个异步操作)。这个时候,事件处理器根本不关心读事件,它只管发这么个请求,它魂牵梦萦的是这个读操作的完成事件。这个事件处理器很拽,发个命令就不管具体的事情了,只等着别人(系统)帮他搞定的时候给他回个话。
事件分离器等着这个读事件的完成(比较下与Reactor的不同);
当事件分离器默默等待完成事情到来的同时,操作系统已经在一边开始干活了,它从目标读取数据,放入用户提供的缓存区中,最后通知事件分离器,这个事情我搞完了;
事件分离器通知之前的事件处理器: 你吩咐的事情搞定了;
事件处理器这时会发现想要读的数据已经乖乖地放在他提供的缓存区中,想怎么处理都行了。如果有需要,事件处理器还像之前一样发起另外一个读操作,和上面的几个步骤一样。
开源C++开发框架ACE(Adaptive Communication Enviromen) 提供了大量平台独立的底层并发支持类(线程、互斥量等).同时在更高一层它也提供了独立的几组C++类,用于实现Reactor及Proactor模式。 尽管它们都是平台独立的单元,但他们都提供了不同的接口.
ACE Proactor在MS-Windows上无论是性能还在健壮性都更胜一筹,这主要是由于Windows提供了一系列高效的底层异步API。
不幸的是,并不是所有操作系统都为底层异步提供健壮的支持。举例来说,许多Unix系统就有麻烦. ACE中的Proactor在Unix上是使用Posix标准实现的异步操作,Posix中有一个AIO,Proactor使用AIO实现异步传输。但Linux在2.6以前版本中不支持AIO,而在2.6版本以后,部分支持AIO。就因为这个部分支持,所以,Posix的子类不能正常工作。因此,ACE Reactor可能是Unix系统上更合适的解决方案.正因为系统底层的支持力度不一,为了在各系统上有更好的性能,开发者不得不维护独立的好几份代码:为Windows准备的ACE Proactor以及为Unix系列提供的ACE Reactor。
就像我们提到过的,真正的异步模式需要操作系统级别的支持。由于事件处理器及操作系统交互的差异,为Reactor和Proactor设计一种通用统一的外部接口是非常困难的。这也是设计通行开发框架的难点所在。
ACEProactor框架包含了一组高度相关的类,其数量相对较多,我在进行以下描述的时候不可能按照顺序讨论它们,而又不进行提前引用。到最后我会描述完所有这些类。下面这些类给出了ACE Proactor框架的各个类以及它们之间的关系。可以把这个图1-1当作描述ACE Proactor框架实际应用的范本。注意:类名中以ACE_开始的类名称是ACE Procator框架中包含的类,而以golden_开始的类名称是实际应用范本提供的类。
下面的代码声明了一个类,它所完成的基本工作是处理接收和发送数据。
图1.1 ACE Proactor框架中的类
#include "ace/Asynch_IO.h"
class golden_aio_handler : public ACE_Service_Handler
{
public :
golden_aio_handler (golden_aio_acceptor *acc = 0) ;
virtual void open ( ACE_HANDLE new_handle,
ACE_Message_Block &message_block ) ;
virtual void handle_read_stream(
const ACE_Asynch_Read_Stream::Result &result);
virtual void handle_write_stream(
const ACE_Asynch_Write_Stream::Result &result);
private:
ACE_Asynch_Read_Stream reader_;
ACE_Asynch_Write_Stream writer_;
} ;
这段代码首先包含了一些必需的头文件,以引入这个例子使用的ACE Proactor框架类:
ACE_Service_Handler 在Proactor框架中创建事件处理器所用的目标类 。
ACE_Handler ACE_Service_Handler的父类,定义了通过ACE_Proactor框架处理异步I/O完成事件所需要的接口。
ACE_Asynch_Read_Stream 用于在已经连接的TCP/IP socket上发起读操作的I/0工厂类。
ACE_Asynch_Write_Stream 用于在已经连接的TCP/IP socket上发起写操作的I/0工厂类。
Result 每个I/O工厂类都把Result定义为嵌在自己内部的类,用以保存该工厂发起的每个操作的结果。所有的Result类都从ACE_Asynch_Result派生,并且增加了专用于它们所针对的I/O类型的数据和方法。因为每个异步I/O操作的发起和完成都是分离的、不同的事情,需要有一种机制来“记住”操作的参数,并且连同结果一起吧这些参数转交给完成处理器。
当TCP连接打开时,我们应该把新socket的句柄传给事件处理器对象,在这个例子中是golden_aio_handler。把句柄放在事件处理器里是有益的,原因如下:
它是socket的生命期一个方便的控制点,因为它是连接工厂的目标。
I/O操作最有可能从这个类发起。
在使用ACE_Proactor框架的异步连接建立类时golden_aio_handler::open()挂钩方法会在新连接建立时被调用。下面是我们程序中的open()挂钩:
void
golden_aio_handler::open(ACE_HANDLE new_handle, ACE_Message_Block &)
{
this->handle(new_handle);
//打开异步读写
reader_.open (*this, new_handle, 0, proactor ());
writer_.open (*this, new_handle, 0, proactor ());
//准备读的缓冲区
ACE_NEW_NORETURN(mblk_, ACE_Message_Block (SIZEOF_HEADER_WITH_CRC));
if (reader_.read (*mblk_,SIZEOF_HEADER_WITH_CRC) <0)
{
delete this ;
}
}
在一开始,我们使用继承而得到的ACE_Handler::handle()方法保存新socket的句柄。该方法把句柄存储在一个方便的地方,以便在析构函数~golden_aio_handler()访问或者用于其他用途。这是在这个类中实现的socket句柄生命期管理的一部分。
要发起I/O,必须初始化所需的I/O工厂对象。在存储了socket句柄之后,open()方法会初始化reader_和writer_ I/O工厂对象,为发起I/O操作做准备。两个类的open()方法都是一样的:
int open (ACE_Handler &handler,
ACE_HANDLE handle = ACE_INVALID_HANDLE,
const void *completion_key = 0,
ACE_Proactor *proactor = 0);
第一个参数表示工厂对象所发起的操作的完成事件处理器里。当通过工厂对象发起的I/O操作完成时,ACE_Proactor框架会回调这个对象。这也是为什么该处理器对象叫做完成事件处理器的原因。在我们的程序中,golden_aio_handler对象是ACE_Handler的后代,即是读操作也是写操作的完成事件处理器,所以*this被用作处理器参数。handle是新传入的socket句柄,completion_key参数只适用于windows默认传入0即可,proactor参数会传入一个在进程范围的ACE_Procator单体对象。
程序中的open()挂钩方法所做的最后一件事情,是调用ACE_Asynch_Read_Stream::read()方法,从而在新的socket上发起一个读操作。ACE_Asynch_Read_Stream::read()函数如下:
int read (ACE_Message_Block &message_block,
size_t num_bytes_to_read,
const void *act = 0,
int priority = 0,
int signal_number = ACE_SIGRTMIN);
为传输指定一个ACE_Message_Block ,使得缓冲区管理变得更为容易,因为可以利用ACE_Message_Block的各种能力,以及它与ACE的其他部分的集成。在发起读操作时,数据会被读入开始于数据块的写指针处在的块中,因为要被读取的数据将被写入块中。
ACE_Proactor框架是基于事件的框架。I/O工厂登记“每个操作”与“该操作完成时应回调的完成事件处理器”之间建立关联。当读取完成时,ACE_Proactor框架会调用ACE_Handler::handle_read_stream()挂钩方法:
void golden_aio_handler::handle_read_stream(
const ACE_Asynch_Read_Stream::Result &result)
{ ACE_Asynch_Read_Stream::Result &result
if (!result.success () || result.bytes_transferred () == 0)
delete this;
else if (result.bytes_transferred () < result.bytes_to_read ())
{
if (reader_.read (*mblk_, result.bytes_to_read () - result.bytes_transferred ()) < 0)
delete this ;
}
else if (mblk_->length () == SIZEOF_HEADER_WITH_CRC)
handle_msg_header();
else
{
if (handle_msg_pack()<0)
delete this ;
}
}
传入的ACE_Asynch_Read_Stream::Result指向的是用于保存读取操作结果的对象。每个I/O工厂类都会定义自己的Result类,即用于保存每个操作发起时所用的参数,又用于保存操作的结果。
如果读操作读取了任何数据,处理接收read到的报文数据包用handle_msg_pack函数,然后发起一个写操作,把数据处理结果返回给对端。当写操作完成时,ACE_Proactor框架调用下面的handle_write_stream方法:
void golden_aio_handler::handle_write_stream(const ACE_Asynch_Write_Stream::Result &result)
{
if(reader_.read (*mblk_,SIZEOF_HEADER_WITH_CRC) < 0)
delete this;
}
不管写操作是否成功完成,在该操作中使用的消息块都会释放。如果socket出了问题,先前发起的读操作也会完成并出错,而handle_read_stream()会清理对象和socket句柄。
图1-2给出了本程序事件序列。
ACE提供里两个工厂类,用于通过ACE_Proactor框架前摄式地建立TCP/IP连接:
ACE_Asynch_Acceptor , 用于发起被动的连接建立
ACE_Asynch_Connector , 用于发起主动的连接建立
图1.2 ACE Proactor异步回调序列图
当使用其中一个类建立TCP/IP连接时,ACE_Proactor框架会创建一个从ACE_Service_Handler派生的事件服务处理器,比如golden_aio_handler,用以处理新连接。ACE_Service_Handler类是
ACE_Proactor框架中所有用异步方式连接的服务的基类,从ACE_Handler派生,所以服务类也可以处理在服务中发起的I/O操作的完成.
ACE_Asynch_Acceptor是一个相当容易使用的类,它的一个挂钩方法是一个protected虚方法:make_handler()。Proactor框架调用这个方法获取一个ACE_Service_Handler对象,用以为新连接提供服务。下面的代码说明了这种情况:
golden_aio_handler * golden_aio_acceptor::make_handler (void)
{
///来一个连接,就新增一个句柄。在线程池中处理
golden_aio_handler *ih;
ACE_NEW_RETURN (ih, golden_aio_handler (this), 0);
if (clients_.insert (ih) == -1)
{
delete ih ;
return NULL ;
}
return ih;
}
return 0 ;
}
ACE_Proactor类负责驱动ACE_Proactor框架的完成处理,这个类等待完成事件的发生、把这些事件多路分离给相关联的完成事件处理器,并分派每个完成处理器上适当的挂钩方法。因此,要让异步I/O完成事件处理器得以发生----无论是I/O还是连接建立----在Golden Server中都必须运行前摄器的时间循环。这通常很简单,只需要把下面的代码插入到应用中就可以了:
int golden_aio::svc()
{
ACE_Proactor::instance()->proactor_run_event_loop ();
return 1 ;
}
可以通过两种方式来使用ACE_Proactor,如上所示的程序代码instance(),作为单体来使用。也可以通过实例化一个或多个实例来使用。这个能力被用于在一个进程中支持多个前摄器。如下代码所示,这是应用于镜像发送和镜像接收的前摄器
int golden_mirror_sender::svc()
{
proactor_sender_->proactor_run_event_loop ();
return 1 ;
}
int golden_mirror_receiver::svc()
{
proactor_recviver_->proactor_run_event_loop ();
return 1 ;
}
各种操作系统上的异步I/O设施会有很大的不同,为了在所有这些系统上维持统一的接口和编程方法,ACE_Proactor类使用了Bridge模式来维持灵活性和可扩展性,同时还使得ACE_Proactor框架能够使用不同的异步I/O实现。
ACE_WIN32_Proactor类是Windows上的ACE_Proactor实现。使用了I/O完成端口进行完成事件检测。在初始化异步操作工厂时,I/O句柄与前摄器的I/O完成端口被关联在一起。在这种实现中,windows下的GetQueuedCompletionStatus()函数负责执行事件循环,如下程序代码
int golden_server::create_proactor()
{
ACE_Proactor::instance()->close_singleton();
impl_ = new ACE_WIN32_Proactor(0,1);
ACE_Proactor::instance(new ACE_Proactor(impl_,1),1) ;
return 0;
}
int golden_server::create_proactor_mirror_recviver()
{
ACE_NEW_RETURN(impl_mirror_recviver_, ACE_WIN32_Proactor(0,1),-1);
ACE_NEW_RETURN(mirror_recviver_proactor_, ACE_Proactor(impl_mirror_recviver_,1),-1);
return 0;
}
int golden_server::create_proactor_mirror_sender()
{
ACE_NEW_RETURN(impl_mirror_sender_, ACE_WIN32_Proactor(0,1),-1);
ACE_NEW_RETURN(mirror_sender_proactor_, ACE_Proactor(impl_mirror_sender_,1),-1);
return 0;
}
大多数网络服务器都被设计成能同时处理多个客户请求。使用反应式事件处理、多个进程和多个线程。在构建多线程服务器时,我们拥有多种选择,包括:为每个请求派生一个新线程、为每个连接/会话派生一个新线程、预先派生一池受管线程,也就是创建一个线程池。在Golden Server设计中我们采用了了线程池的方法。
线程池模型有两种变种,每种都有不同的性能特征:
半同步/半异步模型。在这种模型中,一个侦听会异步的接收请求,并在某个队列中缓冲它们。另外一组工作者线程负责同步地处理这些请求。
领导者/跟随着模型。在这种模型总,有一个线程是领导者,其余线程是在线程池中的跟随者。当请求到达时,领导者会拾取它,并从跟随者中选取一个新的领导者,然后继续处理该请求。因此,在这种模型中,接收请求的线程池就是处理它的线程。
领导者/跟随者模型中,只用了一组线程等待新请求,并处理请求。一个线程被选作领导者,阻塞在“到来的请求源”上,当请求到达时,领导者线程首先获取请求,把某个跟随者提升为领导者,然后继续处理所收到的请求。新领导者在请求源上等待新的请求,与此同时旧领导者会处理刚刚收到的请求,一旦就领导者完成处理,它就会作为跟随者线程回到线程池的末尾。
领导者/跟随者模型的一个优点是性能得到了提高,因为不用进行线程间的上下文切换。但同时这种模型也是复杂的。在程序中单个ACE_Task封装了线程池中的所有线程。
class golden_aio :public ACE_Task<ACE_SYNCH>
{
public:
golden_aio(int number_of_connection);
/// ACE_TASK的虚拟方法。用来启动svc。
virtual int open (void * = 0);
///初始化
virtual int init(u_short ,ACE_Proactor* );
///结束并关闭
virtual int fini();
/// Run by a daemon thread to handle deferred processing
virtual int svc (void);
};
int golden_aio::open (void * )
{
return activate (THR_NEW_LWP | THR_JOINABLE |THR_INHERIT_SCHED ,number_of_thread_);
}
int golden_aio::svc()
{
ACE_Proactor::instance()->proactor_run_event_loop ();
return 1 ;
}
每个线程启动时,首先会通过调用activate(),将任务转化为运行在一个或多个线程中的主动对象。主动对象执行任务的svc()挂钩方法。每个线程在执行proactor_run_event_loop ()调用GetQueuedCompletionStatus ()。 如果没有消息到达线程会阻塞在GetQueuedCompletionStatus ()函数上,直到有消息到来那么有一个线程便成了领导者线程。如果领导者线程能很快的处理完所有事情,领导者线程会再次进入等待状态。如果领导者线程不能马上处理完,则从跟随者线程中指定一个新的领导者线程,自己去处理事件,不再当领导者。
在Golden Server中golden_user、golden_authorize、golden_startup、golden_prot、golden_system_info、golden_dir_visitor、golden_mirror_sender、golden_mirror_receiver采用单体实例模式。相关单体模式的概念,请自行参考相关手册和书籍。
打开goldensdk.h头文件,根据接口类型找到合适的位置,添加接口的声明、接口的描述注释。
打开goldensdk.cpp文件,添加接口的空实现。
打开goldensdk.def文件,添加接口名称。
按照步骤完成Goldenserver模块
在goldensdk.cpp文实现已经添加的空接口。
在golden_message_protocol.h中添加自定义的报文数据结构定义和报文消息ID , 命名规则如下GOLDEN_PACK_XXX、GOLDEN_PACK_XXX_RESULT、MESSAGE_XXX、MESSAGE_XXX_RESULT。
在golden_message_protocol.cpp中添加用来计算报文数据结构大小的函数声明和整编\解编数据流的函数声明。命名规则如下:sizeof_GOLDEN_PACK_XXX() 、sizeof_GOLDEN_PACK_XXX_RESULT()、int operator<<(ACE_OutputCDR &cdr , const GOLDEN_PACK_XXX &spack) ,int operator<<(ACE_OutputCDR &cdr , const GOLDEN_PACK_XXX_RESUL &spack);
在golden_message_protocol.cpp中添加用来计算报文数据结构大小的函数实现和整编\解编数据流的函数实现。
在golden_message_protocol.cpp中添加全部变量_gstring中的内容,用来描述报文内容。
在goldeserver.h中的golden_aio_handler类中添加处理报文的成员函数声明。命名规则如下:int msg_xxx() 、int msg_xxx_result() .
在goldeserver.cpp中添加处理报文的成员函数的空实现golden_aio_handler:: msg_xxx(), golden_aio_handler:: msg_xxx_result() .
在goldeserver.cpp的 int golden_aio_handler::handle_msg_pack()函数中添加报文处理项。
实现f步骤中定义的成员函数空实现。
C++网络编程卷一--- 运用ACE和模式消除复杂性
C++网络编程卷二--- 基于ACE和框架的系统化复用
ACE程序员指南--- 网络与系统编程的实用设计模式
设计模式:可复用面向对象软件的基础