基于SEDA的异步框架设计与实现
四、异步框架总体设计与实现
1、框架中的stage理想结构
前文提到,基于SEDA的异步框架,一个stage的理想结构描述如下:

在这个框架的设想中,一个stage一般需要有如下几个组件:
1、D-MQ:分布式消息中间件。用做事件队列,以进行消息的传递。
2、Local-Queue:本地队列。一般是blockingQueue,用以辅助实现stage内的动态线程池。采用Local-Queue的目的在于避免数据在mq中的堆积导致mq性能下降。
3、Thread Pool:动态线程池。进行事件的并发处理。
4、Worker:事件的具体处理器
5、Stage Controller:stage的性能控制器。用以对stage的队列、资源、调度策略进行控制。
引此为框架的设计理念,于是有了如下基于SEDA的异步框架的架构设计。
2、SEDA异步框架的使用场景
该异步框架可以用来处理如下几个场景的问题:
1、系统资源监控(CPU、内存、线程池、队列)
2、外围服务交互情况(API被调用、上游服务交互、请求方等)监控
3、系统报警(服务异常、接口压力过大等)
4、基于日志和事件的数据挖掘(规则挖掘等)
5、重要业务数据切片转储(里程碑消息、核心服务交互数据等)
6、异步触发的操作(表A写完后异步写表B等)
其使用场景大致可如下图所示:

3、SEDA异步框架系统总体架构
因而,基于以上所述适用范围的框架实现之后的系统架构,一般可如下所示:

当然,以上结构并非绝对的,如有需要,你完全可以通过自己定制bundle和bundle之间的拓扑关系,来实现各种复杂的事件处理过程。你只需要简单通 过声明bundle相关配置,即可实现任何按照你所希望的有向图去关联的bundle。框架提供给了你一个经过轻量级封装后的平台,后面的业务逻辑,就靠 开发者自己了。
4、异步框架原生态架构(Virtual Bundle)
基于上述的设计理念,最终实现的异步框架的原生态架构如下所示:

异步框架在无任何扩展的时候,其主要组件如下:
1、bundle:消息中心的核心组件。由读、处理、写三部分功能组成。同时整合开关、定时器、动态线程池等元素来支持多样化的输入和需求。bundle可以从多种数据源获取数据,并进行数据的处理。
1)开关:用以决定该bundle是否被激活。如未被激活,则该bundle将停止读取数据,同时不会在其他服务上产生该bundle对应的数据(比如在mq上生成该bundle的队列、连接、交换机等。)
2)定时器:用以指定该bundle是否定时运行。如未指定,则实时运行。
3)动态线程池:用以支持bundle以同步/异步方式调用。如未指定,则同步运行。
2、bundle decider:用以对bundle的关键指标进行决策(是否激活、时效性、同步类型等)。并同时提供健康检查。
3、Work carrier:处理数据的最小单元。
5、异步框架的AMQP实现(AMQP Bundle)
异步框架扩展的AMQP实现,其架构图如下所示:

其主要组件说明如下:
1、amqp bundle:消息中心的核心组件。由读、处理、写三部分功能组成。在整合开关、定时器、动态线程池之余,提供了配置化的订阅订阅管理以及关键行为的声明。
要声明一个bundle仅需声明对应的bean,示例如下:
<!-- 报警消息收集器 -->
<bean id="alarmCollector" class="com.cc.deimos.satellite.core.collector.CommonAmqpCollectBundle">
</bean>
1)开关:用以决定该bundle是否被激活。如未被激活,则该bundle将停止读取数据,同时不会在其他服务上产生该bundle对应的数据(比如在 mq上生成该bundle的队列、连接、交换机等)。加上开关之后,最大的优势在于其可以更方便的支持分布式部署。对不同的部署实例设置不一样的 active设置可以完成不同stage在不同机器的启停。默认激活。我们为bundle加上开关,示例如下:
<!-- 报警消息收集器 -->
<bean id="alarmCollector" class="com.cc.deimos.satellite.core.collector.CommonAmqpCollectBundle">
<property name="active" value="true" />
</bean>
2)定时器:用以指定该bundle是否定时运行。默认实时运行。我们为bundle加上定时器,示例如下:
<!-- 报警消息收集器 -->
<bean id="alarmCollector" class="com.cc.deimos.satellite.core.collector.CommonAmqpCollectBundle">
<property name="timer" value="0/30 * * * * ?"/>
</bean>
3)动态线程池:用以支持bundle内部的实际数据流处理过程以同步/异步方式调用。默认同步运行。我们为bundle加上动态线程池,示例如下:
<!-- 报警消息收集器 -->
<bean id="alarmCollector" class="com.cc.deimos.satellite.core.collector.CommonAmqpCollectBundle">
<property name="taskExecutor" ref="alarmCollectBundleExecutor"/>
</bean>
<!-- 报警信息收集器对应的动态线程池 -->
<bean id="alarmCollectBundleExecutor" class="org.springframework.scheduling.concurrent.ThreadPoolTaskExecutor">
<property name="corePoolSize" value="2" />
<property name="maxPoolSize" value="30" />
<property name="queueCapacity" value="200" />
</bean>
4)订阅发布:用以声明收集和推送信息时所需的交换机和密钥。通过支持逗号分隔的多key组合来支持多对多的上下游bundle关系。每个key的配置语 法符合rabbitmq中topic类型的exchange使用规范即可。默认采用“deimos-common”交换机。以下给出几种声明的配置:
其一:最简易配置。配置要订阅和发布的消息key即可。交换机采用默认配置。
<!-- 报警消息收集器 -->
<bean id="alarmCollector" class="com.cc.deimos.satellite.core.collector.CommonAmqpCollectBundle">
<property name="pubKeys" value="process.alarm.*" />
<property name="subKeys" value="collect.alarm.*, collect.log.error" />
</bean>
其二:声明特殊的来源和目的地的交换机:
<!-- 报警消息收集器 -->
<bean id="alarmCollector" class="com.cc.deimos.satellite.core.collector.CommonAmqpCollectBundle">
<property name="pubKeys" value="process.alarm.*" />
<property name="subKeys" value="collect.alarm.*, collect.log.error" />
<property name="pubDest" value="spec1" />
<property name="subDest" value="spec2" />
</bean>
5)事件队列:每个bundle默认实现一个固定格式的独立队列。可通过配置另外指定。可支持bundle监听多队列的需求。如需要特别指定一个或多个事件队列,则示例如下:
<!-- 报警消息收集器 -->
<bean id="alarmCollector" class="com.cc.deimos.satellite.core.collector.CommonAmqpCollectBundle">
<property name="pubKeys" value="process.alarm.*" />
<property name="subKeys" value="collect.alarm.*, collect.log.error" />
<property name="subQueues">
<list>
<ref bean="queueForLogError" />
</list>
</property>
</bean>
<!-- error日志消息的订阅 -->
<!--
如队列的声明不采用默认配置,完整声明如下:
<property name="exchangeName" value="deimos-common" />
<property name="queue" value="logQueue" />
<property name="bindingKey" value="collect.log.*" />
-->
<bean id="queueForLogError" class="com.cc.deimos.satellite.bo.AmqpQueueConfig">
<property name="bindingKey" value="collect.log.error" />
</bean>
6)监听容器:按照默认配置实现,并发数可通过配置指定。bundle如需额外设定channel数量,则示例如下:
<!-- 报警消息收集器 -->
<bean id="alarmCollector" class="com.cc.deimos.satellite.core.collector.CommonAmqpCollectBundle">
<property name="pubKeys" value="process.alarm.*" />
<property name="subKeys" value="collect.alarm.*, collect.log.error" />
<property name="concurrency" value="20" />
</bean>
7)关键行为。用以给发布的消息打上bundle的标签。以辅助其他bundle进行数据筛选和处理。默认以发布的key为关键行为。如需额外声明,则示例如下:
<!-- 报警消息收集器 -->
<bean id="alarmCollector" class="com.cc.deimos.satellite.core.collector.CommonAmqpCollectBundle">
<property name="pubKeys" value="process.alarm.*" />
<property name="subKeys" value="collect.alarm.*, collect.log.error" />
<property name="keyAction" value="ALARM_KEY_INFO" />
</bean>
2、bundle decider:用以对bundle的关键指标进行决策(是否激活、时效性、同步类型等)。并同时提供健康检查。默认采用fix strategy decider(定参策略决策器)。可进行配置来指定所需决策器类型,示例如下:
<!-- 报警消息收集器 -->
<bean id="alarmCollector" class="com.cc.deimos.satellite.core.collector.CommonAmqpCollectBundle">
<property name="pubKeys" value="process.alarm.*" />
<property name="subKeys" value="collect.alarm.*, collect.log.error" />
<property name="strategyDecider" value="FIXED_STRATEGY"/>
</bean>
3、work carrier:处理数据的最小单元。Bundle依据决策器指示的状态同步/异步、实时/定时调用work carrier进行处理。完全对开发者透明。用户者无需关心该组件。bundle将结合decider进行调度。同时work carrier处理后的数据推送过程也对开发者透明。开发者所需要做的就是实现bundle的doWork方法,并将处理之后的数据直接return即 可。doWork方法如下所示:
@Override
public Object doWork(List<DeimosSatelliteRequest> message) throws Exception{
// do somethoing with message then retrun the result;
}
4、exchange:rabbitmq交换机。默认所有bundle都请求“deimos-common”。可集群化。配置见上。
5、amq:采用支持amqp协议的rabbitmq。默认单机内存节点。可采用镜像队列或其他方案来进行broker、queue的集群化。
6、channel:amq信道。可启动多信道并发监听amq队列消息。支持配置化设定。配置见上。
在web/servlet容器启动之后,框架中的各个组件将被依次加载,以下给出了bundle的大致启动流程,也正是因为这个启动流程,将上述的各个组件进行串联,并开始执行各自负责的工作:
以上详细介绍了SEDA框架的AMQP实现中主要组件的作用、声明方式以及实现原理。总结一下,异步框架的AMQP实现中,bundle与bundle之间通过分布式 队列rabbitmq进行数据传递,bundle内部提供包含阻塞队列的动态线程池taskExecutor来进行数据处理,同时提供了定时器timer 来控制bundle的定时/实时调用。workcarrier作为消息处理的最小单元,其调用机制完全对用户透明。消息在bundle中的接收、处理和推 送由bundle decider组件进行管理。用户只需要简单实现doWork方法和声明bundle配置即可实现消息的处理和传递。
6、一个简单的bundle安装示例
你完全可以只按照如下几步,就可以轻松实现你每个stage:
1、继承AmqpBundle类,实现doWork方法,完成你的业务逻辑。示例如下(通用收集器demo):
public class CommonAmqpCollectBundle extends SatAmqpBundle {
/**
* 采用并发队列。性能比阻塞队列高
*/
public final ConcurrentLinkedQueue<DeimosSatelliteRequest> cacheQueue = new ConcurrentLinkedQueue<DeimosSatelliteRequest>();
@Override
public Object doWork(List<DeimosSatelliteRequest> message) throws Exception {
logger.info("i am now in LogWorker:" + Thread.currentThread().getName() + "message is : " + message
+ ". now begin to collect!");
// 此处不采用锁,因为其带来的影响很有限
cacheQueue.addAll(message);
if (cacheQueue.size() < SatConstant.LOG_BATCH_SIZE) {
return null;
}
// 进行遍历导数据
List<DeimosSatelliteRequest> list = new ArrayList<DeimosSatelliteRequest>();
for (int i = 0; i < SatConstant.LOG_BATCH_SIZE && !cacheQueue.isEmpty(); i++) {
DeimosSatelliteRequest meta = cacheQueue.poll();
// 此时队列也已经为空了
if(meta == null){
break;
}
// 校验
if(meta.getTimestamp() == null || meta.getRealData() == null || meta.getData() == null){
logger.error("[deimos-satellite]meta param is error! meta request: " + meta);
continue;
}
// 记录关键行为
if(meta.getData().get(SatApiConstant.KEY_ACTION) == null){
meta.getData().put(SatApiConstant.KEY_ACTION, keyAction);
}
list.add(meta);
}
// 排序 ,以时间戳为key。考虑到可能出现时间戳一致的情况,所以不能用map。考虑到如果log要push到其他平台或者服务上,
// 该切片应该先保证自身有序而不能完全依赖于下一个bundle来处理
Collections.sort(list, new Comparator<DeimosSatelliteRequest>() {
@Override
public int compare(DeimosSatelliteRequest o1, DeimosSatelliteRequest o2) {
if (o1.getTimestamp().longValue() >= o2.getTimestamp()) {
return -1;
} else {
return 1;
}
}
});
logger.info("[deimos-satellite]common amqp collctor prepare to push to next bundle............ key action: " + keyAction);
return list;
}
}
2、对新写的bundle类加上配置声明。以下为最轻便的写法。如果需要额外定制其他bundle参数,参照上面的相关说明,进行定制即可。
<!-- 报警消息收集器,最简易参数声明。在切分成不同stage之后没有什么需要特别关注的潜在性能瓶颈时使用 -->
<bean id="alarmCollector" class="com.cc.deimos.satellite.core.collector.CommonAmqpCollectBundle">
<property name="pubKeys" value="process.alarm.*" />
<property name="subKeys" value="collect.alarm.*, collect.log.error" />
</bean>
3、启动服务。至此,你的bundle也就随着服务的启动就自动启动并开始工作了。
以上描述的一个bundle启动的过程,当所需要处理的业务被合理拆解成数个bundle(也就是所谓的stage)之后,就可以形成一个完整的基于工作流的系统实现。以下为基于对来源A进行事件收集的简易报警系统,在被拆解为三个bundle之后的数据流:

6、框架改进空间
目前框架仅仅提供了一个非常轻量的解决方案,并仅对AMQP进行了实现。后续可有如下几个改进升级的空间:
1)构成bundle strategy center。各个bundle的decider(决策器)在决策过程中,可以依赖strategy center进行bundle的相关决策。
2)支持bundle集群化、broker集群化,并引入相关策略(比如一致性哈希)来保证基于该框架的系统的高可用。可纳入bundle strategy center。
3)框架进一步基于IOC思想,进行面向接口编程的改造和升级。
(暂时整理到这,具体的uml图以及代码后续提供。)