一、tbschedule核心知识点
1、tbschedule是淘宝开源的,能够让批量任务或变化的任务,被动态的分配到不同主机(可分布式)的jvm,不同的线程组中并行执行。
所有任务能够不重复,不遗漏的执行。
2、tbschedule的任务、策略等调度数据是存储在zookeeper中的。
3、tbschedule的执行是基于jdk的Timer和TimerTask实现的。
4、tbschedule中的任务,是依附于策略而运行的。也就是说,任务定义了要执行的行为,包括任务名称、
取数据和数据处理的bean、每次取数的数量、执行的开始与结束时间、任务项等信息,
而策略定义了要执行的任务、在哪台机器上执行、所有机器最大线程组,单个机器线程组数等,并控制任务的执行与停止。
二、重要概念或类介绍
1、ZKManager
ZKManager就是最基本的zookeeper会话管理类,内容包括zookeeper的创建、会话的连接或重连接、关闭会话等。
2、TBScheduleManagerFactory
TBScheduleManagerFactory是tbschedule管理类,包含的功能有:
a)配置zookeeper,并创建zookeeper会话
zookeeper的配置信息有:zkConnectString, rootPath, userName, password, zkSessionTimeout, isCheckParentPath
b)调度任务和调度策略的管理器生成
ScheduleDataManager4ZK,调度任务管理器(对应在zookeeper中的数据),在此进行初始化和生成。
ScheduleStrategyDataManager4ZK,调度策略管理器(对应在zookeeper中的数据),在此进行初始化和生成。
c)调度服务的重启、停止等
如stopServer(String strategyName)、stopAll()、reStart()等。
3、ScheduleServer
任务处理器(可以理解为线程组),由一组线程(n个线程)组成,每个任务处理器有全局唯一的标识符,
一般以IP$UUID[例如192.168.1.100$0C78F0C0FA084E54B6665F4D00FA73DC]的形式出现,
一个任务类型的数据可以n个任务处理器处理。内分为Sleep模式和NotSleep模式:
a)sleep模式,当一线程处理完任务,同时从任务池取不到任务时,若其它线程仍工作,则自己休眠,
若其它线程已休眠,则新调取需要处理的数据,同时唤醒其它休眠线程处理数据;
b)NotSleep模式,当一线程处理完任务,同时从任务池取不到任务时,则新调取需要处理的数据,
同时唤醒其它休眠线程处理数据;
4、TaskItem
任务项,也就是将待处理的任务(数据),进行分片划分,
如:可以按数据的id按10取模,这样就将数年数据划分成了0、1、2、3、4、5、6、7、8、9共10个任务项;
也可按数据的首字母分成了A、B、C、D、E、F、G、H、I、J、K、L、M、N、O、P、Q、R、S、T、U、V、W、X、Y、Z供26个任务项。
这个可以根据需要自行定义的。
5、TaskDealBean
自定义的任务处理类,需要实现Schedule的接口IScheduleTaskDealMulti(批处理)或者IScheduleTaskDealSingle(单任务处理),
内部主要有两个方法,一个是筛选需当前任务处理器处理的数据,另一个是处理已筛选好的数据。
6、OwnSign
环境,指定运行环境,如:开发环境、测试环境、预发环境、生产环境。在筛选当前任务处理器需处理的数据时,会传入该参数。
7、ScheduleTaskType
任务的配置类,包括运行的线程数(threadNumber)、运行时间,任务项分组、没数据时的休眠时间、每次取数的量等
8、ScheduleStrategy
策略的配置类,所有机器的最大线程组数(assignNum),单个jvm的线程数(numOfSingleServer),运行机器(IPList)等信息。
三、tbschedule与spring整合的开发步骤
尽可能多的理解tbschedule和spring后,能理解tbschedule与spring整合的方式其实有多种形式的,
在此介绍一种方式 ,任务和策略在spring启动时进行自动注册。
1、添加maven依赖(另一种方式是直接下载源码,这种方式更好,因为目前版本的tbschedule是有bug的,如查看zookeeper连接信息时,
tbschedule源码是新建已在代码写死的属性,或者读取tomcat中未有的tbschedule配置类,这是不对,应直接读取已有的zookeeper属性,
当然直接maven依赖也不影响使用),spring依赖包在此略过。
2、下载tbschedule的源码http://code.taobao.org/p/tbschedule, 将路径下的tbschedule/ branches / 3.1.0 / src / WebRoot /schedule文件夹复制com.taobao.pamirs.schedule tbschedule 3.2.18 org.apache.zookeeper zookeeper 3.4.6
到工程webapp下,里面tbschdule的jsp文件,便于页面查看与控制任务执行。
3、编写自定义的抽象任务类,内包含调度任务配置类scheduleTaskType和调度策略配置类scheduleStrategy,
便于过会对任务进行自动注册任务和策略信息,该类同时可实现接口IScheduleTaskDealSingle,
继承该抽象类的任务类实现其中的方法,如AbstractBaseScheduleTask.java:
public abstract class AbstractBaseScheduleTask<T> implements IScheduleTaskDealSingle<T> { /** * 调度任务的配置 */ private ScheduleTaskType scheduleTaskType; /** * 调度策略的配置 */ private ScheduleStrategy scheduleStrategy; public ScheduleTaskType getScheduleTaskType() { return scheduleTaskType; } public void setScheduleTaskType(ScheduleTaskType scheduleTaskType) { this.scheduleTaskType = scheduleTaskType; } public ScheduleStrategy getScheduleStrategy() { return scheduleStrategy; } public void setScheduleStrategy(ScheduleStrategy scheduleStrategy) { this.scheduleStrategy = scheduleStrategy; } }4、编写启动类,继承TBScheduleManagerFactory类,用于配置zookeeper信息,
实现ApplicationListener
加载调度任务和调度策略的配置信息到zookeeper中,如类SystemTBScheduleManagerFactory.java :
public class SystemTBScheduleManagerFactory extends TBScheduleManagerFactory implements ApplicationListener5、编写任务类,继承前面自定义的抽象类AbstractBaseScheduleTask,如:{ @Override public void onApplicationEvent(ContextRefreshedEvent event) { //注册调度任务和调度策略 try { super.init(); //默认初始化信息 IScheduleDataManager iScheduleDataManager = null; ScheduleStrategyDataManager4ZK scheduleStrategyDataManager4ZK = null; int waitSecond = 120; //默认初始化等待时间,最长120秒 while((null == iScheduleDataManager || null == scheduleStrategyDataManager4ZK) && waitSecond>0){ waitSecond--; TimeUnit.SECONDS.sleep(1); //等待1秒 try{ iScheduleDataManager = super.getScheduleDataManager();//获取调度任务管理器 scheduleStrategyDataManager4ZK = super.getScheduleStrategyManager();//获取调度策略管理器 }catch (Exception e){ } } Assert.notNull(iScheduleDataManager,"初始化tbschedule配置信息失败"); //若仍初始化失败,则抛异常 Assert.notNull(scheduleStrategyDataManager4ZK,"初始化tbschedule配置信息失败"); //若仍初始化失败,则抛异常 Map ,AbstractBaseScheduleTask> taskMap = event.getApplicationContext().getBeansOfType(AbstractBaseScheduleTask.class); for(Map.Entry ,AbstractBaseScheduleTask> m : taskMap.entrySet()){ String key = m.getKey(); AbstractBaseScheduleTask task = m.getValue(); ScheduleTaskType taskType = task.getScheduleTaskType(); taskType.setBaseTaskType("task_"+key); //任务类型(任务名称) taskType.setDealBeanName(key); ScheduleStrategy scheduleStrategy = task.getScheduleStrategy(); scheduleStrategy.setStrategyName("strategy_"+key); //策略名称 scheduleStrategy.setTaskName(taskType.getBaseTaskType()); //任务名称 scheduleStrategy.setKind(ScheduleStrategy.Kind.Schedule); iScheduleDataManager.updateBaseTaskType(taskType); scheduleStrategyDataManager4ZK.updateScheduleStrategy(scheduleStrategy); } } catch (Exception e) { e.printStackTrace(); } } }
public class SimpleTask extends AbstractBaseScheduleTask6、配置spring文件spring-tbschedule.xml,包含启动类和任务类配置。{ /** * 执行单个任务 * @param task Object * @param ownSign 当前环境名称 * @throws Exception */ public boolean execute(Date task, String ownSign) throws Exception{ System.out.println("dispose task : "+task.getTime()); //当前任务处理器内的线程处理数据 return true; } /** * 根据条件,查询当前调度服务器可处理的任务 * @param taskParameter 任务的自定义参数 * @param ownSign 当前环境名称 * @param taskItemNum 当前任务类型的任务队列数量 * @param taskItemList 当前调度服务器,分配到的可处理队列 * @param eachFetchDataNum 每次获取数据的数量 * @return * @throws Exception */ public List selectTasks(String taskParameter, String ownSign, int taskItemNum, List taskItemList, int eachFetchDataNum) throws Exception { List dateList = new ArrayList<>(); List taskIdList = new ArrayList<>(); for(TaskItemDefine t : taskItemList){ //确定当前任务处理器需处理的任务项id taskIdList.add(Long.valueOf(t.getTaskItemId())); } for(int i=0;i ;i++){ // 添加最多指定数量的待处理数据 Date date = new Date(); //生成待处理数据 Long remainder = date.getTime() % taskItemNum ; if(taskIdList.contains(remainder)){ //根据数据取模,判断当前待处理数据,是否应由当前任务处理器处理 dateList.add(date); } TimeUnit.SECONDS.sleep(1); } return dateList; //返回当前任务处理器需要处理的数据 } /** * 获取任务的比较器,主要在NotSleep模式下需要用到 * @return */ public Comparator getComparator() { return null; } }
xml version="1.0" encoding="UTF-8"?>xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:context="http://www.springframework.org/schema/context" xsi:schemaLocation="http://www.springframework.org/schema/beans http://www.springframework.org/schema/beans/spring-beans.xsd http://www.springframework.org/schema/context http://www.springframework.org/schema/context/spring-context.xsd "> id="systemTBScheduleManagerFactory" class="com.dragon.tbscheduleStudy.system.SystemTBScheduleManagerFactory"> name="zkConfig"> key="zkConnectString" value="127.0.0.1:2181" /> key="rootPath" value="/myself/tbscheduleStudy" /> key="userName" value="root" /> key="password" value="123456" /> key="zkSessionTimeout" value="8000" /> key="isCheckParentPath" value="true" /> id="simpleTask" class="com.dragon.tbscheduleStudy.task.SimpleTask" > name="scheduleTaskType"> class="com.taobao.pamirs.schedule.taskmanager.ScheduleTaskType"> name="permitRunStartTime" value="0 0 0 * * ?" /> name="permitRunEndTime" value="59 59 23 * * ?" /> name="sleepTimeNoData" value="3000" /> name="sleepTimeInterval" value="1000" /> name="fetchDataNumber" value="10" /> name="taskItems">
0:{TYPE=A,KIND=1} 1:{TYPE=B,KIND=2} 2:{TYPE=C,KIND=3} name="scheduleStrategy"> class="com.taobao.pamirs.schedule.strategy.ScheduleStrategy"> name="assignNum" value="9" /> name="numOfSingleServer" value="3" /> name="IPList">
127.0.0.1
7、配置web.xml文件,如:
xml version="1.0" encoding="UTF-8"?>xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://java.sun.com/xml/ns/javaee http://java.sun.com/xml/ns/javaee/web-app_3_0.xsd" version="3.0"> contextConfigLocation classpath:spring-tbschedule.xml org.springframework.web.context.ContextLoaderListener
8、修改项目的index.jsp页面,重定向到tbschedule首页,如:
<% response.sendRedirect("schedule/index.jsp"); %>
至此,开发流程结束,启动项目,在浏览器输入http://localhost:8080/schedule/index.jsp,可查看任务情况,
若想修改配置,则输入地址http://localhost:8080/schedule/index.jsp?manager=true即可