上周末打球实在太累了,就没来得及更新,只是列了个提纲做做准备,发现Context还是有很多内容的。结果也花了不少时间才写完,所以这篇需要各位慢慢消化,并且最好多写几个例子加深理解。
如果有不了解Esper的同学,建议先看看《Esper学习之一:Esper介绍 》《Esper学习之二:事件类型》《Esper学习之三:进程模型》这三篇基础文章,这样会有助于Esper的学习。
Context是Esper里一个很有意思的概念,要是理解为上下文,我觉得有点不妥。以我的理解,Context就像一个框,把不同的事件按照框的规则框起来,并且有可能有多个框,而框与框之间不会互相影响。不知道各位在看完这篇文章后是否认同我的观点,我愿洗耳恭听。
1.Context基本语法
语法结构如下
create context context_name partition [by] event_property [and event_property [and ...]] from stream_def [, event_property [...] from stream_def] [, ...]
说明:
context_name为context的名字,并且唯一。如果重复,会说明已存在。
event_property为事件的属性名,多个属性名之间用and连接,也可以用逗号连接。
stream_def为事件流的定义,简单的定义可以是一个事件的名称,比如之前定义了一个Map结构的事件为User,那么这里就可以写User。复杂的流定义后面会说到
举个例子:
create context NewUser partition by id and name from User // id和name是User的属性
如果context包含多个流,例子如下:
create context Person partition by sid from Student, tid from Teacher // sid是Student的属性,tid是Teacher的属性
多个流一定要注意,每个流的中用于context的属性的数量要一样,数据类型也要一致。比如下面这几个就是错误的:
create context Person partition by sid from Student, tname from Teacher // 错误:sid是int,tname是String,数据类型不一致 create context Person partition by sid from Student, tid,tname from Teacher // 错误:Student有一个属性,Teacher有两个属性,属性数量不一致 create context Person partition by sid,sname from Student, tname,tid from Teacher // 错误:sid对应tname,sname对应tid,并且sname和tname是String,sid和tid是int,属性数量一样,但是对应的数据类型不一致
实际上可以对进入context的事件增加过滤条件,不符合条件的就被过滤掉,就像下面这样:
create context Person partition by sid from Student(age > 20) // age大于20的Student事件才能建立或者进入context
看了这么多,可能大家只是知道context的一些基本定义方法,但是不知道什么意思。其实很简单,partition by后面的属性,就是作为context的一个约束,比如说id,如果id相等的则进入同一个context里,如果id不同,那就新建一个context。好比根据id分组,id相同的会被分到一个组里,不同的会新建一个组并等待相同的进入。
如果parition by后面跟着同一个流的两个属性,那么必须两个属性值一样才能进入context。比如说A事件id=1,name=a,那么会以1和a两个值建立context,有点像数据库里的联合主键。然后B事件id=1,name=b,则又会新建一个context。接着C事件id=1,name=a,那么会进入A事件建立的context。
如果partition by后面跟着两个流的一个属性,那么两个属性值一样才能进入context。比如说Student事件sid=1,那么会新建一个context,然后来了个Teacher事件tid=1,则会进入sid=1的那个context。多个流也一样,不用关心是什么事件,只用关心事件的属性值一样即可进入同一个context。
要是说了这么多还是不懂,可以看看下面要讲的context自带属性也许就能明白一些了。
2. Built-In Context Properties
Context本身自带一些属性,最关键的是可以查看所创建的context的标识,并帮助我们理解context的语法。
如上所示,name表示context的名称,这个是不会变的。id是每个context的唯一标识,从0开始。key1和keyN表示context定义时所选择的属性的值,1和N表示属性的位置。例如:
EPL: create context Person partition by sid, sname from Student // key1为sid,key2为sname
为了说明对这几个属性的应用,我举了一个比较完整的例子。
import com.espertech.esper.client.EPAdministrator; import com.espertech.esper.client.EPRuntime; import com.espertech.esper.client.EPServiceProvider; import com.espertech.esper.client.EPServiceProviderManager; import com.espertech.esper.client.EPStatement; import com.espertech.esper.client.EventBean; import com.espertech.esper.client.UpdateListener; class ESB { private int id; private int price; public int getId() { return id; } public void setId(int id) { this.id = id; } public int getPrice() { return price; } public void setPrice(int price) { this.price = price; } } class ContextPropertiesListener2 implements UpdateListener { public void update(EventBean[] newEvents, EventBean[] oldEvents) { if (newEvents != null) { EventBean event = newEvents[0]; System.out.println("context.name " + event.get("name") + ", context.id " + event.get("id") + ", context.key1 " + event.get("key1") + ", context.key2 " + event.get("key2")); } } } public class ContextPropertiesTest2 { public static void main(String[] args) { EPServiceProvider epService = EPServiceProviderManager.getDefaultProvider(); EPAdministrator admin = epService.getEPAdministrator(); EPRuntime runtime = epService.getEPRuntime(); String esb = ESB.class.getName(); // 创建context String epl1 = "create context esbtest partition by id,price from " + esb; // context.id针对不同的esb的id,price建立一个context,如果事件的id和price相同,则context.id也相同,即表明事件进入了同一个context String epl2 = "context esbtest select context.id,context.name,context.key1,context.key2 from " + esb; admin.createEPL(epl1); EPStatement state = admin.createEPL(epl2); state.addListener(new ContextPropertiesListener2()); ESB e1 = new ESB(); e1.setId(1); e1.setPrice(20); System.out.println("sendEvent: id=1, price=20"); runtime.sendEvent(e1); ESB e2 = new ESB(); e2.setId(2); e2.setPrice(30); System.out.println("sendEvent: id=2, price=30"); runtime.sendEvent(e2); ESB e3 = new ESB(); e3.setId(1); e3.setPrice(20); System.out.println("sendEvent: id=1, price=20"); runtime.sendEvent(e3); ESB e4 = new ESB(); e4.setId(4); e4.setPrice(20); System.out.println("sendEvent: id=4, price=20"); runtime.sendEvent(e4); } }
执行结果:
sendEvent: id=1, price=20 context.name esbtest, context.id 0, context.key1 1, context.key2 20 sendEvent: id=2, price=30 context.name esbtest, context.id 1, context.key1 2, context.key2 30 sendEvent: id=1, price=20 context.name esbtest, context.id 0, context.key1 1, context.key2 20 sendEvent: id=4, price=20 context.name esbtest, context.id 2, context.key1 4, context.key2 20
这个例子说得比较明白,针对不同的id和price,都会新建一个context,并context.id会从0开始增加作为其标识。如果id和price一样,事件就会进入之前已经存在的context,所以e3这个事件就会和e1一样存在于context.id=0的context里面。
对于epl2这个句子,意思是在esbtest这个context限制下进行事件的计算,不过这个句子很简单,可以说没有什么计算,事件进入后就显示出来了。实际上写成什么样都可以,但是必须以context xxx开头(xxx表示context定义时的名字),比如说:
// context定义 create context esbtest2 partition by id from ESB // 每当5个id相同的ESB事件进入时,统计price的总和 context esbtest select sum(price) from ESB.win:length_batch(5) // 根据不同的id,统计3秒内进入的事件的平均price,且price必须大于10 context esbtest select avg(price) from ESB(price>10).win:time(3 sec)
也许你会发现为什么我写的句子都会带有".win:length"或者".win:time",那是因为我要计算的都是一堆事件,所以必须用一定条件才能把事件聚集起来。当然并不是一个事件没法计算,只不过更多情况下计算都是以多个事件为基础的。关于这一点,学习到后面就会有更多的接触。
3. Hash Context
前面介绍的Context语法是以事件属性来定义的,Esper提供了以Hash值为标准定义Context,通俗一点说就是提供事件属性参与hash值的计算,计算的值再对某个值(这是什么)是同余的则进入到同一个context中。详细语法如下:
create context context_name coalesce [by] hash_func_name(hash_func_param) from stream_def [, hash_func_name(hash_func_param) from stream_def ] [, ...] granularity granularity_value [preallocate]
a). hash_func_name为hash函数的名称,Esper提供了CRC32或者使用Java的hashcode函数来计算hash值,分别为consistent_hash_crc32和hash_code。你也可以自己定义hash函数,不过这需要配置。
b). hash_func_param为参与计算的属性列表,比如之前的sid或者tname什么的。
c). stream_def就是事件类型,可以一个可以多个。不同于前面的Context语法要求,Hash Context不管有多个少属性作为基础来计算hash值,hash值都只有一个,并且为int型。所以就不用关心这些属性的个数以及数据类型了。
d). granularity是必选参数,表示为最多能创建多少个context
e). granularity_value就是那个用于取余的“某个值”,因为Esper为了防止内存溢出,就想出了取余这种办法来限制context创建的数量。也就是说context.id=hash_func_name(hash_func_param) % granularity_value。
f). preallocate是一个可选参数,如果使用它,那么Esper会预分配空间来创建granularity_value数量的context。比如说granularity_value为1024,那么Esper会预创建1024个context。内存不大的话不建议使用这个参数。
Hash Context同样可以过滤事件,举个完整的例子:
// 以java的hashcode方法计算sid的值(sid必须大于5),以CRC32算法计算tid的值,然后对10取余后的值来建立context create context HashPerson coalesce by hash_code(sid) from Student(sid>5), consistent_hash_crc32(tid) from Teacher granularity 10
Hash Context也有Built-In Context Properties,只不过只有context.id和context.name了。用法和前面说的一样,这里就不列举了。
小贴士:
1.如果用于hash计算的属性比较多,那么就不建议使用CRC32算法了,因为他会把这些属性值先序列化字节数组以后才能计算hash值。hashcode方法相对它能快很多。
2.如果使用preallocate参数,建议granularity_value不要超过1000
3.如果granularity_value超过65536,引擎查找context会比较费劲,进而影响计算速度
4. Category Context
Category Context相对之前的两类context要简单许多,也更容易理解。语法说明如下:
create context context_name group [by] group_expression as category_label [, group [by] group_expression as category_label] [, ...] from stream_def
我相信基本上不用我说,大家都能理解。group_expression表示分组策略的表达式,category_label为策略定义一个名字,一个context可以有多个策略同时存在,但是特殊的是之能有一个stream_def。例如:
create context CategoryByTemp group temp < 5 as cold, group temp between 5 and 85 as normal, group temp > 85 as large from Temperature
Category Context也有它自带的属性。
label指明进入的事件所处的group是什么。完整例子如下:
import com.espertech.esper.client.EPAdministrator; import com.espertech.esper.client.EPRuntime; import com.espertech.esper.client.EPServiceProvider; import com.espertech.esper.client.EPServiceProviderManager; import com.espertech.esper.client.EPStatement; import com.espertech.esper.client.EventBean; import com.espertech.esper.client.UpdateListener; class ESB3 { private int id; private int price; public int getId() { return id; } public void setId(int id) { this.id = id; } public int getPrice() { return price; } public void setPrice(int price) { this.price = price; } } class ContextPropertiesListener4 implements UpdateListener { public void update(EventBean[] newEvents, EventBean[] oldEvents) { if (newEvents != null) { EventBean event = newEvents[0]; System.out.println("context.name " + event.get("name") + ", context.id " + event.get("id") + ", context.label " + event.get("label")); } } } public class ContextPropertiesTest4 { public static void main(String[] args) { EPServiceProvider epService = EPServiceProviderManager.getDefaultProvider(); EPAdministrator admin = epService.getEPAdministrator(); EPRuntime runtime = epService.getEPRuntime(); String esb = ESB3.class.getName(); String epl1 = "create context esbtest group by id<0 as low, group by id>0 and id<10 as middle,group by id>10 as high from " + esb; String epl2 = "context esbtest select context.id,context.name,context.label, price from " + esb; admin.createEPL(epl1); EPStatement state = admin.createEPL(epl2); state.addListener(new ContextPropertiesListener4()); ESB3 e1 = new ESB3(); e1.setId(1); e1.setPrice(20); System.out.println("sendEvent: id=1, price=20"); runtime.sendEvent(e1); ESB3 e2 = new ESB3(); e2.setId(0); e2.setPrice(30); System.out.println("sendEvent: id=0, price=30"); runtime.sendEvent(e2); ESB3 e3 = new ESB3(); e3.setId(11); e3.setPrice(20); System.out.println("sendEvent: id=11, price=20"); runtime.sendEvent(e3); ESB3 e4 = new ESB3(); e4.setId(-1); e4.setPrice(40); System.out.println("sendEvent: id=-1, price=40"); runtime.sendEvent(e4); } }
输出结果为:
sendEvent: id=1, price=20 context.name esbtest, context.id 1, context.label middle sendEvent: id=0, price=30 sendEvent: id=11, price=20 context.name esbtest, context.id 2, context.label high sendEvent: id=-1, price=40 context.name esbtest, context.id 0, context.label low
可以发现,id=0的事件,并没有触发监听器,那是因为context里的三个category没有包含id=0的情况,所以这个事件就被排除掉了。
5. Non-Overlapping Context
这类Context有个特点,是由开始和结束两个条件构成context。语法如下:
create context context_name start start_condition end end_condition
这个context有两个条件做限制,形成一个约束范围。当开始条件和结束条件都没被触发时,引擎会观察事件的进入是否会触发开始条件。如果开始条件被触发了,那么就新建一个context,并且观察结束条件是否被触发。如果结束条件被触发,那么context结束,引擎继续观察开始条件何时被触发。所以说这类Context的另一个特点是,要么context存在并且只有一个,要么条件都没被触发,也就一个context都没有了。
start_condition和end_condition可以是时间,或者是事件类型。比如说:
create context NineToFive start (0, 9, *, *, *) end (0, 17, *, *, *) // 9点到17点此context才可用(以引擎的时间为准)。如果事件进入的事件不在此范围内,则不受该context影响
我列了一个完整的例子,以某类事件开始,以某类事件结束
import com.espertech.esper.client.EPAdministrator; import com.espertech.esper.client.EPRuntime; import com.espertech.esper.client.EPServiceProvider; import com.espertech.esper.client.EPServiceProviderManager; import com.espertech.esper.client.EPStatement; import com.espertech.esper.client.EventBean; import com.espertech.esper.client.UpdateListener; class StartEvent{} class EndEvent{} class OtherEvent { private int id; public int getId() { return id; } public void setId(int id) { this.id = id; } } class NoOverLappingContextTest3 implements UpdateListener { public void update(EventBean[] newEvents, EventBean[] oldEvents) { if (newEvents != null) { EventBean event = newEvents[0]; System.out.println("Class:" + event.getUnderlying().getClass().getName() + ", id:" + event.get("id")); } } } public class NoOverLappingContextTest { public static void main(String[] args) { EPServiceProvider epService = EPServiceProviderManager.getDefaultProvider(); EPAdministrator admin = epService.getEPAdministrator(); EPRuntime runtime = epService.getEPRuntime(); String start = StartEvent.class.getName(); String end = EndEvent.class.getName(); String other = OtherEvent.class.getName(); // 以StartEvent事件作为开始条件,EndEvent事件作为结束条件 String epl1 = "create context NoOverLapping start " + start + " end " + end; String epl2 = "context NoOverLapping select * from " + other; admin.createEPL(epl1); EPStatement state = admin.createEPL(epl2); state.addListener(new NoOverLappingContextTest3()); StartEvent s = new StartEvent(); System.out.println("sendEvent: StartEvent"); runtime.sendEvent(s); OtherEvent o = new OtherEvent(); o.setId(2); System.out.println("sendEvent: OtherEvent"); runtime.sendEvent(o); EndEvent e = new EndEvent(); System.out.println("sendEvent: EndEvent"); runtime.sendEvent(e); OtherEvent o2 = new OtherEvent(); o2.setId(4); System.out.println("sendEvent: OtherEvent"); runtime.sendEvent(o2); } }
执行结果:
sendEvent: StartEvent sendEvent: OtherEvent Class:blog.OtherEvent, id:2 sendEvent: EndEvent sendEvent: OtherEvent
由此可以看出,在NoOverLapping这个Context下监控OtherEvent,必须是在StartEvent被触发才能监控到,所以在EndEvent发送后,再发送一个OtherEvent是不会触发Listener的。
6. OverLapping
OverLapping和NoOverLapping一样都有两个条件限制,但是区别在于OverLapping的初始条件可以被触发多次,并且只要被触发就会新建一个context,但是当终结条件被触发时,之前建立的所有context都会被销毁。他的语法也很简单:
create context context_name initiated [by] initiating_condition terminated [by] terminating_condition
initiating_condition和terminating_condition可以为事件类型,事件或者别的条件表达式。下面给出了一个完整的例子。
import com.espertech.esper.client.EPAdministrator; import com.espertech.esper.client.EPRuntime; import com.espertech.esper.client.EPServiceProvider; import com.espertech.esper.client.EPServiceProviderManager; import com.espertech.esper.client.EPStatement; import com.espertech.esper.client.EventBean; import com.espertech.esper.client.UpdateListener; class InitialEvent{} class TerminateEvent{} class SomeEvent { private int id; public int getId() { return id; } public void setId(int id) { this.id = id; } } class OverLappingContextListener implements UpdateListener { public void update(EventBean[] newEvents, EventBean[] oldEvents) { if (newEvents != null) { EventBean event = newEvents[0]; System.out.println("context.id:" + event.get("id") + ", id:" + event.get("id")); } } } class OverLappingContextListener2 implements UpdateListener { public void update(EventBean[] newEvents, EventBean[] oldEvents) { if (newEvents != null) { EventBean event = newEvents[0]; System.out.println("Class:" + event.getUnderlying().getClass().getName() + ", id:" + event.get("id")); } } } public class OverLappingContextTest { public static void main(String[] args) { EPServiceProvider epService = EPServiceProviderManager.getDefaultProvider(); EPAdministrator admin = epService.getEPAdministrator(); EPRuntime runtime = epService.getEPRuntime(); String initial = InitialEvent.class.getName(); String terminate = TerminateEvent.class.getName(); String some = SomeEvent.class.getName(); // 以InitialEvent事件作为初始事件,TerminateEvent事件作为终结事件 String epl1 = "create context OverLapping initiated " + initial + " terminated " + terminate; String epl2 = "context OverLapping select context.id from " + initial; String epl3 = "context OverLapping select * from " + some; admin.createEPL(epl1); EPStatement state = admin.createEPL(epl2); state.addListener(new OverLappingContextListener()); EPStatement state1 = admin.createEPL(epl3); state1.addListener(new OverLappingContextListener2()); InitialEvent i = new InitialEvent(); System.out.println("sendEvent: InitialEvent"); runtime.sendEvent(i); SomeEvent s = new SomeEvent(); s.setId(2); System.out.println("sendEvent: SomeEvent"); runtime.sendEvent(s); InitialEvent i2 = new InitialEvent(); System.out.println("sendEvent: InitialEvent"); runtime.sendEvent(i2); TerminateEvent t = new TerminateEvent(); System.out.println("sendEvent: TerminateEvent"); runtime.sendEvent(t); SomeEvent s2 = new SomeEvent(); s2.setId(4); System.out.println("sendEvent: SomeEvent"); runtime.sendEvent(s2); } }
执行结果:
sendEvent: InitialEvent context.id:0, id:0 sendEvent: SomeEvent Class:blog.SomeEvent, id:2 sendEvent: InitialEvent context.id:1, id:1 context.id:0, id:0 sendEvent: TerminateEvent sendEvent: SomeEvent
从结果可以看得出来,每发送一个InitialEvent,都会新建一个context,以至于context.id=0和1。并且当发送TerminateEvent后,再发送SomeEvent监听器也不会被触发了。
另外,context.id是每一种Context都会有的自带属性,而且针对OverLapping,还增加了startTime和endTime两种属性,表明context的开始时间和结束时间。
7. Context Condition
Context Condition主要包含Filter,Pattern,Crontab以及Time Period
A). Filter主要就是对属性值的过滤,比如:
create context NewUser partition by id from User(id > 10)
B). Pattern是复杂事件流的代表,比如说“A事件到达后跟着B事件到达”这是一个完整的Pattern。Pattern是Esper里面很特别的东西,并且用它描述复杂的事件流是最合适不过的了。这里暂且不展开说,后面会有专门好几篇来讲解Pattern。
C). Crontab是定时任务,主要用于NoOverLapping,就像前面提到的(0, 9, *, *, *),括号里的五项代表分,时,天,月,年。关于这个后面也会有讲解。
D). Time Period在这里只有一种表达式,就是after time_period_expression。例如:after 1 minute,after 5 sec
8. Context Nesting
Context也可以嵌套,意义就是多个Context联合在一起组成一个大的Context,以满足复杂的限制需求。语法结构:
create context context_name context nested_context_name [as] nested_context_definition , context nested_context_name [as] nested_context_definition [, ...]
举个例子:
create context NineToFiveSegmented context NineToFive start (0, 9, *, *, *) end (0, 17, *, *, *), context SegmentedByUser partition by userId from User
应用和普通的Context没区别,在此就不举例了。另外针对嵌套Context,其自带的属性使用方式会有些变化。比如针对上面这个,若想查看NineToFive的startTime和SegmentedByUser的第一个属性值,要按照下面这样写:
context NineToFiveSegmented select context.NineToFive.startTime, context.SegmentedByUser.key1 from User
9. Output When Context Partition Ends
当Context销毁时,如果你想同时查看此时Context里的东西,那么Esper提供了一种办法来输出其内容。例如:
create context OverLapping initiated InitialEvent terminated TerminateEvent context OverLapping select * from User output snapshot when terminated
那么当终结事件发送到引擎后,会立刻输出OverLapping的快照。
如果你想以固定的频率查看Context的内容,Esper也支持。例如:
context OverLapping select * from User output snapshot every 2 minute // 每两分钟输出OverLapping的事件
关于output表达式,后面也会有详解。
以上的内容算是包含了Context的所有方面,可能还有些细节需要各位自己去研读他的手册,并且多加练习。Esper的内容之多以至于我说了很多次“后面会专门讲解”,不过也确实是因为内容复杂,所以不得不先跳过这些。在学习到之后的内容以后,再回过头来理解Context可能会有另一番效果。
PS:为了完成这篇文章,我又重新细读了手册,调试了好几个例子,花了三个晚上才终于搞定。