Flink中的时间和窗口操作

 

1.窗口概念

在大多数场景下,我们需要统计的数据流都是无界的,因此我们无法等待整个数据流终止后才进行统计。通常情况下,我们只需要对某个时间范围或者数量范围内的数据进行统计分析:如每隔五分钟统计一次过去一小时内所有商品的点击量;或者每发生1000次点击后,都去统计一下每个商品点击率的占比。在 Flink 中,我们使用窗口 (Window) 来实现这类功能。按照统计维度的不同,Flink 中的窗口可以分为 时间窗口 (Time Windows) 和 计数窗口 (Count Windows) 。

 

2. 窗口类型

2.1 flink支持两种划分窗口的方式(time和count)   

 如果根据时间划分窗口,那么它就是一个time-window    如果根据数据划分窗口,那么它就是一个count-window

 

2.2 flink支持窗口的两个重要属性(size和interval)    

你可能感兴趣的:(大数据计算引擎,Flink,flink,大数据,scala)