flink 常用窗口函数

前言

窗口是flink作为实时计算中的一个重要的概念,也称TimeWindow, TimeWindow是将指定时间范围内的所有数据组成一个 window,一次对一个window 里面的所有数据进行计算

flink中的窗口类型

  • 滚动窗口
Flink 默认的时间窗口根据 Processing Time 进行窗口的划分,将 Flink 获取到的数据根据进入 Flink 的时间划分到不同的窗口中
DataStream> minTempPerWindowStream = dataStream
 .map(new MapFunction>() {
 @Override
 public Tuple2 map(SensorReading value) throws 
Exception {
 return new Tuple2<>(value.getId(), value.getTemperature());
 }
 })
 .keyBy(data -> data.f0) 
 .timeWindow( Time.seconds(15) )
 .minBy(1);

使用TimeWindow相关API时,需要基本明确其计算模型,flink的窗口概念很像是算法中的桶的概念,即把一个时间窗口范围内的数据根据一定的业务字段分组后,归到这个“桶”中,然后基于这个“桶”中的数据做各种计算、归并等业务操作

你可能感兴趣的:(flink,入门到精通,flink,大数据,big,data)