数据文

时间和窗口

文章目录

时间和窗口
- 一、Flink 的三种时间语义
- 二、水位线（Watermark）
- - 1. Flink 中的 Watermark 机制
  - 2. 如何生成水位线
  - 3. 水位线的传递
- 三、窗口（Window）
- - 1.窗口的概念和分类
  - 2. 窗口分配器（Window Assigners）
  - 3. 窗口函数（Window Functions）
  - 4. 触发器（Trigger）、移除器（Evictor）、允许延迟和侧输出流（Side Output）
  - 5. 窗口的生命周期
- 四、迟到数据的处理，结果正确性的三重保障

下一章： Flink 1.13 处理函数（ProcessFunction）

一、Flink 的三种时间语义

Event Time：是事件创建的时间。它通常由事件中的时间戳描述，例如采集的日志数据中，每一条日志都会记录自己的生成时间，Flink 通过时间戳分配器访问事件时间戳。
Processing Time：是每一个执行基于时间操作的算子的本地系统时间，与机器相关，默认的时间属性就是Processing Time。
Ingestion Time：是数据进入 Flink 的时间。

二、水位线（Watermark）

1. Flink 中的 Watermark 机制

在 Flink 中，用来衡量事件时间（Event Time）进展的标记，就被称作“水位线”。

水位线是插入到数据流中的一个标记，可以认为是一个特殊的数据；
水位线主要属性就是时间戳，用来表示当前事件时间的进展；
水位线是基于数据的时间戳生成的；
水位线的时间戳必须单调递增，以确保任务的事件时间时钟一直向前推进；
水位线可以通过设置延迟，来保证正确处理乱序数据；
一个水位线 Watermark(t)，表示在当前流中事件时间已经达到了 timestamp, 代表 timestamp 之前的所有数据都到齐了，如果后续还有 timestamp 小于 Watermark 的数据到达，称为迟到数据；
基于事件时间，用来触发窗口、定时器等。

2. 如何生成水位线

生成水位线的总体原则
Flink 中的水位线，其实是流处理中对低延迟和结果正确性的一个权衡机制，而且把控制的权力交给了程序员，我们可以在代码中定义水位线的生成策略。
水位线生成策略（Watermark Strategies）
DataStream API 中，有一个单独用于生成水位线的方法： .assignTimestampsAndWatermarks()，它主要用来为流中的数据分配时间戳，并生成水位线来指示事件时间。

public interface WatermarkStrategy<T> extends TimestampAssignerSupplier<T>, WatermarkGeneratorSupplier<T>{ 
    @Override //时间戳分配器
    TimestampAssigner<T> createTimestampAssigner(
							TimestampAssignerSupplier.Context context);  
    @Override  //水位线生成器
    WatermarkGenerator<T>  createWatermarkGenerator(
							WatermarkGeneratorSupplier.Context context); 
}

TimestampAssigner：主要负责从流中数据元素的某个字段中提取时间戳，并分配给元素。时间戳的分配是生成水位线的基础。
WatermarkGenerator：主要负责按照既定的方式，基于时间戳生成水位线。WatermarkGenerator 接口中，主要又有两个方法：onEvent()和 onPeriodicEmit()。
onEvent：每个事件到来都会调用，它的参数有当前事件、时间戳，以及允许发出水位线的一个WatermarkOutput，可以基于事件做各种操作
onPeriodicEmit：周期性调用，可以由 WatermarkOutput 发出水位线。周期时间为处理时间，可以调用环境配置的.setAutoWatermarkInterval()方法来设置，默认200ms。
```
env.getConfig().setAutoWatermarkInterval(60 * 1000L)
```

Flink 内置水位线生成器
Flink 内置水位线生成器采用的是周期性生成水位线，默认200ms，因为断点式会给系统带来压力。

有序流
对于有序流，主要特点就是时间戳单调[Monotonously]增长，不会出现迟到数据。

stream.assignTimestampsAndWatermarks( 
  WatermarkStrategy.<Event>forMonotonousTimestamps() 
 .withTimestampAssigner(new SerializableTimestampAssigner<Event>() { 
   @Override                     
		 public long extractTimestamp(Event element,long recordTimestamp){
                      return element.timestamp; 
   } 
  }) 
);

乱序流
由于乱序流中需要等待迟到数据到齐，所以必须设置一个固定量的延迟时间。这时生成水位线的时间戳，就是当前数据流中最大的时间戳减去延迟的结果，相当于把表调慢，当前时钟会滞后于数据的最大时间戳。

stream.assignTimestampsAndWatermarks( 
  //maxOutOfOrderness 参数，表示“最大乱序程度”
  WatermarkStrategy.<Event>forBoundedOutOfOrderness(Duration.ofSeconds(5) 
	 .withTimestampAssigner(new SerializableTimestampAssigner<Event>() { 
   @Override                     
		 public long extractTimestamp(Event element,long recordTimestamp){
       return element.timestamp; 
   } 
  }) 
);

乱序流中生成的水位线真正的时间戳，其实是 当前最大时间戳 – 延迟时间 – 1，因为时间戳为 t 的水位线，表示时间戳≤t 的数据全部到齐，不会再来了，实际上为t的数据还会来。

public void onPeriodicEmit(WatermarkOutput output) { 
 output.emitWatermark(new Watermark(maxTimestamp - outOfOrdernessMillis - 1)); 
}

自定义水位线策略

周期性水位线生成器（Periodic Generator）

public static class CustomWatermarkStrategy implements WatermarkStrategy<Event> { 
   @Override 
   public TimestampAssigner<Event> createTimestampAssigner( TimestampAssignerSupplier.Context context) {       return new SerializableTimestampAssigner<Event>() { 
                   @Override 
                   public long extractTimestamp(Event element, long recordTimestamp){
                       return element.timestamp; // 告诉程序数据源里的时间戳是哪一个字段 
                   } 
             }; 
   } 

   @Override 
   public WatermarkGenerator<Event> createWatermarkGenerator(WatermarkGeneratorSupplier.Context context) {               
	  return new WatermarkGenerator<Event> {         
				 private Long delayTime = 5000L; // 延迟时间  
				 // 观察到的最大时间戳       
				 private Long maxTs = Long.MIN_VALUE + delayTime + 1L; 
         		 @Override         
				 public void onEvent(Event event, long eventTimestamp, WatermarkOutput output) { 
            		//每来一条数据就调用一次 
            		maxTs = Math.max(event.timestamp, maxTs); // 更新最大时间戳
				 } 
         		 @Override         
				 public void onPeriodicEmit(WatermarkOutput output) { 
            		// 发射水位线，默认200ms调用一次 
            		output.emitWatermark(new Watermark(maxTs - delayTime - 1L));
         		 } 
    	  	}; 
	}
}

断点式水位线生成器（Punctuated Generator）

public class CustomPunctuatedGenerator implements WatermarkGenerator<Event> {
	@Override     
	public void onEvent(Event r,long eventTimestamp, WatermarkOutput output) {
		// 只有在遇到特定的itemId时，才发射水位线 
        if (r.user.equals("Mary")) {             
			output.emitWatermark(new Watermark(r.timestamp- 1));         
		} 
    } 
 
    @Override     
	public void onPeriodicEmit(WatermarkOutput output) { 
        // 不需要做任何事情，因为我们在onEvent方法中发射了水位线 
    } 
}

在自定义数据源中发送水位线

// 泛型是数据源中的类型 
public static class ClickSourceWithWatermark implements SourceFunction<Event> {         
	private boolean running = true; 
    @Override
    public void run(SourceContext<Event> sourceContext) throws Exception { 
        Random random = new Random(); 
        String[] userArr = {"Mary", "Bob", "Alice"}; 
        String[] urlArr  = {"./home", "./cart", "./prod?id=1"}; 
        while (running) { 
           long currTs = Calendar.getInstance().getTimeInMillis(); 
           String username = userArr[random.nextInt(userArr.length)]; 
           String url = urlArr[random.nextInt(urlArr.length)]; 
           Event event = new Event(username, url, currTs); 
           // 使用collectWithTimestamp方法将数据发送出去，并指明数据中的时间戳的字段
           sourceContext.collectWithTimestamp(event, event.timestamp); 
           // 发送水位线 
           sourceContext.emitWatermark(new Watermark(event.timestamp-1L));
           Thread.sleep(1000L); 
         } 
     } 
 	 @Override         
	 public void cancel() {             
		 running = false; 
     } 
}

在数据流开始之前，Flink 会插入一个大小是负无穷大（在 Java 中是-Long.MAX_VALUE）的水位线，而在数据流结束时，Flink 会插入一个正无穷大（Long.MAX_VALUE）的水位线，保证所有的窗口闭合以及所有的定时器都被触发。

对于离线数据集，Flink 也会将其作为流读入，也就是一条数据一条数据的读取。在这种情况下，Flink 对于离线数据集，只会插入两次水位线，也就是在最开始处插入负无穷大的水位线，在结束位置插入一个正无穷大的水位线。因为只需要插入两次水位线，就可以保证计算的正确，无需在数据流的中间插入水位线了。

3. 水位线的传递

Watermark是一条携带时间戳的特殊数据，从代码指定生成的位置，插入到流里面。

一对多：广播
多对一：取最小

最新 Flink 1.13 时间和窗口（时间语义、Watermark、Window 窗口、Trigger）快速入门、详细教程_第1张图片

多对多：拆分来看，其实就是上面两种的结合

三、窗口（Window）

1.窗口的概念和分类

Flink 是一种流式计算引擎，主要是来处理无界数据流的，数据源源不断、无穷无尽。想要更加方便高效地处理无界流，一种方式就是将无限数据切割成有限的“数据块”进行处理，这就是所谓的“窗口”（Window）。

在 Flink 中，窗口其实并不是一个“框”，流进来的数据被框住了就只能进这一个窗口。相比之下，我们应该把窗口理解成一个“桶”。在 Flink 中，窗口可以把流切割成有限大小的多个“存储桶”（bucket)；每个数据都会分发到对应的桶中，当到达窗口结束时间时，就对每个桶中收集的数据进行计算处理。

最新 Flink 1.13 时间和窗口（时间语义、Watermark、Window 窗口、Trigger）快速入门、详细教程_第2张图片

**窗口的分类：**

按照驱动类型分类
- 时间窗口（Time Window）
  时间窗口以时间点来定义窗口的开始（start）和结束（end），所以截取出的就是某一时间段的数据。到达结束时间时，窗口不再收集数据，触发计算输出结果，并将窗口关闭销毁。所以可以说基本思路就是“定点发车”。处理时间窗口和事件时间窗口。窗口时间范围都是左闭右开的区间[start，end)。最大允许的时间戳就是 end - 1，与水位线一致。
- 计数窗口（Count Window）
  计数窗口基于元素的个数来截取数据，到达固定的个数时就触发计算并关闭窗口。底层是通过“全局窗口”（Global Window）来实现的。
按照窗口分配数据的规则分类
- 滚动窗口（Tumbling Windows）
  滚动窗口有固定的大小，是一种对数据进行“均匀切片”的划分方式。窗口之间没有重叠，也不会有间隔，是“首尾相接”的状态。
  滚动窗口可以基于时间定义，也可以基于数据个数定义；需要的参数只有一个，就是窗口的大小（window size）。
- 滑动窗口（Sliding Windows）
  与滚动窗口类似，滑动窗口的大小也是固定的。区别在于，窗口之间并不是首尾相接的，而是可以“错开”一定的位置。定义滑动窗口的参数有两个：除去窗口大小（window size）之外，还有一个“滑动步长”（window slide），它其实就代表了窗口计算的频率。
  滑动窗口可以基于时间定义，也可以基于数据个数定义。
- 会话窗口（Session Windows）
  这里的会话类似 Web 应用中 session 的概念，不过并不表示两端的通讯过程，而是借用会话超时失效的机制来描述窗口。据来了之后就开启一个会话窗口，如果接下来还有数据陆续到来，那么就一直保持会话；如果一段时间一直没收到数据，那就认为会话超时失效，窗口自动关闭。
  
  如果相邻两个数据到来的时间间隔（Gap）小于指定的大小（size），那说明还在保持会话，它们就属于同一个窗口；如果 gap 大于 size，那么新来的数据就应该属于新的会话窗口，而前一个窗口就应该关闭了。
  
  乱序流下，每来一个新的数据，都会创建一个新的会话窗口；然后判断已有窗口之间的距离，如果小于给定的 size，就对它们进行合并（merge）操作。
  
  会话窗口只能基于时间来定义。
- 全局窗口（Global Windows）
  这种窗口全局有效，会把相同 key 的所有数据都分配到同一个窗口中；说直白一点，就跟没分窗口一样。无界流的数据永无止尽，所以这种窗口也没有结束的时候，默认是不会做触发计算的。如果希望它能对数据进行计算处理，还需要自定义“触发器”（Trigger）。
在调用窗口算子之前，是否有 keyBy 操作。
- 按键分区窗口（Keyed Windows） stream.keyBy(…).window(…)
- 非按键分区窗口（Non-Keyed Windows） stream.windowAll(…)
  并行度变成了 1。手动调大窗口算子的并行度也是无效的，windowAll 本身就是一个非并行的操作。

2. 窗口分配器（Window Assigners）

定义窗口分配器（Window Assigners）是构建窗口算子的第一步，作用是定义数据应该被“分配”到哪个窗口。窗口分配数据的规则，其实就对应着不同的窗口类型，窗口分配器其实就是在指定窗口的类型。

下面是窗口的使用方式示例，窗口分配器后面需要有窗口函数。

stream.keyBy(<key selector>) 		//返回KeyedStream
      .window(<window assigner>) 	//返回WindowedStream
      .aggregate(<window function>)  
      
stream.windowAll(<window assigner>) //返回AllWindowedStream
	  .aggregate(<window function>)

不同窗口类型下的窗口分配器：

时间窗口
时间窗口是最常用的窗口类型，又可以细分为滚动、滑动和会话三种。时间窗口的调用方式是直接调用 .window()，而 .timeWindow() 由于事件时间语义时需要另外声明，实践中容易忘记声明，故1.12 版本之后已弃用。

滚动处理时间窗口
```
keyedStream.window(TumblingProcessingTimeWindows.of(Time.seconds(5)))  // 窗口大小
```
of的重载方法两个参数size 和 offset。第一个参数当然还是窗口大小，第二个参数则表示窗口起始点的偏移量。比如北京时间每天 0 点开启：
```
keyedStream.window(TumblingProcessingTimeWindows.of(Time.days(1), Time.hours(-8)))
```

滑动处理时间窗口

//of的参数依次是窗口大小、滑动步长、窗口起始点偏移量（可选）
keyedStream.window(SlidingProcessingTimeWindows.of(Time.seconds(10), Time.seconds(5) [,offset] ))

处理时间会话窗口

//方式一
keyedStream.window(ProcessingTimeSessionWindows.withGap(Time.seconds(10)) //超时时间 10秒
       
//方式二     
keyedStream.window(ProcessingTimeSessionWindows.withDynamicGap(  //session gap 的动态提取
	new SessionWindowTimeGapExtractor<Tuple2<String, Long>>() { 
	    @Override     
		public long extract(Tuple2<String, Long> element) {   
 		   return element.f0.length() * 1000;  // 提取session gap值返回, 单位毫秒
	    } 
	}))

滚动事件时间窗口

keyedStream.window(TumblingEventTimeWindows.of(Time.seconds(5))) // 窗口大小

滑动事件时间窗口

//of的参数依次是窗口大小、滑动步长
keyedStream.window(SlidingEventTimeWindows.of(Time.seconds(10), Time.seconds(5)))

事件时间会话窗口

keyedStream.window(EventTimeSessionWindows.withGap(Time.seconds(10))) //超时时间 10秒

计数窗口

滚动计数窗口
```
stream.keyBy(...).countWindow(10) 
```
滑动计数窗口
```
stream.keyBy(...).countWindow(10，3)
```

全局窗口

stream.keyBy(...).window(GlobalWindows.create()); //必须自行定义触发器才能实现窗口计算

3. 窗口函数（Window Functions）

在窗口分配器之后，必须再接上一个定义窗口如何进行计算的操作，这就是所谓的“窗口函数”（window functions）。

最新 Flink 1.13 时间和窗口（时间语义、Watermark、Window 窗口、Trigger）快速入门、详细教程_第3张图片

窗口函数定义了要对窗口中收集的数据做的计算操作，根据处理的方式可以分为两类：增量聚合函数和全窗口函数。

增量聚合函数（incremental aggregation functions）
窗口对无限流的切分，可以看作得到了一个有界数据集。如果我们等到所有数据都收集齐，在窗口到了结束时间要输出结果的一瞬间再去进行聚合，显然就不够高效了——这相当于真的在用批处理的思路来做实时流处理。
为了提高实时性，我们可以再次将流处理的思路发扬光大：就像 DataStream 的简单聚合一样，每来一条数据就立即进行计算，中间只要保持一个简单的聚合状态就可以了；区别只是在于不立即输出结果，而是要等到窗口结束时间。等到窗口到了结束时间需要输出计算结果的时候，我们只需要拿出之前聚合的状态直接输出，这无疑就大大提高了程序运行的效率和实时性。

归约函数（ReduceFunction）

与简单聚合时用到的 ReduceFunction 是同一个函数类接口。ReduceFunction 可以对已有的数据进行归约处理，把每一个新输入的数据和当前已经归约出来的值，再做一个聚合计算，不会改变流的元素数据类型，所以输出类型和输入类型是一样的。

   windowedStream.reduce(
	new ReduceFunction<Tuple2<String, Long>>() { 
  		@Override 
  		public Tuple2<String, Long> reduce(Tuple2<String, Long> value1,
					 					Tuple2<String, Long> value2) throws Exception { 
        		// 定义累加规则，窗口闭合时，向下游发送累加结果 
        		return Tuple2.of(value1.f0, value1.f1 + value2.f1);
     		} 
 	})

聚合函数（AggregateFunction）

AggregateFunction 可以看作是 ReduceFunction 的通用版本，这里有三种类型：输入类型（IN）、累加器类型（ACC）和输出类型（OUT）。输入类型 IN 就是输入流中元素的数据类型；累加器类型 ACC 则是我们进行聚合的中间状态类型；而输出类型当然就是最终计算结果的类型，输入数据、中间状态、输出结果三者类型都可以不同。

windowedStream.aggregate(
	new AggregateFunction<Event, Tuple2<HashSet<String>, Long>, Double> { 
  		@Override   // 创建一个累加器，这就是为聚合创建了一个初始状态      
		public Tuple2<HashSet<String>, Long> createAccumulator() {
		 	return Tuple2.of(new HashSet<String>(), 0L);          
		} 
		@Override 	//属于本窗口的数据来一条累加一次，并返回累加器
   		public Tuple2<HashSet<String>,Long> add(Event value, 
							 Tuple2<HashSet<String>, Long> accumulator) { 
       		accumulator.f0.add(value.user);             
			return Tuple2.of(accumulator.f0, accumulator.f1 + 1L); 
		} 
		@Override  // 窗口闭合时，增量聚合结束，将计算结果发送到下游        
		public Double getResult(Tuple2<HashSet<String>, Long> accumulator) { 
       		return (double) accumulator.f1 / accumulator.f0.size();
		} 
		@Override  //合并两个累加器，需要合并窗口的场景下才会被调用。最常见的是会话窗口
		public Tuple2<HashSet<String>, Long> merge(
				        Tuple2<HashSet<String>, Long> a, Tuple2<HashSet<String>, Long> b) {
       		return null; 
   		} 
	} 
)

另外，直接基于 WindowedStream 调用的简单聚合方法.sum()/max()/maxBy()/min()/minBy()底层，其实都是通过 AggregateFunction 来实现。

全窗口函数（full window functions）
与增量聚合函数不同，全窗口函数需要先收集窗口中的数据，并在内部缓存起来，等到窗口要输出结果的时候再取出数据进行计算。
为什么还需要有全窗口函数呢？有些场景下，我们要做的计算必须基于全部的数据才有效，如中位数。输出的结果有可能要包含上下文中的一些信息（比如窗口的起始时间）。

窗口函数（WindowFunction）

处理窗口函数 ProcessWindowFunction 完全覆盖了 WindowFunction 的功能，它基本上被 ProcessWindowFunction 替代了。

stream.keyBy(<key selector>) 
 .window(<window assigner>) 
 .apply(
    new WindowFunction<IN, OUT, KEY, W extends Window> extends Function, Serializable { 
	     void apply(KEY key, W window, Iterable<IN> input, Collector<OUT> out) throws Exception; 
	});

处理窗口函数（ProcessWindowFunction）
Context不仅能够获取窗口信息，还可以访问当前的时间和状态信息。这里的时间就包括了处理时间（processing time）和事件时间水位线（event time watermark）。

stream.keyBy(data -> true)
			.window(TumblingEventTimeWindows.of(Time.seconds(10))) 
			.process(new UvCountByWindow()) 
// 自定义窗口处理函数 统计UV 去重用户数
public static class UvCountByWindow extends ProcessWindowFunction<Event, String, Boolean, TimeWindow> {
    @Override
    public void process(Boolean aBoolean, Context context, 
					Iterable<Event> elements, Collector<String> out) throws Exception {
        HashSet<String> userSet = new HashSet<>();
        // 遍历所有数据，放到Set里去重 
        for (Event event : elements) {
           userSet.add(event.user);
        }
        // 结合窗口信息，包装输出内容 
        Long start = context.window().getStart();
        Long end = context.window().getEnd();
		Long currentWatermark = context.currentWatermark();
        out.collect("窗口: " + new Timestamp(start) + " ~ " 
					+ new Timestamp(end) + " 的独立访客数量是：" + userSet.size());
     }
}

全窗口函数因为运行效率较低，很少直接单独使用，往往会和增量聚合函数结合在一起，共同实现窗口的处理计算。

增量聚合和全窗口函数的结合使用
我们之前在调用 WindowedStream 的 .reduce() 和 .aggregate() 方法时，只是简单地直接传入了一个 ReduceFunction 或 AggregateFunction 进行增量聚合。除此之外，其实还可以传入第二个参数：一个全窗口函数，可以是 WindowFunction 或者 ProcessWindowFunction。

stream.keyBy(data -> data.url) 
      .window(SlidingEventTimeWindows.of(Time.seconds(10), Time.seconds(5))) 
      // 同时传入增量聚合函数和全窗口函数 
      .aggregate(new UrlViewCountAgg(), new UrlViewCountResult()) 
      .print();

// 自定义增量聚合函数，来一条数据就加一
public static class UrlViewCountAgg 
			   implements AggregateFunction<Event, Long, Long> {
    @Override         
    public Long createAccumulator() { return 0L; }
    @Override         
    public Long add(Event value, Long accumulator) {  return accumulator + 1; }
    @Override
    public Long getResult(Long accumulator) {  return accumulator; }
    @Override         
    public Long merge(Long a, Long b) {  return null; }
}

// 自定义窗口处理函数，只需要包装窗口信息 
public static class UrlViewCountResult extends ProcessWindowFunction<Long,
        UrlViewCount, String, TimeWindow> {
    @Override
    public void process(String url, Context context, Iterable<Long> elements, 
                        Collector<UrlViewCount> out) throws Exception {
        // 结合窗口信息，包装输出内容 
        Long start = context.window().getStart();
        Long end = context.window().getEnd();
        // 迭代器中只有一个元素，就是增量聚合函数的计算结果 
        out.collect(new UrlViewCount(url, elements.iterator().next(), start, end));
    }
}

4. 触发器（Trigger）、移除器（Evictor）、允许延迟和侧输出流（Side Output）

触发器（Trigger）
触发器主要是用来控制窗口什么时候触发计算。所谓的“触发计算”，本质上就是执行窗口函数，所以可以认为是计算得到结果并输出的过程。
Trigger 是窗口算子的内部属性，每个窗口分配器（WindowAssigner）都会对应一个默认的触发器。EventTimeTrigger、ProcessingTimeTrigger 和 CountTrigger。
全局窗口(GlobalWindow)的默认触发器是永不会被触发的NeverTrigger。因此，在使用全局窗口时，必须自定义一个触发器。
通过使用 trigger() 方法指定触发器，将会覆盖窗口分配器的默认触发器。
如窗口开的太大，会使我们看到计算结果的时间间隔变长。所以我们可以使用触发器，来隔一段时间触发一次窗口计算。我们在代码中计算了每个 url 在 10 秒滚动窗口的 pv 指标，然后设置了触发器，每隔 1 秒钟触发一次窗口的计算。

//触发器三个方法响应事件后的返回类型：可以控制窗口触发计算，还可以定义窗口什么时候关闭（销毁）
public enum TriggerResult {
    CONTINUE(false, false),    //什么都不做
    FIRE_AND_PURGE(true, true),//触发计算输出结果，并清除窗口
    FIRE(true, false),			 //触发计算，输出结果
    PURGE(false, true);			//清空窗口中的所有数据，销毁窗口
    // ------------------------------------------------------------------------
    private final boolean fire;
    private final boolean purge;
} 

public static class MyTrigger extends Trigger<Event, TimeWindow> {
    @Override //窗口中每到来一个元素，【TriggerContext对象，可以用来注册定时器回调】
    public TriggerResult onElement(Event event, long l,TimeWindow timeWindow, 
						TriggerContext triggerContext) throws Exception {
        ValueState<Boolean> isFirstEvent = triggerContext.getPartitionedState(
                new ValueStateDescriptor<Boolean>("first-event", Types.BOOLEAN));
        
        if (isFirstEvent.value() == null) {
          for(long i=timeWindow.getStart();i<timeWindow.getEnd();i = i + 1000L) {
                triggerContext.registerEventTimeTimer(i);
          }
          isFirstEvent.update(true);
        }
        return TriggerResult.CONTINUE;
    }
    @Override //当注册的事件时间定时器触发时
    public TriggerResult onEventTime(long l, TimeWindow timeWindow,
							    TriggerContext triggerContext) throws Exception {
        return TriggerResult.FIRE;
    }
    @Override //当注册的处理时间定时器触发时
    public TriggerResult onProcessingTime(long l, TimeWindow timeWindow,
								 TriggerContext triggerContext) throws Exception {
        return TriggerResult.CONTINUE;
    }

	//public boolean canMerge() { return false; }
	//onMerge()方法，与状态触发器相关，并且在相应的窗口合并时合并两个触发器的状态，一般用于会话窗口。

    @Override //当窗口关闭销毁时, 一般用来清除自定义的状态。
    public void clear(TimeWindow timeWindow, TriggerContext triggerContext)
					 			 throws Exception {
        ValueState<Boolean> isFirstEvent =triggerContext.getPartitionedState(
                new ValueStateDescriptor<Boolean>("first-event", Types.BOOLEAN));
        isFirstEvent.clear();
    }


	//Trigger上下文可以拿到的东西，和处理函数的定时服务差不多，定时服务见 处理函数 一章
	public interface TriggerContext {

        long getCurrentProcessingTime();

        MetricGroup getMetricGroup();

        long getCurrentWatermark();

        void registerProcessingTimeTimer(long time);

        void registerEventTimeTimer(long time);

        void deleteProcessingTimeTimer(long time);

        void deleteEventTimeTimer(long time);

        <S extends State> S getPartitionedState(StateDescriptor<S, ?> stateDescriptor);

        <S extends Serializable> ValueState<S> getKeyValueState(
                String name, Class<S> stateType, S defaultState);

        <S extends Serializable> ValueState<S> getKeyValueState(
                String name, TypeInformation<S> stateType, S defaultState);
    }
}
stream.keyBy(r -> r.url).window(...).trigger(new MyTrigger()).process(...);

移除器（Evictor）
驱逐器能够在触发器触发之后，以及在应用窗口函数之前或之后从窗口中移除元素。
默认情况下，预实现的移除器是在执行窗口函数（window fucntions）之前移除数据。
```
stream.keyBy(...).window(...).evictor(new MyEvictor())
```
Evictor 接口定义了两个方法：
- evictBefore()：定义执行窗口函数之前的移除数据操作
- evictAfter()：定义执行窗口函数之后的以处数据操作
Flink带有三个内置的驱逐器:
1. CountEvictor：保持窗口内元素数量符合用户指定数量，多余的窗口缓冲区的开头丢弃元素。
2. DeltaEvictor：使用DeltaFunction和一个阈值，计算窗口缓冲区中的最后一个元素与其余每个元素之间的 delta值，并删除delta值大于或等于阈值的元素。
3. TimeEvictor：以毫秒为单位的时间间隔作为参数，对于给定的窗口，找到元素中的最大的时间戳max_ts，并删除时间戳小于max_ts-interval的所有元素。
允许延迟（Allowed Lateness）
“允许的最大延迟”（Allowed Lateness）：我们可以设定允许延迟一段时间，在这段时间内，窗口不会销毁，继续到来的数据依然可以进入窗口中并触发计算。直到水位线推进到了窗口结束时间 + 延迟时间，才真正将窗口的内容清空，正式关闭窗口。窗口的触发计算（Fire）和清除（Purge）操作被分开。

stream.keyBy(...) 
      .window(TumblingEventTimeWindows.of(Time.hours(1))) 
      .allowedLateness(Time.minutes(1))

将迟到的数据放入侧输出流
Flink还提供了另外一种方式处理迟到数据。我们可以将未收入窗口的迟到数据，放入“侧输出流”（side output）进行另外的处理。所谓的侧输出流，相当于是数据流的一个“分支”，这个流中单独放置那些错过了该上的车、本该被丢弃的数据。

OutputTag<Event> outputTag = new OutputTag<Event>("late") {};
 
SingleOutputStreamOperator<AggResult> winAggStream = stream.keyBy(...) 
       	.window(TumblingEventTimeWindows.of(Time.hours(1))) 
				.sideOutputLateData(outputTag) 
				.aggregate(new MyAggregateFunction()) 
DataStream<Event> lateStream = winAggStream.getSideOutput(outputTag);

5. 窗口的生命周期

窗口的创建
窗口的类型和基本信息由窗口分配器指定，但窗口不会预先创建好，而是由数据驱动创建。当第一个应该属于这个窗口的数据元素到达时，就会创建对应的窗口。
窗口计算的触发
每个窗口还会有自己的窗口函数和触发器。窗口函数可以分为增量聚合函数和全窗口函数，主要定义了窗口中计算的逻辑；而触发器则是指定调用窗口函数的条件。
对于不同的窗口类型，触发计算的条件也会不同。滚动事件时间窗口，应该在水位线到达窗口结束时间触发计算，属于“定点发车”；计数窗口，元素数量达到定义大小时触发计算，属于“人满发车”。窗口的触发时机：watermark>=end-1ms
当我们设置了事件时间窗口的允许延迟，如果水位线超过了窗口结束时间、但还没有到达设定的最大延迟时间，这期间内到达的迟到数据也会触发窗口计算。
窗口的销毁
一般情况下，当时间达到了结束点，就会直接触发计算输出结果、进而清除状态销毁窗口。Flink中只对时间窗口有销毁机制；由于计数窗口是基于GlobalWindw实现的，而全局窗口不会清除状态，所以就不会被销毁。
在特殊的场景下，窗口的销毁和触发计算会有所不同。事件时间语义下，如果设置了允许延迟，那么在水位线到达窗口结束时间时，仍然不会销毁窗口；窗口真正被完全删除的时间点，是窗口的结束时间加上用户指定的允许延迟时间。

四、迟到数据的处理，结果正确性的三重保障

Flink 处理迟到数据，对于结果的正确性有三重保障：水位线的延迟，窗口允许迟到数据，以及将迟到数据放入窗口侧输出流。

下一章：Flink 1.13 处理函数（ProcessFunction）

你可能感兴趣的:(Flink,教程,flink,sql,数据仓库,大数据)

mysql禁用远程登录 igotyback mysql
去mysql库中的user表里，将host都改成localhost之后刷新权限FLUSHPRIVILEGES;
第四天旅游线路预览——从换乘中心到喀纳斯湖陟彼高冈yu 基于Google earth studio 的旅游规划和预览旅游
第四天：从贾登峪到喀纳斯风景区入口，晚上住宿贾登峪；换乘中心有4路车，喀纳斯①号车，去喀纳斯湖，路程时长约5分钟；将上面的的行程安排进行动态展示，具体步骤见”Googleearthstudio进行动态轨迹显示制作过程“、“Googleearthstudio入门教程”和“Googleearthstudio进阶教程“相关内容，得到行程如下所示：Day4-2-480p
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
linux中sdl的使用教程,sdl使用入门 Melissa Corvinus linux中sdl的使用教程
本文通过一个简单示例讲解SDL的基本使用流程。示例中展示一个窗口，窗口里面有个随机颜色快随机移动。当我们鼠标点击关闭按钮时间窗口关闭。基本步骤如下：1.初始化SDL并创建一个窗口。SDL_Init()初始化SDL_CreateWindow()创建窗口2.纹理渲染存储RGB和存储纹理的区别：比如一个从左到右由红色渐变到蓝色的矩形，用存储RGB的话就需要把矩形中每个点的具体颜色值存储下来；而纹理只是一
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
使用 FinalShell 进行远程连接（ssh 远程连接 Linux 服务器）编程经验分享开发工具服务器 ssh linux
目录前言基本使用教程新建远程连接连接主机自定义命令路由追踪前言后端开发，必然需要和服务器打交道，部署应用，排查问题，查看运行日志等等。一般服务器都是集中部署在机房中，也有一些直接是云服务器，总而言之，程序员不可能直接和服务器直接操作，一般都是通过ssh连接来登录服务器。刚接触远程连接时，使用的是XSHELL来远程连接服务器，连接上就能够操作远程服务器了，但是仅用XSHELL并没有上传下载文件的功能
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
MYSQL面试系列-04 king01299 面试 mysql 面试
MYSQL面试系列-0417.关于redolog和binlog的刷盘机制、redolog、undolog作用、GTID是做什么的？innodb_flush_log_at_trx_commit及sync_binlog参数意义双117.1innodb_flush_log_at_trx_commit该变量定义了InnoDB在每次事务提交时，如何处理未刷入（flush）的重做日志信息（redolog）。它
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
第六集如何安装CentOS7.0，3分钟学会centos7安装教程 date分享
从光盘引导系统按回车键继续进入引导程序安装界面，选择语言这里选择简体中文版点击继续选择桌面安装下面给系统分区选择磁盘，点击完成选择基本分区，点击加号swap分区,大小填内存的两倍在选择根分区，使用所有可用的磁盘空间选择文件系统ext4点击完成，点击开始安装设置root密码，点击完成设置普通用户和密码，点击完成整个过程持续八分钟左右根据个人配置不同，时间长短不同好，现在点击重启系统进入重启状态点击本
C++菜鸟教程 - 从入门到精通第二节 DreamByte c++
一.上节课的补充(数据类型)1.前言继上节课,我们主要讲解了输入,输出和运算符,我们现在来补充一下数据类型的知识上节课遗漏了这个知识点,非常的抱歉顺便说一下,博主要上高中了,更新会慢,2-4周更新一次对了,正好赶上中秋节,小编跟大家说一句:中秋节快乐!2.int类型上节课,我们其实只用了int类型int类型,是整数类型,它们存贮的是整数,不能存小数(浮点数)定义变量的方式很简单inta;//定义一
福袋生活邀请码在哪里填写，福袋生活app邀请码使用教程小小编007
很多人下载福袋生活后，注册使用时需要填写邀请码。因为福袋生活是注册邀请制，所以首次使用填写邀请码才可以正常登录使用。福袋生活是广州市福袋生活信息科技有限公司旗下一家多元化社交电商导购平台，以APP为载体，社群为媒介，汇集衣食住行、吃喝玩乐生活服务板块，使用福袋生活可以领到淘宝，拼多多等电商平台的商品优惠券和返利，还可以兼职去分享赚钱。我为什么从福袋生活转到果冻宝盒呢？当然是因为福袋生活返利更高，注
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
SpringBlade dict-biz/list 接口 SQL 注入漏洞文章永久免费只为良心 oracle 数据库
SpringBladedict-biz/list接口SQL注入漏洞POC:构造请求包查看返回包你的网址/api/blade-system/dict-biz/list?updatexml(1,concat(0x7e,md5(1),0x7e),1)=1漏洞概述在SpringBlade框架中，如果dict-biz/list接口的后台处理逻辑没有正确地对用户输入进行过滤或参数化查询（PreparedSta
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
2023-08-20 圆梦菌
魔力宝贝最详细新手教程，新手该如何完美开局，建议收藏转发2023-08-2010:34《魔力宝贝》手游体力是什么?魔力宝贝体力恢复机制是每10分钟回复1点；体力作用：挑战关卡需消耗体力体力获取方式1、好友每天可以赠送15次，也就是15点体力2、系统每天中午12点以及下午6点赠送25体3、在商城使用神石购买《魔力宝贝》手游战斗力如何提升?1、宠物强化宠物通过融合进阶后可以大幅度提升战力，最高级的宠物
JAVA·一个简单的登录窗口 MortalTom java 开发语言学习
文章目录概要整体架构流程技术名词解释技术细节资源概要JavaSwing是Java基础类库的一部分，主要用于开发图形用户界面（GUI）程序整体架构流程新建项目，导入sql.jar包（链接放在了文末），编译项目并运行技术名词解释一、特点丰富的组件提供了多种可视化组件，如按钮（JButton）、文本框（JTextField）、标签（JLabel）、下拉列表（JComboBox）等，可以满足不同的界面设计
入门MySQL——查询语法练习 K_un
前言：前面几篇文章为大家介绍了DML以及DDL语句的使用方法，本篇文章将主要讲述常用的查询语法。其实MySQL官网给出了多个示例数据库供大家实用查询，下面我们以最常用的员工示例数据库为准，详细介绍各自常用的查询语法。1.员工示例数据库导入官方文档员工示例数据库介绍及下载链接：https://dev.mysql.com/doc/employee/en/employees-installation.h
ESP32-C3入门教程网络篇⑩——基于esp_https_ota和MQTT实现开机主动升级和被动触发升级的OTA功能小康师兄 ESP32-C3入门教程 https 服务器 esp32 OTA MQTT
文章目录一、前言二、软件流程三、部分源码四、运行演示一、前言本文基于VSCodeIDE进行编程、编译、下载、运行等操作基础入门章节请查阅：ESP32-C3入门教程基础篇①——基于VSCode构建HelloWorld教程目录大纲请查阅：ESP32-C3入门教程——导读ESP32-C3入门教程网络篇⑨——基于esp_https_ota实现史上最简单的ESP32OTA远程固件升级功能二、软件流程
2023最详细的Python安装教程（Windows版本）程序员林哥 Python python windows 开发语言
python安装是学习pyhon第一步，很多刚入门小白不清楚如何安装python，今天我来带大家完成python安装与配置，跟着我一步步来，很简单，你肯定能完成。第一部分：python安装（一）准备工作1、下载和安装python(认准官方网站)当然你不想去下载的话也可以分享给你，还有入门学习教程，点击下方卡片跳转进群领取（二）开始安装对于Windows操作系统，可以下载“executableins
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
ubuntu安装wordpress lissettecarlr
1安装nginx网上安装方式很多，这就就直接用apt-get了apt-getinstallnginx不用启动啥，然后直接在浏览器里面输入IP:80就能看到nginx的主页了。如果修改了一些配置可以使用下列命令重启一下systemctlrestartnginx.service2安装mysql输入安装前也可以更新一下软件源，在安装过程中将会让你输入数据库的密码。sudoapt-getinstallmy
计算机毕业设计PHP仓储综合管理系统（源码+程序+VUE+lw+部署） java毕设程序源码王哥 php 课程设计 vue.js
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置：phpStudy+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue+Express。项目技术：原生PHP++Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是小皮phpstudy最新版，我们在这个版本上开发的。其他版本理论上也可以。2.开发
阿里云服务器4核8G配置购买及价格类文章汇总（10篇）阿里云最新优惠和活动汇总
阿里云服务器4核8G配置如何购买？价格是多少？4核8G配置的阿里云服务器可以通过云服务器产品页购买也可以通过阿里云活动去下单购买，一般通过活动购买的用户比较多，但是不同实例规格的阿里云服务器价格不一样，带宽不同价格也不一样，本文为大家汇总了10篇关于阿里云服务器4核8G配置购买教程文章和价格类文章，分为购买类文章和价格类文章，以供大家参考如何购买阿里云服务器4核8G配置和最新优惠价格是多少。阿里云
绝招曝光！3小时高效利用ChatGPT写出精彩论文 kkai人工智能 chatgpt 人工智能 ai 学习媒体
在这份指南中，我将深入解析如何利用ChatGPT4.0的高级功能，指导整个学术研究和写作过程。从初步探索研究主题，到撰写结构严谨的学术论文，我将一步步展示如何在每个环节中有效运用ChatGPT。如果您还未使用PLUS版本，可以参考相关教程。**初步探索与主题的确定**起初，我处于庞大的知识领域中，寻找一个可深入研究的领域。ChatGPT如同灯塔，通过深入分析最新研究趋势和领域热点，帮助我在广阔的学
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
LeetCode[Math] - #66 Plus One Cwind java LeetCode 题解 Algorithm Math
原题链接：#66 Plus One 要求：给定一个用数字数组表示的非负整数，如num1 = {1, 2, 3, 9}, num2 = {9, 9}等，给这个数加上1。注意： 1. 数字的较高位存在数组的头上，即num1表示数字1239 2. 每一位（数组中的每个元素）的取值范围为0~9 难度：简单分析：题目比较简单，只须从数组
JQuery中$.ajax()方法参数详解 AILIKES JavaScript jsonp jquery Ajax json
url: 要求为String类型的参数，（默认为当前页地址）发送请求的地址。 type: 要求为String类型的参数，请求方式（post或get）默认为get。注意其他http请求方法，例如put和 delete也可以使用，但仅部分浏览器支持。 timeout: 要求为Number类型的参数，设置请求超时时间（毫秒）。此设置将覆盖$.ajaxSetup()方法的全局
JConsole & JVisualVM远程监视Webphere服务器JVM Kai_Ge JVisualVM JConsole Webphere
JConsole是JDK里自带的一个工具，可以监测Java程序运行时所有对象的申请、释放等动作，将内存管理的所有信息进行统计、分析、可视化。我们可以根据这些信息判断程序是否有内存泄漏问题。　　使用JConsole工具来分析WAS的JVM问题，需要进行相关的配置。　　首先我们看WAS服务器端的配置. 　　1、登录was控制台https://10.4.119.18
自定义annotation 120153216 annotation
Java annotation 自定义注释@interface的用法一、什么是注释说起注释，得先提一提什么是元数据(metadata)。所谓元数据就是数据的数据。也就是说，元数据是描述数据的。就象数据表中的字段一样，每个字段描述了这个字段下的数据的含义。而J2SE5.0中提供的注释就是java源代码的元数据，也就是说注释是描述java源
CentOS 5/6.X 使用 EPEL YUM源 2002wmj centos
CentOS 6.X 安装使用EPEL YUM源1. 查看操作系统版本[root@node1 ~]# uname -a Linux node1.test.com 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux [root@node1 ~]#
在SQLSERVER中查找缺失和无用的索引SQL 357029540 SQL Server
--缺失的索引 SELECT avg_total_user_cost * avg_user_impact * ( user_scans + user_seeks ) AS PossibleImprovement , last_user_seek ,
Spring3 MVC 笔记（二） —json+rest优化 7454103 Spring3 MVC
接上次的 spring mvc 注解的一些详细信息！其实也是一些个人的学习笔记呵呵！
替换“\”的时候报错Unexpected internal error near index 1 \ ^ adminjun java “\替换”
发现还是有些东西没有刻子脑子里,,过段时间就没什么概念了,所以贴出来...以免再忘... 在拆分字符串时遇到通过 \ 来拆分，可是用所以想通过转义 \\ 来拆分的时候会报异常 public class Main { /*
POJ 1035 Spell checker(哈希表) aijuans 暴力求解--哈希表
/* 题意：输入字典，然后输入单词，判断字典中是否出现过该单词，或者是否进行删除、添加、替换操作，如果是，则输出对应的字典中的单词要求按照输入时候的排名输出题解：建立两个哈希表。一个存储字典和输入字典中单词的排名，一个进行最后输出的判重 */ #include <iostream> //#define using namespace std; const int HASH =
通过原型实现javascript Array的去重、最大值和最小值 ayaoxinchao JavaScript array prototype
用原型函数（prototype）可以定义一些很方便的自定义函数，实现各种自定义功能。本次主要是实现了Array的去重、获取最大值和最小值。实现代码如下： <script type="text/javascript"> Array.prototype.unique = function() { var a = {}; var le
UIWebView实现https双向认证请求 bewithme UIWebView https Objective-C
什么是HTTPS双向认证我已在先前的博文 ASIHTTPRequest实现https双向认证请求中有讲述，不理解的读者可以先复习一下。本文是用UIWebView来实现对需要客户端证书验证的服务请求，网上有些文章中有涉及到此内容，但都只言片语，没有讲完全，更没有完整的代码，让人困扰不已。但是此知
NoSQL数据库之Redis数据库管理(Redis高级应用之事务处理、持久化操作、pub_sub、虚拟内存) bijian1013 redis 数据库 NoSQL
3.事务处理 Redis对事务的支持目前不比较简单。Redis只能保证一个client发起的事务中的命令可以连续的执行，而中间不会插入其他client的命令。当一个client在一个连接中发出multi命令时，这个连接会进入一个事务上下文，该连接后续的命令不会立即执行，而是先放到一个队列中，当执行exec命令时，redis会顺序的执行队列中
各数据库分页sql备忘 bingyingao oracle sql 分页
ORACLE 下面这个效率很低 SELECT * FROM ( SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_FS_RETURN order by id desc) A ) WHERE RN <20; 下面这个效率很高 SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_
【Scala七】Scala核心一：函数 bit1129 scala
1. 如果函数体只有一行代码，则可以不用写{},比如 def print(x: Int) = println(x) 一行上的多条语句用分号隔开，则只有第一句属于方法体，例如 def printWithValue(x: Int) : String= println(x); "ABC" 上面的代码报错，因为，printWithValue的方法
了解GHC的factorial编译过程 bookjovi haskell
GHC相对其他主流语言的编译器或解释器还是比较复杂的，一部分原因是haskell本身的设计就不易于实现compiler，如lazy特性，static typed，类型推导等。关于GHC的内部实现有篇文章说的挺好，这里，文中在RTS一节中详细说了haskell的concurrent实现，里面提到了green thread，如果熟悉Go语言的话就会发现，ghc的concurrent实现和Go有点类
Java-Collections Framework学习与总结-LinkedHashMap BrokenDreams LinkedHashMap
前面总结了java.util.HashMap，了解了其内部由散列表实现，每个桶内是一个单向链表。那有没有双向链表的实现呢？双向链表的实现会具备什么特性呢？来看一下HashMap的一个子类——java.util.LinkedHashMap。
读《研磨设计模式》-代码笔记-抽象工厂模式-Abstract Factory bylijinnan abstract
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * Abstract Factory Pattern * 抽象工厂模式的目的是： * 通过在抽象工厂里面定义一组产品接口，方便地切换“产品簇” * 这些接口是相关或者相依赖的
压暗面部高光 cherishLC PS
方法一、压暗高光&重新着色当皮肤很油又使用闪光灯时，很容易在面部形成高光区域。下面讲一下我今天处理高光区域的心得：皮肤可以分为纹理和色彩两个属性。其中纹理主要由亮度通道（Lab模式的L通道）决定，色彩则由a、b通道确定。处理思路为在保持高光区域纹理的情况下，对高光区域着色。具体步骤为：降低高光区域的整体的亮度，再进行着色。如果想简化步骤，可以只进行着色（参看下面的步骤1
Java VisualVM监控远程JVM crabdave visualvm
Java VisualVM监控远程JVM JDK1.6开始自带的VisualVM就是不错的监控工具. 这个工具就在JAVA_HOME\bin\目录下的jvisualvm.exe, 双击这个文件就能看到界面通过JMX连接远程机器, 需要经过下面的配置: 1. 修改远程机器JDK配置文件 (我这里远程机器是linux).
Saiku去掉登录模块 daizj saiku 登录 olap BI
1、修改applicationContext-saiku-webapp.xml <security:intercept-url pattern="/rest/**" access="IS_AUTHENTICATED_ANONYMOUSLY" /> <security:intercept-url pattern=&qu
浅析 Flex中的Focus dsjt html Flex Flash
关键字：focus、 setFocus、 IFocusManager、KeyboardEvent 焦点、设置焦点、获得焦点、键盘事件一、无焦点的困扰——组件监听不到键盘事件原因：只有获得焦点的组件（确切说是InteractiveObject）才能监听到键盘事件的目标阶段；键盘事件（flash.events.KeyboardEvent）参与冒泡阶段，所以焦点组件的父项（以及它爸
Yii全局函数使用 dcj3sjt126com yii
由于YII致力于完美的整合第三方库，它并没有定义任何全局函数。yii中的每一个应用都需要全类别和对象范围。例如，Yii::app()->user;Yii::app()->params['name'];等等。我们可以自行设定全局函数，使得代码看起来更加简洁易用。(原文地址) 我们可以保存在globals.php在protected目录下。然后，在入口脚本index.php的，我们包括在
设计模式之单例模式二（解决无序写入的问题） come_for_dream 单例模式 volatile 乱序执行双重检验锁
在上篇文章中我们使用了双重检验锁的方式避免懒汉式单例模式下由于多线程造成的实例被多次创建的问题，但是因为由于JVM为了使得处理器内部的运算单元能充分利用，处理器可能会对输入代码进行乱序执行（Out Of Order Execute）优化，处理器会在计算之后将乱序执行的结果进行重组，保证该
程序员从初级到高级的蜕变 gcq511120594 框架工作 PHP android html5
软件开发是一个奇怪的行业，市场远远供不应求。这是一个已经存在多年的问题，而且随着时间的流逝，愈演愈烈。我们严重缺乏能够满足需求的人才。这个行业相当年轻。大多数软件项目是失败的。几乎所有的项目都会超出预算。我们解决问题的最佳指导方针可以归结为——“用一些通用方法去解决问题，当然这些方法常常不管用，于是，唯一能做的就是不断地尝试，逐个看看是否奏效”。现在我们把淫浸代码时间超过3年的开发人员称为
Reverse Linked List hcx2013 list
Reverse a singly linked list. /** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */ p
Spring4.1新特性——数据库集成测试 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
C# Ajax上传图片同时生成微缩图(附Demo) liyonghui160com
1.Ajax无刷新上传图片,详情请阅我的这篇文章。（jquery + c# ashx） 2.C#位图处理 System.Drawing。 3.最新demo支持IE7,IE8,Fir
Java list三种遍历方法性能比较 pda158 java
从c/c++语言转向java开发，学习java语言list遍历的三种方法，顺便测试各种遍历方法的性能，测试方法为在ArrayList中插入1千万条记录，然后遍历ArrayList，发现了一个奇怪的现象，测试代码例如以下： package com.hisense.tiger.list; import java.util.ArrayList; import java.util.Iterator;
300个涵盖IT各方面的免费资源（上）——商业与市场篇 shoothao seo 商业与市场 IT资源免费资源
A.网站模板+logo+服务器主机+发票生成 HTML5 UP:响应式的HTML5和CSS3网站模板。 Bootswatch:免费的Bootstrap主题。 Templated:收集了845个免费的CSS和HTML5网站模板。 Wordpress.org|Wordpress.com:可免费创建你的新网站。 Strikingly:关注领域中免费无限的移动优
localStorage、sessionStorage uule localStorage
W3School 例子 HTML5 提供了两种在客户端存储数据的新方法： localStorage - 没有时间限制的数据存储 sessionStorage - 针对一个 session 的数据存储之前，这些都是由 cookie 完成的。但是 cookie 不适合大量数据的存储，因为它们由每个对服务器的请求来传递，这使得 cookie 速度很慢而且效率也不

最新 Flink 1.13 时间和窗口（时间语义、Watermark、Window 窗口、Trigger）快速入门、详细教程