活在风浪里~

Flink watermark

1.简介

Flink水印的本质是DataStream中的一种特殊元素，每个水印都携带有一个时间戳。当时间戳为T的水印出现时，表示事件时间t <= T的数据都已经到达，即水印后面应该只能流入事件时间t > T的数据。也就是说，水印是Flink判断迟到数据的标准，同时也是窗口触发的标记。本质上用来处理实时数据中的乱序问题的，通常是水位线和窗口结合使用来实现。

2. WaterMark触发时机

上面谈到了对数据乱序问题的处理机制是watermark+window，那么window什么时候该被触发呢？

基于Event Time的事件处理，Flink默认的事件触发条件为：

对于out-of-order及正常的数据而言

watermark的时间戳 > = window_end_time

在 [window_start_time,window_end_time] 中有数据存在。

对于late element太多的数据而言

Event Time > watermark的时间戳

WaterMark相当于一个EndLine，一旦Watermarks大于了某个window的end_time，就意味着windows_end_time时间和WaterMark时间相同的窗口开始计算执行了。

就是说，我们根据一定规则，计算出Watermarks，并且设置一些延迟，给迟到的数据一些机会，也就是说正常来讲，对于迟到的数据，我只等你一段时间，再不来就没有机会了。

WaterMark时间可以用Flink系统现实时间，也可以用处理数据所携带的Event time。

总的来说：WaterMark的任务触发时机为：

1：watermark时间 >= window_end_time 即max(timestamp, currentMaxTimestamp....)-allowedLateness >= window_end_time
2：在[window_start_time,window_end_time)中有数据存在

针对乱序事件的处理总结为：


窗口window 的作用是为了周期性的获取数据。
watermark的作用是防止数据出现乱序(经常)，事件时间内获取不到指定的全部数据，而做的一种保险方法。
allowLateNess是将窗口关闭时间再延迟一段时间。
sideOutPut是最后兜底操作，所有过期延迟数据，指定窗口已经彻底关闭了，就会把数据放到侧输出流。

3.watermark的几种生产方式

3.1 标点水位线(Punctuated Watermark)

标点水位线（Punctuated Watermark）通过数据流中某些特殊标记事件来触发新水位线的生成。这种方式下窗口的触发与时间无关，而是决定于何时收到标记事件。

在实际的生产中Punctuated方式在TPS很高的场景下会产生大量的Watermark在一定程度上对下游算子造成压力，所以只有在实时性要求非常高的场景才会选择Punctuated的方式进行Watermark的生成。


class PunctuatedAssigner extends AssignerWithPunctuatedWatermarks[MyEvent] {
    override def extractTimestamp(element: MyEvent, previousElementTimestamp: Long): Long = {
        element.getCreationTime
    }
    override def checkAndGetNextWatermark(lastElement: MyEvent, extractedTimestamp: Long): Watermark = {
        if (element.hasWatermarkMarker()) new Watermark(extractedTimestamp) else null
    }
}

其中extractTimestamp用于从消息中提取事件时间,checkAndGetNextWatermark用于检查事件是否标点事件，若是则生成新的水位线。不同于定期水位线定时调用getCurrentWatermark，标点水位线是每接受一个事件就需要调用checkAndGetNextWatermark，若返回值非 null 且新水位线大于当前水位线，则触发窗口计算

注：数据流中每一个递增的EventTime都会产生一个Watermark。在实际的生产中Punctuated方式在TPS很高的场景下会产生大量的Watermark在一定程度上对下游算子造成压力，所以只有在实时性要求非常高的场景才会选择Punctuated的方式进行Watermark的生成

3.2 定期水位线(Periodic Watermark)

周期性的（允许一定时间间隔或者达到一定的记录条数）产生一个Watermark。不管是否有新的消息抵达，水位线提升的时间间隔是由用户设置的，在两次水位线提升时隔内会有一部分消息流入，用户可以根据这部分数据来计算出新的水位线。

在实际的生产中Periodic的方式必须结合时间和积累条数两个维度继续周期性产生Watermark，否则在极端情况下会有很大的延时。

举个例子，最简单的水位线算法就是取目前为止最大的事件时间，然而这种方式比较暴力，对乱序事件的容忍程度比较低，容易出现大量迟到事件。


class BoundedOutOfOrdernessGenerator extends AssignerWithPeriodicWatermarks[MyEvent] {
    val maxOutOfOrderness = 3500L; // 3.5 seconds
    var currentMaxTimestamp: Long;
    override def extractTimestamp(element: MyEvent, previousElementTimestamp: Long): Long = {
        val timestamp = element.getCreationTime()
        currentMaxTimestamp = max(timestamp, currentMaxTimestamp)
        timestamp;
    }
    override def getCurrentWatermark(): Watermark = {
        // return the watermark as current highest timestamp minus the out-of-orderness bound
        new Watermark(currentMaxTimestamp - maxOutOfOrderness);
    }
}

其中extractTimestamp用于从消息中提取事件时间，而getCurrentWatermark用于生成新的水位线，新的水位线只有大于当前水位线才是有效的。每个窗口都会有该类的一个实例，因此可以利用实例的成员变量保存状态，比如上例中的当前最大时间戳

注：周期性的(一定时间间隔或者达到一定的记录条数)产生一个Watermark。在实际的生产中Periodic的方式必须结合时间和积累条数两个维度继续周期性产生Watermark，否则在极端情况下会有很大的延时。

4. flink1.11之后新的水印生成策略WatermarkStrategy

在flink 1.11之前的版本中，提供了两种生成水印（Watermark）的策略，分别是AssignerWithPunctuatedWatermarks和AssignerWithPeriodicWatermarks，这两个接口都继承自TimestampAssigner接口。所以为了避免代码的重复，在flink 1.11 中对flink的水印生成接口进行了重构，统一使用使用assignTimestampsAndWatermarks方法来构造水印，新的接口需要传入一个WatermarkStrategy对象。

assignTimestampsAndWatermarks(WatermarkStrategy<T>)

4.1 WatermarkStrategy源码：


@Public
public interface WatermarkStrategy<T> extends
    TimestampAssignerSupplier<T>, WatermarkGeneratorSupplier<T> {
  /**
   * Instantiates a WatermarkGenerator that generates watermarks according to this strategy.
   */
  @Override
  WatermarkGenerator<T> createWatermarkGenerator(WatermarkGeneratorSupplier.Context context);

  /**
   * Instantiates a {@link TimestampAssigner} for assigning timestamps according to this
   * strategy.
   */
  @Override
  default TimestampAssigner<T> createTimestampAssigner(TimestampAssignerSupplier.Context context) {
    // By default, this is {@link RecordTimestampAssigner},
    // for cases where records come out of a source with valid timestamps, for example from Kafka.
    return new RecordTimestampAssigner<>();
  }

  // ------------------------------------------------------------------------
  //  Builder methods for enriching a base WatermarkStrategy
  // ------------------------------------------------------------------------

  /**
   * Creates a new {@code WatermarkStrategy} that wraps this strategy but instead uses the given
   * {@link TimestampAssigner} (via a {@link TimestampAssignerSupplier}).
   *
   * <p>You can use this when a {@link TimestampAssigner} needs additional context, for example
   * access to the metrics system.
   *
   * <pre>
   * {@code WatermarkStrategy<Object> wmStrategy = WatermarkStrategy
   *   .forMonotonousTimestamps()
   *   .withTimestampAssigner((ctx) -> new MetricsReportingAssigner(ctx));
   * }</pre>
   */
  default WatermarkStrategy<T> withTimestampAssigner(TimestampAssignerSupplier<T> timestampAssigner) {
    checkNotNull(timestampAssigner, "timestampAssigner");
    return new WatermarkStrategyWithTimestampAssigner<>(this, timestampAssigner);
  }

  /**
   * Creates a new {@code WatermarkStrategy} that wraps this strategy but instead uses the given
   * {@link SerializableTimestampAssigner}.
   *
   * <p>You can use this in case you want to specify a {@link TimestampAssigner} via a lambda
   * function.
   *
   * <pre>
   * {@code WatermarkStrategy<CustomObject> wmStrategy = WatermarkStrategy
   *   .forMonotonousTimestamps()
   *   .withTimestampAssigner((event, timestamp) -> event.getTimestamp());
   * }</pre>
   */
  default WatermarkStrategy<T> withTimestampAssigner(SerializableTimestampAssigner<T> timestampAssigner) {
    checkNotNull(timestampAssigner, "timestampAssigner");
    return new WatermarkStrategyWithTimestampAssigner<>(this,
        TimestampAssignerSupplier.of(timestampAssigner));
  }

  /**
   * Creates a new enriched {@link WatermarkStrategy} that also does idleness detection in the
   * created {@link WatermarkGenerator}.
   *
   * <p>Add an idle timeout to the watermark strategy. If no records flow in a partition of a
   * stream for that amount of time, then that partition is considered "idle" and will not hold
   * back the progress of watermarks in downstream operators.
   *
   * <p>Idleness can be important if some partitions have little data and might not have events
   * during some periods. Without idleness, these streams can stall the overall event time
   * progress of the application.
   */
  default WatermarkStrategy<T> withIdleness(Duration idleTimeout) {
    checkNotNull(idleTimeout, "idleTimeout");
    checkArgument(!(idleTimeout.isZero() || idleTimeout.isNegative()),
        "idleTimeout must be greater than zero");
    return new WatermarkStrategyWithIdleness<>(this, idleTimeout);
  }

  // ------------------------------------------------------------------------
  //  Convenience methods for common watermark strategies
  // ------------------------------------------------------------------------

  /**
   * Creates a watermark strategy for situations with monotonously ascending timestamps.
   *
   * <p>The watermarks are generated periodically and tightly follow the latest
   * timestamp in the data. The delay introduced by this strategy is mainly the periodic interval
   * in which the watermarks are generated.
   *
   * @see AscendingTimestampsWatermarks
   */
  static <T> WatermarkStrategy<T> forMonotonousTimestamps() {
    return (ctx) -> new AscendingTimestampsWatermarks<>();
  }

  /**
   * @see BoundedOutOfOrdernessWatermarks
   */
  static <T> WatermarkStrategy<T> forBoundedOutOfOrderness(Duration maxOutOfOrderness) {
    return (ctx) -> new BoundedOutOfOrdernessWatermarks<>(maxOutOfOrderness);
  }

  /**
   * Creates a watermark strategy based on an existing {@link WatermarkGeneratorSupplier}.
   */
  static <T> WatermarkStrategy<T> forGenerator(WatermarkGeneratorSupplier<T> generatorSupplier) {
    return generatorSupplier::createWatermarkGenerator;
  }

  /**
   * Creates a watermark strategy that generates no watermarks at all. This may be useful in
   * scenarios that do pure processing-time based stream processing.
   */
  static <T> WatermarkStrategy<T> noWatermarks() {
    return (ctx) -> new NoWatermarksGenerator<>();
  }

创建source之后设置的固定延迟生成水印watermark，如kafka

wordSource.assignTimestampsAndWatermarks(
    WatermarkStrategy
            .<Tuple2<String, Long>>forBoundedOutOfOrderness(Duration.ofSeconds(5))      // 设置水印允许延迟5秒
 .withTimestampAssigner((event, timestamp) -> event.f1 ));da

4.2 单调递增生成水印：

dataStream.assignTimestampsAndWatermarks(WatermarkStrategy.forMonotonousTimestamps());

使用WatermarkStrategy 生成watermark demo:

package it.kenn.eventtime;
 
import com.alibaba.fastjson.JSONObject;
import it.kenn.util.DateUtils;
import org.apache.flink.api.common.eventtime.*;
import org.apache.flink.api.common.serialization.SimpleStringSchema;
import org.apache.flink.api.java.functions.KeySelector;
import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.streaming.api.TimeCharacteristic;
import org.apache.flink.streaming.api.datastream.SingleOutputStreamOperator;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.streaming.api.functions.windowing.ProcessWindowFunction;
import org.apache.flink.streaming.api.windowing.assigners.TumblingEventTimeWindows;
import org.apache.flink.streaming.api.windowing.time.Time;
import org.apache.flink.streaming.api.windowing.windows.TimeWindow;
import org.apache.flink.streaming.connectors.kafka.FlinkKafkaConsumer;
import org.apache.flink.util.Collector;
import org.apache.kafka.clients.consumer.ConsumerConfig;
import org.apache.kafka.common.serialization.StringDeserializer;
 
import java.time.Duration;
import java.time.LocalDateTime;
import java.time.ZoneOffset;
import java.time.format.DateTimeFormatter;
import java.time.temporal.ChronoUnit;
import java.util.Iterator;
import java.util.Properties;
 
 
/**
 * 主要是event time、watermark的知识
 */
public class EventTimeDemo {
    public static void main(String[] args) throws Exception {
        final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        env.setStreamTimeCharacteristic(TimeCharacteristic.EventTime);
        env.setParallelism(6);
        Properties properties = new Properties();
        properties.setProperty(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG, "localhost:9092");
        properties.setProperty(ConsumerConfig.GROUP_ID_CONFIG, "1test_34fldink182ddddd344356");
        properties.setProperty(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class.getName());
        properties.setProperty(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class.getName());
        properties.setProperty(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, "earliest");
 
        SingleOutputStreamOperator<JSONObject> kafkaSource = env.addSource(new FlinkKafkaConsumer<>("metric-topic", new SimpleStringSchema(), properties)).map(JSONObject::parseObject);
 
        kafkaSource
                .assignTimestampsAndWatermarks(WatermarkStrategy
                        .<JSONObject>forBoundedOutOfOrderness(Duration.ofSeconds(5))//水印策略
                        .withTimestampAssigner((record, ts) -> {
                            DateTimeFormatter pattern = DateTimeFormatter.ofPattern("yyyy-MM-dd'T'HH:mm:ss.SSS'Z'");
//                            LocalDateTime parse = LocalDateTime.parse(record.getString("@timestamp"), pattern).plusHours(8);
//                            return parse.toInstant(ZoneOffset.of("+8")).toEpochMilli();
                            return DateUtils.parseStringToLong(record.getString("@timestamp"),pattern,8, ChronoUnit.HOURS);
                        })//解析事件时间
                        .withIdleness(Duration.ofMinutes(1))//对于很久不来的流（空闲流，即可能一段时间内某源没有流来数据）如何处置
                )
                .keyBy(new KeySelector<JSONObject, String>() {
                    @Override
                    public String getKey(JSONObject record){
                        if (record.containsKey("process") && record.getJSONObject("process").containsKey("name")){
                            return record.getJSONObject("process").getString("name");
                        }else {
                            return "unknown-process";
                        }
                    }
                })
                .window(TumblingEventTimeWindows.of(Time.seconds(5)))
                //四个泛型分别是输入类型，输出类型，key和TimeWindow,这个process函数处理的数据是这个5s窗口中的所有数据
                .process(new ProcessWindowFunction<JSONObject, Tuple2<String,Long>, String, TimeWindow>() {
                    @Override
                    public void process(String key, Context context, Iterable<JSONObject> iterable, Collector<Tuple2<String,Long>> collector) throws Exception {
                        String time = null;
                        Long ts = 0L;
                        Iterator<JSONObject> iterator = iterable.iterator();
                        if (iterator.hasNext()){
                            JSONObject next = iterator.next();
                            time = next.getString("@timestamp");
                            DateTimeFormatter pattern = DateTimeFormatter.ofPattern("yyyy-MM-dd'T'HH:mm:ss.SSS'Z'");
//                            time = LocalDateTime.parse(time, pattern).plusHours(8).toString().replace("T"," ");
                            ts = DateUtils.parseStringToLong(time, pattern, 8, ChronoUnit.HOURS);
                        }
                        collector.collect(new Tuple2<>(key,ts));
                    }
                })
                .print();
//        kafkaSource.print();
        env.execute();
    }
}

package it.kenn.util;
 
import java.time.LocalDateTime;
import java.time.ZoneOffset;
import java.time.format.DateTimeFormatter;
import java.time.temporal.TemporalUnit;
 
/**
 * 时间工具类
 *
 * @author kenn
 * 2020年11月25日23点10分
 */
public final class DateUtils {
 
    public static Long parseStringToLong(String time, DateTimeFormatter pattern, int offset, TemporalUnit unit) {
//        DateTimeFormatter pattern = DateTimeFormatter.ofPattern("yyyy-MM-dd'T'HH:mm:ss.SSS'Z'");
        LocalDateTime dateTime = null;
        if (offset > 0){
            dateTime = LocalDateTime.parse(time, pattern).plus(offset, unit);
        }else if (offset < 0){
            dateTime = LocalDateTime.parse(time, pattern).minus(Math.abs(offset), unit);
        }else {
            dateTime = LocalDateTime.parse(time, pattern);
        }
        return dateTime.toInstant(ZoneOffset.of("+8")).toEpochMilli();
    }
 
    public static Long parseStringToLong(String time, DateTimeFormatter pattern) {
        return parseStringToLong(time, pattern, 0, null);
    }
 
    public static Long parseStringToLong(String time) {
        return parseStringToLong(time, DateTimeFormatter.ofPattern("yyyy-MM-dd'T'HH:mm:ss.SSS'Z'"));
    }
 
    public static LocalDateTime parseStringToDateTime(String time, DateTimeFormatter pattern) {
        return LocalDateTime.parse(time, pattern);
    }
 
    public static LocalDateTime parseStringToDateTime(String time) {
        return parseStringToDateTime(time, DateTimeFormatter.ofPattern("yyyy-MM-dd'T'HH:mm:ss.SSS'Z'"));
    }
}

4.3 一种是periodic（周期性）水印


public class MonkeyPeriodicWatermarkGenerator implements WatermarkGenerator<Tuple2<String, Long>> {

 // 因为Watermark是不断推进的，所以我们总是保存最大的事件时间
 private long currentTimestamp;
 // 允许最大的乱序时间
 private long maxOutOfOrderness = 3000;

    @Override
    public void onEvent(Tuple2<String, Long> event, long eventTimestamp, WatermarkOutput output) {
        currentTimestamp = Math.max(event.f1, currentTimestamp);
    }

    @Override
    public void onPeriodicEmit(WatermarkOutput output) {
 // 发出水印（允许乱序时间）
 output.emitWatermark(new Watermark(currentTimestamp - maxOutOfOrderness));
    }
}

StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
ExecutionConfig config = env.getConfig();
// 设置水印的生成间隔为1秒，也就是说每隔1秒往流中加入一个水印
config.setAutoWatermarkInterval(1000);

DataStreamSource<Tuple2<String, Long>> wordSource = env.addSource(new RichSourceFunction<Tuple2<String, Long>>() {
    private volatile Boolean isCancel;
    private int totalCount;

    @Override
    public void open(Configuration parameters) throws Exception {
        this.isCancel = false;
        this.totalCount = 0;
    }

    @Override
    public void run(SourceContext<Tuple2<String, Long>> ctx) throws Exception {
        while(!this.isCancel) {
            String word = RandomStringUtils.randomAlphabetic(10);
            ctx.collect(Tuple2.of(word, System.currentTimeMillis()));
            this.totalCount++;

            if(this.totalCount % 100 == 0) {
                TimeUnit.SECONDS.sleep(1);
            }
        }
    }

    @Override
    public void cancel() {
        this.isCancel = true;
    }
});

SingleOutputStreamOperator<Tuple2<String, Long>> wordWithTsDS =
 wordSource.assignTimestampsAndWatermarks(new WatermarkStrategy<Tuple2<String, Long>>() {
            @Override
            public WatermarkGenerator<Tuple2<String, Long>> createWatermarkGenerator(WatermarkGeneratorSupplier.Context context) {
                return new MonkeyPeriodicWatermarkGenerator();
            }

            @Override
            public TimestampAssigner<Tuple2<String, Long>> createTimestampAssigner(TimestampAssignerSupplier.Context context) {
                return (event, ts) -> event.f1;
            }
        });

wordWithTsDS.map(tuple -> tuple.f0)
        .map(word -> Tuple2.of(word, 1), TypeInformation.of(new TypeHint<Tuple2<String, Integer>>() {}))
        .keyBy(wordAndCnt -> wordAndCnt.f0)
        .window(TumblingEventTimeWindows.of(Time.seconds(5)))
        .reduce((wc1, wc2) -> Tuple2.of(wc1.f0, wc1.f1 + wc2.f1)).name("reduce")
        .print();

env.execute("Flink Eventtime and Watermark");
punctuated watermark
接下来，我用代码模拟一下使用punctuated watermark。我需要对Source做以下改造，就是Source发出的消息有可能会有时间戳，也有可能没有时间戳。但如果我们检测到时间戳后，立即发出水印。

首先，此处基于punctuated事件来发出水印，只要检测到元组中的第二个字段不为-1，马上发出水印。注意提取事件时间有一处小细节，第一次因为还没有任何的事件时间，所以默认会是Long.MIN_VALUE，系统会直接报错，所以，我们初始化为0。

public class PunctuatedWatermarkGenerator
        implements WatermarkGenerator<Tuple2<String, Long>> , TimestampAssigner<Tuple2<String, Long>> {
    @Override
    public long extractTimestamp(Tuple2<String, Long> element, long recordTimestamp) {
 // 提前事件时间要先判断时间戳字段是否为-1
 if(element.f1 != -1) {
            return element.f1;
        }
        else {
 // 如果为空，返回上一次的事件时间
 return recordTimestamp > 0 ? recordTimestamp : 0;
        }
    }

    @Override
    public void onEvent(Tuple2<String, Long> event, long eventTimestamp, WatermarkOutput output) {
        if(event.f1 != -1) {
            output.emitWatermark(new Watermark(event.f1));
        }
    }

    @Override
    public void onPeriodicEmit(WatermarkOutput output) {
 // nothing
 }
}

4.4 指定使用punctuated watermark


SingleOutputStreamOperator<Tuple2<String, Long>> wordWithTsDS =
        wordSource.assignTimestampsAndWatermarks(new WatermarkStrategy<Tuple2<String, Long>>() {
            @Override
            public WatermarkGenerator<Tuple2<String, Long>> createWatermarkGenerator(WatermarkGeneratorSupplier.Context context) {
                return new PunctuatedWatermarkGenerator();
            }

            @Override
            public TimestampAssigner<Tuple2<String, Long>> createTimestampAssigner(TimestampAssignerSupplier.Context context) {
                return new PunctuatedWatermarkGenerator();
            }
        });

4.5 处理空闲数据源

在某些情况下，由于数据产生的比较少，导致一段时间内没有数据产生，进而就没有水印的生成，导致下游依赖水印的一些操作就会出现问题，比如某一个算子的上游有多个算子，这种情况下，水印是取其上游两个算子的较小值，如果上游某一个算子因为缺少数据迟迟没有生成水印，就会出现eventtime倾斜问题，导致下游没法触发计算。

所以filnk通过WatermarkStrategy.withIdleness()方法允许用户在配置的时间内（即超时时间内）没有记录到达时将一个流标记为空闲。这样就意味着下游的数据不需要等待水印的到来。

当下次有水印生成并发射到下游的时候，这个数据流重新变成活跃状态。

在Flink中，我们可以使用withIdleness来设置空闲的source。


ingleOutputStreamOperator<Tuple2<String, Long>> wordWithTsDS =
        wordSource.assignTimestampsAndWatermarks(WatermarkStrategy
                .<Tuple2<String, Long>>forBoundedOutOfOrderness(Duration.ofSeconds(5))      // 设置水印允许延迟5秒
 .withIdleness(Duration.ofSeconds(15))                                       // 设置空闲source为15秒
 .withTimestampAssigner((event, timestamp) -> event.f1));

大部分时候，我们只需要使用内置的BoundedOutOfOrdernessWatermarks即可，并使用Lambda表达式从事件中提出时间戳就好。但还是得了解它的实现机制。这样将来出现问题的时候，我们也能够第一时间发现问题在哪儿。

案例demo


import org.apache.flink.api.common.functions.MapFunction;
import org.apache.flink.api.java.tuple.Tuple;
import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.streaming.api.TimeCharacteristic;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.streaming.api.functions.AssignerWithPeriodicWatermarks;
import org.apache.flink.streaming.api.functions.windowing.WindowFunction;
import org.apache.flink.streaming.api.watermark.Watermark;
import org.apache.flink.streaming.api.windowing.assigners.TumblingEventTimeWindows;
import org.apache.flink.streaming.api.windowing.time.Time;
import org.apache.flink.streaming.api.windowing.windows.TimeWindow;
import org.apache.flink.util.Collector;
 
import javax.annotation.Nullable;
import java.text.SimpleDateFormat;
import java.util.ArrayList;
import java.util.Collections;
import java.util.Iterator;
import java.util.List;
 
 
/**
 *
 * Watermark 案例
 *
 * Created by xuwei.tech.
 */
public class StreamingWindowWatermark {
 
    public static void main(String[] args) throws Exception {
        //定义socket的端口号
        int port = 9000;
        //获取运行环境
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
 
        //设置使用eventtime，默认是使用processtime
        env.setStreamTimeCharacteristic(TimeCharacteristic.EventTime);
 
        //设置并行度为1,默认并行度是当前机器的cpu数量
        env.setParallelism(1);
 
        //连接socket获取输入的数据
        DataStream<String> text = env.socketTextStream("hadoop100", port, "\n");
 
        //解析输入的数据
        DataStream<Tuple2<String, Long>> inputMap = text.map(new MapFunction<String, Tuple2<String, Long>>() {
            @Override
            public Tuple2<String, Long> map(String value) throws Exception {
                String[] arr = value.split(",");
                return new Tuple2<>(arr[0], Long.parseLong(arr[1]));
            }
        });
 
        //抽取timestamp和生成watermark
        DataStream<Tuple2<String, Long>> waterMarkStream = inputMap.assignTimestampsAndWatermarks(new AssignerWithPeriodicWatermarks<Tuple2<String, Long>>() {
 
            Long currentMaxTimestamp = 0L;
            final Long maxOutOfOrderness = 10000L;// 最大允许的乱序时间是10s
 
            SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss.SSS");
            /**
             * 定义生成watermark的逻辑
             * 默认100ms被调用一次
             */
            @Nullable
            @Override
            public Watermark getCurrentWatermark() {
                return new Watermark(currentMaxTimestamp - maxOutOfOrderness);
            }
 
            //定义如何提取timestamp
            @Override
            public long extractTimestamp(Tuple2<String, Long> element, long previousElementTimestamp) {
                long timestamp = element.f1;
                currentMaxTimestamp = Math.max(timestamp, currentMaxTimestamp);
                System.out.println("key:"+element.f0+",eventtime:["+element.f1+"|"+sdf.format(element.f1)+"],currentMaxTimestamp:["+currentMaxTimestamp+"|"+
                        sdf.format(currentMaxTimestamp)+"],watermark:["+getCurrentWatermark().getTimestamp()+"|"+sdf.format(getCurrentWatermark().getTimestamp())+"]");
                return timestamp;
            }
        });
         // 保存被丢弃的数据
        OutputTag<Tuple2<String,Long>> outputTag = new <Tuple2<String,Long>>("late-data"){};
        //分组，聚合
        DataStream<String> window = waterMarkStream.keyBy(0)
                .window(TumblingEventTimeWindows.of(Time.seconds(3)))//按照消息的EventTime分配窗口，和调用TimeWindow效果一样
                .allowedLateness(Time.seconds(2))// 允许数据迟到2s
                .sideOutputLateData(outputTag)   //  通过sideOutputLateData 可以把迟到的数据统一收集，统计存储，方便后期排查问题。旁路输出 
                .apply(new WindowFunction<Tuple2<String, Long>, String, Tuple, TimeWindow>() {
                    /**
                     * 对window内的数据进行排序，保证数据的顺序
                     * @param tuple
                     * @param window
                     * @param input
                     * @param out
                     * @throws Exception
                     */
                    @Override
                    public void apply(Tuple tuple, TimeWindow window, Iterable<Tuple2<String, Long>> input, Collector<String> out) throws Exception {
                        String key = tuple.toString();
                        List<Long> arrarList = new ArrayList<Long>();
                        Iterator<Tuple2<String, Long>> it = input.iterator();
                        while (it.hasNext()) {
                            Tuple2<String, Long> next = it.next();
                            arrarList.add(next.f1);
                        }
                        Collections.sort(arrarList);
                        SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss.SSS");
                        String result = key + "," + arrarList.size() + "," + sdf.format(arrarList.get(0)) + "," + sdf.format(arrarList.get(arrarList.size() - 1))
                                + "," + sdf.format(window.getStart()) + "," + sdf.format(window.getEnd());
                        out.collect(result);
                    }
                });
        // 把迟到数据暂时打印到控制台,实际中可以保存到其它存储介质中
        DataStream<Tuple2<String,Long>> sideOut = window.getSideOutput(outputTag);
        //测试-把结果打印到控制台即可
        window.print();
 
        //注意：因为flink是懒加载的，所以必须调用execute方法，上面的代码才会执行
        env.execute("eventtime-watermark");
 
    }
 
 
}

你可能感兴趣的:(Flink,flink,java,windows,大数据,hadoop)

DeepSeek smallpond搅动大数据风云彭铖洋 javascript reactjs
DuckDB走向分布式？DeepSeek的smallpond涉足大数据DuckDB！降维打击传统大数据领域，搅动中台数据工程风云！DeepSeek正在利用smallpond（一种新的、简单的分布式计算方法）推动DuckDB超越其单节点根源。但它是否解决了可扩展性挑战——还是带来了新的权衡？DeepSeek最近搞了个大新闻。他们的R1模型在2025年1月发布时，就直接干翻了OpenAI的O1等竞争对
Java注解说明书：从正确姿势到防坑指南，让你的代码会说话！双囍菜菜 Java java python 开发语言
《Java注解说明书：从正确姿势到防坑指南，让你的代码会说话！》——手把手教你玩转官方小标签，避开90%新手踩过的坑文章目录《Java注解说明书：从正确姿势到防坑指南，让你的代码会说话！》第一章：初识注解——代码世界的智能便利贴1.1注解的前世今生：从纸质标签到数字革命1.2注解的四大核心价值与实现原理第二章：基础三巨头——每个Javaer必须刻进DNA的标签2.1@Override：防手残终极护
Python, Java 联合开发全国以及港澳主要商业银行办信用卡实操APP (Siliver) Geeker-2025 python java
以下是一个使用Python和Java联合开发全国以及港澳主要商业银行办信用卡实操APP的示例架构和部分代码示例。这个APP主要功能包括查询银行信息、了解办信用流程、模拟申请信用卡等操作。###整体架构概述-**Python部分**：-用于数据处理和分析，例如从各种数据源获取银行信息、信用政策等数据，并进行数据清洗和整理。-可以利用数据分析和可视化库来辅助生成信用评估报告和相关图表。-**Java部
Java nmap 命令网络安全（king）网络安全黑客网络工程师网络 web安全安全
Java与Nmap的结合：网络安全监测利器在现代网络环境中，安全性是至关重要的。尤其在企业和组织中，维护网络的安全性将直接影响到其运营的正常进行。Nmap（NetworkMapper）是一个开源的网络扫描工具，广泛应用于网络安全评估。今天，我们结合Java语言，探讨如何利用Java调用Nmap命令以实现网络安全监测的目的。什么是Nmap？Nmap是一个强大的网络扫描工具，可以用于发现网络上的设备、
Hbase在hdfs上的archive目录占用空间过大宝罗Paul 大数据 hbase
hbase版本：1.1.2hadoop版本：2.7.3Hbase在hdfs上的目录/apps/hbase/data/archive占用空间过大，导致不停地发出hdfs空间使用率告警。【问题】告警信息alert:datanode_storageistriggered告警信息表明某个或某些datanode的HDFS存储空间使用率已超过阈值(我们设置的是80%)，需要清理。[hdfs@master-2r
TCP通信-支持服务端与多个客户端同时通信冷眼热眸 JAVA语言 tcp/ip 网络服务器网络协议 java
在上一篇文章中，我展示了基于TCP通信协议的客户端与服务端进行通信，但是只能有一个客户端与服务端进行通信，详情请点击括号内的文章(UDP传输协议和TCP传输协议的解释和实例)。本篇文章讲述；基于多线程实现多个客户端与服务端同时通信，且附有代码的注解。客户端代码如下（Client）packagecom.itheima_tcp;importjava.io.DataOutputStream;import
Java直通车系列13【Spring MVC】（Spring MVC常用注解）浪九天 Java直通车 java spring 后端
目录1.@Controller2.@RequestMapping3.@GetMapping、@PostMapping、@PutMapping、@DeleteMapping4.@RequestBody5.@ResponseBody6.@PathVariable7.@RequestParam8.@ModelAttribute在SpringMVC项目中，注解是非常重要的组成部分，它可以帮助我们更简洁、高
windows安装虚拟机 linux
1.下载VMware,一直点next即可。2.在下面给出的这个位置下出现两个网卡（VMwarexxxxxxxx即可），即为安装成功控制面板\所有控制面板项\网络连接。3.导入镜像
H5播放webrtc视频视频处理html5
一、简介WebRTC概念WebRTC是由Google主导的，由一组标准、协议和JavaScriptAPI组成，用于实现浏览器之间（端到端之间）的音频、视频及数据共享。WebRTC不需要安装任何插件，通过简单的JavaScriptAPI就可以使得实时通信变成一种标准功能。为什么使用webrtc现在各大浏览器以及终已经逐渐加大对WebRTC技术的支持。下图是webrtc官网给出的现在已经提供支持了的浏
docker 开源nas_NAS如何装qBittorrent？一个教程就够了！X86与ARM均可用鸡糟的黄医桑 docker 开源nas
大家好，我是加勒比考斯，是一个NAS领域的老司基。以前是负责NAS板块的小编一枚，有幸玩过众多品牌的NAS，包括有群晖、威联通、华芸、西部数据、铁威马以及Drobo等。我会一直输出NAS干货，码字不易，希望大家给个关注！创作声明：qBittorrent是一款开源免费的种子和磁力链接下载工具，支持Windows、Mac和Linux，它的功能非常强大。但是无论是群晖还是威联通官方都没有直接提供，本文就
Kubernetes_15_k8s交付jenkins并集成docker/k8s/java/maven环境 hellowordx007 Kubernetes kubernetes 服务器 linux
配置jenkins镜像并集成Docker环境在运维机执行[root@wwwjenkins]#pwd/opt/sortware/jenkins[root@wwwjenkins]#vimDockerfile##配置Dockerfile集成Docker环境FROMjenkins/jenkins:2.287USERrootADDkubectl/usr/bin/kubectlADDget-docker.sh
关于Android Studio编译时提示Execution failed for task ‘:xxx:compileDebugJavaWithJavac‘ 居然是阿宋 android studio android gradle
在项目首次导入编译时，总是会出现一些比较难排除的问题，特别是在提示中无法直接找到原因：*Exceptionis:org.gradle.api.tasks.TaskExecutionException:Executionfailedfortask':bc_iothub:compileDebugJavaWithJavac'.atorg.gradle.api.internal.tasks.propert
开源项目 cs294639693
阿里阿里的开源项目很多，这也跟@淘宝正明的开源态度密不可分。有很多重量级的项目，例如LVS、Tengine，或者很有实践价值的中间件，例如MetaQ(分布式消息系统)、dubbo(RPC框架)、cobar(数据库中间件)，或者是Java世界的工具，例如druid、fastjson。都说国内Java公司的技术架构大部分来自阿里系，我觉得一方面来自阿里员工，一方面也可以来自阿里的开源项目。地址有几个：
180.HTML、CSS、JavaScript 我也念过晚霞 html css javascript
———————————————————————————————【1.引言】在Android开发过程中，前端技术（HTML、CSS、JavaScript）逐渐成为不可或缺的技能之一。无论是通过WebView显示网页内容，还是构建混合应用，掌握前端基础将有助于提升整体产品体验。本文在保证内容全面性的前提下，剔除了多余的推荐信息，直接进入技术核心讲解。通过详细介绍HTML、CSS与JavaScript的
如何在Android中实现网络请求 python资深爱好者 android 网络
在Android中实现网络请求有多种方法，常用的几种方法包括使用HttpURLConnection、OkHttp库和Retrofit库。下面分别介绍这几种方法：1.使用HttpURLConnectionHttpURLConnection是Java标准库提供的类，用于处理HTTP请求。下面是一个简单的例子：java复制代码importjava.io.BufferedReader;importjava
Java进阶——一篇搞懂多线程实战 1加1等于 Java java
本文主要是对Java多线程相关知识进行总结和讲解。一、线程创建方式继承Thread类：通过重写run()方法来定义线程的执行逻辑，只能单继承。实现Runnable接口：这种方式更加灵活，避免了单继承的问题，而且同一个Runnable实例可以被多个线程共享，提高了代码的复用性，因此在实际开发中更为推荐。实现Callable接口：与前两种方式不同，Callable接口支持线程执行后返回结果，并且可以抛
android多个usb摄像头,Android中多USB摄像头解决方案——UVCCamera源码分析（四）桔子毛 android多个usb摄像头
经过前几章的学习，我们大概了解了整个UVCCamera初始化、开始预览的过程。那么接着我们将来看看UVCCamera是如何实现拍照功能的。本章内容相对比较简单，均是Java层的实现。我们直接来看代码：@OverridepublicvoidcaptureStill(finalStringpath,OnCaptureListenerlistener){super.captureStill(path,l
全网最简单实用Android平板USB摄像头开发，同时预览多个摄像头，双目摄像头，同时打开手机前后摄像头（红外摄像头、人脸识别、活体检测、Android Camer 云启软件 Android原生笔记
老规矩，先视频8月20日背景：多摄像头有很多实现方案，手机上能实现跑通，但是Android平板USB的找了好久才实现，需要低版本API，废话不多说直接代码：工具类importandroid.graphics.SurfaceTexture;importandroid.hardware.Camera;importandroid.view.TextureView;importjava.io.IOExce
kokoro 82M参数的声音模型kokoro-onnx，支持中文 skywalk8163 人工智能人工智能
kokoro大约是官网：github.comonnx推理官网：GitHub-thewh1teagle/kokoro-onnx:TTSwithkokoroandonnxruntime可以参考这个文档使用：Kokoro-82M实战：最强TTS开源模型Windows本地极简部署完全攻略_kokorotts本地部署-CSDN博客实践下来英文不错，中文还欠缺些。kokoro82M参数的声音模型介绍❤️Kok
华为欧拉系统 Tomcat 安装详解阿绵运维后端 tomcat java Linux
1.安装或确认安装JavaTomcat需要Java环境（JDK或JRE）才能运行。如果系统尚未安装Java，可以使用以下命令安装OpenJDK：#更新软件包索引yumupdate-y#安装OpenJDK21（可根据需求安装其他版本，如8、11、17等）yuminstall-yjava-21-openjdkjava-21-openjdk-devel#验证Java是否安装成功java-version如
从零用java实现小红书 springboot vue uniapp （2）主页优化顽疲 java仿写小红书 java spring boot vue.js
前言移动端演示http://8.146.211.120:8081/#/前面的文章我们基本完成了主页的布局今天我们具体的去进行实现并且分享我开发时遇到的问题首先先看效果java仿小红书主页实现效果为1.顶端全屏切换2.上划加载更多3.下拉当前页整体刷新顶端全屏切换我们选择gui-switch-navigation结合swiperswiper-item进行实现关键代码.................
【Spring】SpringBoot手写模拟Spring boot 九师兄 boot spring spring boot java
1.概述本章主要讲解SpringBoot手写模拟Springboot，在此之前我们先了解一下怎么创建SpringMVC。2.SpringMvc容器以前我们配置SpringMVC一般采用xml的方式配置，配置如下现在如果采用java的方式，不要xml该怎么配置呢？视频参考：SpringMvc零配置本文出自csdn九师兄，防伪标志，本文由九师兄唯一发布。原地址：https://blog.csdn.ne
Hadoop、Spark、Flink Shuffle对比逆袭的小学生 hadoop spark flink
一、Hadoop的shuffle前置知识：Map任务的数量由Hadoop框架自动计算，等于分片数量，等于输入文件总大小/分片大小，分片大小为HDFS默认值128M，可调Reduce任务数由用户在作业提交时通过Job.setNumReduceTasks(int)设置数据分配到Reduce任务的时间点，在Map任务执行期间，通过Partitioner（分区器）确定每个键值对的目标Reduce分区。默认
Tomcat 新手入门指南局外人_Jia tomcat java
Tomcat新手入门指南ApacheTomcat是一个开源的JavaServlet容器和Web服务器，广泛用于部署和运行JavaWeb应用程序。以下是Tomcat的入门指南，帮助你快速上手。1.安装Tomcat步骤1:下载Tomcat访问ApacheTomcat官网。选择适合的版本（如Tomcat9.x）并下载压缩包（zip或tar.gz）。步骤2:解压文件将下载的压缩包解压到指定目录，如/opt
Beekeeper Studio：一款跨平台的SQL编辑器与数据库管理工具牧桔好Victor
BeekeeperStudio：一款跨平台的SQL编辑器与数据库管理工具项目地址:https://gitcode.com/gh_mirrors/be/beekeeper-studio项目介绍BeekeeperStudio是一款跨平台的SQL编辑器和数据库管理工具，适用于Linux、Mac和Windows操作系统。作为社区版，BeekeeperStudio采用GPL许可证，完全免费且开源。无论您是数
大模型应用开发技术：自定义状态段智华深入理解 ChatGPT Mulit-Agent LangGraph LangChain ERNIE SPEED
LlaMA3系列博客基于LlaMA3+LangGraph在windows本地部署大模型（一）基于LlaMA3+LangGraph在windows本地部署大模型（二）基于LlaMA3+LangGraph在windows本地部署大模型（三）基于LlaMA3+LangGraph在windows本地部署大模型（四）
Java微服务SpringCloud+Uniapp+Vue3+Element Plus开源商城BizSpring BizSpring源码商城 java spring cloud 教育电商小程序 uni-app
BizSpring开源地址Githubhttps://github.com/BizSpringSource/bizspring-vue3-opensource.gitGiteehttps://gitee.com/BizSpring/bizspring-vue3-opensource.gitBizSpring核心开源框架名称框架核心框架springboot、springcloud、springclo
【Hadoop】什么是Zookeeper？如何理解Zookeeper？ 2302_79952574 hadoop zookeeper 大数据
ZooKeeper是一个开源的分布式应用程序协调服务，可以为分布式应用提供一致性的服务，功能包括：配置维护、名字服务、分布式同步、组服务等等。ZooKeeper的目标是封装好复杂易出错的关键服务，将简单易用的接口和性能高效、功能稳定的系统提供给用户。1.Zookeeper的特点最终一致性：Client不论连接到哪个Server,展示给它的都是同一个视图。可靠性：如果某个消息被一台服务器接受，那么它
Java反射 lyrhhhhhhhh java 开发语言
在Java的世界中，反射（Reflection）是一个强大而神秘的工具。它允许程序在运行时动态地获取类的信息并操作类的属性和方法。本文将带你深入理解Java反射，揭开反射的神秘面纱。一、什么是反射？Java反射是指在运行时（runtime）动态地获取类的信息、调用类的方法、操作类的属性等功能。通过Java反射，我们可以在运行时检查类的方法和属性，实例化对象，调用方法，获取和设置属性的值，以及操作数
Java代理 lyrhhhhhhhh java 开发语言
在软件开发中，代理模式是一种非常常见的设计模式。它允许我们通过一个代理对象间接访问目标对象，从而在不修改目标对象的情况下增强其功能。代理模式广泛应用于日志记录、权限校验、事务管理、延迟加载等场景。本文将带你深入了解Java中的代理模式，包括静态代理和动态代理的实现方式。一、什么是代理给目标对象提供一个代理对象，并且由代理对象控制着对目标对象的引用在程序中，代理模式的核心思想是：代理对象：代替目标对
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/[email protected]:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理