广阔天地大有可为

5、flink任务中常用的转换算子（Transformation）

1、什么是Flink中的转换算子

在使用 Flink DataStream API 开发流式计算任务时，可以将一个或多个 DataStream 转换成新的 DataStream，在应用程序中可以将多个数据转换算子合并成一个复杂的数据流拓扑图。

2、常用的转换算子

Flink提供了功能各异的转换算子，Map,FlatMap,Filter,KeyBy,Reduce,Window,WindowAll...
通过操作各种转换算子，来获取新的DataStream及子类的实例，来完成计算需求。

Tips: 下面测试用例基于 Flink1.17.0、java1.8 编写

3、基本转换算子（map/ filter/ flatMap）

3.1 Map

功能说明：

DataStream[T] → DataStream[R]
输入一个元素同时输出一个元素，可以对元素的数据类型和内容做转换，好比SQL中的UDF函数

代码示例：

package com.baidu.datastream.transform;

import org.apache.flink.api.common.functions.MapFunction;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;

public class Map {
    public static void main(String[] args) throws Exception {
        // 1.获取执行环境
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

        // 2.使用 Map 算子
        // 方式1：使用 Lambda表达式
        env.fromElements("刘备", "张飞", "关羽", "赵云", "马超", "黄忠")
                .map(value -> value + "_")
                .print();

        // 方式2：使用 MapFunction实现类
        /*
         *  TODO MapFunction
         *   功能说明：
         *      对元素做1：1映射转换
         *   泛型说明：
         *      @T : 输入数据类型
         *      @O : 输出数据类型
         * */
        MapFunction mapFunction = new MapFunction() {
            @Override
            public Integer map(String value) throws Exception {
                return value.length();
            }
        };

        env.fromElements("刘备", "张飞", "关羽", "赵云", "马超", "黄忠")
                .map(mapFunction)
                .print();

        // 3.触发程序执行
        env.execute();
    }
}

执行结果：

3.2 FlatMap

功能说明：

DataStream[T] → DataStream[R]
输入一个元素同时产生零个、一个或多个元素，好比SQL中的UDTF(1对多)函数

代码示例：

package com.baidu.datastream.transform;

import org.apache.flink.api.common.functions.FlatMapFunction;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.util.Collector;

public class FlatMap {
    public static void main(String[] args) throws Exception {
        // 1.获取执行环境
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

        // 2.使用 FlatMap 算子

        // 方式：使用 flatMapFunction实现类
        /*
         *  TODO flatMapFunction
         *   功能说明：
         *      对输入元素做1:多的转换（好比SQL中的UDTF函数）
         *   泛型说明：
         *      @T : 输入数据类型
         *      @O : 输出数据类型
         * */
        FlatMapFunction flatMapFunction = new FlatMapFunction() {

            @Override
            public void flatMap(String value, Collector out) throws Exception {
                for (String s : value.split("_")) {
                    out.collect(s);
                }
            }
        };

        env.fromElements("刘_备", "张_飞", "关_羽", "赵_云", "马_超", "黄_忠")
                .flatMap(flatMapFunction)
                .print();

        // 3.触发程序执行
        env.execute();
    }
}

执行结果：

3.3 Filter

功能说明：

DataStream[T] → DataStream[T]
为每个元素执行一个逻辑判断，并保留那些判断为 true 的元素，好比SQL中的where

代码示例：

package com.baidu.datastream.transform;

import org.apache.flink.api.common.functions.FilterFunction;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;

public class Filter {
    public static void main(String[] args) throws Exception {
        // 1.获取执行环境
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

        // 2.使用 Filter 算子
        // 方式1：使用 Lambda表达式
        env.fromElements("刘备", "张飞", "关羽", "赵云", "马超", "黄忠")
                .filter(value -> value.equals("刘备"))
                .print();

        // 方式2：使用 FilterFunction实现类
        /*
         *  TODO FilterFunction
         *   功能说明：
         *      对元素过滤处理
         *   泛型说明：
         *      @T : 输入数据类型
         * */
        FilterFunction filterFunction = new FilterFunction() {

            @Override
            public boolean filter(String value) throws Exception {
                return value.equals("张飞");
            }
        };

        env.fromElements("刘备", "张飞", "关羽", "赵云", "马超", "黄忠")
                .filter(filterFunction)
                .print();

        // 3.触发程序执行
        env.execute();
    }
}

执行结果：

4、聚合算子

4.1 KeyBy（按键分区）

功能说明：

DataStream[T] → KeyedStream[T,K]
根据指定的字段(key)，将数据划分到不相交的分区中。相同key的元素会被分到同一个分区中。

分区规则：
分区编号 = 指定字段(key) 的哈希值 % 分区个数(并行度)

思考：

1、哪些数据类型不能作为分区的key？

数组类型不能作为key

当key的类型为bean类型时，bean类必须要重写hashCode方法

代码示例：

package com.baidu.datastream.transform;

import com.baidu.bean.FlinkUser;
import org.apache.flink.api.java.functions.KeySelector;
import org.apache.flink.streaming.api.datastream.KeyedStream;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;

public class KeyBy {
    public static void main(String[] args) throws Exception {
        // 1.获取执行环境
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        env.setParallelism(3);

        // 2.使用 KeyBy 算子

        // 方式1：使用 Lambda表达式
        // TODO key的类型为 String
        KeyedStream stringKeyedStream = env.fromElements("蜀_刘备", "蜀_关羽", "魏_曹操", "吴_孙权", "吴_孙坚", "吴_孙策").keyBy(value -> value.split("_")[0]);
        stringKeyedStream.print();

        // TODO key的类型为 bean (需重写hashCode方法)
        KeyedStream userKeyedStream = env.fromElements(new FlinkUser(1L, "x", 100L), new FlinkUser(2L, "x", 110L), new FlinkUser(3L, "y", 120L), new FlinkUser(4L, "y", 130L), new FlinkUser(5L, "z", 140L)).keyBy(user -> user);

        // TODO key的类型为 数组(不支持)
//        KeyedStream arrayKeyedStream = env.fromElements("蜀_刘备", "蜀_关羽", "魏_曹操", "吴_孙权", "吴_孙坚", "吴_孙策")
//                .keyBy(value -> value.split("_"));

        // 方式2：使用 KeySelector实现类
        /*
         * TODO KeySelector
         *   功能说明：
         *       从输入的数据中提取key，然后根据 `key的hashcode%并行度` 进行分区
         *       注意：这里的分区是逻辑分区
         *   泛型说明：
         *       @IN  ： 输入数据类型
         *       @KEY ： key的数据类型
         *   重要提示：
         *       什么类型的数据不能作为key呢？
         *          1.当 POJO 类且没有重写 hashCode() 方法而是依赖依赖于 Object.hashCode() 实现时
         *          2.任意类型的数组
         * */
        KeySelector keySelector = new KeySelector() {

            @Override
            public String getKey(FlinkUser value) throws Exception {
                return value.name;
            }
        };
        KeyedStream userNameKeyedStream = env.fromElements(new FlinkUser(1L, "x", 100L), new FlinkUser(2L, "x", 110L), new FlinkUser(3L, "y", 120L), new FlinkUser(4L, "y", 130L), new FlinkUser(5L, "z", 140L)).keyBy(keySelector);

        // max("字段名称") pojo类一定要含有空参构造
        //userNameKeyedStream.sum("id").print();

        // 3.触发程序执行
        env.execute();
    }
}

执行结果：

4.2 Reduce

功能说明：

KeyedStream[T,K] → DataStream[T]
在相同key的数据流上`滚动`执行聚合操作。将当前元素与上次一次聚合后得到的值(保存的状态值)组合然后输出新值，并将这个值作为状态进行保存。

Reduce函数的弊端：
聚合前数据类型 = 聚合后数据类型，不能修改数据类型
不能提供初始值进行聚合操作，当只有一个元素时，不会触发reduce函数

代码示例：

package com.baidu.datastream.transform;

import org.apache.flink.api.common.RuntimeExecutionMode;
import org.apache.flink.api.common.functions.MapFunction;
import org.apache.flink.api.common.functions.ReduceFunction;
import org.apache.flink.api.java.functions.KeySelector;
import org.apache.flink.api.java.tuple.Tuple;
import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;

public class Reduce {
    public static void main(String[] args) throws Exception {
        // 1.获取执行环境
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        env.setParallelism(4);


        // 2.使用 Reduce 算子
        /*
        * TODO ReduceFunction
        *   功能说明：
        *       对相同key中的元素进行聚合操作(依次聚合)
        *   泛型说明：
        *       输入数据和输出数据的类型
        *   重要说明：
        *       这种聚合方式不能修改value的数据类型
        *
        * */
        ReduceFunction> reduceFunction = new ReduceFunction>() {

            @Override
            public Tuple2 reduce(Tuple2 value1, Tuple2 value2) throws Exception {
                return new Tuple2(value1.f0, value1.f1 + value2.f1);
            }
        };

        // 统计每个国家出现的次数
        env.fromElements("蜀_刘备", "蜀_关羽", "魏_曹操", "吴_孙权", "吴_孙坚", "吴_孙策")
                .map(
                        new MapFunction>() {
                            @Override
                            public Tuple2 map(String value) throws Exception {
                                return new Tuple2(value.split("_")[0], 1);
                            }
                        }
                )
                .keyBy(
                        new KeySelector, String>() {
                            @Override
                            public String getKey(Tuple2 value) throws Exception {
                                return value.f0;
                            }
                        }

                )
                .reduce(reduceFunction)
                .print()
        ;


        // 3.触发程序执行
        env.execute();
    }
}

运行结果：

4.3 sum、min、max、minBy、maxBy

功能说明：

KeyedStream[T,K] → DataStream[T]
在相同key的数据流上`滚动`执行相应聚合操作。

min、minBy的区别：
min：聚合状态中保存的是第一个元素的非聚合字段
minBy：聚合状态中保存的是当前元素的非聚合字段

代码示例：

package com.baidu.datastream.transform;

import com.baidu.bean.FlinkUser;
import org.apache.flink.streaming.api.datastream.KeyedStream;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;

public class SumMinMaxMinByMaxBy {
    public static void main(String[] args) throws Exception {
        // 1.获取执行环境
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        env.setParallelism(1);

        KeyedStream userKeyedStream = env.fromElements(
                new FlinkUser(1L, "x", 100L),
                new FlinkUser(2L, "x", 110L),
                new FlinkUser(3L, "x", 120L),
                new FlinkUser(4L, "x", 130L),
                new FlinkUser(5L, "y", 140L)
        ).keyBy(user -> user.name);

        /*
         * TODO max("")、max(num)
         *   功能说明：
         *      根据指定的字段，做聚合操作
         *   怎样指定聚合字段：
         *      当 value类型为 pojo时，通过 max("字段名称") 来指定字段
         *      当 value类型为 tuple时，通过 max(num) 来指定字段
         *   重点说明：
         *      当 value类型为pojo时，必须实现空参构造方法，才能提取字段
         * */
        //userKeyedStream.max("id").print();
        //userKeyedStream.min("id").print();
        //userKeyedStream.sum("id").print();
        //userKeyedStream.maxBy("id").print();
        userKeyedStream.minBy("id").print();


        env.execute();


    }
}

5、物理分区算子

Flink提供了将数据重新分区的方法，当任务发生数据倾斜时，这个算子会很有用。

5.1 shuffle - 随机分区

功能说明：

DataStream[T] → DataStream[T]
将元素随机地均匀分配到下游分区

Tips：
因为是完全随机，当输入相同时，每次执行的结果可能会不同

代码示例：

package com.baidu.datastream.transform;

import com.baidu.bean.FlinkUser;
import org.apache.flink.streaming.api.datastream.KeyedStream;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;

public class Shuffle {
    public static void main(String[] args) throws Exception {
        // 1.获取执行环境
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        env.setParallelism(3);

        KeyedStream userKeyedStream = env.fromElements(
                new FlinkUser(1L, "x", 100L),
                new FlinkUser(2L, "x", 110L),
                new FlinkUser(3L, "x", 120L),
                new FlinkUser(4L, "x", 130L),
                new FlinkUser(5L, "x", 140L),
                new FlinkUser(6L, "x", 150L)).keyBy(user -> user.name);

        /*
         * TODO 问题：由于 keyBy 算子，导致数据倾斜(key相同，导致数据都被同一个并行子任务处理)
         *    我们可以使用 shuffle 算子将数据均匀的在分配到其他并行子任务中去
         * 重点提示：
         *    shuffle 算子只能操作 DataStream，不能操作 KeyedStream
         * */
        userKeyedStream.sum("id").shuffle().print();

        env.execute();

    }
}

运行结果：

5.2 rebalance - 轮询分区

功能说明：

DataStream[T] → DataStream[T]
使用Round-Robin负载均衡算法，将输入的数据平均的分配到下游分区中去。

代码示例：

package com.baidu.datastream.transform;

import com.baidu.bean.FlinkUser;
import org.apache.flink.streaming.api.datastream.KeyedStream;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;

public class Rebalance {
    public static void main(String[] args) throws Exception {
        // 1.获取执行环境
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        env.setParallelism(3);

        KeyedStream userKeyedStream = env.fromElements(
                new FlinkUser(1L, "x", 100L),
                new FlinkUser(2L, "x", 110L),
                new FlinkUser(3L, "x", 120L),
                new FlinkUser(4L, "x", 130L),
                new FlinkUser(5L, "x", 140L),
                new FlinkUser(6L, "x", 150L)).keyBy(user -> user.name);

        /*
         * TODO 问题：由于 keyBy 算子，导致数据倾斜(key相同，导致数据都被同一个并行子任务处理)
         *    我们可以使用 rebalance 算子将数据均匀的在分配到其他并行子任务中去
         * 重点提示：
         *    rebalance 算子只能操作 DataStream，不能操作 KeyedStream
         * */
        userKeyedStream.sum("id").rebalance().print();

        env.execute();
    }
}

运行结果：

5.3 rescale - 重缩分区

功能说明：

DataStream[T] → DataStream[T]
使用Round-Robin负载均衡算法，将以分区为单位将输入的数据平均的分配到下游分区中去。

和rebalance的区别：

rebalance将输入数据作为一个整体，根据数据输入的顺序随机分发到下游分区(涉及到了网络传输)
rescale将以上游分区为单位，随机的分配到下游分区中去

使用场景：

当source算子为可并发数据源时(如kafka，5个分区)，设置5个Task来读取分别读取每个分区的数据
此时，可以使用rescale来分发到下游实现负载均衡，这样可以做到数据只在本地传输而不是网络传输

5.4 global - 全局分区

功能说明：

DataStream[T] → DataStream[T]
将元素分发到下游的一个分区中去

5.5 broadcast - 广播分区

功能说明：

DataStream[T] → DataStream[T]
将元素广播到下游的每个分区

Tips：
数据被广播后，会在下游算子的每个分区中都保留一份，可以将数据进行重复处理

代码示例：

package com.baidu.datastream.transform;

import com.baidu.bean.FlinkUser;
import org.apache.flink.streaming.api.datastream.KeyedStream;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;

public class Broadcast {
    public static void main(String[] args) throws Exception {
        // 1.获取执行环境
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        env.setParallelism(3);

        KeyedStream userKeyedStream = env.fromElements(
                new FlinkUser(1L, "x", 100L),
                new FlinkUser(2L, "x", 110L),
                new FlinkUser(3L, "x", 120L),
                new FlinkUser(4L, "x", 130L),
                new FlinkUser(5L, "x", 140L),
                new FlinkUser(6L, "x", 150L)).keyBy(user -> user.name);

        userKeyedStream.sum("id").broadcast().print();

        env.execute();
    }
}

运行结果：

5.6 自定义分区

功能说明：

DataStream[T] → DataStream[T]
使用用户定义的 Partitioner 将元素分发到下游算子的分区中去

代码示例：

package com.baidu.datastream.transform;

import com.baidu.bean.FlinkUser;
import org.apache.flink.api.common.functions.Partitioner;
import org.apache.flink.api.java.functions.KeySelector;
import org.apache.flink.streaming.api.datastream.KeyedStream;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;

public class PartitionCustom {
    public static void main(String[] args) throws Exception {
        // 1.获取执行环境
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        env.setParallelism(3);

        KeyedStream userKeyedStream = env.fromElements(
                new FlinkUser(1L, "x", 100L),
                new FlinkUser(2L, "x", 110L),
                new FlinkUser(3L, "x", 120L),
                new FlinkUser(4L, "x", 130L),
                new FlinkUser(5L, "x", 140L),
                new FlinkUser(6L, "x", 150L)).keyBy(user -> user.name);

        /*
         *  TODO Partitioner
         *   功能说明：
         *       自定义分区器，根据输入的数据获取分区编号
         *   泛型说明：
         *       @K ： key的数据类型
         * */
        Partitioner partitioner = new Partitioner() {
            @Override
            public int partition(Long key, int numPartitions) {
                if (key == 1L || key == 2L) {
                    return 0;
                } else if (key == 3L || key == 4L) {
                    return 1;
                } else {
                    return 2;
                }
            }
        };

        /*
         * TODO KeySelector
         *  功能说明：
         *       key提取器，根据输入的数据，获取key
         *  泛型说明：
         *       @IN  ： 输入数据类型
         *       @KEY ： 输出数据类型(key)
         * */
        KeySelector keySelector = new KeySelector() {
            @Override
            public Long getKey(FlinkUser value) throws Exception {
                return value.id;
            }
        };

        userKeyedStream.sum("id").partitionCustom(partitioner, keySelector).print();

        env.execute();
    }
}

运行结果：

6、分流

在处理数据的时候，经常会将一条流或者一个表根据某些条件拆分成多条流或者多个表

flink中提供了分流的方式：1、使用filter算子分流 2、使用侧输出流分流

6.1 使用filter算子分流 - 不推荐

这种分流方式的弊端：

需要将原始流复制多份，并对每一份做一次判断，效率很低 (多次读取，多次判断)

代码示例：

    // 通过 filter 分流
    public static void ByFilter() throws Exception {
        // 1.获取执行环境
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

        // 根据国家，将 totalStream 分为三股流
        DataStreamSource totalStream = env.fromElements("蜀_刘备", "蜀_关羽", "魏_曹操", "吴_孙权", "吴_孙坚", "吴_孙策");

        SingleOutputStreamOperator weiStream = totalStream.filter(e -> e.contains("魏"));
        SingleOutputStreamOperator shuStream = totalStream.filter(e -> e.contains("蜀"));
        SingleOutputStreamOperator wuStream = totalStream.filter(e -> e.contains("吴"));

        weiStream.print();
        shuStream.print();
        wuStream.print();

        // 3.触发程序执行
        env.execute();
    }

6.2 使用侧输出流分流 - 推荐

避免了使用filter算子的弊端，指定source读取一次，判断一次即可完成分流操作

代码示例：

    // 通过 侧输入流 分流
    public static void ByOutputTag() throws Exception {
        // 1.获取执行环境
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

        // 根据国家，将 totalStream 分为三股流
        DataStreamSource totalStream = env.fromElements("蜀_刘备", "蜀_关羽", "魏_曹操", "吴_孙权", "吴_孙坚", "吴_孙策");

        // 初始化侧输出流
        OutputTag weiOutputTag = new OutputTag("wei", Types.STRING);
        OutputTag shuOutputTag = new OutputTag("shu", Types.STRING);
        OutputTag wuOutputTag = new OutputTag("wu", Types.STRING);

        // 通过 ProcessFunction向 侧输出流发送数据
        SingleOutputStreamOperator process = totalStream.process(
                new ProcessFunction() {
                    @Override
                    public void processElement(String value, ProcessFunction.Context ctx, Collector out) throws Exception {
                        // 往侧输出流中发送数据
                        if (value.contains("魏")) {
                            ctx.output(weiOutputTag, value);
                        } else if (value.contains("蜀")) {
                            ctx.output(shuOutputTag, value);
                        } else if (value.contains("吴")) {
                            ctx.output(wuOutputTag, value);
                        }

                    }
                }
        );

        SideOutputDataStream weiStream = process.getSideOutput(weiOutputTag);
        SideOutputDataStream shuStream = process.getSideOutput(shuOutputTag);
        SideOutputDataStream wuStream = process.getSideOutput(wuOutputTag);

        weiStream.print();
        shuStream.print();
        wuStream.print();

        // 3.触发程序执行
        env.execute();
    }

7、合流

flink中合并流分两种，纵向合并(类似sql中的union all) 、横向合并(类似sql中的join)

7.1 union - 纵向合并

语法：dataStream.union(otherStream1, otherStream2, ...)

注意：多个 dataStream 元素的数据类型必须相同

代码示例：

package com.baidu.datastream.transform;

import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;

// TODO 纵向合并流
public class Union {
    public static void main(String[] args) throws Exception {
        // 1.获取执行环境
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        env.setParallelism(4);

        DataStreamSource streamA = env.fromElements("刘备", "张飞", "关羽", "赵云", "马超", "黄忠");
        DataStreamSource streamB = env.fromElements(1, 2, 3, 4, 5, 6);
        DataStreamSource streamC = env.fromElements("蜀国", "蜀国", "魏国", "蜀国", "西凉", "汉朝");

        streamA.union(streamC).print();

        // 3.触发程序执行
        env.execute();
    }
}

7.2 connect - 纵向合并

语法：DataStream,DataStream → ConnectedStream

注意：合并的两个 dataStream 的数据类型可以不同

代码示例：

package com.baidu.datastream.transform;

import org.apache.flink.streaming.api.datastream.ConnectedStreams;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.streaming.api.functions.co.CoMapFunction;

// TODO “连接” 两个数据流并保留各自的类型。connect 允许在两个流的处理逻辑之间共享状态。
public class Connect {
    public static void main(String[] args) throws Exception {
        // 1.获取执行环境
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        env.setParallelism(4);

        DataStreamSource streamA = env.fromElements("刘备", "张飞", "关羽", "赵云", "马超", "黄忠");
        DataStreamSource streamB = env.fromElements(1, 2, 3, 4, 5, 6);

        ConnectedStreams connectedStreams = streamA.connect(streamB);

        // TODO 使用 CoMapFunction 函数，分别对 streamA、streamB流进行处理
        connectedStreams.map(
                new CoMapFunction() {
                    /**
                     * 处理第一条流中的数据
                     */
                    @Override
                    public String map1(String value) throws Exception {
                        return "streamA中的数据：" + value;
                    }

                    /**
                     * 处理第二条流中的数据
                     */
                    @Override
                    public String map2(Integer value) throws Exception {
                        return "streamB中的数据：" + value;
                    }
                }
        ).print();


        // 3.触发程序执行
        env.execute();
    }
}

你可能感兴趣的:(#,Flink,API,使用技巧,flink,大数据)

Hadoop与云原生集成：弹性扩缩容与OSS存储分离架构深度解析
Hadoop与云原生集成的必要性Hadoop在大数据领域的基石地位作为大数据处理领域的奠基性技术，Hadoop自2006年诞生以来已形成包含HDFS、YARN、MapReduce三大核心组件的完整生态体系。根据CSDN技术社区的分析报告，全球超过75%的《财富》500强企业仍在使用Hadoop处理EB级数据，其分布式文件系统HDFS通过数据分片（默认128MB块大小）和三副本存储机制，成功解决了P
Kubernetes 常用命令程序员的世界你不懂《容器》kubernetes 容器云原生
Kubernetes通过KubeApiserver作为整个集群管理的入口。Apiserver是整个集群的主管理节点，用户通过Apiserver配置和组织集群，同时集群中各个节点同etcd存储的交互也是通过Apiserver进行交互。Apiserver实现了一套RESTful的接口，用户可以直接使用API同Apiserver交互。另外官方还提供了一个客户端kubectl随工具集打包，用于可直接通过k
NFL的React GPT项目使用指南吕岚伊
NFL的ReactGPT项目使用指南一、项目目录结构及介绍ReactGPT是由NFL团队开发的一个尝试性项目，旨在创建一个自主的React开发者工具，利用AI辅助进行React代码的生成与修改。以下是本项目的主要目录结构和各部分功能简介：├──env#环境变量配置文件所在目录│└──.env#存放OPENAI_API_KEY等敏感信息的环境变量文件├──example#可能包含示例代码或配置的目录
【Java从入门到起飞】初始Java I'm Joe Java java 开发语言
文章目录1.Java语言概述1.1Java概述1.2Java语言简史1.3Java之父1.4Java技术体系平台1.5java的主要特性2.Java开发环境2.1Java语言跨平台的原理2.2什么是JDK、JRE、JVM2.3JDK的目录介绍3.注释(comment)4.JavaAPI文档5.Java核心机制：JVM5.1Java语言的优缺点5.1.1优点5.1.2缺点5.2JVM功能说明5.2.
全栈Todo应用实战：从零到一的本地部署与深度解析
全栈Todo应用实战：从零到一的本地部署与深度解析前言在现代Web开发中，全栈应用已成为主流。本文将以一个经典的Todo（待办事项）应用为例，详细记录从项目下载、环境配置、后端启动、数据库交互到前端运行的完整流程。我们将深入探讨在此过程中遇到的一个典型问题——CORS与API请求失败，并提供从“快速修复”到“最佳实践”的解决方案。这不仅是一份操作指南，更是一次宝贵的实战经验总结。你将从本博客中学到
用Flink实现的一个实时订单对账功能, Flink的双流实时对账
1.为什么业务订单数据不用Mysql之类的强事务性数据库监控反而用Flink的实时?一般这种涉及到订单的数据流都要用mysql监控实现,但是鉴于减少mysql的数据库压力和提高更实时性,可以考虑用Flink实时的数据流做实时的参考2.如何处理乱序数据?使用watermark水位保证第一层数据延迟.PS:这里的水位不能设置太长延迟使用processfuntion更加灵活的处理迟到数据,设置一个定时器
使用Spire.Doc.Free在Python中为Word文档添加批注 Ven% python python word 批注
文章目录技术背景环境准备完整实现代码功能说明：注意事项：总结在文档协作和审阅过程中，批注是极其重要的功能。本文将详细介绍如何使用Python的Spire.Doc.Free库为Word文档添加批注，并提供一个完整的解决方案。技术背景Spire.Doc.Free是一个功能强大且免费的Python库，用于处理Word文档。虽然免费版本有一些限制（如文档处理页数限制等），但它提供了丰富的API用于文档操作
深入TA-Lib：量化技术指标详解
深入TA-Lib：量化技术指标详解本文系统讲解TA-Lib技术指标分析，涵盖基础、数据处理、趋势与动量指标、均量线、布林线等，并结合Python代码与大数据、机器学习实战案例，助力读者掌握量化交易实战技巧。本文系统梳理了TA-Lib技术指标分析的核心内容，包括TA-Lib基础、数据处理、趋势与动量指标、均量线、布林线等关键技术指标分析方法，并结合Python代码示例与大数据、机器学习的融合实战案例
Flink 多流转换（三）CoProcessFunction合流操作案例 Alienware^ #Flink Flink
文章目录下面是CoProcessFunction的一个具体示例：我们可以实现一个实时对账的需求，也就是app的支付操作和第三方的支付操作的一个双流Join。App的支付事件和第三方的支付事件将会互相等待5秒钟，如果等不来对应的支付事件，那么就输出报警信息。程序如下：Gitee源代码如下publicclassBillCheckExample{publicstaticvoidmain(String[]
编程语言与API函数库速查字典大全一一MIO一一
本文还有配套的精品资源，点击获取简介：《Delphi、VB、TC、API函数库速查字典1.0》提供了一个全面的编程语言参考资源，涵盖了Delphi、VB、TurboC以及WindowsAPI的函数库。它包括一个名为"lib"的文件，用于快速查询和理解不同编程语言和API的相关函数。Delphi以其组件库和面向对象的特性受到青睐，VB则因其易用性而广受欢迎，而TC作为经典的C编译器，API函数库则提
深度对比：innerHTML vs 虚拟DOM——原理、性能与应用全解析止观止前端前端框架前端 html5 javascript reactjs xss
引言在现代Web开发中，高效操作DOM（文档对象模型）是构建高性能应用的关键。传统方法如innerHTML和新兴的虚拟DOM（VirtualDOM）技术代表了两种截然不同的DOM更新策略。innerHTML作为浏览器原生API，直接操纵HTML字符串；虚拟DOM则是通过JavaScript对象树进行优化更新，广泛应用于React、Vue等框架。本文深入对比两者的核心原理、技术细节、应用场景及优劣，
Flink双流处理：实时对账实现1
Flink双流处理：实时对账实现1去发现同类优质开源项目:https://gitcode.com/资源描述本资源文件详细介绍了Flink双流处理的实时对账实现。内容涵盖了基础概念、双流处理的方法以及实战案例，帮助开发者深入理解Flink在实时对账场景中的应用。内容概述基础概念介绍了Flink的基本概念和架构，为后续的双流处理打下基础。双流处理方法详细讲解了Flink中双流处理的核心方法和技巧，帮助
大数据时代下的时序数据库选型指南：基于工业场景的IoTDB技术优势与适用性研究 Loving_enjoy 计算机学科论文创新点机器学习 facebook 经验分享课程设计
>在宝钢集团的智能工厂里，5万多个传感器每秒产生150万+数据点，传统数据库系统每天积压3TB未处理数据——这揭示了工业4.0时代的核心矛盾：**海量时序数据处理能力已成为智能制造的关键瓶颈**。###工业时序数据的四大特殊性工业场景下的时序数据与传统互联网数据存在本质差异：1.**高精度时间要求**-数控机床振动监测需微秒级时间戳-电网故障定位要求时间同步精度≤1μs2.**多源异构性**```
Flink双流实时对账
在电商、金融、银行、支付等涉及到金钱相关的领域，为了安全起见，一般都有对账的需求。比如，对于订单支付事件，用户通过某宝付款，虽然用户支付成功，但是用户支付完成后并不算成功，我们得确认平台账户上是否到账了。针对上述的场景，我们可以采用批处理，或离线计算等技术手段，通过定时任务，每天结束后，扫描数据库中的数据，核对当天的支付数据和交易数据，进行对账。想要达到实时对账的效果，比如有的用户支付成功但是并没
Redisson实现限流器详解：从原理到实践源末coco 单片机 stm32 嵌入式硬件
什么是限流器？限流器（RateLimiter）是一种控制请求频率的机制，用于保护系统免受过多请求的冲击。想象一下，你开了一家餐厅，如果同时涌入1000个客人，厨房肯定忙不过来，这时候就需要"限流"——控制进入餐厅的人数。限流的常见场景//场景1：API接口限流@RestControllerpublicclassUserController{@GetMapping("/api/user/{id}")
nextjs+react项目如何代理本地请求解决跨域啃火龙果的兔子开发DEMO react.js 前端前端框架
在Next.js+React项目中解决本地开发跨域问题，可以通过以下几种方式实现代理请求：方案1：使用Next.js内置的Rewrites功能（推荐）1.修改next.config.js/**@type{import('next').NextConfig}*/constnextConfig={asyncrewrites(){return[{source:'/api/:path*',//匹配所有/a
IntelliJ IDEA 使用技巧与插件推荐：提升开发效率的终极指南海豹工匠 ide jetbrain JAVA 编程工具
在现代软件开发中，IntelliJIDEA作为一款功能强大的集成开发环境（IDE），深受开发者的喜爱。它不仅支持多种编程语言和框架，还提供了丰富的功能和插件，帮助开发者提高工作效率和代码质量。本文将深入探讨IntelliJIDEA的使用技巧和插件推荐，助您充分利用这款优秀的开发工具。目录IntelliJIDEA简介高效使用IntelliJIDEA的技巧快捷键大全代码导航与搜索高级重构实时错误检查与
网络爬虫：技术原理、应用场景与合法使用全攻略程序小武 python爬虫入门爬虫网络
爬虫是什么？网络爬虫（WebScraping或WebCrawling）是一种通过自动化方式从网站上抓取公开数据的程序。它通过模拟用户在浏览器中浏览网页的过程，访问网页、提取信息，并将数据保存到本地系统中。爬虫技术广泛应用于搜索引擎、数据收集、市场分析、信息聚合等多个领域。爬虫能做什么？数据收集爬虫可以高效地从互联网上的大量网站收集信息。比如，抓取新闻网站上的文章内容、商品电商平台的价格与库存数据、
斗鱼大数据面试题及参考答案大模型大数据攻城狮大数据大数据面试 hadoop面试 spark面试 flink面试手撕SQL 手撕代码
GC（垃圾回收）相关知识一、常见的GC收集器SerialGCSerialGC是最基本的垃圾收集器，它是单线程的。在进行垃圾收集时，会暂停所有的用户线程，直到垃圾收集完成。它的工作过程比较简单，首先标记出所有的垃圾对象，然后将它们清除。例如，在一个小型的、对响应时间要求不高的Java应用程序中，如简单的命令行工具，SerialGC可以满足垃圾收集的需求。因为这种应用程序通常没有很高的并发要求，暂停用
Java 大视界 -- Java 大数据机器学习模型在金融市场情绪指数构建与投资决策支持中的应用（339）青云交大数据新视界 Java 大视界 java 大数据机器学习金融情绪指数投资决策量化策略情绪分析
Java大视界--Java大数据机器学习模型在金融市场情绪指数构建与投资决策支持中的应用（339）引言：正文：一、Java构建的金融市场情绪数据采集与预处理体系1.1多源异构数据接入引擎1.2数据采集延迟测试报告1.3情绪数据预处理管道二、Java驱动的金融市场情绪指数构建模型2.1多维度情绪指数计算框架2.2情绪指数与投资决策的映射模型三、Java在金融投资决策支持中的实战应用3.1量化私募情绪
封装---统一处理接口与打印错误信息寻觅~流光封装工具前端 javascript 开发语言 typescript
一.简介我在重构代码时突然想到一个想法并实现出来:封装一个统一处理接口与打印错误信息,控制显示错误信息在控制台,接口请求时loading效果展示等等这个只是个人想法,而且比较简略,不太清楚实际工作是否这样写,但是我认为只要有这个想法就要去实现,总比没实现好,欢迎大家的建议与指导介绍我在项目中如何封装一个统一的API请求函数，解决每个接口都要写try...catch的繁琐问题，并实现自动错误日志、t
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
Cesium加载各类数据总结 zhu_zhu_xia cesium JavaScript javascript
接触到的加载数据类型：源地图、shp、Geojson、png、wms、地形底图一.Cesium加载各类底图#此类加载的本质在于newCesium.ImageryProvider()Apidefination：“Providesimagerytobedisplayedonthesurfaceofanellipsoid.Thistypedescribesaninterfaceandisnotinten
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
[特殊字符] 实时数据洪流突围战：Flink+Paimon实现毫秒级分析的架构革命（附压测报告）——日均百亿级数据处理成本降低60%的工业级方案 Lucas55555555 flink 大数据
引言：流批一体的时代拐点据阿里云2025白皮书显示，实时数据处理需求年增速达240%，但传统Lambda架构资源消耗占比超运维成本的70%。某电商平台借助Flink+Paimon重构实时数仓后，端到端延迟从分钟级压缩至800ms，计算资源节省5.6万核/月。技术红利窗口期：2025年ApachePaimon1.0正式发布，支持秒级快照与湖仓一体，成为替代Iceberg的新范式一、痛点深挖：实时数仓
JavaScript 基础09：Web APIs——日期对象、DOM节点梦想当全栈 JavaScript javascript 前端开发语言
JavaScript基础09：WebAPIs——日期对象、DOM节点进一步学习DOM相关知识，实现可交互的网页特效能够插入、删除和替换元素节点。能够依据元素节点关系查找节点。一、日期对象掌握Date日期对象的使用，动态获取当前计算机的时间。ECMAScript中内置了获取系统时间的对象Date，使用Date时与之前学习的内置对象console和Math不同，它需要借助new关键字才能使用。1.实例
[Vue warn]: onUnmounted is called when there is no active component instance to be associated with 扬帆起航&d vue.js javascript 前端 ecmascript 前端框架
[Vuewarn]:onUnmountediscalledwhenthereisnoactivecomponentinstancetobeassociatedwith.LifecycleinjectionAPIscanonlybeusedduringexecutionofsetup().Ifyouareusingasyncsetup(),makesuretoregisterlifecyclehoo
Flutter——数据库Drift开发详细教程(七) 怀君 flutter flutter 数据库
目录入门设置漂移文件入门变量数组定义表支持的列类型漂移特有的功能导入嵌套结果LIST子查询Dart互操作SQL中的Dart组件类型转换器现有的行类Dart文档注释结果类名称支持的语句自定义SQL类型定义类型使用自定义类型在Dart中在SQL中方言意识支持的SQLite扩展json1fts5地缘垄断自定义查询带有生成的api的语句自定义选择语句自定义更新语句入门Drift提供了一个dart_api来
Flutter——数据库Drift开发详细教程之迁移(九) 怀君 flutter flutter 数据库
迁移入门引导式迁移配置用法例子切换到make-migrations开发过程中手动迁移迁移后回调导出模式导出架构下一步是什么？调试导出架构的问题修复这个问题架构迁移助手自定义分步迁移转向逐步迁移手动生成测试迁移编写测试验证数据完整性在运行时验证数据库模式迁移器API一般提示迁移视图、触发器和索引复杂的迁移更改列的类型更改列约束删除列重命名列合并列添加新列入门Drift通过严格的架构确保查询类型安全。
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To [email protected]:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to '[email protected]
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。