Flink 开发一个简单的应用程序只需要构建环境、构建数据源、构建数据处理方案、构建数据输出及执行程序这五个步骤，但每个步骤都有对应其他强大的API，所以本文一一举例学习。

构建环境

流处理

StreamExecutionEnvironment env = null;
// 构建流环境，如果在本地则创建本地环境，如果是集群，则创建集群环境
env  = StreamExecutionEnvironment.getExecutionEnvironment();
// 创建本地执行环境并设置并行数
env = StreamExecutionEnvironment.createLocalEnvironment(3);
// 创建远程执行环境，jobmanager的IP，端口，并行度，运行程序的位置
env = StreamExecutionEnvironment.createRemoteEnvironment("10.xxx.xx.103",6123,5,"D:/test/abc.jar");

第三种方式可以直接从本地代码中构建与远程集群的Flink JobManager 的RPC连接，通过指定应用程序所在的jar包，将运行程序远程拷贝到 JobManager 节点上，然后将Flink 应用运行在远程的环境中，本地程序相当于一个客户端。

批处理

ExecutionEnvironment env = null;
// 构建流环境，如果在本地则创建本地环境，如果是集群，则创建集群环境
env  = ExecutionEnvironment.getExecutionEnvironment();
// 创建本地执行环境并设置并行数
env = ExecutionEnvironment.createLocalEnvironment(3);
// 创建远程执行环境，jobmanager的IP，端口，并行度，运行程序的位置
env = ExecutionEnvironment.createRemoteEnvironment("10.xxx.xx.103",6123,5,"D:/test/abc.jar");

构建数据源

        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        // 从集合中读取数据
        DataStream ds = env.fromCollection(Arrays.asList(1,2,3,4,5,6));
        // 直接读取数据
        DataStream ds1 = env.fromElements(1,2,3,4,5);
        // 从文件读取
        DataStream ds2 = env.readTextFile("D:\\workspace\\spring\\middleware\\flink\\flink-test\\src\\main\\resources\\hello.txt");
        // 从 kafka 读取
        Properties properties = new Properties();
        properties.setProperty("bootstrap.servers", "10.240.30.104:9092");
        properties.setProperty("group.id", "test");
        properties.setProperty("enable.auto.commit", "true");
        properties.setProperty("auto.commit.interval.ms", "0");
        FlinkKafkaConsumer myConsumer = new FlinkKafkaConsumer("topic1", new SimpleStringSchema(),properties);
        DataStream ds3 = env.addSource(myConsumer);
        // 自定义数据源
        DataStream ds4 = env.addSource(new CustomizeSource());

自定义数据源

package com.example.demo;

import org.apache.flink.streaming.api.functions.source.SourceFunction;

/**
 * @author big uncle
 * @date 2021/6/3 13:54
 * @module
 **/
public class CustomizeSource implements SourceFunction {

    private boolean running = true;

    /**
     * 读取数据
    **/
    @Override
    public void run(SourceContext ctx) throws Exception {
        String str = "a-b-c:";
        int i =0;
        while (running){
            i++;
            ctx.collect(str+i);
            Thread.sleep(1000);
        }
    }

    /**
     * 关闭
    **/
    @Override
    public void cancel() {
        running = false;
    }
}

Transform

map fliter flatmap

    public static void main(String[] args) throws Exception {

        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        DataStream dataStream = env.fromElements("a,b,c,d,e,1,2,3,4");
        // 读取值是 "a,b,c,d,e,1,2,3,4" 转变为 一个个的元素
        dataStream.flatMap(new FlatMapFunction() {
            @Override
            public void flatMap(String s, Collector

Flink-1.12（四）Flink API

构建环境

流处理

批处理

构建数据源

Transform

key

split 和 Select （OutputTag）Connect和CoMap以及Union

分区

Sink 输出

window

基本类型

时间窗口(Time Window)

计数窗口(Count Window)

代码演示

窗口函数

增量聚合函数

全窗口函数

其他可选API

ProcessFunction API

KeyedProcessFunction

你可能感兴趣的:(Flink-1.12（四）Flink API)