wqy19941008

实时Flink1.14.4 doit

Flink DOIT 1.14.4

简介

批计算不等于离线。实时批计算— 快速得到结果。MySQL OLAP 。
有界数据流—>>>批计算

应用场景：
事件驱动型应用。
数据分析型应用
数据管道应用

滚动聚合全量聚合。
多级API 。 table api = ==DSL 槽位资源可扩展。任务示例可扩展。
每个算子都可以成为一个独立的任务
入门程序WordCount

基本Source 算子
Kafka 只有生产者有事务消费者没有事务机制。
Flink 批计算。
map 与mapPartitions：
两个算子在调用函数时的机制不一样。
一个是元素一个是迭代器连接数据库。

RuntimeExecutionMode ：流模式和批模式。
Flink中使用 lambda 表达式---->>> 单方法接口的方法实现函数式接口。
lambda 表达式泛型问题。keySelector 接口。
传入TypeHint 或 TypeInformation。Types 生成类型对象。
并不是很方便。相对而言优势并不明显。泛型是一种参数确切来说是泛型参数。
匿名内部类相对而言更好。

相关算子：
—Source
----Kafka Source 支持精确一次语义。
开启了Kafka 底层消费值的自动位移提交机制，他会把最新的消费位移提交到kafka的consumer_offsets中，就算吧自动位移提交机制开启，KafkaSource 依然不依赖于自动位移提交机制，优先从flink自己的状态中去获取偏移量，更可靠。
自己提交的偏移量做监控使用。
addSource和fromSource：
addSource 接受的是SourceFunction的对象 socket 底层 addSource fromCollection fromElement
fromSource 接受的是Source 接口的对象。kafka Source
***** 自定义的Source 算子
SourceFunction
RichSourcFunction：富函数。
有runtimeContext 和open close 生命周期方法。
生命周期方法： MapReduce —>>> MR. 线程方法。
flink 运行的task 实例称为subtask 。
ParallelSource Function 并行的Source 。

----Transformation
*** map。 flatmap 。filter 。 project 投影【java中有这个方法】
**** keyBy minBy min。滚动聚合算子在 keyedStream 上操作。
min ：返回数据的拼接，最小值+ 第一条数据。
minBy：返回一条完整数据。
都是滚动聚合逻辑 max只更新最大值的字段，maxBy更新所有的数据。
**** reduce : 自己定义逻辑。
reduce 只能返回一个值。如果向要返回多个值需要看底层的API 。上层的API 应用简单，但是限制较多，底层API 灵活一些
对比reduce 和sum 底层是 processFunction。
-----利用Reduce 实现Sum

----Sink算子
WriteAsText ~ + WriteMode ！
writeAsCsv 行列分隔符。只能用在元组流上，JavaBean 没有实现。Bean对象实现不是很方便，元组字段已经确定。

*****导入log4j的依赖，和配置文件。看报错的细节
需要刷新到磁盘。csv output format : buffered writer —>>> 4K 缓冲。
底层都是writeUsingOutputFormat 不同的类型。
writeAs 方法均被标记为要被废弃。

******** StreamFileSink: 功能强大，存储分桶。建议使用。
写入文件中为了后门离线计算。支持分桶存储和列式存储。
Inprogress----- 写入达到一定状态----->>> pending 挂起状态— 终态Finished File。三个生命周期------->>>>> …

    dependency>
        <dependency>
            <groupId>org.apache.flinkgroupId>
            <artifactId>flink-connector-filesartifactId>
            <version>1.14.4version>
        dependency>

defaultRollingPolicy 指定滚动更新策略：
判定包括时间和大小。
BULK 列式存储----->>>>
Parquet-avro .整合。hadoop-common

批模式
流模式需要加入checkpoint 才可以落盘。
行式存储：：forRowFormat
分桶支持列式存储这里的分桶是吧不同文件写入文件夹。
forBulkFormat ：一批整体编码整体写入。整体编码压缩率高。
一堆小文件压缩率高？还是总和大小一样的一个大文件------>>>>>. 后者压缩率高。
后面还可以生成列式存储文件。

&&&& 行列之间存储的博弈%%%%%
数仓之中列式存储更加合适？
orc parquet ：列式存储。

FileSink.forRowFormat();
FileSink.forBulkFormat();
StreamSource.map(JSON::toJSONString).sinkTo();

addSink : 后面加的是Sink Function
sinkTo: 后面加的是Sink 接口的实现类
需要开启ckpt 机制做一个整合。

列格式：
&&&&
write Factory
----ParquetAvroWriter.forGenericRecord. forReflectRecord forSpecificRecord
parquet 文件自带Schema
手动构造Schema。
Avro 的Schema
用avsc 文件。配置结果。描述文件生成Java。Bean
forReflectRecord：根据Java Bean 反射。
forSpecificRecord ：传入特殊的 Bean 即可。
自动生成avro Bean 代码。
bulk 模式下文件滚动策略只有一种：当发生ckpt 时进行滚动。
bulk 模式下不能根据文件大小时间间隔进行滚动—>> 是一个整体。
map 和 map ———>>>>> Java 中是这样：
person 是Stu 的父类。List 不是List 父类
Scala中可以：
协变。person 是Stu 的父类。List 是List 父类
逆变 // 不变。

协变的容器类型。。
3 种方式对比：
1. 自己构造Schema
2. 特殊的Avro Bean----->>>>. avsc 生成 Avro 类型
3. Java Bean ------>>>>> Reflect bean
生产中常用的支持EOS 语义的按照时间段将文件划分子文件夹。
既可以输出行文件又可以输出列文件。
列存储：
若干行分为一个行组。parquet 本身没有定死序列化的方式，
avro 序列化。

  StreamingFileSink sink = StreamingFileSink.forRowFormat(
                        new Path(savePath),
                        new SimpleStringEncoder<String>("UTF-8")
                ).withRollingPolicy(policy)
                .withBucketAssigner(new DateTimeBucketAssigner("'dt='yyyyMMdd/'hour='HH", ZoneId.of("Asia/Shanghai")))
                .withOutputFileConfig(config)
                .build();

需要构造一个列模式的FileSink 需要构造一个ParquetAvro Writer Factory 。

自己构建Schema api 方法直接给Avro Schema
. Avro Bean 特定Bean Class avro 描述文件 maven 构建 avsc 文件。
Java Bean

//总结 StreamFileSink ----->>>>>>>.<<<<<<<--------
schema 需要序列化。
Hive 解析Avro 序列化某些版本会有问题解析Map 问题。

KafkaSink

 Configuration configuration = new Configuration();
        configuration.setInteger("res.port", 8822);
        StreamExecutionEnvironment env = StreamExecutionEnvironment.createLocalEnvironmentWithWebUI(configuration);

        //StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        env.enableCheckpointing(5000, CheckpointingMode.EXACTLY_ONCE);
        env.getCheckpointConfig().setCheckpointStorage("/Users/wangqianyu/software/programfoFlinkLearn/NewFlinkDoit/src/main/resources");

        DataStreamSource<String> streamSource = env.socketTextStream("localhost", 9999);
        KafkaSink<String> kafkaSink = KafkaSink.<String>builder()
                .setBootstrapServers("localhost:9092")
                .setRecordSerializer(KafkaRecordSerializationSchema.<String>builder()
                        .setTopic("topic-01")
                        .setValueSerializationSchema(new SimpleStringSchema())
                        .build()
                ).setDeliverGuarantee(DeliveryGuarantee.EXACTLY_ONCE)
                .setTransactionalIdPrefix("doit-1001")
                .build();
        streamSource.sinkTo(kafkaSink);

        env.execute("flink-kafka-sink");

source :1个并行度—>>>> 自定义的并行度是1. 后面是12 也可以startNewChain。

JdbcSink

保证EOS。/不保证EOS
实现幂等性： on dulpicate key ～。
MySQL 不支持同一个连接上存在多个并行的事务必须设置withTransactionPerConnection 为true
Oracle 支持多个。

Redis Sink

bahir。flink/spark 扩展。
各种sink 就是对各种数据存储客户端的封装。
Redis 基础数据结构：
String 和 Hash 不同。大key Hash。小key String 。。对于不同类型 API 同名不同意！！！！
-------- 总结-------

多流操作API

----- 侧输出流 processFunction
分流–> deprecated. ------->>>>> outPutSelector ++++ select .

connect 操作。
******* 两个流连接为一个流共享状态但是互相独立处理
coFlatMapFunction ～ coMapFunction～
******* 最大的意义在于广播状态共享状态 ********
Union 合并
类似于SQL 中两个表的 Union 。
对比Connect：Connect 两个流得数据类型可以一样也可以不一样。
Union：必须相同。

CoGroup 协同分组---->>>
Join 底层。
where + KeySelector equalTo ～。无界流 ---->>>> 有界流. 只支持两个流操作。94
迭代器是窗口中的一组。
必须要开窗口 window～。
TumblingProcessingTimeWindow ～。 TumblingEventTimeWindow ～。
s1.coGroup(s2).where.equalTo.window.apply(new coGroupFunction~)
使用coGroup :
验证左外连接～～～～

Join 关联操作
join ~ where ~ equalTo~ window ~ apply ~
***********窗口相关：～后面讲。
join 是 inner join 如果想left 或right join ：用coGroup
apply + flatJoinFunction ～

广播broadcast：
把广播流得数据放到每个主流的实例中去。
关联字典表。或者维表。相当于Map端的Join 。把数据打宽。
-----------主流：用户事件流
-----------广播流：维度信息。
processElement------处理主流数据
processBroadcastElement------ 处理广播流数据
自己维护状态程序奔溃后。状态容易丢失。Flink内部封装的状态容错性好。

ProcessFunction : 整理！总结。

事件驱动型应用— 用process 用的比较多。
不同流的类型之间相互转化。
process 可以做测流输出生命周期方法。拿到运行时上下文信息。
keyed Process Function～/

多流算子回顾

相关算子～～～
Join coGroup
广播流。------ process Function。

flink 中的SubTask Task 槽位

2022-09-11
streamGraph-----jobGraph-----executionGraph—物理执行图
同一个task的运行实例不能放在同一个task slot 中
一个task slot 可以运行多个不同的task
task— 算子的封装
第一个task的结果传给第二个task？两个task进行网络数据传输。—>>>> 两个算子逻辑放在同一个类中。
多个算子的逻辑放在一个Task中调用----->>>
算子链。
task 代表一段逻辑---->>>> sub task 代表运行实例。
并行度----->>>>>>
算子并行度传递规律
节省网络传输---- 节省线程资源，
keyBy是一个独立的任务。

同一个task 的多个并行实例不能放在同一个task slot中。
并行度最大的槽位数<=总槽位数。
以槽位为最小调度单位。一个task slot 可以运行多个不用task 的1个并行实例。

task 与算子链

能否实现 one to one 传输。上下游之间
并行度相同
属于相同的slotSharingGroup ------->>>
是否共享槽位。在一个task 实例中即可共享槽位。
不同共享组的算子不能共享槽位。
两个负担很重的算子-- 规定不在同一个共享组中。
setParallelism
slotSharingGroup 不设置默认跟随。
startNewChain ～开启新链禁用前链合并。
disableChaining～禁用前后链合并。

分区规则：
分区partition 算子。顶层 channel Selector ～/
global ----
broadcast—
forward 1对1。。---- shuffle。 rebalance ---- rescale----
partitionCustom ～自定义

定义上下游数据分发规则。—
shuffle ：随机发送。
rebalance 轮询发送。
rescale：上下游并行度是倍数关系。自己组中轮询---->>>
keyBy设置不了并行度。分区算子而不是计算算子。
默认发数据的规则是轮询— rebalance。

并行度相关复习

算子并行度: main 方法只是一个客户端。可以算子绑定的条件; 1.one to one 2.并行度相同 3. slot sharingGroup 同一个槽位共享组。

时间概念时间语义。

处理时间。事件时间。
事件时间的推进。单调递增不可回退事件不动数据不动时间不动
处理时间语义:
事件时间语义:

时间窗口定时器需要用户自己定义处理.
-----时间推进机制.

1.12+ 默认是事件时间的语义.
事件时间语义中有迟到乱序的概念。
推进时间广播到下游. 数据流中既有数据还有WaterMark. 虽然没有数据过来但是还是会每隔一定时间发送 WaterMark.

watermark 和事件时间语义。
时间的推进策略。WaterMark ~ 数据 + WaterMark 。时间戳会向下游做广播。
一个并行度取最大
多个并行度来源数据取最小。多个并行度的WaterMark 最终结果为最小的.
时间窗口到达触发计算逻辑. 假设每一个窗口都有一个桶存储当前窗口内的数据,

WaterMark Idle timeout :某个分区一直没有数据进来，导致WaterMark 没有推进会强制推进WM。防止数据大量积压。
理解事件时间推进机制---->>> 不同的时间语义。 watermark 和时间窗口统计。
周期性插入带有时间戳的 WM 。源头一般是Source 算子。迟滞时间设置在源头设置。

watermark = 收到的最大时间- 容错时间. 可以容忍的乱序时间。
WM 可以选择在任何节点生成，一般都在源头生成。

ctx 中可以得到watermark。
processElement 方法是在什么时候触发？？
----- 收到数据后才会调用没有数据输入不会触发。打印时机—>> 打印的WM 是上一条的WM 但是WM会更新。打印的是旧的。 WaterMark 在数据后面会到达。

窗口相关

滚动聚合 aggregate
全窗口聚合： process~

在批计算模式中，shuffle的上游可以做局部聚合，然后会把局部聚合结果交给下游去做全局聚合
- 因此，就需要提供两个局部聚合结果进行合并的逻辑
- 在流式计算中，不存在这种上游局部聚合和交给下游全局聚合的机制！
  - 所以，在流式计算模式下，不用实现下面的方法
    Accumulator 中的 merge 方法。

经典分组TopN 。30 s内分组。
可以用滚动聚合算子 Top 2 .但是返回值只能输出一条信息，需要将两条做一个拼接。
全窗口---->>>> top N~。
keyBy+ window +apply
keyBy+window+ processWindowFunction ~

apply 和process 对比:
process 中信息更多含有ctx 可以做测流输出。可以拿到状态。 getRuntimeContext~。实现Rich Function接口。
apply 相对局限直接继承自Function。没有很多的信息。

窗口API相关总结

滚动 滑动 会话窗口 。
全局窗口   key的window 事件时间 处理时间语义。
会话窗口 根据session Gap 划分窗口。

窗口触发器。

flink的默认序列化 不是JDK的序列化  默认用的是avro 序列化。

allowedLateness(2)：
如果WaterMark 此刻的事件时间推进到了A窗口结束点后2s 如果还来A窗口的数据，就算迟到不会再触发A窗口的计算，而是输出到测流迟到流了。

Trigger 和Evictor
onElement 判断是否要触发  触发前  触发后~

Evictor Before + + Evictor After
移除数据。

Evictor ：工作机制：移除本次窗口计算中想移除的数据。算子调用Trigger 发现满足触发逻辑时会先调用Evictor Before 计算之前移除。
而后计算，计算后Evictor After 进行数据清理。一般是Evictor Before 。

状态管理:

自己的状态raw状态。 Flink管理：托管状态。

算子状态：ListState 一般source端会用到。需要实现checkpointedFunction 接口 snapshot state .initializeState. ListState/UnionListState .
UnionListState 需要人工指定算子重分配。

键控状态：按照Key来进行分组绑定状态。
ListState valueState MapState
自动容错Task级别故障开启Checkpoint 和重试机制。
checkpoint 存储。定期ckpt。

状态数据在重启后的重分配:~. keyed State 也会有重分配的问题。不会有逻辑的错误

ListState MapState ReducingState AggregatingState 相关API
…

iterable 和iterator。
1.Iterator接口的核心方法next()或者hashNext()，previous()等，都是严重依赖于指针的，也就是迭代的目前的位置。如果Collection直接实现Iterator接口，那么集合对象就拥有了指针的能力，内部不同方法传递，就会让next()方法互相受到阻挠。只有一个迭代位置，互相干扰。
2.Iterable 每次获取迭代器，就会返回一个从头开始的，不会和其他的迭代器相互影响。
3.这样子也是解耦合的一种，有些集合不止有一个Iterator内部类，可能有两个，比如ArrayList，LinkedList，可以获取不同的Iterator执行不一样的操作。

状态TTL: 详解。

数据的存活时长管理：Redis TTL

updateTtlOnReadAndWrite 更新TTL.
updateTtlOnCreateAndWrite
刷新TTL 计时。插入更新时刷新计时。
setStateVisibility(StateTtlConfig.StateVisibility.NeverReturnExpired) // 不允许返回已过期但尚未被清理的数据
.setStateVisibility(StateTtlConfig.StateVisibility.ReturnExpiredIfNotCleanedUp) // 允许返回已过期但尚未被清理的数据

异步线程定期清除。过期未被清除: ~~evictor 清除~~ 。底层会做过滤。超时不返回。
TTL 是默认按照事件时间。实际用的是处理时间。

数据清理策略：
.cleanupIncrementally(1,false) // 增量清理（每当一条状态数据被访问，则会检查这条状态数据的ttl是否超时，是就删除）
.cleanupFullSnapshot() // 全量快照清理策略（在checkpoint的时候，保存到快照文件中的只包含未过期的状态数据，但是它并不会清理算子本地的状态数据）
过滤器过滤过期数据本地的数据没有改动。
RockDB 使用。
//.cleanupInRocksdbCompactFilter(1000) // 在rocksdb的compact机制中添加过期数据过滤器，以在compact过程中清理掉过期状态数据
HashMap + RockDB
HashMap : runtime Heap +Disk
RockDB: 内嵌DB KV数据库。数据不是以对象形式存在，以序列化形式存在。

状态后端—StateBackend。

状态功能的具体实现，
两种StateBackend 存到HDFS 上的快照格式是一样的可以切换。兼容SBK。
RockDB – compact [Hbase compact]
Hbase 相关。minor compact major compact。
不设置清理策略会有奇怪事情发生~~~。~~~。

flink容错机制相关参数配置示例

UnionList 不需要人工指定也是自动重分配[勘误]。broadcast 广播模式。下游每一个获得所有状态数据。
ListState 模式采用round robin方式

flink 状态容错中ckpt的基本思想

ckpt是为了解决系统崩溃时如何恢复

flink容错机制相关参数配置示例

checkpoint 是保证：
1.故障重启后各个算子能恢复到统一的状态经过了相同的数据影响之后的状态
2. 数据不会被漏处理不会丢失

状态数据TTL清理策略的底层逻辑

定时器 去检查状态数据  是否过期。
三种策略：
	增量清除
		代码做过期检查。 针对本地状态空间做清除
	cleanFullSnapShot本地状态空间没有做清理.
		生成的快照结果文件 不会有过期数据  针对快照生效。不去管理本地空间

TTL参数设置:
.setUpdateType(StateTtlConfig.UpdateType.OnReadAndWrite) // 设置ttl计时重置的策略设置策略为最后一个生效 setValue形式.
状态可见性:
过期的检查清除策略: 不是覆盖针对不同的场景. 写三种都生效. key的形式put.
默认清除策略:
.cleanupIncrementally(1,false) // 增量清理（每当一条状态数据被访问，则会检查这条状态数据的ttl是否超时，是就删除）
每个subtask 都有自己的状态空间.HashMapStateBackend.
ListState ValueState 使用过程中都将状态放在HashMap中. CopyOnWriteStateMap ~Flink自己设计的结果.
里面放入KV.
List: K:List<>
Value K:value 大key是keyBy的key
cleanUpSize: 每次迭代去检查多少个 key的State 访问状态会驱动代码进行清理.
True or false:
数量数达到批次数次才可以. true 每条数据都要处理.

Flink 实现EOS 语义容错各环节要点

容错
核心流程,

source ：记录偏移量。可以回滚。KafkaSource 。自己保存偏移量。
Flink: checkpoint保证一条或者一批数据要么是经过了完整的处理如果失败重启恢复后所有算子的state 数据都能回到这条数据从未处理过的状态。
Sink端保证：
采用幂等写入的方式
—采用两阶段提交的方式
采用预写日志提交的方式。
Hbase 的事务：行级事务。一行之中各个字段保持原子性。

状态的精确一次。State的精确一次。
checkpoint 算法关键点：
barrier分段思想。
source 端需要数据重放。
barrier 是source 算子定期插入。算子做完快照后需要向JobManager 做一个应答。
JM 收到对所有算子的应答。之后任务这次ckpt是成功的。本身就是一个两阶段协议。
1） barrier 会在数据源流入源头被注入并行数据流中。
2）Barrier 接着向下游传递
3）一旦sink算子接收到barrier算子有两种情况
引擎内严格一次处理保证
Sink算子收到了所有上游的barrier-n时，sink算子对自己的state 进行快照然后通知检查点协调器当所有算子都向检查点协调器汇报成功之后检查点协调器向所有算子确认本次快照完成。
端到端严格一次处理保证：
Sink算子已经收到上游所有的Barrier-n算子时 Sink算子对自己的State 进行了快照并预提交事务。再通知检查点协调器检查点协调器向所有算子确认本次。快照的完成 Sink算子提交食物。两阶段的第二阶段，本次事务完成。

ckpt的对齐和不对齐。
多并行度 多条流的Checkpoint barrier。对齐。。
checkpoint 等待。阻塞 缓存。
非对齐的ckpt。  
ckpt对齐-----阻塞传递。背压。 数据积压。   逐级传递 背压 情况。  数据处理效率 很低。 非对齐 只能保证at  least  once。
说明：
	ckpt 机制的调用流程实质是2PC。JobMaster 是协调者 所有Operator task 是执行者。start ckpt是pre-commit的开始信号 而每个operator task 的ckpt是 pre-commit 的过程。ack是 operator task反馈给协调者JobMaster  最后callback 是commit。

checkpoint 对应的API:

tolerableCkptFailure Number 允许失败的最大次数。
ckpt 数据会更新。
对齐超时时间。: 超时后失败。
setCheckpointInterval :
最大并行的ckpt数: 允许同时存在的ckpt数量

sink 端的容错策略:
2PC：
两阶段。事务
两阶段预写日志提交。

幂等性写入可以实现最终一致。但是会有过程中的不一致。
如果一批数据 在两次运行中 计算逻辑产生的结果是不确定的。 随机数Random

flink 写入kafka无法实现幂等写入。

kafka 幂等机制:
生产者幂等 producer API 发送到Broker时会失败，producer 会自动重试
利用了序列号 producer 序列号作为幂等性保证。
kafka 支持事务写入：
伪事务。
两阶段:
第一阶段：开启事务。正确输出数据 barrier 到达预提交事物。存储本次对外事务号以及事务状态 pending
做local checkpoint 向 jobmanager 上报
等待notify
第二阶段：
notify 到达
提交事务向外部系统 commit。如果成功则修改事务状态 finished。

预写日志的两阶段提交方式。

Task 自动重启策略：
fixDelayRestart
noRestart
exponential delay
失败的failover策略：
Region 策略。全部重启。或者重启收到影响的最小级。 job中有两个完全不相关的流水线。
一个task失败。所有task 都重启？不一定 ALL/Region
cluster 级别重启
需要从某个快照状态恢复。手动指定savepoint

flink 端到端精确一次场景测试

Flink 程序分布式部署运行

执行计划的生成

spark的血缘：子RDD包含父RDD的引用
Flink 利用图
Spark-sql：
sql—语法树—解析树逻辑执行计划----逻辑优化树优化后的逻辑执行计划----物理执行计划树
----RDD级别的代码。code gen 代码生成。
streamGraph----JobGraph - – Execution Graph---- 物理执行图。

JobManager 把。JobG 变成Execution G 添加并行度。
StreamGraph 转为JobG 在client 端。做算子链聚合Operator Chain 。

物理执行图是不存在的只是运行后的一个效果。

flink standalone 集群测试

Flink-Session Mode
Application Mode
PerJob Mode
maven-shaded-plugin。将依赖打入Jar包
flink 访问HDFS 需要两个。 jar包
flink-shaded-hadoop3-uber-3.1.1.7.2.9.0-173-9.0.jar
commons-cli-1.4.jar
Flink Metrics
8032 请求ResourceManager。8020:NameNode 请求
1.14.4 -t remote。默认提交到yarn 加入这个参数可以提交到standalone 集群。
session 模式集群资源隔离度不够所有任务共享集群资源共享Job Manager

Yarn 提供的是 yarn container 最轻量级的它里面只能运行进程
K8s docker 提供的是轻量级的虚拟机里面可以运行简化版操作系统
VmVare重量级虚拟机

Yarn 做不到CPU的完全隔离。

yarn 不同模式：
集群的生命周期和资源的隔离保证
session 模式：多个Job共享一个JobManager Job退出集群不会退出。
PerJob模式：每个Job独享集群。Job退出集群退出。 main方法在client端运行
ApplicationMode: 每个Job 独享一个集群 job退出则集群退出 main方法在集群中运行。-----生产环境建议
session 模式：适应于多次提交小Job的场景。
perJob 和Application 模式需要重新申请JM TM 比较耗时。
Yarn 资源调度策略：
Fair。FIFO【过期】 Capacity。默认
启动Session-cluster 之后不需要指定taskManager 个数。执行任务时会根据需要申请资源。老版本是固定的数目现在可以根据需求灵活。
内存分配的最小单位：
session 模式需要传入yarn application 的Id。-d detach 分离模式。
standalone–standaloneSessionCluster-EntryPoint
PerJob模式：集群启动和Job提交合二为一。
Application Mode ：
Session On Yarn：
集群运行的Job需要多少资源就动态申请多少资源。
集群运行的Job被cancel 那么占用的yarn资源也会随之被释放。
集群的JobManager 会一直存在。
Per-job模式。
没有submit 不能提交新Job
Application Mode
Yarn Application Cluster EntryPoint

你可能感兴趣的:(学习总结,flink)

nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
《算法》四学习——1.1节进阶的Farmer 算法算法笔记
前言买了一本算法4，每天看一点，对每个小结来个学习总结，输出驱动输入。本篇笔记针对第一章基础1.1基础编程模型1.1节总结了相关的语法、语言特性和书中将会用到的库。笔记自己在编码中容易遗漏的点&&优先级比||高在开发中习惯了加括号，所以没注意到这点，教材上也有但是忘记了二分查找中计算mid=left+(right-left)/2这样计算可以有效避免(left+right)/2溢出答疑java无穷大
网关gateway学习总结猪猪365 学习总结学习总结
一微服务概述:微服务网关就是一个系统!通过暴露该微服务的网关系统,方便我们进行相关的鉴权,安全控制,日志的统一处理,易于监控的相关功能!实现微服务网关技术都有哪些呢?1nginx:nginx是一个高性能的http和反向代理web的服务器,同事也提供了IMAP/POP3/SMTP服务.他可以支撑5万并发链接,并且cpu,内存等资源消耗非常的低,运行非常的稳定!2Zuul:Zuul是Netflix公司
全面指南：用户行为从前端数据采集到实时处理的最佳实践数字沉思营销流量运营系统架构前端内容运营大数据
引言在当今的数据驱动世界，实时数据采集和处理已经成为企业做出及时决策的重要手段。本文将详细介绍如何通过前端JavaScript代码采集用户行为数据、利用API和Kafka进行数据传输、通过Flink实时处理数据的完整流程。无论你是想提升产品体验还是做用户行为分析，这篇文章都将为你提供全面的解决方案。设计一个通用的ClickHouse表来存储用户事件时，需要考虑多种因素，包括事件类型、时间戳、用户信
document获取元素的方法小成语 js 平时 js
js学习总结----DOM获取元素的方法（8个）DOM:documentobjectmodel文档对象模型DOM就是描述整个html页面中节点关系的图谱，可以如下图理解在DOM中，提供了很多的获取元素的方法和之间关系的属性以及操作这些元素的方法。1、获取页面中元素的方法1）、document.getElementById('元素的ID')在整个文档中，通过元素的ID获取到这个元素对象(获取的是一个
10/24 每周学习总结5 木木ainiks 1024程序员节
1RecordingtheMoolympicsS#include#includeusingnamespacestd;typedeflonglongint_1;intn;structnode{int_1begin_b;int_1end_e;}a[300];boolcmp(nodea,nodeb){if(a.end_e==b.end_e)returna.begin_b>b.begin_b;return
Day25_0.1基础学习MATLAB学习小技巧总结（25）——四维图形的可视化非常规定义M 0.1基础学习MATLAB 学习 matlab 开发语言 SIMULINK 数学建模
利用空闲时间把碎片化的MATLAB知识重新系统的学习一遍，为了在这个过程中加深印象，也为了能够有所足迹，我会把自己的学习总结发在专栏中，以便学习交流。参考书目：1、《MATLAB基础教程(第三版)(薛山)》2、《MATLABR2020a完全自学一本通》之前的章节都是基础的数据运算用法，对于功课来说更加重要的内容是建模、绘图、观察数据趋势，接下来我会结合自己的使用经验，来为大家分享绘图、建模使用的小
详解 Flink 的常见部署方式文刀小桂 Flink flink 大数据
一、常见部署模式分类1.按是否依赖外部资源调度1.1Standalone模式独立模式(Standalone)是独立运行的，不依赖任何外部的资源管理平台，只需要运行所有Flink组件服务1.2Yarn模式Yarn模式是指客户端把Flink应用提交给Yarn的ResourceManager,Yarn的ResourceManager会在Yarn的NodeManager上创建容器。在这些容器上，Flink
幸福感恩日记第15篇豫豫妈
2018.7.3豫豫妈早课心得：1、这个世界外面没有别人，只有自己。一切都是自己的问题。2、每个人都不是完美的，学会转念，高效沟通。3、讲好每句话也是阴阳并存的，一阴一阳之谓道。4、坚持读经，早起学习，记笔记及时内化，学以致用才能正确的引导孩子。5、一个工具，二个方法，一个核心；五个步骤，僵化学习、固化学习、内化学习、优化学习、变化学习运用易经思维进行学习总结。方法：如果----那么----有点像
大数据之flink与hive 星辰_mya 大数据 flink hive
其实吧我不太想写flink，因为线上经验确实不多，这也是我需要补的地方，没有条件创造条件，先来一篇吧flink：高性能低延迟流批一体的分布式计算框架基于事件时间对实时数据精准处理快速响应支持批处理，高效离线分析和数据挖掘数据仓库的引擎丰富数据源/接收器，集成多种数据存储格式和源，比较常见就是咱们今天的主题hive了checkpoint恢复机制，故障恢复快速恢复计算任务分布式弹性扩展，据业务灵活增加
Java中的大数据处理框架对比分析省赚客app开发者 java 开发语言
Java中的大数据处理框架对比分析大家好，我是微赚淘客系统3.0的小编，是个冬天不穿秋裤，天冷也要风度的程序猿！今天，我们将深入探讨Java中常用的大数据处理框架，并对它们进行对比分析。大数据处理框架是现代数据驱动应用的核心，它们帮助企业处理和分析海量数据，以提取有价值的信息。本文将重点介绍ApacheHadoop、ApacheSpark、ApacheFlink和ApacheStorm这四种流行的
一文搞懂 Flink Task 数据交互之数据写源码 mn_kw flink 交互 java
一文搞懂FlinkTask数据交互之数据写源码1.RecordWriterOutput2.RecordWriter3.数据分区器ChannelSelector4.数据输出模型ResultPartition5.子模型ResultSubpartition6.本地buffer池LocalBufferPool7.获取buffer8.将buffer添加到ResultSubpartitionFlink重要源码
概率图模型（PGM）综述医学影像处理概率图模型概率图模型综述
RefLink:http://www.sigvc.org/bbs/thread-728-1-1.htmlGraphicalModel的基本类型基本的GraphicalModel可以大致分为两个类别：贝叶斯网络(BayesianNetwork)和马尔可夫随机场(MarkovRandomField)。它们的主要区别在于采用不同类型的图来表达变量之间的关系：贝叶斯网络采用有向无环图(DirectedAc
【驻村】费晓琴2020.04.10工作日志和学习总结 aaf247918939
工作日志1、5:20好视通唱班歌签到传家书2、读经典小打卡，驻村群读小村大道3、练八锻锦，练习4、下午宋书记、尹老师、小村大道作者郑旺盛和村两位来看望回村的志愿者学习感悟生活中的纷纷扰扰，可归结为一个字，争！这个世界的吵门市，喧嚣，摩擦，抱怨，勾心斗角，尔虞我诈，都源自争！在日常生活中，心胸开阔一点，就争不起来，得失看轻一点，就争不起来，功利心淡一点，就争不起来，为他人考虑略多一点，就更争不起来，
Python基础知识进阶之正则表达式_头歌python正则表达式进阶前端陈萨龙程序员 python 学习面试
最后硬核资料：关注即可领取PPT模板、简历模板、行业经典书籍PDF。技术互助：技术群大佬指点迷津，你的问题可能不是问题，求资源在群里喊一声。面试题库：由技术群里的小伙伴们共同投稿，热乎的大厂面试真题，持续更新中。知识体系：含编程语言、算法、大数据生态圈组件（Mysql、Hive、Spark、Flink）、数据仓库、Python、前端等等。网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是
机器学习 VS 表示学习 VS 深度学习 Efred.D 人工智能机器学习深度学习人工智能
文章目录前言一、机器学习是什么?二、表示学习三、深度学习总结前言本文主要阐述机器学习,表示学习和深度学习的原理和区别.一、机器学习是什么?机器学习(machinelearning),是从有限的数据集中学习到一定的规律,再把学到的规律应用到一些相似的样本集中做预测.机器学习的历史可以追溯到20世纪40年代McCulloch提出的人工神经元网络,目前学界大致把机器学习分为传统机器学习和机器学习两个类别
大数据新视界 --大数据大厂之Flink强势崛起：大数据新视界的璀璨明珠青云交大数据新视界 Flink 大数据数据类型实时处理流处理框架对比应用场景数据处理大数据新视界数据库
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：Ja
Docker部署单点es Javaismymorning ES学习笔记 docker elasticsearch
前言该笔记是根据B站上黑马SpringCloud学习总结的一、ES是什么？Elasticsearch是一个分布式、高扩展、高实时的搜索与数据分析引擎。它能很方便的使大量数据具有搜索、分析和探索的能力。充分利用Elasticsearch的水平伸缩性，能使数据在生产环境变得更有价值二、Docker部署ES步骤1.创建网络因为还要部署Kibana，实现es和Kibana关联，创建一个网络Kibana是为
数据结构顺序表学习总结 sumandavg 数据结构数据结构 1024程序员节
数据结构是计算机存储、组织数据的方式。数据结构是指相互之间存在一种或多种特定关系的数据元素的集合。通常情况下，精心选择的数据结构可以带来更高的运行或者存储效率。目录前言1.顺序表介绍1.1什么是顺序表1.2顺序表的性质1.3顺序表的构成1.4顺序表的框架代码（C++版）2.顺序表的操作2.1初始化顺序表2.1.1步骤2.1.2代码展示2.2顺序表的插入2.2.1步骤2.2.2代码展示2.3顺序表的
flink增量检查点降低状态依赖实现的详细步骤 goTsHgo Flink 大数据分布式 flink 大数据
增量检查点启动恢复的时间是很久的，业务上不能接受，所以可以通过降低状态依赖来减少恢复的时间。降低状态依赖尽可能减少状态的复杂性和依赖关系，通过拆分状态或将状态外部化到其他服务中，从而降低恢复的开销。实施措施：将状态分割为更小的单元，减少每次恢复的状态量。使用外部状态存储服务，减少Flink状态后端的负担。拆分状态和将状态外部化到其他服务可以帮助减少作业的状态依赖，从而降低恢复时间和复杂度。以下是详
绘本讲师训练营【48期】1/21阅读原创《学习总结》优丫漫绘本馆丹丹
48005王亚丹——2019年11月中旬第一次听到有绘本讲师培训班的时候就依然决定报名，于是就有了2020年1月1日的相遇。3天的时间又长又很短，长的是身体不佳，短的是学习时间太短。第一日上午首先是幽默的班班组织大家自我介绍。其次帅气智慧的阿渡老师从《如何阅读图画书》开始给我们分享了绘本基础理论知识：由最早的绘本到图画书进入大陆的历程；如何读绘本；如何选绘本；如何创作绘本剧及设计绘本活动、延伸等。
flink table factory基础知识 loukey_j
一、概述在flink中很多组件都是TableFactory的子类。比如序列化，反序列化，tableSinkFactory,tableSourceFactory.TableFactory是用来创建序列化，反序列器，tableSource和tableSink的工厂。二、TableFactory源码在flink框架中，TableFactory的子类并不是程序员自己随心new出来的。flink的提供给程序
2024年最全使用Python求解方程_python解方程(1)，字节面试官迟到 2401_84569545 程序员 python 学习面试
最后硬核资料：关注即可领取PPT模板、简历模板、行业经典书籍PDF。技术互助：技术群大佬指点迷津，你的问题可能不是问题，求资源在群里喊一声。面试题库：由技术群里的小伙伴们共同投稿，热乎的大厂面试真题，持续更新中。知识体系：含编程语言、算法、大数据生态圈组件（Mysql、Hive、Spark、Flink）、数据仓库、Python、前端等等。网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是
01-Flink安装部署及入门案例（仅供学习），音视频时代你还不会NDK开发小猪佩琪962 2024年程序员学习 flink 学习大数据
先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新大数据全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵
比较Spark与Flink 傲雪凌霜，松柏长青大数据后端 spark flink 大数据
ApacheSpark和ApacheFlink都是目前非常流行的大数据处理引擎，但它们在架构、处理模式、应用场景等方面有一些显著的区别。下面是二者的对比：1.处理模式Spark:主要支持批处理（BatchProcessing），也能通过SparkStreaming处理流式数据，但SparkStreaming本质上是通过微批（micro-batching）的方式处理流数据，延迟相对较高。SparkS
Apache Flink：实时流处理与批处理的统一框架小码快撩 flink 大数据
导语在大数据处理领域，流处理和批处理是两种主要的处理方式。然而，传统的系统通常将这两者视为独立的任务，需要不同的工具和框架来处理。ApacheFlink是一个开源的流处理框架，它打破了这种界限，提供了一个统一的平台来处理实时流数据和批处理数据。一、基本概念与架构ApacheFlink的基本概念与架构主要包括以下几个核心组成部分：基本概念1.流处理模型：无界流(UnboundedStreams):数
(学习总结15)C++11小语法与拷贝问题瞌睡不来学习 c++c++STL
C++11小语法与拷贝问题auto关键字范围forinitializer_list深拷贝与浅拷贝写时拷贝以下代码环境为VS2022C++。auto关键字在早期C/C++中auto的含义是：使用auto修饰的变量，是具有自动存储器的局部变量，不过一般都会隐藏，导致后来不重要了。C++11中，标准委员会赋予了auto全新的含义，即：auto不再是一个存储类型指示符，而是作为一个新的类型指示符来指示编译
【战盟第二期智家集训班】房康
沈阳-有住-浑南店-房康12月6日一、学习总结：1.今天的主要学习内容是上午刘总给我们讲解了未来的发展方向和一些未来的机遇，让我对做海尔智家更有信心，山丽丽老师讲解的企业文化也让我讲解到我们海尔是一个非常诚信的企业和为用户着想的企业只有这样企业才能做的更大更强走的更长远。蒋老师讲的卡萨帝品牌也让我了解到卡萨帝不单单是一件电器也是一件艺术品。2.通过下午的系统学习让我懂得了如何做一个合格的智家设计师
我们在进行前后端联调的时候如何避免数据丢失拿不到返回数据查看不了状态信息等问题？朱道阳底层原理面试八股回归前端 npm git python
最近在进行前后端联调开发的全栈开发工作但是这时候会出现很多问题比如说前端拿不到数据获得的状态码可能是正确的传的值却是null我进行了学习总结出一下几点一、数据校验前端程序员必须对后端提供的数据进行严格的数据校验。数据校验的目的是确保接收到的数据符合预期的格式和类型。在JavaScript中，可以使用typeof操作符或Array.isArray()方法进行基本的类型检查。更复杂的数据结构，可以使用
flink独立集群部署嘎子吱吱吱吱 flink hadoop linux
#flink独立集群部署说明安装环境三台服务器47.106.23.1（master）47.112.173.2（worker1）47.115.162.3（worker1）提前装好jdk和ssh,以下操作最好不要用root账号提前下载好flink的包并解压设置三台服务器之间ssh免密登录生成本机秘钥以47.106.23.1为例（其他两台参考本服务器）#生成本机秘钥cd;ssh-keygen-trsa-
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方

实时Flink1.14.4 doit

Flink DOIT 1.14.4

简介

KafkaSink

JdbcSink

Redis Sink

多流操作API

ProcessFunction : 整理！总结。

多流算子回顾

flink 中的SubTask Task 槽位

task 与算子链

并行度相关 复习

时间概念 时间语义。

窗口相关

窗口API相关总结

状态管理:

状态后端—StateBackend。

flink容错机制相关参数配置示例

flink 状态容错中ckpt的基本思想

flink容错机制相关参数配置示例

状态数据TTL清理策略的底层逻辑

Flink 实现EOS 语义容错各环节要点

checkpoint 对应的API:

flink 写入kafka无法实现幂等写入。

flink 端到端 精确一次场景测试

Flink 程序分布式部署运行

执行计划的生成

flink standalone 集群测试

你可能感兴趣的:(学习总结,flink)

并行度相关复习

时间概念时间语义。

flink 端到端精确一次场景测试