E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Flink数据湖
【极数系列】
Flink
详细入门教程 & 知识体系 & 学习路线(01)
文章目录01引言02
Flink
是什么2.1
Flink
简介2.2
Flink
架构2.3
Flink
应用场景2.4
Flink
运维03
Flink
环境搭建3.1
Flink
服务端环境搭建3.2
Flink
部署模式3.3
Flink
浅夏的猫
·
2024-01-29 06:34
Flink
flink
大数据
【极数系列】
Flink
配置参数如何获取?(06)
文章目录gitee码云地址简介概述01配置值来自.properties文件1.通过路径读取2.通过文件流读取3.通过IO流读取02配置值来自命令行03配置来自系统属性04注册以及使用全局变量05
Flink
浅夏的猫
·
2024-01-29 06:34
Flink
flink
大数据
java
flink
源码分析 - 简单解析命令行参数
flink
版本:
flink
-1.11.2提取主类代码位置:org.apache.
flink
.api.java.utils.MultipleParameterTool#fromArgs代码逻辑比较简单,此处不再赘述
zxfBdd
·
2024-01-29 06:04
大数据
大数据
java
flink
源码分析 - jar包中提取主类和第三方依赖
flink
版本:
flink
-1.11.2提取主类代码位置:org.apache.
flink
.client.program.PackagedProgram#getEntryPointClassNameFromJar
zxfBdd
·
2024-01-29 06:03
大数据
flink
jar
大数据
【大数据】
Flink
架构(六):保存点 Savepoint
《
Flink
架构》系列(已完结),共包含以下6篇文章:
Flink
架构(一):系统架构
Flink
架构(二):数据传输
Flink
架构(三):事件时间处理
Flink
架构(四):状态管理
Flink
架构(五):检查点
G皮T
·
2024-01-29 06:32
#
Flink
大数据
flink
保存点
savepoint
检查点
checkpoint
状态恢复
Flink
的 API
Flink
为开发流式/批处理应用程序提供了不同级别的抽象。最低级别的抽象只是提供有状态和及时的流处理。是的通过流程嵌入到DataStreamAPI中功能。
m0_66520412
·
2024-01-28 20:00
flink
大数据
flink
词汇表
Flink
应用集群#
Flink
应用集群是一个专用的
Flink
集群,只从一个
Flink
执行
Flink
作业应用程序。
Flink
的生命周期集群绑定了
Flink
应用的生命周期。
m0_66520412
·
2024-01-28 20:00
flink
flink
窗口(Window)
一、什么是窗口(窗口的概念)
Flink
是一种流式计算引擎,主要是来处理无界数据流的,数据源源不断、无穷无尽。
m0_66520412
·
2024-01-28 20:30
flink
大数据
flink
通过状态快照实现容错
状态后端#
Flink
管理的键控状态是一种分片的键/值存储,以及每个键/值存储的工作副本键控状态的项保留在负责该键的TaskManager的本地某个位置。算子state也是需要它的计算机的本地状态。
m0_66520412
·
2024-01-28 20:30
flink
大数据
流分析&活动时间和水印
使用事件时间#如果要使用事件时间,还需要提供时间戳提取器和水印
Flink
将用于跟踪事件时间进度的生成器。这将在下面关于使用水印的部分,但首先我们应该解释什么是水印。
m0_66520412
·
2024-01-28 20:30
数据结构
flink
架构
Flink
是一个分布式系统,需要有效的分配和管理计算资源,以便执行流式处理应用程序。
m0_66520412
·
2024-01-28 20:29
flink
架构
大数据
数据湖
技术之核心特性篇
引入
数据湖
技术,可以更好的演进整体架构模式,形成一套湖仓一体的模式。
风筝Lee
·
2024-01-28 18:58
数据湖
数据仓库
数据湖
技术之平台建设篇1
一.建设思路在原有平台基础上,融合
数据湖
技术,提供统一、完善的湖仓能力,逐步实现湖仓一体、流批一体的最终模式。
风筝Lee
·
2024-01-28 18:58
数据湖
大数据
数据湖
技术之发展现状篇
一.大数据处理架构:大数据处理架构的发展过程具体可以分为三个主要阶段:批处理架构、混合处理架构(Lambda、Kappa架构)、湖仓一体。首先是随着Hadoop生态相关技术的大量应用,批处理架构应运而生,借助离线计算引擎的能力很好的满足了业务对大规模数据分析处理场景的需求。随着业务场景越来越多样化,对数据实效性方面有了更高的要求,诞生了一些新的架构模式,比如说Lambda、Kappa等,很好的解决
风筝Lee
·
2024-01-28 18:56
数据湖
hive
hadoop
spark
大数据——
Flink
知识点整理
目录1.
Flink
的特点2.
Flink
和SparkStreaming的对比3.
Flink
和Blink、Alink之间的关系4.JobManager和TaskManager的职责5.
Flink
集群部署有哪些模式
Vicky_Tang
·
2024-01-28 06:17
Flink
flink
面试
big
data
大数据
【大数据】详解
Flink
中的 WaterMark
详解
Flink
中的WaterMark1.基础概念1.1流处理1.2乱序1.3窗口及其生命周期1.4KeyedvsNon-Keyed1.5
Flink
中的时间2.Watermark2.1案例一2.2案例二2.3
G皮T
·
2024-01-28 06:13
#
Flink
flink
大数据
实时计算
数据流
WaterMark
水位线
【大数据】
Flink
中的状态管理
Flink
中的状态管理1.算子状态2.键值分区状态3.状态后端4.有状态算子的扩缩容4.1带有键值分区状态的算子4.2带有算子列表状态的算子4.3带有算子联合列表状态的算子4.4带有算子广播状态的算子在前面的博客中我们指出
G皮T
·
2024-01-28 06:13
#
Flink
大数据
flink
实时计算
状态管理
状态后端
迟到数据处理 和 基本时间的合流
WatermarkStrategy.forBoundedOutOfOrderness(Duration.ofSeconds(10));2.设置窗口延迟关闭
Flink
的窗口,也允许迟到数据。
莫噶
·
2024-01-27 22:20
Flink
flink
函数类(Function Classes)和 富函数类(Rich Function Classes)
目录函数类(FunctionClasses)富函数类(RichFunctionClasses)函数类(FunctionClasses)
Flink
暴露了所有UDF函数的接口,具体实现方式为接口或者抽象类,
莫噶
·
2024-01-27 22:47
Flink
大数据
flink
37、
Flink
的CDC 格式:debezium部署以及mysql示例(完整版)
Flink
系列文章一、
Flink
专栏
Flink
专栏系统介绍某一知识点,并辅以具体的示例进行说明。1、
Flink
部署系列本部分介绍
Flink
的部署、配置相关基础内容。
一瓢一瓢的饮 alanchanchn
·
2024-01-27 20:08
#
Flink专栏
flink
大数据
kafka
flink
hive
flink
sql
flink
kafka
flink
cdc
flink
TaskManager 内存模型(二)
抛开JVM内存模型,单从TaskManager内存的主要使用方式来看,TaskManager的内存主要分为三个部分:NetworkBuffers:一定数量的MemorySegment,主要用于网络传输。在TaskManager启动时分配,通过NetworkEnvironment和NetworkBufferPool进行管理ManagedMemory:由MemoryManager管理的一组Memory
邵红晓
·
2024-01-27 13:09
Flink
On K8s 集群原理
Flink
OnK8s架构image.png
Flink
任务在Kubernetes上运行的步骤有:●首先往Kubernetes集群提交了资源描述文件后,会启动Master和Worker的container。
fat32jin
·
2024-01-27 10:18
Flink
实现数据写入MySQL
先准备一个文件里面数据有:a,1547718199,1000000b,1547718200,1000000c,1547718201,1000000d,1547718202,1000000e,1547718203,1000000f,1547718204,1000000g,1547718205,1000000h,1547718210,1000000i,1547718210,1000000j,15477
莫噶
·
2024-01-27 08:23
flink
mysql
大数据
Flink
问题解决及性能调优-【
Flink
根据不同场景状态后端使用调优】
Flink
实时groupby聚合场景操作时,由于使用的是rocksdb状态后端,发现CPU的高负载卡在rocksdb的读写上,导致上游算子背压特别大。
PONY LEE
·
2024-01-27 08:21
Flink问题解决及性能调优
flink
大数据
Flink
面试题
0.思维导图1.简单介绍一下
Flink
♥♥
Flink
是一个分布式的计算框架,主要用于对有界和无界数据流进行有状态计算,其中有界数据流就是值离线数据,有明确的开始和结束时间,无界数据流就是指实时数据,
韩顺平的小迷弟
·
2024-01-27 08:51
大数据面试题
flink
大数据
flink
-cdc实战之oracle问题记录01
记录问题,温暖你我,上台欢迎点赞留言关注2024-01-2611:02:56,168ERROROracle|oracle_logminer|streamingMiningsessionstoppedduetothe{}[io.debezium.connector.oracle.logminer.LogMinerHelper]io.debezium.DebeziumException:Supplem
大大蚊子
·
2024-01-27 08:45
flink
大数据
oracle
Flink
max maxby区别
max只会显示指定字段的大小变化,而maxBy会显示其他字段的变化。max:取指定字段的当前的最大值,如果有多个字段,其他非比较字段,以第一条为准。maxBy:取指定字段的当前的最大值,如果有多个字段,其他字段以最大值那条数据为准。这种比较符合常识。举例,原始数据,如下:stock_277,22.3760055422398,SYSStock,1631002964777stock_277,1.141
core512
·
2024-01-27 08:12
Flink
flink
大数据
max
maxby
Flink
生产环境相关问题
1.
Flink
+Kafka保证精确一次消费相关问题?Fink的检查点和恢复机制和可以重置读位置的source连接器结合使用,比如kafka,可以保证应用程序不会丢失数据。
大数据左右手
·
2024-01-27 08:09
Flink
面试
flink
Flink
-Task启动源码
1.总结1.1submitTaskTaskExecutor#submitTask开始,主要有4个工作:首先将TaskSlot的状态修改为Active,然后取消Slot的使用超时任务:Timeout从BlobService下载Task执行需要的各种资源构造Task对象newTask封装一个Task信息对象TaskInfo,(TaskInfo,JobInfo,JobMasterInfo)初始化Resu
yangguanghaozi
·
2024-01-27 07:47
Flink
flink
大数据
big
data
flink
系列--
flink
sql cdc源码分析
前言关于cdc(changedatacapture)不知道的小伙伴们可以去百度一下,简单来说就是对于数据库的变更进行一个探测,因为数据库的更改对于客户端来说是没有感知的,你需要开启线程去查询,才知道数据有没有更新,但是就算是查询,如果是直接select*from....,这样获取的结果还要和上次获取的结果对比,才知道数据有没有发生变化,耗时大,一个简单的思路是在要查询的表中添加一个updateTi
鲸失
·
2024-01-27 07:17
flink系列
Flink
2.0 状态管理存算分离架构演进
本文整理自阿里云智能
Flink
存储引擎团队负责人梅源在
Flink
ForwardAsia2023的分享,梅源结合阿里内部的实践,分享了状态管理的演进和
Flink
2.0存算分离架构的选型。
Apache Flink
·
2024-01-27 07:46
flink
架构
大数据
Flink
事件时间与处理时间
Flink
在数据流中支持几种不同概念的时间。1.处理时间ProcessingTime(处理时间)是指执行相应操作的机器系统时间,是操作算子在计算过程中获取到的所在主机的系统时间。
qq_489366879
·
2024-01-27 07:42
flink
大数据
flink
-源码探索-RPC-分析
背景介绍:对
flink
整个流程进行分析,首先第一步需要了解每个组件之前的通讯方式,以及调用的流程,这样就可以对后面研究的代码,主要分析
flink
1.14.2比较新的版本。
slow-wing
·
2024-01-27 07:11
flink探索笔记
技术分享
flink
rpc
p2p
95-080-046-源码-启动-
flink
-daemon.sh
1.视界2.启动lcc@lcc
flink
-1.9.0$bin/start-cluster.shStartingcluster.Startingstandalonesessiondaemononhostlcc.Startingtaskexecutordaemononhostlcc
九师兄
·
2024-01-27 07:11
大数据-flink
flink
-windows下源码编译、启动、调试
前言想要快速上手了解一个项目,就需要先把项目跑起来:p)
flink
最新分支版本是release-1.11,但是此版本还未支持windows启动脚本(原因可能是大佬都用mbp),所以本次使用支持windows
wigen
·
2024-01-27 07:40
flink
flink
java
大数据技术之
Flink
-CDC
第1章CDC简介1.1什么是CDCCDC是ChangeDataCapture(变更数据获取)的简称。核心思想是,监测并捕获数据库的变动(包括数据或数据表的插入、更新以及删除等),将这些变更按发生的顺序完整记录下来,写入到消息中间件中以供其他服务进行订阅及消费。1.2CDC的种类CDC主要分为基于查询和基于Binlog两种方式,我们主要了解一下这两种之间的区别:基于查询的CDC基于Binlog的CD
莱恩大数据
·
2024-01-27 07:35
大数据训练营
flink
大数据
big
data
Flink
源码剖析:
flink
-streaming-java 之 JobGraph
2.1JobVertex2.2JobEdge2.3IntermediateDataSet2.4StreamConfig2.5StreamGraph到JobGraph的核心转换3.自带WordCount示例详解本文主要围绕
Flink
Matty_Blog
·
2024-01-27 07:04
Flink
flink
-start源码
jobSubmittestCsefinalStreamExecutionEnvironmentenv=newStreamExecutionEnvironment(configuration);//将算子添加进transformArrayList中env.fromCollection(Collections.singletonList(42)).addSink(newDiscardingSinkjo
jiayeliDoCn
·
2024-01-27 07:30
flink
大数据
[AIGC大数据基础]
Flink
: 大数据流处理的未来
Flink
是一个分布式流处理引擎,它被广泛应用于大数据领域,具有高效、可扩展和容错的特性。它是由Apache软件基金会开发和维护的开源项目,并且在业界中受到了广泛认可和使用。
程序员三木
·
2024-01-27 07:28
大后端
AI
大数据
AIGC
flink
【大数据】
Flink
中的事件时间处理
Flink
中的事件时间处理1.时间戳2.水位线3.水位线传播和事件时间4.时间戳分配和水位线生成在之前的博客中,我们强调了时间语义对于流处理应用的重要性并解释了处理时间和事件时间的差异。
G皮T
·
2024-01-27 07:57
#
Flink
大数据
flink
watermark
时间戳
水位线
事件时间
Flink
1.13 容错机制
状态的一致性当在分布式系统中引入状态时,自然也引入了一致性问题。一致性实际上是"正确性级别"的另一种说法,也就是说在成功处理故障并恢复之后得到的结果,与没有发生任何故障时得到的结果相比,前者到底有多正确?举例来说,假设要对最近一小时登录的用户计数。在系统经历故障之后,计数结果是多少?如果有偏差,是有漏掉的计数还是重复计数?一致性级别在流处理中,一致性可以分为3个级别:at-most-once(最多
万事万物
·
2024-01-27 07:39
Flink
集成 Debezium Confluent Avro ( format=debezium-avro-confluent )
博主历时三年精心创作的《大数据平台架构与原型实现:数据中台建设实战》一书现已由知名IT图书品牌电子工业出版社博文视点出版发行,点击《重磅推荐:建大数据平台太难了!给我发个工程原型吧!》了解图书详情,京东购书链接:https://item.jd.com/12677623.html,扫描左侧二维码进入京东手机购书页面。本文介绍的场景是:使用KafkaConnect的DebeziumMySQLSourc
Laurence
·
2024-01-27 06:54
大数据专题
付费专栏
flink
cdc
debezium
avro
confluent
schema-registry
kafka
Flink
基础系列28-
Flink
容错机制
一.一致性检查点(checkpoint)image.png
Flink
故障恢复机制的核心,就是应用状态的一致性检查点有状态流应用的一致检查点,其实就是所有任务的状态,在某个时间点的一份拷贝(一份快照);1
只是甲
·
2024-01-27 05:33
Flink
Checkpoints 翻译
英文原址https://ci.apache.org/projects/
flink
/
flink
-docs-master/ops/state/checkpoints.html概述Checkpoints保存了流插入屏障时的位置及所有节点处理完该屏障的状态
晚熟的程序员
·
2024-01-27 04:33
数据仓库现代化和迁移解决方案Datametica
Datametica是一家通过建立
数据湖
来帮助企业实现数据平台现代化的公司,该
数据湖
安全地保存结构化和非结构化数据。随着企业
数据湖
从各种来源收集大量数据,需要利用信息并帮助做出更明智的业务决策。
weixin_30777913
·
2024-01-26 20:20
数据仓库
数据中台架构原理与开发实战:构建数据中台的步骤与方法
它可以对业务数据进行收集、加工处理、存储、分析,为各个部门提供简单有效的数据服务,包括数据仓库、
数据湖
、数据应用平台等。
OpenChat
·
2024-01-26 20:15
AI实战
大数据AI人工智能
Python实战
大数据
人工智能
语言模型
Java
Python
架构设计
CDH 6.3.2 Parcel 包安装 Apache
Flink
1.10.2
CDH6.3.2Parcel包安装Apache
Flink
1.10.2文档材料介质路径调整Maven配置文件编译
Flink
1.创建服务目录2.下载介质3.编译
Flink
Shaded制作Pacel包配置
Flink
Parcel1
JP.Hu
·
2024-01-26 19:37
Flink
apache
flink
大数据
Flink
基础入门
前言SparkStreaming准确来说算是一个微批处理伪实时的做法,可是
Flink
是真的来一条就会处理一条,而且在SparkStreaming和Kafka进行整合时我们需要手动去管理偏移量的问题,而在
IT领域君
·
2024-01-26 19:28
第二课
Flink
安装部署、环境配置及运行应用程序(2)
上接第二课
Flink
安装部署、环境配置及运行应用程序(1)视频地址【Apache
Flink
入门教程】3.
Flink
安装部署、环境配置及运行应用程序_哔哩哔哩_bilibiliApache
Flink
China
起名-困难户
·
2024-01-26 18:26
Flink
flink
大数据
【
Flink
】记录
Flink
任务单独设置配置文件而不使用集群默认配置的一次实践
该环境已经默认添加了
Flink
onYarn的客户端配置。我们的
Flink
任务类型是
Flink
onYarn的任务。默认的配置文件是在/etc/
flink
/conf目录下。
kiraraLou
·
2024-01-26 18:54
Flink
flink
大数据
上一页
7
8
9
10
11
12
13
14
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他