E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
大数据计算-Flink
Flink
源码之 KafkaSource
Flink
源码分析系列文档目录请点击:
Flink
源码分析系列文档目录前言FLIP-27:RefactorSourceInterface-Apache
Flink
-ApacheSoftwareFoundation
AlienPaul
·
2024-01-11 21:53
【动态读取配置文件】ParameterTool读取带环境的配置信息
不同环境
Flink
配置信息是不同的,为了区分不同环境的配置文件,使用ParameterTool工具读取带有环境的配置文件信息区分环境的配置文件三个配置文件:
flink
.properties:决定那个配置文件生效
不进大厂不改名二号
·
2024-01-11 15:26
flink
java
flink
PiflowX组件 - Filter
计算引擎
flink
组件分组common端口Inport:默认端口outport:默认端口组件属性名称展示名称默认值允许值是否必填描述例子conditioncondition“”无是过滤条件。
暗影八度
·
2024-01-11 13:47
大数据
spark
flink
数据库
hdfs
PiflowX-MysqlCdc组件
计算引擎
flink
组件分组cdc端口Inport:默认端口outport:默认端口组件属性名称展示名称默认值允许值是否必填描述例子hostnameHostname“”无是MySQL数据库服务器的IP地址或主机名
暗影八度
·
2024-01-11 13:14
spark
flink
big
data
大数据
hadoop
The Next Generation of Apache
Flink
摘要:本文整理自阿里云智能
Flink
分布式执行负责人、Apache
Flink
PMC成员、
Flink
2.0ReleaseManager宋辛童老师在
Flink
ForwardAsia2023主会场的分享。
Apache Flink
·
2024-01-11 13:39
flink
大数据
Apache
Flink
和 Paimon 在自如数据集成场景中的使用
业务背景自如目前线上有基于Hive的离线数仓和基于
Flink
、Kafka的实时数仓,随着业务发展,我们也在探索引入湖仓一体的架构更好的支持业务,我们对比了Iceberg、Hudi、Paimon后,最终选择
Apache Flink
·
2024-01-11 13:09
apache
flink
大数据
阿里云实时计算企业级状态存储引擎 Gemini 技术解读
本文整理自阿里云
Flink
存储引擎团队李晋忠,兰兆千,梅源关于阿里云实时计算企业级状态存储引擎Gemini的研究,内容主要分为以下五部分:流计算状态访问的痛点企业级状态存储引擎GeminiGemini性能评测
Apache Flink
·
2024-01-11 13:36
阿里云
云计算
基于Hologres+
Flink
的曹操出行实时数仓建设作者:林震|曹操出行实时计算负责人
作者:林震|曹操出行实时计算负责人曹操出行业务背景介绍曹操出行创立于2015年5月21日,是吉利控股集团布局“新能源汽车共享生态”的战略性投资业务,以“科技重塑绿色共享出行”为使命,将全球领先的互联网、车联网、自动驾驶技术以及新能源科技,创新应用于共享出行领域,以“用心服务国民出行”为品牌主张,致力于打造服务口碑最好的出行品牌。作为一家互联网出行平台,主要提供了网约车、顺风车、专车等一些出行服务。
阿里云大数据AI技术
·
2024-01-11 09:40
flink
大数据
flink
中的row类型详解
在Apache
Flink
中,`Row`是一个通用的数据结构,用于表示一行数据。它是
Flink
TableAPI和
Flink
DataSetAPI中的基本数据类型之一。
后季暖
·
2024-01-11 09:10
flink
大数据
深入理解
Flink
(四)
Flink
Time+WaterMark+Window 深入分析
Flink
Window常见需求背景需求描述每隔5秒,计算最近10秒单词出现的次数——滑动窗口每隔5秒,计算最近5秒单词出现的次数——滚动窗口关于
Flink
time种类TimeCharacteristicProcessingTimeIngestionTimeEventTimeWindowAssigner
我很ruo
·
2024-01-11 09:39
大数据
flink
大数据
分布式
Flink
/Doris生产环境方案选型的一些思考
以
Flink
为主的计算组件和以Doris为代表的存储+计算一体的方案选择问题是我们在技术选型过程中最常见的问题之一。也是很多公司和业务支持过程中会遇到的问题。
王知无(import_bigdata)
·
2024-01-11 09:37
flink
大数据
Flink
-CEP 实战教程
文章目录1.基本概念1.1CEP是什么1.2模式(Pattern)1.3应用场景2.快速上手2.1引入依赖2.2入门实例3.模式API(PatternAPI)3.1个体模式3.1.1基本形式3.1.2量词(Quantifiers)3.1.3条件(Conditions)3.2组合模式3.2.1初始模式(InitialPattern)3.2.2近邻条件(ContiguityConditions)3.2
阿moments
·
2024-01-11 09:06
Flink
flink
java
大数据
Flink
API开发之窗口(Window)
案例用到的测试数据请参考文章:
Flink
自定义Source模拟数据流原文链接:https://blog.csdn.net/m0_52606060/article/details/135436048窗口的概念
Appreciate(欣赏)
·
2024-01-11 09:05
Flink
大数据
flink
java
深入理解
Flink
(五)
Flink
Standalone 集群启动源码剖析
前言
Flink
集群的逻辑概念:JobManager(StandaloneSessionClusterEntrypoint)+TaskManager(TaskManagerRunner)
Flink
集群的物理概念
我很ruo
·
2024-01-11 09:03
大数据
flink
网络
大数据
分布式
yarn
【Kafka-3.x-教程】-【六】Kafka 外部系统集成 【Flume、
Flink
、SpringBoot、Spark】
【Kafka-3.x-教程】专栏:【Kafka-3.x-教程】-【一】Kafka概述、Kafka快速入门【Kafka-3.x-教程】-【二】Kafka-生产者-Producer【Kafka-3.x-教程】-【三】Kafka-Broker、Kafka-Kraft【Kafka-3.x-教程】-【四】Kafka-消费者-Consumer【Kafka-3.x-教程】-【五】Kafka-监控-Eagle【K
bmyyyyyy
·
2024-01-11 06:50
Kafka
kafka
flume
flink
spark
#kafka集成外部系统
Flink
复习3-2-4-6-1(v1.17.0): 应用开发 - DataStream API - 状态和容错 - 数据类型&序列化 - 概述
DataTypes&SerializationSupportedDataTypes(支持的数据类型)TuplesandCaseClassesPOJOsPrimitiveTypes(基本数据类型)GeneralClassTypes(一般类型)ValuesHadoopWritablesSpecialTypes(特殊类型)TypeErasure&TypeInference(类型擦除和类型推断)Typeh
ε(´ο`*)))
·
2024-01-11 05:30
flink复习
flink
大数据
Flink
|《
Flink
官方文档 - DataStream API - 状态与容错 - 数据类型以及序列化 - 概览》学习笔记
学习文档:《
Flink
官方文档-DataStreamAPI-状态与容错-数据类型以及序列化-概览》学习笔记如下:
Flink
使用独特的方式来处理数据类型以及序列化。
长行
·
2024-01-11 05:59
Flink
flink
数据类型
序列化
泛型
Flink
SQL设置sink的并行度
createtableaaa(pt_dtstring,proc_timetimestamp,ctimetimestamp,PRIMARYKEY(tqi_id)NOTENFORCED)with('connector'='upsert-kafka','topic'='bbb','properties.bootstrap.servers'='${sql.kafka.bootstrap.server}',
青云游子
·
2024-01-10 15:51
Flink
flink
第 7 节
Flink
standalone集群HA配置
上篇:第6节
Flink
onyarn内部实现1、
Flink
-HA高可用JobManager高可用(HA)jobManager协调每个
flink
任务部署。它负责任务调度和资源管理。
江湖侠客
·
2024-01-10 12:04
Flink入门实战
Flink
1.15本地集群部署Standalone模式(独立集群模式)
一.环境准备1、集群规划,CentOS7环境192.168.11.10411.104(DB测试)centf11104192.168.11.10511.105(DB测试)centf11105192.168.11.10611.106(DB测试)centf11106jdk安装参考:linux环境javajdk12.0.2部署_天一道长--玄彬的博客-CSDN博客2、jdk12安装》配置免密登入》三个节点
天一道长--玄彬
·
2024-01-10 12:04
大数据
flink
java
大数据
Flink
集群安装部署(Standalone,Yarn模式)
目录一.环境准备二.
Flink
集群安装步骤三.
Flink
OnYarn一.环境准备需要提前安装配置JDK,Hadoop二.
Flink
集群安装步骤1.下载安装包下载地址:Indexof/dist/
flink
MJK祺
·
2024-01-10 12:03
大数据
hadoop
flink
flink
Standalone独立集群模式配置和部署:
1.在conf/
flink
-conf.yaml文件下配置机器地址,jobmanger.rpc.addresssjia加上机器名下面红的地方配置就好,注意3台机器都是一样的IP,这样保证这台是主机器2,配置每个文件
平凡天下
·
2024-01-10 12:33
Flink
standalone集群部署配置
文章目录简介软件依赖部署方案二、安装1.下载并解压2.ssh免密登录3.修改配置文件3.启动集群4.访问WebUI简介
Flink
独立模式(Standalone)是部署
Flink
最基本也是最简单的方式:所需要的所有
shandongwill
·
2024-01-10 12:27
大数据
Flink
flink
大数据
5.MapReduce之Combiner-预聚合
目录概述本地预计算Combiner意义实践前提代码日志观察结束概述在MR、Spark、
Flink
中,常用的减少网络传输的手段。
流月up
·
2024-01-10 12:49
大数据
mapreduce
大数据
Combiner
预聚合
4.MapReduce 序列化
序列化序列化对象-->字节序例:存储到磁盘或者网络传输MR、Spark、
Flink
:分布式的执行框架必然会涉及到网络传输ja
流月up
·
2024-01-10 12:46
大数据
mapreduce
大数据
序列化
实践
深入理解
Flink
(三)
Flink
内核基础设施源码级原理详解
Hadoop生态各大常见组件的RPC技术实现
Flink
RPC网络通信框架Akka详解1、ActorSystem是管理Actor生命周期的组件,Actor是负责进行通信的组件。
我很ruo
·
2024-01-10 08:20
大数据
flink
大数据
hadoop
分布式
详解
flink
exactly-once和两阶段提交
以下是我们常见的三种
flink
处理语义:最多一次(At-most-Once):用户的数据只会被处理一次,不管成功还是失败,不会重试也不会重发。
后季暖
·
2024-01-10 08:58
flink
大数据
深入理解
Flink
(一)
Flink
架构设计原理
大数据分布式计算引擎设计实现剖析MapReduceMapReduce执行引擎解析MapReduce的组件设计实现图Spark执行引擎解析Spark相比于RM的真正优势的地方在哪里:(Simple、Fast、Scalable、Unified)DAG引擎中间计算结果可以进行内存持久化基于内存计算(不完全对,确切地说是把数据都加载(从内存中间件中读取)到内存中,然后来执行计算)生态多样,算子丰富,API
我很ruo
·
2024-01-10 08:57
大数据
flink
大数据
分布式
Flink
CDC使用
Flink
环境准备
Flink
版本对应的CDC版本两个jar包上传到
flink
bin目录下
flink
-sql-connector-mysql-cdcmysql-connector-java重启
Flink
集群
无故事王国LH
·
2024-01-10 08:22
flink
大数据
Flink
编程实践
(一)开发WordCount程序.在Linux系统中实现WordCount程序,并打包成JAR文件,提交到
Flink
中运行。
cwn_
·
2024-01-10 08:20
大数据
flink
大数据
java
深入理解
Flink
(二)
Flink
StateBackend 和 Checkpoint 容错深入分析
Flink
State设计详解State简单说,就是
Flink
Job的Task在运行过程中,产生的一些状态数据。
我很ruo
·
2024-01-10 07:41
大数据
flink
windows
大数据
Flink
之Task重启策略
Task重启策略1策略APInoRestart无参数,task失败后不重启,整个job同时失败,默认策略.代码示例RestartStrategies.noRestart();fixedDelayRestart参数注释restartAttempts最大重启次数delayBetweenAttempts重启时间间隔代码示例//最多重启5次,每次任务失败后间隔1s重启RestartStrategies.f
飞天小老头
·
2024-01-10 06:45
FLink
flink
大数据
安装配置
Flink
安装配置
Flink
1.上传安装包到Linux2.解压到指定路径tar-zxf.
叶子上的考拉
·
2024-01-10 05:28
flink
linux
大数据
Flink
任务实战优化
前言:一个好产品,功能应该尽量包装在服务内部;对于
Flink
而言,无疑是做到了这一点。
i7杨
·
2024-01-10 01:06
Flink
flink
大数据
Flink
CDC的分析和应用代码
前言:原本想讲如何基于
Flink
实现定制化计算引擎的开发,并以
Flink
CDC为例介绍;发现这两个在表达上不知以谁为主,所以先分析
Flink
CDC的应用场景和技术实现原理,下一篇再去分析
Flink
能在哪些方面
i7杨
·
2024-01-10 01:06
Flink
flink
大数据OLAP引擎发展原因及特性分析
在大数据高速发展时期,多个技术团队基于OLAP的应用需求,开发出多种OLAP技术,如Hive、SparkSql、
Flink
Sql、Impala、Kylin、ClickHouse、Doris等,或者在实现其他应用需求的时候
i7杨
·
2024-01-10 01:31
大数据技术分析
大数据
大数据 MapReduce如何让数据完成一次旅行?
专栏上一期我们聊到MapReduce编程模型将
大数据计算
过程切分为Map和Reduce两个阶段,先复习一下,在Map阶段为每个数据块分配一个Map计算任务,然后将所有map输出的Key进行合并,相同的Key
善守的大龙猫
·
2024-01-10 00:31
大数据
大数据
mapreduce
机器学习分布式架构
2.流计算(Storm,Spark,
Flink
)使用滑动窗口,在滑动窗口内的数据全部完成后再滑动到下一个时间窗口进行新一轮的数据处理,以分钟级别居多
小幸运Q
·
2024-01-09 17:27
yarn on
flink
监控
flink
任务监控
Flink
任务一般为实时不断运行的任务,如果没有任务监控,任务异常时无法第一时间处理会比较麻烦。这里通过调用API接口方式来获取参数,实现任务监控。
实时即未来
·
2024-01-09 13:28
flink
大数据
Flink
RestAPI
which
flink
找到
Flink
客户端地址如果输出结果为空,则说明
Flink
客户端没有安装在系统路径中。在这种情况下,您可以通过设置
FLINK
_HOME环境变量来指定
Flink
客户端的路径。
实时即未来
·
2024-01-09 13:57
大数据
Flink
窗口与WaterMark
本文的重心将放在
Flink
如何进行窗口操作以及开发者如何尽可能地利用
Flink
所提供的功能。下面展示了
Flink
窗口在keyedst
大数据技术派
·
2024-01-09 13:26
flink
java
eclipse
大数据
开发语言
flink
sql 知其所以然(十一):去重不仅仅有 count distinct 还有强大的 deduplication
1.序篇下面即是文章目录,也对应到了本文的结论,小伙伴可以先看结论快速了解博主期望本文能给小伙伴们带来什么帮助:背景及应用场景介绍:博主期望你了解到,
flink
sql的deduplication其实就是
程序员的隐秘角落
·
2024-01-09 12:36
阿里云大数据ACA及ACP复习题(81~100)
(B)A:
大数据计算
服务MaxComputeB:QuickBI数据可视化分析平台C:实时计算
Flink
版D:云原生数据仓库(分析型数据库)AnalyticDB**解析**:阿里云实时计算
Flink
版(AlibabaCloudRealtimeComputeforApache
Flink
周周的奇妙编程
·
2024-01-09 08:20
阿里云
大数据
云计算
Flink
SQL1.12 读取Mysql,写到Kafka、Hbase
Flink
SQL1.12读取Mysql,写到Kafka、Hbase概览心路历程案例流程pom文件如下测试代码docker安装kafka、hbase、mysql等hosts概览使用
flink
sql1.12
王糍粑的小夕
·
2024-01-09 07:10
flink
hbase
kafka
mysql
flink
1.17—关于TopN的测试
关于TopN的测试
flink
:1.17.1官网地址:https://nightlies.apache.org/
flink
/
flink
-docs-release-1.17/zh/docs/dev/table
王糍粑的小夕
·
2024-01-09 07:10
flink
flink
大数据
flink
教程-详解
flink
1.11中的新部署模式-Application模式
背景perjob模式的问题引入application模式通过程序提交任务Application模式源码解析背景目前对于
flink
来说,生产环境一般有两个部署模式,一个是session模式,一个是perjob
大数据技术与应用实战
·
2024-01-09 06:53
流式湖仓增强,Hologres +
Flink
构建企业级实时数仓
流式湖仓增强,Hologres+
Flink
构建企业级实时数仓一、Hologres+
Flink
,阿里云上众多客户实时数仓的首选随着大数据从规模化走向实时化,实时数据的需求覆盖互联网、交通、传媒、金融、政府等各个领域
Elivis Hu
·
2024-01-08 22:52
数仓
flink
大数据
Flink
嵌套json 解析成Table
在
flink
table中消息可以理解为表的一行记录。所以对于一个消息队列中的一个topic来说,可以根据json数据格式映射成一张表。
loukey_j
·
2024-01-08 18:52
实战
Flink
Java api消费kafka实时数据落盘HDFS
文章目录1需求分析2实验过程2.1启动服务程序2.2启动kafka生产3JavaAPI开发3.1依赖3.2代码部分4实验验证STEP1STEP2STEP35时间窗口1需求分析在Javaapi中,使用
flink
大数据程序终结者
·
2024-01-08 11:13
flink
java
kafka
大数据 Yarn - 资源调度框架
但是Yarn并不是随Hadoop的推出一开始就有的,Yarn作为分布式集群的资源调度框架,它的出现伴随着Hadoop的发展,使Hadoop从一个单一的
大数据计算
引擎,成为一个集存储、计算、资源管理为一体的完整大数据平台
善守的大龙猫
·
2024-01-08 10:48
大数据
大数据
上一页
15
16
17
18
19
20
21
22
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他