E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Flink流处理
大数据秋招面经之spark系列
3.repartition与coalesce4.spark的oom问题怎么产生的以及解决方案5.storm与
flink
,sparkstreaming之间的区别6.spark的几种部署方式:7.复习spark
wq17629260466
·
2024-09-06 19:54
大数据
spark
【Kafka专栏 11】深入理解Kafka的网络线程模型:是谁在幕后“操纵”数据流?
Java和大数据领域,致力于探索技术的边界,分享前沿的实践和洞见文章专栏:夏之以寒-kafka专栏专栏介绍:本专栏旨在以浅显易懂的方式介绍Kafka的基本概念、核心组件和使用场景,一步步构建起消息队列和
流处理
的知识体系
夏之以寒
·
2024-09-06 14:16
夏之以寒-kafka专栏
kafka
网络
分布式
网络模型
Apache
Flink
运行时架构
Flink
运行时架构
Flink
整个系统由两个主要部分组成JobManager和TaskManager,
Flink
架构也遵循Master-Slave架构设计原则,JobManager为Master节点,TaskManager
生病的毛毛虫
·
2024-09-06 04:44
flink
架构
Flink
生态与未来
本文为《
Flink
大数据项目实战》学习笔记,想通过视频系统学习
Flink
这个最火爆的大数据计算框架的同学,推荐学习课程:
Flink
大数据项目实战:http://t.cn/EJtKhaz核心组件栈
Flink
weixin_30394333
·
2024-09-06 02:00
大数据
人工智能
数据库
1+X云计算运维与开发(中级)实战案例——Kafka集群部署
前言Kafka是一种开源的
流处理
平台和消息系统,被设计用于构建实时数据管道和流式应用程序,可以处理大规模的实时数据流,并提供高吞吐量、持久性存储和分布式处理能力。
kuuuugua
·
2024-09-05 15:41
1+X云计算运维与开发(中级)
云计算
运维
kafka
Windows系统下的Spark环境配置
Spark支持批处理和
流处理
,其显著特点是能够在内存中进行迭代计算,从而加快数据处理速度。
eeee~~
·
2024-09-05 11:19
3:大数据技术
实用教程
spark
大数据
分布式
Flink
实践场景-通过DataStream KeyedProcessFunction统计每小时的出租车司机的收入
一、场景说明以及依赖请查看上一篇介绍
Flink
实践场景-通过DataStreamApi统计每小时的出租车司机的收入-CSDN博客二、KeyedProcessFunction介绍在
Flink
中,KeyedProcessFunction
似水_逆行
·
2024-09-05 10:12
Flink
flink
大数据
EMR组件部署指南
本文将详细介绍如何部署EMR的主要组件,包括:JDK1.8ElasticsearchKafka
Flink
ZookeeperHBaseHadoopPhoenixScalaSparkHive准备工作所有操作都在
ivwdcwso
·
2024-09-05 00:05
运维
EMR
大数据
开源
运维
kafka单条消息太大引起的线上故障
问题现象1.收到日志异常报警,一个
Flink
任务写入kafka消息出现了异常,异常消息如下org.apache.
flink
.streaming.connectors.kafka.
Flink
KafkaException
ab342173024
·
2024-09-04 15:44
线上故障篇
java
12、
Flink
解决流上的确定性最佳实践
最佳实践示例1运行流查询前主动开启TRY_RESOLVE模式,在检查到流查询中存在无法解决的NDU问题时,尽量按照错误提示修改SQL主动避免问题示例:
FLINK
-27639INSERTINTOt_join_sinkSELECTo.order_id
猫猫爱吃小鱼粮
·
2024-09-04 11:13
Flink
SQL
flink
大数据
Flink
详解系列之八--Checkpoint和Savepoint
一、Checkpoint获取分布式数据流和算子状态的一致性快照是
Flink
容错机制的核心,这些快照在
Flink
作业恢复时作为一致性检查点存在。
王吉吉real
·
2024-09-04 11:53
Kafka【二】关于消费者组(Consumer Group)、分区(partition)和副本(replica)的理解
【1】概述ApacheKafka是一个分布式
流处理
平台,它允许你发布和订阅记录流,存储记录流,并且可以对这些记录流进行处理。
流烟默
·
2024-09-02 02:20
#
kafka
分布式
消费者组
消息中间件:深入理解 Kafka 的核心架构与组件解析
消息中间件:深入理解Kafka的核心架构与组件解析Kafka是一种流行的分布式
流处理
平台,广泛应用于实时数据处理和消息队列场景。
upgrador
·
2024-09-01 09:33
#
消息中间件
kafka
架构
linq
Kafka入门:从零开始了解分布式
流处理
平台
Kafka不仅是一个消息队列,还是一个强大的
流处理
平台,它能够实时地处理大量数据,满足各种复杂的数据处理需求。Kafka的特性高吞吐量:Kafka每秒可以处理几十万条消息,延迟低至毫秒。
犬余
·
2024-08-31 19:34
分布式
kafka
学习
笔记
聊聊
flink
的Table Formats
序本文主要研究一下
flink
的TableFormats实例CSVFormat.withFormat(newCsv().field("field1",Types.STRING)//required:orderedformatfields.field
go4it
·
2024-08-31 01:48
Flink
(1.13) 的运行架构
架构图image.png官网原图:https://ci.apache.org/projects/
flink
/
flink
-docs-release-1.13/fig/processes.svg
Flink
运行时至少包含两个进程
万事万物
·
2024-08-30 22:54
使用python创建kafka的topic
文章目录使用python创建kafka的topickafka基本概念所需安装的包代码样例使用python创建kafka的topickafka基本概念ApacheKafka是一个开源的分布式
流处理
平台,
百流
·
2024-08-30 16:02
python笔记
python
kafka
开发语言
常见的实时数仓方案
实时部分以消息队列的方式实时增量消费,一般以
Flink
+Kafka的组合实现,维度表存在关系型数据库或者HBase;离线部分一般采用T+1周期调度分析历史存量数据,每天凌晨产出,更新覆盖前一天的结果数据
北极冰雨
·
2024-08-30 05:27
大数据
大数据
Qt/C++ 音视频开发 - VLC 回调处理
应用使用场景实时视频
流处理
:用于监控系统,直播平台等。多媒体播放器:构建一个自定义的音视频播放器。视频分析与处理:如视频剪辑、特效添加等。
鱼弦
·
2024-08-29 16:57
人工智能时代
qt
c++
音视频
Flink
的窗口聚合
Flink
在开启窗口后,经常会对数据进行聚合操作,本文介绍一下
Flink
的窗口聚合。
Flink
的窗口聚合的分类分为两类:全量聚合和增量聚合。
蜗牛@漫步
·
2024-08-29 12:32
Flink实时处理
Flink
Flink窗口
window
窗口聚合
Flink
任务的失败恢复
在我们写完
Flink
程序并部署服务器上后,我们希望程序会一直运行下去。但总会有很多情况会导致全部或部分任务出现异常而导致程序中止,这个时候就希望任务能够自动处理这些异常情况。
蜗牛@漫步
·
2024-08-29 12:02
Flink实时处理
flink
大数据
实时大数据
Flink
的Savepoint机制
Flink
有检查点(checkpoint)和保存点(savepoint),他们有很多相似的地方,但作用却不相同。Checkpoints的主要目的是在意外的作业失败的情况下提供一种恢复机制。
蜗牛@漫步
·
2024-08-29 12:02
Flink实时处理
Flink
savepoint
checkpoint
保存点
Spark on YARN
ApacheSparkApacheSpark是一个快速通用的大规模数据处理引擎,支持多种计算模式,如批处理、
流处理
、机器学习和图形处理。Spark提供了一个统一的编程模型,可以在单个集群上运行各种
静听山水
·
2024-08-28 09:26
Spark
spark
大数据
分布式
(十四)基于
Flink
SQL 应用案例
基于上面的应用场景,结合
Flink
SQL,完成技术方案设计,并输出实现代码。目录问题1详解问题2详解问题1详解基于问题一,主要
springk
·
2024-08-28 07:44
Flink全景解析
sql
大数据
实时数据处理
实时数据
flink
flinksql
10、
Flink
动态表之更新和追加查询详解
更新和追加查询虽然这两个示例查询看起来非常相似(都计算分组计数聚合),但它们在一个重要方面不同:第一个查询更新先前输出的结果,即定义结果表的changelog流包含INSERT和UPDATE操作。第二个查询只附加到结果表,即结果表的changelog流只包含INSERT操作。一个查询是产生一个只追加的表还是一个更新的表区别:产生更新更改的查询通常必须维护更多的状态。将append-only的表转换
猫猫爱吃小鱼粮
·
2024-08-28 07:43
Flink
SQL
flink
数据库
大数据
Flink
SQL w/ Blink Planner执行流程解析(上篇)
Foreword大数据领域SQL化的风潮方兴未艾(所谓"EverybodyknowsSQL"),
Flink
自然也不能“免俗”。
码农老K
·
2024-08-27 17:44
java
sql
flink
hive
大数据
大数据计算-SQL优化手段(CBO)-以
Flink
为例
文章目录背景理论知识示例结果展示结果解释背景大数据计算中,SQL生成的执行计划第一轮会经过固定规则的优化,第二轮会根据原计划,生成多条结合成本的的执行计划,根据cost进行排序,选出最优的执行计划。理论知识原始计划如左图,有三种执行方案方案1,scan表1,scan表2,然后hash,再join方案2,scan表1,scan表2,然后broadcast表1,再join方案2,scan表1,scan
wending-Y
·
2024-08-27 17:12
Flink
入门到实践
大数据
sql
flink
flink
&paimon开发之一:创建catalog
开发环境IDEA
Flink
1.17.1Paimon0.5正式本地或HDFS存储参考链接paimonjavaAPIhttps://paimon.apache.org/docs/master/api/
flink
-api
leichangqing
·
2024-08-27 16:10
flink
大数据
paimon
(二十)
Flink
Paimon
数据湖、湖仓一体是当前大数据领域技术发展的重要趋势。近几年开源数据湖技术如ApacheHudi、ApacheIceberg、ApachePaimon、DeltaLake等不断涌现,基于湖仓一体架构的统一元数据管理、数据治理也越来越受到关注。从传统数仓到数据湖、湖仓一体架构,从流批一体计算到基于数据湖的流批一体存储,越来越多的企业基于开源技术,在集成、计算、存储、查询分析等方面不断优化,建设形成适合
springk
·
2024-08-27 16:38
Flink全景解析
大数据
实时数据
实时数据处理
paimon
flink
paimon
探索未来数据
流处理
的基石 - Pravega开源项目深度解析
探索未来数据
流处理
的基石-Pravega开源项目深度解析pravegaPravega是一个开源的分布式
流处理
平台,用于处理大规模实时数据流。-功能:分布式
流处理
;实时数据处理;高吞吐量;可扩展。
施业任Luna
·
2024-08-27 13:46
flink
报错找不到类java.lang.NoClassDefFoundError: org/apache/
flink
/streaming/api/datastream/DataStream
问题:解决方法:把这个Adddependencieswith"provided"scopetoclasspath勾选上
搞数据的小杰
·
2024-08-26 23:22
flink
java
apache
2024年最新
Flink
教程,从基础到就业,大家一起学习--
Flink
DataStream API-第一篇+源码讲解
本文涉及到大量的底层原理知识,包括运行机制图解都非常详细,还有一些实战案例,所以导致本篇文章会比较长,内容比较多,由于内容太多,很多目录可能展示不出来,需要去细心的查看,非常适合深入了解学习
flink
的小伙伴们
长风清留扬
·
2024-08-26 22:19
flink
java
大数据
大数据
java
flink
PySpark,一个超级强大的 Python 库
,也许能激发我们无尽的创造力,一个独特的技巧,也许能成为我们的隐形盾牌……神奇的Python库之旅,第14章目录一、初识PySpark二、基本操作三、DataFrame和SparkSQL四、机器学习与
流处理
五
炒青椒不放辣
·
2024-08-26 22:18
Python
库之旅
python
Python
库之旅
PySpark
(十三)
Flink
SQL
目录DDL操作DML操作查询语句1.SELECTDISTINCT2.窗口函数3.窗口聚合4.OVER聚合5.连接操作6.TOP-N
Flink
对SQL的支持基于实现了SQL标准的ApacheCalcite
springk
·
2024-08-26 16:59
Flink全景解析
flink
sql
大数据
实时数据处理
实时数据
数据库
开发语言
Flink
内存管理机制
序:
Flink
的内存管理机制也是
Flink
的一大亮点。
Flink
在JVM内部实现了自己的内存管理。
lvwenyuan_1
·
2024-08-26 16:58
flink
Flink
内存管理机制
(十五)
Flink
内存管理机制
本章我们通过对
Flink
内存模型、JobManag
springk
·
2024-08-26 16:27
Flink全景解析
flink
大数据
实时数据
flink
内存管理
内存管理机制
flink
状态参数设置
前提代码示例,通过
flink
消费kafka,查看list状态中的数据,确定参数的具体含义kafka的代码:发送两个key值,一秒发送一次for(inti=0;isource=KafkaSource.builder
陪你一起捡蛋壳
·
2024-08-26 13:36
flink
linq
大数据
(十九)
Flink
CDC
Flink
CDC(
Flink
ChangeDataCapture)是基于数据库的日志CDC技术,实现了全增量一体化读取的数据集成框架。
springk
·
2024-08-26 12:01
Flink全景解析
flink
大数据
cdc
实时数据处理
实时数据
flink
cdc
Flink
内存调优
Flink
内存调优JVM我们知道
Flink
是基于JobManager和TaskManager管理和运行任务,而他们都是以Java进程的形式运行的,所以在了解
Flink
内存时,我们需要先了解一下Java运行时环境
HHoao
·
2024-08-26 10:44
flink
大数据
微服务数据流的协同:Eureka与Spring Cloud Data Flow集成指南
微服务数据流的协同:Eureka与SpringCloudDataFlow集成指南在构建基于SpringCloud的微服务架构时,服务发现和数据
流处理
是两个关键的组成部分。
2401_85842555
·
2024-08-26 08:34
微服务
eureka
spring
cloud
(十)
Flink
Table API 和 SQL 基本概念
Apache
Flink
有两种关系型API来做流批统一处理:TableAPI和SQL。
springk
·
2024-08-25 21:56
Flink全景解析
数据库
flink
大数据
实时数据
开发语言
实时数据处理
(九)基于
Flink
DataStream API 应用案例
在11.11购物节大促活动中,天猫、京东等商家会对外发布购物节对应的交易金额、单量等信息,下面我们以2023.11.11购物节大促为背景,完成如下任务的计算:问题1:每隔1秒统计购物节当日从零点开始,截止到当前时间总交易额。问题2:基于销售的商品,按照品牌分类,每小时统计对应品牌下的总订单量。基于上面的应用场景,结合DataStreamAPI,完成技术方案设计,并输出实现代码。目录问题1详解问题2
springk
·
2024-08-25 21:55
Flink全景解析
flink
大数据
实时数据
实时数据处理
开发语言
flink
状态
状态(State)是一个重要的概念,它允许
Flink
在处理流数据时跟踪和存储中间结果。这对于实现复杂的计算逻辑和满足应用需求至关重要。
王小工
·
2024-08-25 21:54
Flink
大数据
java
flink
大数据
9、
Flink
SQL 流式概念之Compiled Plan详解
生成CompiledPlan配置过程首先会使用COMPILEPLAN语句生成一个JSON文件,它表示了序列化后的执行计划。COMPILEPLAN不支持查询语句SELECT...FROM...。执行COMPILEPLAN语句TableEnvironmenttableEnv=TableEnvironment.create(EnvironmentSettings.inStreamingMode());t
猫猫爱吃小鱼粮
·
2024-08-25 20:53
Flink
SQL
flink
sql
数据库
(十六)
Flink
状态管理
分类状态有效期(TTL)过期数据的清理OperatorStateBroadcastState状态存储StateBackends分类设置StateBackendRocksDBStateBackend详解在
Flink
springk
·
2024-08-25 20:22
Flink全景解析
flink
大数据
实时数据
实时数据处理
状态管理
flink状态管理
深入理解Kafka消费者偏移量管理:如何确保事件已处理
深入理解Kafka消费者偏移量管理:如何确保事件已处理ApacheKafka是一款流行的分布式
流处理
平台,用于构建高吞吐量的数据管道和实时应用。
heromps
·
2024-08-25 00:17
Springboot
kafka
分布式
Flink
CDC Standalone模式部署及
Flink
CDC Job提交
目录部署规划
Flink
CDC下载
Flink
CDC安装安装包解压添加connector包添加MySQL驱动提交
Flink
CDC任务独立模式(Standalonemode)是
Flink
最简单的部署模式。
L(刘二宝)
·
2024-08-24 13:41
Flink
CDC
Flink
CDC
MySQL
Doris
从零到一建设数据中台 - 关键技术汇总
数据中台关键技术汇总语言框架:Java、Maven、SpringBoot数据分布式采集:Flume、Sqoop、kettle数据分布式存储:HadoopHDFS离线批处理计算:MapReduce、Spark、
Flink
我码玄黄
·
2024-08-24 12:09
数据中台
数据挖掘
数据分析
大数据
消息中间件:Kafka消息丢失与堆积问题分析与解决方案
消息中间件:Kafka消息丢失与堆积问题分析与解决方案Kafka作为分布式消息系统,广泛应用于实时数据
流处理
、大数据分析等领域。
upgrador
·
2024-08-24 02:02
#
消息中间件
kafka
分布式
Flink
流转表,表转流,watermark设置
流转表首先创建一个流@Data@AllArgsConstructor@NoArgsConstructorpublicstaticclassNan{privateStringxing;privateStringname;privateLongts;}StreamExecutionEnvironmentenv=StreamExecutionEnvironment.getExecutionEnviron
qzWsong
·
2024-08-24 02:59
flink
flink
大数据
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他