E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
大数据框架flink
Flink
内存管理之Task Manager内存管理
TaskManager内存模型
Flink
的程序运行在内存中。不管是我们在学习C语言、Java语言的时候,我们都很想知道程序到底是如何管理内存的。
斜杠代码日记
·
2023-10-13 20:18
Flink
flink
02、
Flink
Client 实现原理与源码解析
文章目录
Flink
Client实现原理
Flink
Client主要功能ApplicationCode运行ExecutionEnvironment分类CliFrontend构建CliFrontend对象调用
Seniscz
·
2023-10-13 20:18
Flink源码系列
flink
大数据
走进
Flink
什么是
Flink
Flink
是一个分布式的、高性能的、可伸缩的、容错的流处理引擎,它支持批处理和流处理,并提供了丰富的API和库,是实时数据处理的理想选择由Java和Scala实现的,所以所有组件都会运行在
、小H
·
2023-10-13 20:18
flink
Flink
(4)运行时架构
Flink
运行时的组建作业管理器:JobManager任务管理器:TaskManager资源管理器:ResourceManager分发器:Dispacher作业管理器(JobManager)控制一个应用程序执行的主进程
hk_faith
·
2023-10-13 18:46
flink
1.15 savepoint 超时报错 java.util.concurrent.TimeoutException
savepoint命令
flink
savepointe04813d4e7480c526912eb4d32bba510hdfs://
flink
/
flink
/migration/savepoint56650-
Thomas2143
·
2023-10-13 16:26
总结
flink
Hadoop学习-生态体系(ecosystem)概览
0.大背景全球No.1搜索引擎公司谷歌(Google)面临每天海量搜索引擎数据的问题,经过长时间的实践积累,谷歌形成了自己的
大数据框架
,但是并没有开源,而是发表了一篇论文,阐述了自己的思想,在论文中提到了
weixin_33827965
·
2023-10-13 16:38
大数据
flink
exactly-once系列之两阶段提交实现分析
flink
exactly-once系列目录:一、[两阶段提交概述](http://mp.weixin.qq.com/s?
Flink实战剖析
·
2023-10-13 10:52
8.Spark Sql
定义SparkSql是ApacheSpark
大数据框架
的一部分,主要用于处理结构化数据和对Spark数据执行类sql的查询,Spark为其提供了一个称为DataFrame的编程抽象,充当分布式sql查询引擎功能集成
山间浓雾有路灯
·
2023-10-13 09:46
Hive的文件合并
背景:
Flink
数据写入到stage层,然后再入ods层,中间导致hive数据实时性不强,随后做优化,
Flink
之间以orc格式写入到hive问题:单表日800亿数据量,产生过多的小文件,影响Impala
SparkSql
·
2023-10-13 08:55
hive
hadoop
数据仓库
【备忘】maven跳过ssl验证
由于公司网络策略设置原因,配置apache的nexus下载
flink
-doris-collector依赖报错:[ERROR]Failedtoexecutegoalonprojectdemo:Couldnotresolvedependenciesforprojectcom.tianzy.demo
Java小田
·
2023-10-13 05:45
备忘
azkaban
本地调试
keepalived
flink
demo 可以通过IDE工具直接运行
运行
flink
demo的时候,我第一个问题是,需要安装
flink
,运行在
flink
环境呢,还是在idea里写好code直接run就可以呢?自己写了个demo发现直接run也是可以的。
良人与我
·
2023-10-13 02:06
Flink
(1.13) Catalog
Catalog提供了元数据信息,例如数据库、表、分区、视图以及数据库或其他外部系统中存储的函数和信息。数据处理最关键的方面之一是管理元数据。元数据可以是临时的,例如临时表、或者通过TableEnvironment注册的UDF。元数据也可以是持久化的,例如HiveMetastore中的元数据。Catalog提供了一个统一的API,用于管理元数据,并使其可以从TableAPI和SQL查询语句中来访问。
万事万物
·
2023-10-12 23:23
正则表达式替换占位符
false:string.contains(,))代码如下importorg.apache.
flink
.api.java.tuple.Tuple2;importjava.util.ArrayList;importjava.util.HashMap
bluedraam_pp
·
2023-10-12 20:59
Flink
正则表达式
flink
批处理
4.1State4.1.1state概述Apache
Flink
®—StatefulComputationsoverDataStreams回顾单词计数的例子java/**单词计数*/publicclassWordCount
给我一个苹果
·
2023-10-12 19:03
flink
big
data
hadoop
利用
Flink
(1.17)滚动窗口实时统计Apache Doris审计日志
背景及需求:目前生产环境开放给其他业务组后,需要实时统计各业务组访问数仓(ApacheDoris)频次,分析异常请求用户,做到实时监控及提前预警,同时针对慢查询日志,要留存分析原因,降低慢查询带来的负影响。具体需求:统计每30S内各用户访问数仓的频次,同时过滤出慢查询,将慢查询单独输出,用于后期分析。具体方案:1.分析Doris审计日志:从日志可以看到,数据是以"|“分割开的KV数据(这块要特殊说
码猿小站
·
2023-10-12 19:03
flink
Doris
java
apache
flink
大数据
big
data
flink
-2
FLINK
kafkaDWM对于部分数据对象进行进一步加
不爱吃鱼的馋猫
·
2023-10-12 19:02
flink
Flink
(六十)—— 实时 Error 日志告警
大数据时代,随着公司业务不断的增长,数据量自然也会跟着不断的增长,那么业务应用和集群服务器的的规模也会逐渐扩大,几百台服务器在一般的公司已经是很常见的了。那么将应用服务部署在如此多的服务器上,对开发和运维人员来说都是一个挑战。一个优秀的系统运维平台是需要将部署在这么多服务器上的应用监控信息汇总成一个统一的数据展示平台,方便运维人员做日常的监测、提升运维效率,还可以及时反馈应用的运行状态给应用开发人
weixin_42073629
·
2023-10-12 19:32
Flink
大数据
Log4j 爆“核弹级”漏洞,
Flink
等项目受影响,提供
Flink
解决方法,赶紧修!...
据悉,ApacheLog4j2.xorg.apache.logging.log4jlog4j-core2.15.03
Flink
作业修复方案据zhisheng对
Flink
各个版本的Log4j2使用情况
zhisheng_blog
·
2023-10-12 19:01
java
python
大数据
编程语言
数据库
信息安全-威胁检测-
flink
广播流BroadcastState双流合并应用在过滤安全日志
威胁检测-
flink
双流合并应用在过滤安全日志要解决什么问题威胁检测的场景囊括了各种服务器(前端服务、java、go、php、数据库等各种不同种类的服务器),并且日常从服务器中采集的日志种类又达到数十种之多
码者人生
·
2023-10-12 19:59
信息安全
BroadcastState
flink
双流
join
安全日志过滤
Flink
日志采集、集中存储、可视化查询实践
1.背景笔者的开发大数据平台XSailboat中包含基于
Flink
的可视化计算管道开发和运维功能。状态存储器中数据的查看和节点的日志查看功能是其重要的辅助支撑功能。
OkGogooXSailboat
·
2023-10-12 19:50
大数据平台开发技术
flink
大数据
flink
DataStream API(四)状态和容错-使用状态
keyedstate`State生存时间(TTL)清除过期状态完整快照清理增量清理RocksDB压缩期间的清理算子StateBroadcastState使用算子State有状态的源函数使用State在本节中,您将了解
Flink
666呀
·
2023-10-12 19:50
flink
flink
Flink
Log4j 2.x使用Filter过滤日志类型
Flink
Log4j2.x使用Filter过滤日志类型(区别INFO、ERROR)文章目录
Flink
Log4j2.x使用Filter过滤日志类型(区别INFO、ERROR)ThresholdFilterLevelMatchFilter
JermeryBesian
·
2023-10-12 19:17
Flink
flink
log4j
大数据
Hudi 系列-基础概念-索引机制
目录前言问题作用减少开销怎么理解数据变更基础类型全局索引
Flink
Spark总结前言Hudi系列文章在这个这里查看https://github.com/leosanqing/big-data-study
别惹猪儿虫
·
2023-10-12 18:38
Hudi
大数据
大数据
hudi
Java
Flink
-SQL join 优化 -- MiniBatch + local-global
背景问题1.近期在开发
flink
-sql期间,发现数据在启动后,任务总是进行重试,运行一段时间后,containerheartbeattimeout,内存溢出(GCoverheadlimitexceede
dymkkj
·
2023-10-12 18:07
flink
sql
大数据
大数据
flink
篇之三-
flink
运行环境安装(一)单机Standalone安装
一、安装包下载地址https://archive.apache.org/dist/
flink
/
flink
-1.15.0/二、安装配置流程前提基础:Centos环境(建议7以上)安装命令:解压:tar-zxvf
flink
-xxxx.tar.gz
风之清扬
·
2023-10-12 18:06
大数据计算-Flink
大数据分析
大数据
flink
Flink
之窗口聚合算子
1.窗口聚合算子在
Flink
中窗口聚合算子主要分类两类滚动聚合算子(增量聚合)全窗口聚合算子(全量聚合)1.1滚动聚合算子滚动聚合算子一次只处理一条数据,通过算子中的累加器对聚合结果进行更新,当窗口触发时再从累加器中取结果数据
飞天小老头
·
2023-10-12 18:35
FLink
flink
大数据
Flink
之窗口指派API模板
flink
中窗口指派主要分为两类NoKeyedWindows和KeyedWindows,这里就结合这两类阐述窗口指派APINoKeyedWindowsNoKeyedWindows同时又分为两类PorcessingTime
飞天小老头
·
2023-10-12 18:03
FLink
flink
大数据
No.3 课程综述 |
Flink
知其然,知其所以然
课程综述《Apache
Flink
知其然,知其所以然》课程,在内容上会先对
Flink
整体架构和所适用的场景做一个基础介绍,让你对
Flink
有一个整体的认识!
开源社
·
2023-10-12 17:42
flink
rocksdbStateBackend
比较直观的方式是打开RocksDB的nativemetrics,在默认使用
Flink
managedmemory方式的情况下,state.backend.rocksdb.metrics.block-cache-usage
loukey_j
·
2023-10-12 16:09
大数据下一代变革之必研究数据湖技术Hudi原理实战双管齐下-下
文章目录集成Spark开发Spark编程读写示例DeltaStreamer集成
Flink
环境准备sql-clent使用启动插入数据流式读取Bucket索引HudiCatalog集成Spark开发Spark
IT小神
·
2023-10-12 15:56
大数据
数据仓库
大数据
scala
spark
flink
大数据之Hudi数据湖_版本兼容与Maven安装配置_解决Hudi与Hadoop3.0的兼容问题_编译hudi源码---大数据之Hudi数据湖工作笔记0002
然后我们来看一下,hudi我们这次安装的时候,各个组件的版本信息这个hudi对各个版本的支持还是很多的,需要在安装的时候查一下具体的可以这样查一下去看一下具体的hudi对spark的支持是多少,对
flink
脑瓜凉
·
2023-10-12 15:47
hudi数据湖安装
hudi源码编译
hudi与Hadoop
huidi与Hadoop3.x
Flink
CDC 系列 - 实现 MySQL 数据实时写入 Apache Doris
▼关注「Apache
Flink
」视频号,遇见更多大咖▼摘要:本文通过实例来演示怎么通过
Flink
CDC结合Doris的
Flink
Connector实现从Mysql数据库中监听数据并实时入库到Doris数仓对应的表中
Apache Flink
·
2023-10-12 10:28
大数据
数据库
mysql
java
hadoop
博文推荐|
Flink
CDC 结合 Doris
Flink
Connector 实现MySQL数据实时入Apache Doris
本文通过实例来演示怎么通过
Flink
CDC结合Doris的
Flink
Connector实现从MySQL数据库中监听数据并实时入库到Doris数仓对应的表中。
ApacheDoris
·
2023-10-12 10:54
数据库
大数据
hadoop
mysql
java
基于
Flink
SQL CDC 的实时数据同步方案
整理:陈政羽(
Flink
社区志愿者)
Flink
1.11引入了
Flink
SQLCDC,CDC能给我们数据和业务间能带来什么变化?
zhisheng_blog
·
2023-10-12 10:54
数据库
大数据
分布式
python
mysql
使用
Flink
CDC 实现 MySQL 数据实时入 Apache Doris
需要组件:mysql5.7.37Doris-0.15.1
flink
-1.13.6scala_2.12
flink
-connector-mysql-cdc-2.0.2
flink
-doris-connector
红烧佩奇真好吃
·
2023-10-12 10:18
大数据
【Doris】
Flink
CDC 结合 Doris
Flink
Connector 实现MySQL数据实时入Apache Doris
本文通过实例来演示怎么通过
Flink
CDC结合Doris的
Flink
Connector实现从MySQL数据库中监听数据并实时入库到Doris数仓对应的表中。
九层之台起于累土
·
2023-10-12 10:48
【Doris】
【BigData】
flink
mysql
apache
数据仓库
大数据
Flink
面试题-sql
Flink
SQL篇,SQL实操、
Flink
Hive、CEP、CDC、GateWay
Flink
源码篇,作业提交流程、作业调度流程、作业内部转换流程图
Flink
核心篇,四大基石、容错机制、广播、反压、序列化
javastart
·
2023-10-12 10:47
flink
flink
“数据中台”万字深度思考
Flink
平台化需要改进的点等等,参考《数据中台》。
zl1zl2zl3
·
2023-10-12 09:32
中台
中台
2.1、如何在
Flink
SQL中读取&写出到Kafka
目录1、环境设置方式1:在Maven工程中添加pom依赖方式2:在sql-client.sh中添加jar包依赖2、读取Kafka2.1创建kafka表2.2读取kafka消息体(Value)使用'format'='json'解析json格式的消息使用'format'='csv'解析csv格式的消息使用'format'='raw'解析kafka消息为单个字符串字段2.3读取kafka消息键(Key)
广阔天地大有可为
·
2023-10-12 08:58
#
FlinkSQL
使用技巧
kafka
分布式
尚硅谷
Flink
(一)
目录☄️前置工作fenfa脚本概述☄️
Flink
是什么☄️特点(多nb)☄️应用场景(不用看)☄️分层API配环境☄️wordcount☄️WcDemoUnboundStreaming集群部署☄️集群角色
Int mian[]
·
2023-10-12 08:57
flink
大数据
linux
Flink
时间和窗口
文章目录
Flink
时间和窗口一、时间语义1、数据处理系统中的时间语义2、两种时间语义的对比二、水位线1、什么是水位线(1)、有序流中的水位线(2)、乱序流中的水位线(3)、水位线的特性2、如何生成水位线
气质&末雨
·
2023-10-12 08:25
flink
flink
大数据
大数据面试题:Spark和
Flink
的区别
面试题来源:《大数据面试题V4.0》大数据面试题V3.0,523道题,679页,46w字可回答:1)SparkStreaming和
Flink
的区别问过的一些公司:杰创智能科技(2022.11),阿里蚂蚁
蓦然_
·
2023-10-12 08:54
大数据面试题
大数据
spark
flink
Flink
窗口-时间窗口
(一)时间窗口的本质前篇中,我们已经初略讲解了
Flink
中的数量窗口与时间窗口。
保护我方胖虎
·
2023-10-12 08:53
flink
java
大数据
flink
Flink
中jobmanager、taskmanager、slot、task、subtask、Parallelism的概念
场景一个工厂有三个车间每个车间两条生产线生产流程如下原料->加工->过滤->分类->美化->包装->下线JobManager:工厂在上述场景中,工厂就是jobManager,负责协调、调度和监控整个生产过程TaskManager:车间在上述场景中,车间就是taskManager,按照工厂的分配进行生产,所有的问题上报工厂slot:流水线在上述场景中,车间的流水线就是slot,是工作台,真正干活的地
qzWsong
·
2023-10-12 08:52
flink
大数据
Flink
中的时间和窗口(一)
目录6.1时间语义6.1.1
Flink
中的时间语义6.1.2哪种时间语义更重要6.2水位线(Watermark)6.2.1事件时间和窗口6.2.2什么是水位线6.2.3如何生成水位线6.2.4水位线的传递
大数据阿嘉
·
2023-10-12 08:51
flink
java
大数据
Flink
中的时间与窗口
ingestion-time:进入
Flink
的时间。如果没有事件时间可以用这个时间取代。processing-time:执行Operator算子的处理时间,本地系统时间,与机器无关。
XueminXu
·
2023-10-12 08:21
大数据
flink
大数据
Tumbling
Sliding
事件时间
Flink
中的时间和窗口
1.
Flink
的时间和窗口在传统的批处理系统中,我们可以等到一批数据全部都到齐了之后,对其做相关的计算;但是在实时处理系统中,数据是源源不断的,正常情况下,我们就得来一条处理一条。
文文鑫
·
2023-10-12 08:19
Flink
flink
大数据
通过
flink
插入数据Stream_load 方式
1.场景:通过模拟数据发送kafa—>
flink
接收到kakfa数据–>然后通过
flink
进行streamLoad插入数据到doris中;2.建表语句CREATETABLE`wudl_doris01`(
wudl5566
·
2023-10-12 08:44
Flink
flink
big
data
大数据
Flink
任务报Cannot have more than one execute() or executeAsync() call in a single environment
问题描述:使用
Flink
1.12开发的任务在本地IDEA中可以正常运行,发布到集群上报如下错误:java.util.concurrent.CompletionException:org.apache.
flink
.client.deployment.application.ApplicationExecutionException
一个不安分的程序员
·
2023-10-12 06:22
Java
Spark
日志
flink
java
大数据
实时计算
实时数仓
大数据学习笔记之
flink
----流式数据处理引擎
很多人可能都是在2015年才听到
Flink
这个词,其实早在2008年,
Flink
的前身已经是柏林理工大学一个研究性项目,在2014被Apache孵化器所接受,然后迅速地成为了ASF(ApacheSoftwareFoundation
WRichards
·
2023-10-12 05:35
大数据
大数据
flink
上一页
58
59
60
61
62
63
64
65
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他