E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
flink流式处理
大数据学习之
Flink
,10分钟带你初步了解
Flink
目录前摘一、认识
Flink
的Logo编辑二、了解
Flink
的起源三、了解
Flink
的发展四、明白
Flink
的定位五、
Flink
主要的应用场景六、流式数据处理的发展和演变1.流处理和批处理2.传统事务处理
十二点的泡面
·
2024-01-22 19:23
大数据
Flink
大数据
学习
flink
Apache Paimon学习记录
ApachePaimon官网ApachePaimon|ApachePaimon根据官网介绍去快速了解paimon是用来设计做什么,可以做什么,对比与其他数据湖有什么特点,如何使用Paimon特点前身是
Flink
tableStore
这个程序猿可太秀了
·
2024-01-22 17:27
数据质量&批流数仓
大数据文章迁移
数据仓库
数据湖
实时数仓
paimon
Flink
CDC 3.0 详解
一、
Flink
CDC概述
Flink
CDC是基于数据库日志CDC(ChangeDataCapture)技术的实时数据集成框架,支持全增量一体化、无锁读取、并行读取、表结构变更自动同步、分布式架构等高级特性
小枫@码
·
2024-01-22 17:18
Flink
flink
大数据
数据湖技术之Paimon
一、简介
Flink
社区希望能够将
Flink
的Streaming实时计算能力和Lakehouse新架构优势进一步结合,推出新一代StreamingLakehouse技术,促进数据在数据湖上真正实时流动起来
小枫@码
·
2024-01-22 17:48
数据湖
大数据
Flink
入门教程
使用
flink
时需要提前准备好scala环境一、创建maven项目二、添加pom依赖2.11.12org.scala-langscala-library${scala.version}org.scala-langscala-compiler
fengchengwu2012
·
2024-01-22 14:52
BigData
flink
大数据
【
Flink
-1.17-教程】-【四】
Flink
DataStream API(1)源算子(Source)
【
Flink
-1.17-教程】-【四】
Flink
DataStreamAPI(1)源算子(Source)1)执行环境(ExecutionEnvironment)1.1.创建执行环境1.2.执行模式(ExecutionMode
bmyyyyyy
·
2024-01-22 11:34
Flink
flink
#flink-api
#flink-source
#flink原算子
Flink
SQL 实时数据开发经验总结
使用SQL实现流处理的核心技术在了解了Table\SQLAPI的使用方法以及作业运行机制之后,接下来分析SQL实现流处理的核心技术。为什么要分析这个问题呢?因为传统的关系代数以及SQL最开始是为了批处理设计的,在传统关系型数据库以及批处理中,数据都是有界的,因此SQL语句的执行过程比较好理解,但是在流处理中,数据是无界的,那么将SQL应用于流处理的理解成本以及实现成本相对批处理就高很多了。因此在本
BUG记录机
·
2024-01-22 11:52
flink
sql
数据库
flink
if函数false时对字符串做阶段的bug
背景
flink
官网对if函数就是我们正常的理解我们之前在使用
flink
1.12时候也没有发现问题,但是最近一个1.15的任务出现了一个bug本来应该返回cdefg,但是返回了cdeif(false,'abc
这个程序猿可太秀了
·
2024-01-22 10:25
大数据文章迁移
flink
bug
大数据
Flink
(四十九)——
Flink
on Yarn / K8s 原理剖析及实践
本文根据Apache
Flink
进阶篇系列直播课程整理而成,由阿里巴巴技术专家周凯波(宝牛)分享,主要介绍
Flink
onYarn/K8s的原理及应用实践,文章将从
Flink
架构、
Flink
onYarn原理及实践
weixin_42073629
·
2024-01-22 08:03
Flink
大数据
flink
on yarn 三种部署模式的相关命令及其差异
官方文档:https://
flink
.apache.org/2020/07/14/application-deployment-in-
flink
-current-state-and-the-new-application-mode
bigdata-rookie
·
2024-01-22 08:03
Flink
flink
大数据
yarn
Flink
on YARN(下):常见问题与排查思路
杨弢(搏远),阿里巴巴计算平台事业部技术专家,ApacheHadoopCommitter,目前专注于YARN、
Flink
、YuniKorn等开源项目的资源调度方向。
Apache Flink
·
2024-01-22 08:33
Flink
on yarn 实时日志收集到 kafka 打造日志检索系统
点击上方"JasonLee实时计算",选择"设为星标"再也不用担心错过重要文章后台回复"监控",获取grafana监控
Flink
最新的模板背景在
Flink
onyarn的模式下,程序运行的日志会分散的存储在不同的
JasonLee实时计算
·
2024-01-22 08:33
log4j
java
kafka
hadoop
大数据
一张图轻松掌握
Flink
on YARN 基础架构与启动流程
杨弢(搏远),阿里巴巴计算平台事业部技术专家,ApacheHadoopCommitter,目前专注于YARN、
Flink
、YuniKorn等开源项目的资源调度方向。
zhisheng_blog
·
2024-01-22 08:02
flink
部署模式(二)- yarn三种部署模式
基于
flink
1.15.0SessionModeonyarn开启
flink
yarn-session集群.
PONY LEE
·
2024-01-22 08:32
flink
flink
linux
java
flink
部署模式介绍
Flink
为各种场景提供了不同的部署模式,主要有以下三种,它们的区别主要在于:集群的生命周期以及资源的分配方式;应用的main方法到底在哪里执行——客户端(Client)还是JobManager。
201001070
·
2024-01-22 08:32
Flink
flink
大数据
Flink
背景
数仓简介在信息爆炸的时代,为了从海量数据中洞察业务价值,驱动运营决策,企业通常会构建用于数据分析的数据仓库。数据仓库的数据一般来源于多个分散的、异构的数据源,通过数据集成技术将数据整合在一起,消除数据孤岛,便于后续的分析。实时数仓近年来,面向分析的数据系统发展迅速,各种新型的OLAP系统开始显露锋芒,数据湖和Lakehouse的概念也变得炙手可热。然而,数据集成仍然是人们通往数据分析之路上的主要障
201001070
·
2024-01-22 08:31
Flink
flink
大数据
flink
1.13环境搭建
具体安装步骤如下:1.1下载安装包进入
Flink
官网,下载1.13.0版本安装包
flink
-1.13.0-bin-scala_2.12.tgz,注意此处选用对应scala版本为scala2.12的安装包
201001070
·
2024-01-22 08:31
Flink
flink
[
flink
]一
Flink
部署|配置文件|提交作业|部署模式|独立模式部署|yarn模式部署
、集群部署集群规划节点服务器hadoop1hadoop2hadoop3hadoop4角色JobManagerTaskManagerTaskManagerTaskManagerTaskManager1、
flink
-conf.yaml
胖胖学编程
·
2024-01-22 08:30
Flink
flink
Flink
集群部署到YARN上的提交流程
第一步:
Flink
任务提交后,Client向HDFS上传
Flink
的Jar包和配置第二步:之后向YarnResourceManager提交任务,ResourceManager分配Container资源并通知对应的
疯子1313
·
2024-01-22 08:00
flink
yarn
【
Flink
】
Flink
on Yarn 翻译 使用 hdfs jar yarn.provided.lib.dirs
/bin/
flink
run-application-tyarn-application\-Dyarn.provided.lib.dir
九师兄
·
2024-01-22 08:59
大数据-flink
hdfs
hadoop
flink
【
Flink
】部署模式-会话模式/单作业模式/应用模式/Yarn模式/独立模式/K8s模式
目录部署模式会话模式(SessionMode)单作业模式(Per-JobMode)应用模式(ApplicationMode)结合资源提供者(ResourceProvider)下的部署模式独立模式(Standalone)会话模式部署单作业模式部署应用模式部署YARN模式相关准备和配置会话模式/应用模式/单作业模式NativeKubernetes部署模式在一些应用场景中,对于集群资源分配和占用的方式,
清清清清风
·
2024-01-22 08:59
Flink
kubernetes
flink
容器
yarn
大数据
Dinky安装和部署
概述Dinky是一个开箱即用、易扩展,以Apache
Flink
为基础,连接OLAP和数据湖等众多框架的一站式实时计算平台,致力于流批一体和湖仓一体的探索与实践。
Appreciate(欣赏)
·
2024-01-22 08:28
dinky
Flink
flink
大数据
13.
Flink
之
Flink
on Yarn/K8s 原理剖析及实践
Flink
架构概览
Flink
架构概览–Job用户通过DataStreamAPI、DataSetAPI、SQL和TableAPI编写
Flink
任务,它会生成一个JobGraph。
吃胖点儿
·
2024-01-22 08:58
Flink
史上最全深度解析
Flink
内存管理--大数据技术
目前,大数据计算引擎主要使用Java或基于JVM的编程语言实现的,例如ApacheHadoop,ApacheSpark,ApacheDrill,Apache
Flink
等。
大数据学习僧
·
2024-01-22 08:50
Flink
大数据
flink
flink
内存模型
flink
内存管理jvm中java对象模型缺陷
flink
自主管理内存来解决jvm的几个问题早期
flink
内存模型当前
flink
内存模型补充内容
flink
将对象序列化存储会不会存在高昂的序列化和反序列化代价
小路遥同学
·
2024-01-22 08:48
java
java
flink
03-
Flink
内存模型
如何处理缓存和高效处理1自主管理内存
Flink
从一开始就选择了使用自主的内存管理,避开了JVM内存管理在大数据场景下的问题,提升了计算效率.1.1JVM内存管理的不足1.1.1有效数据密度低存储:对象头
情深@骚明
·
2024-01-22 08:48
流式计算
flink
flink
结合Yarn进行部署
1.什么是Yarn模式部署
Flink
独立(Standalone)模式由
Flink
自身提供资源,无需其他框架,这种方式降低了和其他第三方资源框架的耦合性,独立性非常强。
201001070
·
2024-01-22 08:17
Flink
flink
大数据
Flink
(十四)【
Flink
SQL(中)查询】
Flink
SQL查询环境准备:#1.先启动hadoopmyhadoopstart#2.不需要启动
flink
只启动yarn-session即可/opt/module/
flink
-1.17.0/bin/yarn-session.sh-d
让线程再跑一会
·
2024-01-22 08:14
Flink
flink
大数据
Flink
是如何管理内存的
在讲
Flink
管理内存之前要了解下
Flink
为什么要自己实现内存管理一、
Flink
为什么要自己实现内存管理在大数据领域,大多数数据相关的开源框架(Hadoop、Spark、Storm)都是基于JVM运行的
Relian哈哈
·
2024-01-22 08:13
Flink
【内存模型】
Flink
内存模型:从宏观(
Flink
内存模型)、微观(
Flink
内存结构)、数据传输等角度分析
Flink
的内存管理
我们首先先从
Flink
的不同角色看一下
Flink
的内存管理,然后在微观的看一下
Flink
的内存管理器和数据模型,最后再观察下数据传输时的内存管理。
roman_日积跬步-终至千里
·
2024-01-22 08:11
#
flink
实战
flink
java
【内存管理】
flink
内存管理(一):内存管理概述:
flink
主动管理内存原理、
flink
内存模型
文章目录一.
flink
为什么自己管理内存1.处理大数据时JVM内存管理的问题2.
flink
主动管理内存逻辑2.1.
Flink
内存管理方面2.2.序列化、反序列化说明3.
Flink
主动管理内存的好处二.
Flink
roman_日积跬步-终至千里
·
2024-01-22 08:11
#
flink
实战
flink
大数据
flink
内存管理(二):MemorySegment的设计与实现:(1)架构、(2)管理堆内/外内存、(3)写入/读取内存、(4)垃圾清理器
MemorySegment管理堆内存2.基于MemorySegment管理堆外内存3.基于Unsafe管理MemorySegment4.写入和读取内存数据5.创建MemoryCleaner垃圾清理器在
flink
roman_日积跬步-终至千里
·
2024-01-22 08:11
#
flink
实战
#
flink源码
flink
架构
大数据
Flink
TaskManager 内存管理机制介绍与调优总结
作者:董伟柯,腾讯CSIG高级工程师概要
Flink
的新版内存管理机制,要追溯到2020年初发布的
Flink
1.10版本。
腾讯云大数据
·
2024-01-22 08:09
flink
jvm
java
flink
基础概念之什么是时间语义
什么是时间语义
Flink
支持三种不同的时间语义,以便处理流式数据中的事件时间、处理时间和摄入时间。
吃草料的羊
·
2024-01-22 08:38
flink
大数据
TaskExecutor统一内存配置(
FLink
FLIP-49翻译)
文章目录目的:(1)解决流、批配置差异大(2)解决Streaming方式RocksDB配置复杂(3)去掉复杂、不确定、难以理解的配置公共接口修改建议统一流处理和批处理内存管理内存使用场景及特点统一显式和隐式内存申请将托管的堆上内存池和堆外内存池分离MemoryPools和配置方式框架堆内存(FrameworkHeapMemory)用户堆内存(TaskHeapMemory)用户堆外内存(TaskOf
LS_ice
·
2024-01-22 08:38
flink
flink
内存管理(三):MemorySegment内存使用场景:托管内存与网络内存
MemoryManager实例3.算子使用通过MemoryManager使用内存4.ManagedMemory内存空间申请流程二.NetworkBuffer内存申请与使用1.NetworkBuffer构造器在
Flink
roman_日积跬步-终至千里
·
2024-01-22 08:35
#
flink源码
#
flink
实战
flink
python
java
flink
基本概念
1.
Flink
关键组件:这里首先要说明一下“客户端”。其实客户端并不是处理系统的一部分,它只负责作业的提交。
上官沐雪
·
2024-01-22 08:05
flink
flink
linux
人工智能
Spark写入kafka(批数据和流式)
Spark写入(批数据和
流式处理
)Spark写入kafka批处理写入kafka基础#spark写入数据到kafkafrompyspark.sqlimportSparkSession,functionsasFss
中长跑路上crush
·
2024-01-22 07:02
Spark阶段
spark
kafka
linq
Flink
源码之 Window Slice
Flink
源码分析系列文档目录请点击:
Flink
源码分析系列文档目录前言Windowslice是
Flink
对SQLwindow聚合的一种优化方式。
AlienPaul
·
2024-01-22 04:29
java-IO-高级流
高级流高级流(或者称为包装流)是基于原始字节流和字符流之上的一层
流式处理
机制。它们提供了更高级别的功能,使得流的使用更加方便和灵活。
Flying_Fish_roe
·
2024-01-22 04:36
java
开发语言
flink
cdc 3.0 尝鲜
本文会将从环境搭建到demo来全流程体验
flink
cdc3.0包含了如下内容
flink
1.18standalone搭建doris1fe1be搭建整库数据同步测试各同步场景从检查点重启同步任务环境搭建
flink
Antg
·
2024-01-22 03:51
flinkcdc
flinkcdc
flink
doris
9.4 Lambda表达式
9.4Lambda表达式1Lambda语法2.基于Lambda实现函数式编程3.Stream
流式处理
1Lambda语法2.基于Lambda实现函数式编程3.Stream
流式处理
与海boy
·
2024-01-22 03:21
Java工程师(后端开发)
java
Flink
SQL Window源码全解析
文章目录一、概述二、Window分类1、TimeWindow与CountWindow2、TimeWindow子类型TumbleWindow(翻转窗口)HopWindow(滑动窗口)SessionWindow(会话窗口)三、Window分类及整体流程四、创建WindowOperator算子五、WindowOperator处理数据图解六、WindowOperator源码调试1、StreamExecGr
王知无
·
2024-01-22 03:07
支持微服务架构的流数据处理
之前说过消息传输系统一方面将生产者和消费者解耦,另一方面又有足够高的吞吐量,并且能够满足像
Flink
这样的高性能流
afansdie
·
2024-01-21 19:49
基于PiflowX构建MySQL和Postgres的Streaming ETL
说明:案例来自
flink
cdc官方。
PiflowX
·
2024-01-21 18:07
mysql
etl
数据库
PiflowX组件-PostgresCdc
计算引擎
flink
组件分组cdc端口Inport:默认端口outport:默认端口组件属性名称展示名称默认值允许值是否必填描述例子hostnameHostname“”无是PostgreSQL数据库服务器的
PiflowX
·
2024-01-21 18:37
PiflowX
大数据
hadoop
flink
spark
hdfs
PiflowX组件-OracleCdc
计算引擎
flink
组件分组cdc端口Inport:默认端口outport:默认端口组件属性名称展示名称默认值允许值是否必填描述例子hostnameHostname“”无是Oracle数据库服务器的IP地址或主机名
PiflowX
·
2024-01-21 18:36
spark
flink
big
data
大数据
hadoop
flink
容错机制
Apache
Flink
提供了一种容错机制,可以持续恢复数据流应用程序的状态。该机制确保即使出现故障,程序的状态最终也会反映来自数据流的每条记录(只有一次)。
少年阿宏
·
2024-01-21 17:13
flink
flink
Flink
容错机制(一)
目录十:容错机制10.1检查点(Checkpoint)10.1.1检查点的保存10.1.2从检查点恢复状态10.1.3检查点算法10.1.4检查点配置10.1.5保存点(Savepoint)十:容错机制流式数据连续不断地到来,无休无止;所以流处理程序也是持续运行的,并没有一个明确的结束退出时间。机器运行程序,996起来当然比人要容易得多,不过希望“永远运行”也是不切实际的。因为各种硬件软件的原因,
大数据阿嘉
·
2024-01-21 17:12
flink
java
数据库
Flink
容错机制(二)
10.2状态一致性10.2.1一致性的概念和级别10.2.2端到端的状态一致性10.3端到端精确一次(end-to-endexactly-once)10.3.1输入端保证10.3.2输出端保证10.3.3
Flink
大数据阿嘉
·
2024-01-21 17:12
flink
大数据
上一页
10
11
12
13
14
15
16
17
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他