E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Flink源码学习
PiflowX组件-JDBCRead
计算引擎
flink
有界性ScanSource:BoundedLookupSource:SyncMode组件分组Jdbc端口Inport:默认端口outport:默认端口组件属性名称展示名称默认值允许值是否必填描述例子
暗影八度
·
2024-01-01 23:36
大数据
spark
big
data
flink
hadoop
PiflowX组件-ReadFromUpsertKafka
计算引擎
flink
有界性Unbounded组件分组kafka端口Inport:默认端口outport:默认端口组件属性名称展示名称默认值允许值是否必填描述例子kafka_hostKAFKA_HOST“”
暗影八度
·
2024-01-01 23:06
大数据
spark
big
data
flink
hadoop
PiflowX组件-WriteToUpsertKafka
计算引擎
flink
有界性StreamingUpsertMode组件分组kafka端口Inport:默认端口outport:默认端口组件属性名称展示名称默认值允许值是否必填描述例子kafka_hostKAFKA_HOST
暗影八度
·
2024-01-01 23:05
PiflowX
大数据
spark
flink
数据库
hdfs
etl
PiflowX组件-JDBCWrite
计算引擎
flink
有界性Sink:BatchSink:StreamingAppend&UpsertMode组件分组Jdbc端口Inport:默认端口outport:默认端口组件属性名称展示名称默认值允许值是否必填描述例子
暗影八度
·
2024-01-01 23:01
spark
flink
big
data
大数据
hadoop
Flink
学习-时间和窗口
在流数据处理应用中,一个很重要、也很常见的操作就是窗口计算。所谓的“窗口”,一般就是划定的一段时间范围,也就是“时间窗”;对在这范围内的数据进行处理,就是所谓的窗口计算。所以窗口和时间往往是分不开的。时间语义事件时间(EventTime):每个事件在对应的设备上发生的时间,也就是数据生成的时间。处理时间(ProcessingTime):执行处理操作的机器的系统时间摄取时间(IngestionTim
demon7552003
·
2024-01-01 22:04
大数据
flink
大数据
时间和窗口
20200912 001_
Flink
-
Flink
简介
20200912001_
Flink
-
Flink
简介第一章
Flink
简介主要内容•
Flink
是什么•为什么要用
Flink
•流处理的发展和演变•
Flink
的主要特点•
Flink
vsSparkStreaming1.1
强哥带你飞
·
2024-01-01 13:02
Flink
Flink
大数据
flink
有什么优势值得大家这么热衷
flink
通过实现了GoogleDataflow流式计算模型实现了高吞吐、低延迟、高性能兼具实时流式计算框架。
KK架构
·
2024-01-01 13:32
Flink
flink
实时计算
实时仓库
Flink
的特点以及优势
Flink
的优势、数据量&吞吐量&延迟性
Flink
的流处理引擎只需要很少配置就能实现高吞吐率和低延迟。2、支持EventTime和乱序事件
Flink
支持了流处理和EventTime语义的窗口机制。
DemonHunter211
·
2024-01-01 13:32
Hadoop
Flink
的优势
总之,实时计算的业务需求,一般都会用
Flink
进行开发。
有味青年
·
2024-01-01 13:01
笔记
相比于其他流处理技术,
Flink
的优点在哪?
Apache
Flink
是一个开源的流处理框架,用于在高吞吐量和低延迟的情况下进行大规模数据流的处理。
KevinAha
·
2024-01-01 13:31
flink
大数据
Flink
Job 执行流程
Flink
OnYarn模式基于Yarn层面的架构类似SparkonYarn模式,都是由Client提交App到RM上面去运行,然后RM分配第一个container去运行AM,然后由AM去负责资源的监督和管理
程序猿进阶
·
2024-01-01 12:24
Flink
flink
大数据
java
面试
后端
性能优化
spark
聊聊
flink
Table的Joins
序本文主要研究一下
flink
Table的Joins实例InnerJoinTableleft=tableEnv.fromDataSet(ds1,"a,b,c");Tableright=tableEnv.fromDataSet
go4it
·
2024-01-01 12:42
flink
run -C 与 -c
-C可用来添加外部依赖jar包,如自己开发的工具jar包,一个个添加,不能是目录-c指定main()所在的类正确用法
flink
run-d\-C"file:///DSJ/
flink
-1.11.1/ep/xxxx1
luohaifang
·
2024-01-01 11:29
大数据
flink
run
-C
Flink
学习排查问题---
Flink
部署web端无法连接问题
项目场景:
Flink
部署web端无法连接问题问题描述:电脑:win10虚拟机:centos7
flink
:1.10.1在默认配置环境下,正常启动
Flink
显示启动成功后,访问localhost:8081无法正常访问但是输入网站
文耳_lzl
·
2024-01-01 11:29
问题解决
linux
flink
centos
Flink
Kafka[输入/输出] Connector
本章重点介绍生产环境中最常用到的
Flink
kafkaconnector。使用
Flink
的同学,一定会很熟悉kafka,它是一个分布式的、分区的、多副本的、支持高吞吐的、发布订阅消息系统。
程序猿进阶
·
2024-01-01 11:58
Flink
flink
kafka
linq
大数据
java
面试
后端
Flink
|《
Flink
官方文档 - 概念透析 -
Flink
架构》学习笔记
学习文档:概念透析-
Flink
架构学习笔记如下:
Flink
集群剖析客户端(Client):准备数据流程序并发送给JobManager(不是
Flink
执行程序的进程)JobManager:协调
Flink
应用程序的分布式执行
长行
·
2024-01-01 11:28
Flink
flink
架构
集群
CDH 6.3.2集成
flink
1.18 zookeeper版本不匹配
Flink
-yarn启动失败
CDH6.3.2集成
flink
1.18zookeeper版本不匹配
Flink
-yarn不能正常启动,而在CHDWeb页面,
flink
日志报错提示不明确,不能定位具体错误。
qq_21480329
·
2024-01-01 10:05
flink
zookeeper
大数据
Flink
整合面向用户的数据流SDKs/API(
Flink
关于弃用Dataset API的论述)
动机
Flink
提供了三种主要的sdk/API来编写程序:TableAPI/SQL、DataStreamAPI和DataSetAPI。
另存為
·
2024-01-01 05:28
Flink
内容分享(二十八):深度解析
Flink
是如何管理好内存的?
目录前言数据对象直接放在堆内存中
Flink
是怎么做的?
Flink
如何分配内存?
Flink
如何序列化对象?
Flink
如何对二进制数据进行操作?
之乎者也·
·
2024-01-01 05:23
Flink
内容分享
大数据(Hadoop)内容分享
flink
大数据
Flink
内容分享(二十七):Hadoop vs Spark vs
Flink
——大数据框架比较
大数据开发离不开各种框架,我们通过学习ApacheHadoop、Spark和
Flink
之间的特征比较,可以从侧面了解要学习的内容。
之乎者也·
·
2024-01-01 05:52
Flink
内容分享
大数据(Hadoop)内容分享
大数据
flink
hadoop
[
Flink
]
Flink
的waterMark的通俗理解
导读
Flink
为实时计算提供了三种时间,即事件时间(eventtime)、摄入时间(ingestiontime)和处理时间(processingtime)。
延眠万里
·
2024-01-01 05:37
Java程序员:世界有三个伟大的发明「火、轮子、kafka」
在流式计算中,Kafka一般用来缓存数据,例如
Flink
通过消费Kafka的数据进行计算。关于Kafka,我们最先需要了解的是以下四点:Java程序员:世界有三个伟大的发明「火、轮子、kafka」A
Java旺
·
2024-01-01 04:17
Flink
内容分享(十八):基于
Flink
+Iceberg构建企业数据湖实战
目录前言ApacheIceberg的优势ApacheIceberg经典业务场景应用ApacheIceberg的准备工作创建和使用CatalogIcebergDDL命令IcebergSQL查询IcebergSQL写入使用DataStream读取使用DataStream写入前言随着大数据存储和处理需求的多样化,如何构建一个统一的数据湖存储,并在其上进行多种形式的数据分析成了企业构建大数据生态的一个重要
之乎者也·
·
2023-12-31 11:21
Flink
内容分享
大数据(Hadoop)内容分享
flink
大数据
Flink
内容分享(十七):基于
Flink
的“批处理”尝试
目录背景实现方法一VirtualKey方法二算子状态方法三无状态的snapshot引言
Flink
可以说是当下最流行的分布式流数据处理引擎。
之乎者也·
·
2023-12-31 11:51
Flink
内容分享
大数据(Hadoop)内容分享
flink
分布式
linq
Flink
内容分享(十六):
Flink
中的容错机制
目录
Flink
中的容错机制1.1检查点(Checkpoint)1.1.1检查点的保存1.1.2从检查点恢复状态1.1.3检查点算法1.1.4检查点配置1.1.5保存点(Savepoint)1.2状态一致性
之乎者也·
·
2023-12-31 11:50
Flink
内容分享
大数据(Hadoop)内容分享
flink
大数据
Flink
使用之WatermarkStrategy(含源码分析)
Flink
使用介绍相关文档目录
Flink
使用介绍相关文档目录前言概括来说,watermark用于基于eventtime的流计算系统数据流可能发生乱序的情况。
AlienPaul
·
2023-12-31 07:28
Apache Doris在京东搜索实时OLAP中的应用实践
1、前言本文讨论了京东搜索在实时流量数据分析方面,利用Apache
Flink
和ApacheDoris进行的探索和实践。
小晨说数据
·
2023-12-31 03:11
Doris专栏
数据库
大数据
人工智能
数据分析
java
Flink
内容分享(十一):
Flink
面试题总结(二)
1、简单介绍一下
Flink
Flink
是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。并且
Flink
提供了数据分布、容错机制以及资源管理等核心功能。
之乎者也·
·
2023-12-30 22:30
Flink
内容分享
大数据(Hadoop)内容分享
flink
大数据
Flink
内容分享(九):
Flink
生产环境相关问题
目录1.
Flink
+Kafka保证精确一次消费相关问题?2.你们的
Flink
怎么提交的?使用的per-job模式吗?3.了解过
Flink
的两阶段提交策略吗?讲讲详细过程。如果第一阶段宕机了会怎么办?
之乎者也·
·
2023-12-30 22:00
Flink
内容分享
大数据(Hadoop)内容分享
flink
Flink
内容分享(十):
Flink
面试题总结(一)
1、背压问题背压产生的原因流量徒增,流量内容异常,如何发现背压
Flink
webui采集到prometheus,报警发现背问题的定位与处理配置问题,GC的配置、内存&CPU的配置代码问题,算子使用不合理数据问题
之乎者也·
·
2023-12-30 22:00
Flink
内容分享
大数据(Hadoop)内容分享
flink
大数据
【
flink
番外篇】9、
Flink
Table API 支持的操作示例(6)- 表的聚合(group by、Distinct、GroupBy/Over Window Aggregation)操作
Flink
系列文章一、
Flink
专栏
Flink
专栏系统介绍某一知识点,并辅以具体的示例进行说明。1、
Flink
部署系列本部分介绍
Flink
的部署、配置相关基础内容。
一瓢一瓢的饮 alanchan
·
2023-12-30 20:11
flink
示例专栏
flink
大数据
flink
hive
kafka
flink
sql
flink
实时计算
flink
table
【
flink
番外篇】9、
Flink
Table API 支持的操作示例(7)- 表的join操作(内联接、外联接以及联接自定义函数等)
Flink
系列文章一、
Flink
专栏
Flink
专栏系统介绍某一知识点,并辅以具体的示例进行说明。1、
Flink
部署系列本部分介绍
Flink
的部署、配置相关基础内容。
一瓢一瓢的饮 alanchan
·
2023-12-30 20:39
flink
示例专栏
flink
大数据
kafka
flink
kafka
flink
流批一体化
flink
实时计算
flink
hive
Flink
(十一)【状态管理】
Flink
状态管理我们一直称
Flink
为运行在数据流上的有状态计算框架和处理引擎。
让线程再跑一会
·
2023-12-30 17:49
Flink
flink
大数据
Apache
Flink
连载(二十):
Flink
On Yarn运行 - Yarn Per-Job模式(弃用)
博主个人B栈地址:豹哥教你大数据的个人空间-豹哥教你大数据个人主页-哔哩哔哩视频目录1.任务提交命令2.任务提交流程Per-Job模式目前只有yarn支持,Per-job模式从
Flink
1.15版本开始已经被弃用
IT贫道
·
2023-12-30 15:02
大数据计算体系技术栈
Apache
Flink
apache
flink
大数据
Apache
Flink
连载(二十一):
Flink
On Yarn运行原理-Yarn Application模式
个人主页:IT贫道_大数据OLAP体系技术栈,ApacheDoris,Clickhouse技术-CSDN博客私聊博主:加入大数据技术讨论群聊,获取更多大数据资料。博主个人B栈地址:豹哥教你大数据的个人空间-豹哥教你大数据个人主页-哔哩哔哩视频目录1.任务提交命令
IT贫道
·
2023-12-30 15:30
大数据计算体系技术栈
Apache
Flink
apache
flink
大数据
【Spring源码】1.彻底理解IOC,什么是bean(什么是BeanDefinition和BeanFactory)
同时,Spring框架里面大量运用了接口和设计模式,在后面的
源码学习
中都会体现。
蓬莱阁-阁主
·
2023-12-30 14:53
Spring源码
spring
java
后端
Flink
实时电商数仓(九)
用户注册汇总表需求分析统计各窗口的注册用户数,写入Doris思路分析读取kafka用户注册主题数据转换数据结构string->JSONObject->javaBean使用user_info表中的数据代表用户注册设置水位线开窗聚合写入Doris具体实现创建用户注册统计类继承BaseApp,设置端口,并行度,kafka消费者组,kafka主题(Topic_user_register)启动zookeep
十七✧ᐦ̤
·
2023-12-30 11:16
flink
大数据
Flink
版本更新汇总(1.14-1.18)
0、汇总========1.14.0========1.有界流支持Checkpoint;2.批执行模式支持DataStream和Table/SQL混合应用;3.新增HybridSource功能;4.新增缓冲区去膨胀功能;5.新增细粒度资源管理功能;6.新增DataStream的Pulsar连接器;========1.15.0========1.支持增量的Savepoint;2.保证作业级别的指标在
猫猫爱吃小鱼粮
·
2023-12-30 09:55
flink
人工智能
大数据
Flink
实时电商数仓(八)
用户域登录各窗口汇总表主要任务:从kafka页面日志主题读取数据,统计七日回流用户:之前活跃的用户,有一段时间不活跃了,之后又开始活跃,称为回流用户当日独立用户数:同一个用户当天重复登录,只算作一个独立用户。思路分析读取kafka页面主题数据转换数据结构:String->JSONObject过滤数据,uid不为null登录的两种情况用户打开应用后自动登录用户打印应用后没有登录,浏览后跳转到登录页面
十七✧ᐦ̤
·
2023-12-30 09:55
flink
linq
数据库
Flink
DataStream 编程模型
本文是我的第一篇付费文章,这是个开篇纵览,后面会深入讲解
Flink
理论与开发,不限于
Flink
这一个组件,后面也会有Spark、Clickhouse等等,代码也会配套同步到Gitee上面(Gitee地址见文末
大数据技术派
·
2023-12-30 09:54
flink
大数据
Flink
Shuffle、Spark Shuffle、Mr Shuffle 对比
总结:1、
Flink
ShufflePipelinedShuffle:上游Subtask所在TaskManager直接通过网络推给下游Subtask的TaskManager;BlockingShuffle
猫猫爱吃小鱼粮
·
2023-12-30 09:53
flink
spark
mr
搭建
flink
集群 —— 筑梦之路
Apache
Flink
是一个框架和分布式处理引擎,用于在无边界和有边界数据流上进行有状态的计算。
Flink
能在所有常见集群环境中运行,并能以内存速度和任意规模进行计算。
筑梦之路
·
2023-12-30 09:04
大数据
linux系统运维
flink
大数据
Flink
输出至 Elasticsearch
【1】引入pom.xml依赖org.apache.
flink
flink
-connector-elasticsearch6_2.121.10.0【2】ES6Scala代码,自动导入的scala包需要修改为
程序猿进阶
·
2023-12-30 06:27
Flink
flink
elasticsearch
大数据
java
面试
后端
性能优化
Flink
cdc 2.3.0 日前发布,支持众多新特性
连接器增量快照迎来新的连接器成员2.3.0版本MongoDBCDC,OracleCDC两大连接器均支持了增量快照,实现无锁读取+并发读取+断点续传优化2.3.0版本MySQLCDC连接器性能和稳定性大幅提升
Flink
青涩的芒果汁
·
2023-12-30 06:00
技术分享
flink
数据库
大数据
mysql cdc 整库迁移 (mysql to mysql)
技术思想利用mysqlcatalog,mysqlcdc,
flink
jdbc等技术实现mysql整库迁移至下游数据库,这里是示范mysqltomysql,其他sink组件可自行扩展实现。
青涩的芒果汁
·
2023-12-30 06:00
技术分享
mysql
flink
flink
消费Kafka 空指针问题
flink
消费Kafka空指针问题error:2021-12-0210:51:55,644WARNorg.apache.
flink
.runtime.taskmanager.Task[]-Source:CustomSource
青涩的芒果汁
·
2023-12-30 06:30
技术分享
个人笔记
kafka
flink
apache
基于Rsyslog+Kafka+
Flink
+Clickhouse的高性能日志采集、分析、汇聚存储方法
在上一篇博文中介绍了简单的实用负载均衡与实时监控方案(tengine+rsyslog+goaccess),功能上是满足日常需要的。但是用户的需求是没有止境的,更何况我们做技术的都有一颗追求极致的心。在实际场景中客户需要了解平台整体UV、PV,各功能模块PV、UV,区域PV、UV,各手机型号、应用版本的使用情况,平台使用的趋势分析,功能模块的热度分析等指标。用户端精确埋点和基于Haddop的大数据采
IT 行者
·
2023-12-30 05:02
理论与实践
微服务
负载均衡
运维
PiflowX组件-WriteToKafka
计算引擎
flink
有界性StreamingAppendMode组件分组kafka端口Inport:默认端口outport:默认端口组件属性名称展示名称默认值允许值是否必填描述例子kafka_hostKAFKA_HOST
暗影八度
·
2023-12-29 23:14
大数据
hadoop
spark
flink
PiflowX组件-DataGen
具体可以查看
Flink
官方DataGenconnector。计算引擎
flink
有界性字段的数据全部生成完成后,source就结束了。因此,有界性取决于字段的有界性。
暗影八度
·
2023-12-29 23:14
PiflowX
大数据
spark
big
data
flink
flink
generic log-based incremental checkpoints 设计
背景
flink
在1.15版本后开始提供genericlog-basedincrementalcheckpoints的检查点方案,目的在于减少checkpoint的耗时,尽量缩短端到端的数据处理延迟,本文就来看下这种新类型的
lixia0417mul2
·
2023-12-29 23:43
flink
flink
数据库
oracle
上一页
19
20
21
22
23
24
25
26
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他