E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
flink流式处理
详解各类算法在
Flink
架构设计中的深入落地
身为大数据工程师,你还在苦学Spark、Hadoop、Storm,却还没搞过
Flink
?醒醒吧!
吴师兄学算法
·
2023-10-06 22:07
分布式
大数据
编程语言
flink
hadoop
flink
-cdc同步mysql数据到kafka
本文首发于我的个人博客网站等待下一个秋-
Flink
什么是CDC?CDC是(ChangeDataCapture变更数据获取)的简称。
大数据技术派
·
2023-10-06 18:50
kafka初体验基础认知部署
它主要用于解决大规模数据的实时
流式处理
和数据管道问题。Kafka是一个分布式的发布-订阅消息系统,可以快速地处理高吞吐量的数据流,并将数据实时地分发到多个消费者中。
七层汉堡王
·
2023-10-06 18:16
kafka
分布式
Flink
源码阅读之Checkpoint执行过程
前言对应
Flink
来说checkpoint的作用及重要性就不细说了,前面文章写过checkpoint的详细过程和checkpoint周期性触发过程。不熟悉checkpoint大概过程的同学可以查阅。
〇白衣卿相〇
·
2023-10-06 18:43
Flink
--9、双流联结(窗口联结、间隔联结)
星光下的赶路人star的个人主页 我还有改变的可能性,一想起这点,我就心潮澎湃文章目录1、基于时间的合流——双流联结(Join)1.1窗口联结(WindowJoin)1.2间隔联结(IntervalJoin)1、基于时间的合流——双流联结(Join)可以发现,根据某个key合并两条流,与关系型数据库中的表的joi
星光下的赶路人star
·
2023-10-06 14:45
Flink
flink
oracle
大数据
流如何关联维表-
Flink
StreamSQL代码流程解析
因公司产品需要用到
Flink
和动态维表关联的功能。
梧上擎天
·
2023-10-06 08:39
flink
集群部署
32GBbigdata-hnode1192.168.135.1134核心16GBbigdata-hnode2192.168.135.1144核心16GB安装包:https://dlcdn.apache.org/
flink
!@123
·
2023-10-06 07:38
大数据
flink
大数据
Flink
Data Transformation
1.Transformations分类
Flink
的Transformations操作主要用于将一个和多个DataStream按需转换成新的DataStream。
shangjg3
·
2023-10-05 17:46
计算引擎
Flink
flink
大数据
java
Hudi SQL DDL
本文介绍Hudi在Spark和
Flink
中使用SQL创建和更改表的支持。1.SparkSQL创建hudi表1.1创建非分区表使用标准CREATETABLE语法创建表,该语法支持分区和传递表属性。
shangjg3
·
2023-10-05 17:14
数据湖
大数据
数据仓库
flink
spark
sql
Flink
--8、时间语义、水位线(事件和窗口、水位线和窗口的工作原理、生产水位线、水位线的传递、迟到数据的处理)
星光下的赶路人star的个人主页 将自己生命力展开的人,他的存在,对别人就是愈疗文章目录1、时间语义1.1
Flink
星光下的赶路人star
·
2023-10-05 13:31
Flink
flink
数据库
大数据
数据湖|
Flink
+ Iceberg 全场景实时数仓的建设实践
整理|路培杰(
Flink
社区志愿者)摘要:Apache
Flink
是目前大数据领域非常流行的流批统一的计算引擎,数据湖是顺应云时代发展潮流的新型技术架构,以Iceberg、Hudi、Delta为代表的解决方案应运而生
大数据技术架构
·
2023-10-05 13:31
运维
大数据
分布式
编程语言
hadoop
#
Flink
的状态
1.什么是时状态(state)? 有状态的计算是流处理框架要实现的重要功能,因为稍复杂的流处理场景都需要记录状态,然后在新流入数据的基础上不断更新状态。例如以下状态都需要使用流处理的状态功能:数据流中的数据有重复,想对重复数据去重,需要记录哪些数据已经流入过应用,当新数据流入时,根据已流入过的数据来判断去重。检查输入流是否符合某个特定的模式,需要将之前流入的元素以状态的形式缓存下来。比如,判断一
独影月下酌酒
·
2023-10-05 08:13
flink
flink
大数据
flink
读取并实时监控mysql的变化到kafka里
pom.xml4.0.0com.jianxinwork_requirement1.0-SNAPSHOT1.8UTF-8UTF-82.4.1${java.version}${java.version}1.12.02.123.1.3org.apache.
flink
flink
-java
鸡康
·
2023-10-05 03:27
flink
flink
kafka
mysql
flink
cdc实时监测oracle数据库某张表的变化
Oracle参考官网的配置
Flink
CDCoracle配置如下连接oracle首先需要打开这两个服务提前创建对应目录然后cmd命令行运行以下命令--以DBA身份连接到数据库sqlplussys/oracleadminASSYSDBA
鸡康
·
2023-10-05 03:27
flink
flink
oracle
Apache
Flink
1.14.4 Release Announcement
Apache
Flink
社区非常高兴地宣布了Apache的发布
Flink
1.14.4,这是Apache
Flink
1.14的第三个bug修复版本系列。
JasonLee实时计算
·
2023-10-04 23:58
大数据-玩转数据-
Flink
海量数据实时去重
一、海量数据实时去重说明借助redis的Set,需要频繁连接Redis,如果数据量过大,对redis的内存也是一种压力;使用
Flink
的MapState,如果数据量过大,状态后端最好选择RocksDBStateBackend
人猿宇宙
·
2023-10-04 23:26
大数据-玩转数据-FLINK
flink
大数据
sql
flink
知识与理解
文章目录以词频统计为例,
flink
program的基本步骤常见的示例数据时间,窗口与水位线分层API统计窗口内topN
flink
提供的库端到端精确一次24/7savepointactor重点作业指标延迟吞吐
rookie19_HUST
·
2023-10-04 23:43
大数据
开发
flink
大数据
Linux三:软件部署
文章目录1JAVA1.1jdk1.2maven1.3tomcat2数据库2.1MySQL2.2Redis3中间件3.1nginx3.2kafka3.3
flink
3.4storm4Python31JAVA
青衫忆笙い
·
2023-10-04 21:24
LINUX
linux
kylin
mysql
redis
jdk
大数据框架对比:Hadoop、Storm、Samza、Spark和
Flink
本文转自infoq:http://www.infoq.com/cn/articles/hadoop-storm-samza-spark-
flink
简介大数据是收集、整理、处理大容量数据集,并从中获得见解所需的非传统战略和技术的总称
quiterr
·
2023-10-04 17:38
周期性触发的自定义触发器
顺便看下实现自定义触发器的一些要点周期性触发器实现实现一个每分钟触发一次的自定义事件时间触发器,实现代码和注意事项如下所示packagewikiedits.trigger;importorg.apache.
flink
.api.common.state.ValueState
lixia0417mul2
·
2023-10-04 15:26
flink
大数据
flink
flink
自定义窗口分配器
以实现我们的自己的窗口逻辑自定义窗口分配器的实现packagewikiedits.assigner;importcom.google.common.collect.Lists;importorg.apache.
flink
.api.common.ExecutionConfig
lixia0417mul2
·
2023-10-04 15:24
flink
大数据
flink
大数据
Fink Data Sink
Flink
Sink一、DataSinks在使用
Flink
进行数据处理时,数据经DataSource流入,然后通过系列Transformations的转化,最终可以通过Sink将计算结果进行输出,
Flink
DataSinks
shangjg3
·
2023-10-04 13:04
Flink
计算引擎
flink
大数据
数据仓库
Flink
Data Source
Flink
DataSource一、内置DataSource
Flink
DataSource用于定义
Flink
程序的数据来源,
Flink
官方提供了多种数据获取方法,用于帮助开发者简单快速地构建输入流,具体如下
shangjg3
·
2023-10-04 13:33
计算引擎
Flink
flink
大数据
数据仓库
Flink
状态管理与检查点机制
1.状态分类相对于其他流计算框架,
Flink
一个比较重要的特性就是其支持有状态计算。
shangjg3
·
2023-10-04 13:01
计算引擎
Flink
flink
大数据
数据仓库
Flink
- CEP监控下单付款超时通知
在电商领域通常会有这样一种需要,如果客户下单了,但是在10分钟内不付款,应该需要通知客服,再由客服寻问客户为什么还没有付款,从而提高付款效率,我们可以采用
Flink
-CEP的超时机制来处理。
kikiki4
·
2023-10-04 12:55
【征服松鼠】
Flink
on YARN验证笔记
关于
Flink
Flink
架构
Flink
是一种流式计算框架,与Spark的“微批”设计理念不同,
Flink
则将数据看作无限的和有限的数据流,支持对数据流进行逐条或者窗口式处理,从而保证数据处理延迟可以达到毫秒级
85后_老井
·
2023-10-04 10:41
大数据
Flink
(九十六):DML:Deduplication
文章目录DML:DeduplicationDML:DeduplicationDeduplication定义(支持Batch\Streaming):Deduplication其实就是去重,也即上文介绍到的TopN中row_number=1的场景,但是这里有一点不一样在于其排序字段一定是时间属性列,不能是其他非时间属性的普通列。在row_number=1时,如果排序字段是普通列planner会翻译成T
Lansonli
·
2023-10-04 09:19
大数据入门核心技术
#
Flink
大数据
flink
Flink
-application运行模式详解
/bin/
flink
runexamples/streaming/WordCount.jar执行flin
飞_侠
·
2023-10-04 09:11
Flink
---5、聚合算子、用户自定义函数、物理分区算子、分流、合流
星光下的赶路人star的个人主页 欲买桂花同载酒,终不似,少年游文章目录1、聚合算子1.1按键分区(KeyBy)1.2简单聚合(Sum/Min/MinBy/MaxBy)1.3归约聚合(Reduce)2、用户自定义函数(UDF)2.1函数类(FunctionClasses)2.2富函数类(RichFunctionC
星光下的赶路人star
·
2023-10-04 06:16
Flink
flink
大数据
java
Flink
--7、窗口(窗口的概念、分类、API、分配器、窗口函数)、触发器、移除器
星光下的赶路人star的个人主页 内心的平静始于不再让他人掌控你的感情文章目录0、前言1、窗口(Window)1.1窗口的概念1.2窗口的分类1.3窗口API概览1.4窗口分配器(WindowAssigner)1.4.1时间窗口1.4.2计数窗口1.5窗口函数1.5.1增量聚合函数(ReduceFunction/
星光下的赶路人star
·
2023-10-04 06:46
Flink
flink
大数据
数据库
FFA 2021 专场解读 - 实时数据湖
公众号更名公告「
Flink
中文社区」更名为「Apache
Flink
」感谢你们的关注▼关注「Apache
Flink
」视频号,遇见更多大咖▼
Flink
ForwardAsia2021重磅开启,全球40+多行业一线厂商
Apache Flink
·
2023-10-03 21:19
网易
大数据
人工智能
编程语言
hadoop
大数据-玩转数据-
Flink
+Hologres构建实时数仓
阿里云实时计算
Flink
版(以下简称“阿里云Flin
人猿宇宙
·
2023-10-03 21:18
大数据-玩转数据-阿里系
大数据
flink
运维
大数据-玩转数据-双流JOIN
一、双流JOIN在
Flink
中,支持两种方式的流的Join:WindowJoin和IntervalJoin二、WindowJoin窗口join会join具有相同的key并且处于同一个窗口中的两个流的元素
人猿宇宙
·
2023-10-03 21:47
大数据-玩转数据-FLINK
大数据
flink
sql
Flink
DataSet 常用几种读取文件方式--Scala
1、环境jdk1.8.0_108Scala2.11.8
Flink
1.7.2MySql8.0.132、Maven依赖 org.apache.
flink
flink
-scala_2.11 1.7.2
笨鸟先飞-天道酬勤
·
2023-10-03 19:03
Flink
大数据
Flink
DataSet
文件读取
Debezium日常分享系列之:使用数据库中的数据流进行在线机器学习
Debezium日常分享系列之:使用数据库中的数据流进行在线机器学习一、背景介绍二、数据集准备三、使用Apache
Flink
进行分类四、使用Debezium和Kafka作为源数据流五、构建
Flink
流k-means
最笨的羊羊
·
2023-10-03 13:07
日常分享专栏
Debezium日常分享系列
数据库
数据流进行在线机器学习
Flink
整合 Apollo,动态更新
Flink
作业配置
本人自己录的视频,讲解
Flink
整和Apollo,动态更新作业配置,无需重启作业!
zhisheng_blog
·
2023-10-03 10:54
Flink
侧流输出源码解析
Flink
侧流输出源码解析
Flink
的sideoutput为我们提供了侧流(分流)输出的功能,根据条件可以把一条流分为多个不同的流,之后做不同的处理逻辑,下面就来看下侧流输出相关的源码。
JasonLee实时计算
·
2023-10-03 09:45
【Azure 事件中心】Event Hub Client 连接超时(OperationTimeout)测试及解说
AzureEventHub(Azure事件中心)是大数据
流式处理
平台和事件引入服务。它可以每秒接收和处理数百万个事件。
云中路灯
·
2023-10-03 08:30
小白学习
Flink
系列--第二篇-02(流式数据模型)
Theworldbeyondbatch:Streaming102原文作者:TylerAkidau译者:董捷简介欢迎回来!如果你错过了前一篇博文,Theworldbeyondbatch:Streaming101,我强烈建议先花一点时间阅读第一篇博文。第一篇博文介绍了我接下来讲述的这篇博文的一些必要的基础,我假设本篇博文的读者已经熟悉了前一篇博文内介绍的名词与概念。同时,请注意本篇博文里包含了许多动画
菜鸡大数据
·
2023-10-03 07:32
从零开始学Flink
flink
Flink
操作——状态与容错
文章目录Checkpoints概述检查点存储可用的检查点存储选项JobManagerCheckpointStorageFileSystemCheckpointStorage检查点保留目录结构从保留的检查点恢复Checkpointingunderbackpressure缓冲区Debloating非对齐Checkpoints对齐Checkpoint的超时限制并发Checkpoint与Watermark
京河小蚁
·
2023-10-03 07:32
flink
flink
大数据
(八)
Flink
DataStream API 编程指南 - 2 执行模式
DataStreamAPI支持不同的运行时执行模式,你可以根据你的用例需要和作业特点进行选择。DataStreamAPI有一种”经典“的执行行为,我们称之为流(STREAMING)执行模式。这种模式适用于需要连续增量处理,而且预计无限期保持在线的无边界作业。此外,还有一种批式执行模式,我们称之为批(BATCH)执行模式。这种执行作业的方式更容易让人联想到批处理框架,比如MapReduce。这种执行
京河小蚁
·
2023-10-03 07:02
flink
flink
big
data
flink
-窗口
本文档重点介绍如何在
Flink
中执行窗口操作,以及程序员如何从其提供的功能中获得最大的好处。一个有窗口的
Flink
程序的一般结构如下所示。第一个片段指的是键控流,而第二个片段指的是非键控流。
ssehs
·
2023-10-03 07:01
笔记
一文搞懂
Flink
的 Exactly Once 和 At Least Once
本文由知识星球小伙伴范瑞投稿,原文地址:https://www.jianshu.com/p/8d6569361999本文主要为了让你搞懂
Flink
的ExactlyOnce和AtLeastOnce,如果看完之后
zhisheng_blog
·
2023-10-03 07:01
Flink
1.13批流合一的介绍
官网:Apache
Flink
Documentation|Apache
Flink
概况以前由于对
flink
不是很熟悉,
flink
主要是还是流的模式,而且
flink
版本更新迭代比较快,对
flink
流批一直比较模糊
javastart
·
2023-10-03 07:31
flink
flink
flink
的计时器
背景在
flink
中,我们经常使用ontimer计时器实现很多逻辑的功能,常见的比如某个传感器温度增加连续超过1分钟的告警输出等,本文就来简单记录下计时器的作用计时器ontimer的定义publicvoidonTimer
lixia0417mul2
·
2023-10-03 07:31
flink
大数据
flink
大数据
flink
处理函数--副输出功能
背景在
flink
中,如果你想要访问记录的处理时间或者事件时间,注册定时器,或者是将记录输出到多个输出流中,你都需要处理函数的帮助,本文就来通过一个例子来讲解下副输出副输出本文还是基于streaming-with-
flink
lixia0417mul2
·
2023-10-03 07:01
flink
大数据
flink
算法
大数据
大数据
Flink
(九十五):DML:Window TopN
文章目录DML:WindowTopNDML:WindowTopNWindowTopN定义(支持Streaming):WindowTopN是一种特殊的TopN,它的返回结果是每一个窗口内的N个最小值或者最大值。应用场景
Lansonli
·
2023-10-03 07:53
大数据入门核心技术
#
Flink
flink
大数据
《程序员必读的职业规划书》读后感
背景最近在学习
flink
相关知识的时候,偶然翻到一些人的博客,从博客中得知这本书。书名虽然比较low,但是笔者最近正好在个人发展方向上遇到一些问题,索性买来读一读。
外星人rsz
·
2023-10-03 03:03
flink
学习笔记 — 编程模型
flink
抽象分层结构
flink
作为
流式处理
框架,不仅具有高效的流数据和批数据处理性能,具有针对开发人员使用的高效的底层API,同时有方便分析人员使用的table/sqlAPI。
飞不高的老鸟
·
2023-10-02 16:22
大数据-玩转数据-
Flink
SQL编程实战 (热门商品TOP N)
一、需求描述每隔30min统计最近1hour的热门商品top3,并把统计的结果写入到mysql中。二、需求分析1.统计每个商品的点击量,开窗2.分组窗口分组3.over窗口三、需求实现3.1、创建数据源示例input/UserBehavior.csv543462,1715,1464116,pv,1511658000662867,2244074,1575622,pv,1511658000561558
人猿宇宙
·
2023-10-02 15:57
大数据-玩转数据-FLINK
大数据
flink
sql
上一页
63
64
65
66
67
68
69
70
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他