E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
flink流式处理
Flink
SQL深度篇
Flink
SQL深度篇问题导读怎样优化LogicalPlan?怎样优化StreamGraph?TimeWindow,EventTime,ProcessTime和Watermark四者之间的关系是什么?
不爱吃鱼的馋猫
·
2023-11-24 11:22
flink
思考: 为什么
Flink
要弃用Scala API呢?
1.问题描述最近在学习
Flink
API的时候,发现官网声明要废弃ScalaAPI,但是为什么呢?
广阔天地大有可为
·
2023-11-24 11:22
#
Flink
API
使用技巧
scala
flink
spark
一网打尽
Flink
中的时间、窗口和流Join
接下来,我们将会使用
Flink
的windowAPI,它提供了通常使用的各种窗口类型的内置实现。我们将会学到如何进行用户自定义窗口操作符,以及窗口的核心功能:assigners(分配器)
王知无(import_bigdata)
·
2023-11-24 11:20
触发器
flink
stream
java
mapreduce
大数据之使用
Flink
消费Kafka中topic为ods_mall_data的数据,根据数据中不同的表将数据分别分发至kafka的DWD层
由于设备问题,代码执行结果以及数据的展示无法给出,可参照我以往的博客其中有相同数据源展示题目:提示:以下是本篇文章正文内容,下面案例可供参考(使用Scala语言编写)一、读题分析涉及组件:Scala,
Flink
约定Da于配置
·
2023-11-24 11:49
大数据技术
kafka
大数据
flink
scala
spark
Day77_
Flink
(三)
Flink
时间语义和水印
课程大纲课程内容学习效果掌握目标时间语义EventTime掌握IngestionTime掌握ProcessingTime掌握水印水印掌握一、时间语义scala的集合分为了两类,一类是可变的集合(集合可以执行增删改查操作),另一类是不可变集合(集合元素在初始化的时候确定,后续只能进行查,有的可以进行修改,有的不可以)。二者可能名称一样,但是在不同的包下面,对应的包为:scala.collection
dogedong
·
2023-11-24 11:49
#
flink
scala
大数据
Flink
迟到元素的处理
前言前面文章
Flink
中的时间语义和WaterMark有详细介绍过
Flink
WaterMark。WaterMark的出现是用来解决乱序时间的处理也就是处理迟到元素的。
shenjianyu_rex
·
2023-11-24 11:49
flink
flink
大数据
scala
Flink
部署安装及其WorldCount执行
Flink
启动及其WorldCount执行大家好,是瓜哥,最近几年,大数据处理组件
Flink
非常火,作为一个从事多年java的老程序员,也得跟上时代的技步伐,不然迟早就会被这个技术千变万化的时代抛弃。
IT瓜哥-杨得朝
·
2023-11-24 11:18
大数据
flink
scala
大数据
Flink
State and Checkpoint、Scala中获取类对象、通过checkpoint来恢复之前的状态、process...
目录
Flink
StateandCheckpointStateValueStateCheckpoint通过checkpoint来恢复之前的状态1、从
Flink
web页面2、通过
flink
命令StateListStateReducingState
Flink
StateandCheckpoint
Flink
赤兔胭脂小吕布
·
2023-11-24 11:18
scala
flink
spark
java
大数据
Flink
的状态管理机制
一、前言有状态的计算是流处理框架要实现的重要功能,因为稍复杂的流处理场景都需要记录状态,然后在新流入数据的基础上不断更新状态。下面的几个场景都需要使用流处理的状态功能:数据流中的数据有重复,想对重复数据去重,需要记录哪些数据已经流入过应用,当新数据流入时,根据已流入过的数据来判断去重。检查输入流是否符合某个特定的模式,需要将之前流入的元素以状态的形式缓存下来。比如,判断一个温度传感器数据流中的温度
江畔独步
·
2023-11-24 11:17
Flink
flink
flink
从入门到精通-
flink
简介
文章目录
flink
简介名称的由来什么是
flink
为什么需要
flink
流式计算框架比较模型StreamingModelAPI形式保证机制容错机制状态管理
flink
基本概念
flink
架构图JobManagerJobManager
星&海
·
2023-11-24 11:16
flink
flink
big
data
Flink
窗口 Window
官网地址窗口|Apache
Flink
Windowsareattheheartofprocessinginfinitestreams.Windowssplitthestreaminto“buckets”offinitesize
GrassEva
·
2023-11-24 11:43
flink学习笔记
flink
java
为什么
Flink
抛弃了 Scala
可如今,
Flink
竟然公开宣布弃用Scala在
Flink
1.18的官方文档里,有一句非常严肃的话:所有的
Flink
ScalaAPIs已被标记为废弃,且将在未来版本中予以移除。
shengjk1
·
2023-11-24 10:40
Apache
Flink
flink
scala
大数据
Flink
SQL 1.11新功能详解:Hive 数仓实时化 &
Flink
SQL + CDC 实践
问题导读1.
Flink
1.11有哪些新功能?2.如何使用
flink
-cdc-connectors捕获MySQL和Postgres的数据变更?
000X000
·
2023-11-24 06:18
Flink1.11
实时数仓
实时计算
Flink
SQL
1.11
Flink
实战(八十二):
flink
-sql使用(九)
Flink
sql 解析复杂(嵌套)JSON
原文链接:http://apache-
flink
.147419.n8.nabble.com/
flink
-1-10-sql-kafka-format-json-schema-json-object-td4665
王知无(import_bigdata)
·
2023-11-24 06:44
Flink系统性学习专栏
json
flink
sql
《十堂课学习
Flink
SQL》第一章:引言和背景
第一章是关于
Flink
SQL课程的引言和背景。这一章旨在概述有关大数据处理、流处理以及
Flink
SQL的基础知识,以便接下来能够更好地结合上下文进行学习。
smile-yan
·
2023-11-24 06:05
学习
flink
sql
Flink
的状态管理
目录
Flink
中的状态管理状态的原因
Flink
的状态分类ManagedState和RawStateOperatorStateKeyedState状态一致性原文地址:https://program-park.github.io
大Null
·
2023-11-24 06:01
Flink
flink
Flink
状态管理之状态清除StateTtlConfig
1、
Flink
状态去重场景在
Flink
运行的时候,往往是无休止的运行,在整个
Flink
程序运行的长河中,往往会出现很多状态的出现,那么状态的生命周期,也就是创建、使用和销毁,那么在我们写
flink
程序过程中
中国好胖子、
·
2023-11-24 06:29
Flink
flink
状态
state
flink
状态管理
flink
的状态管理机制由于
flink
考虑到程序可能会因为某些不可预知的问题导致任务失败,而恢复作业又需要找到上次任务的断点,因此引出了
flink
状态机制。
呆呆敲代码敲到呆
·
2023-11-24 06:29
Flink(java版)心得
flink
java
Flink
状态管理及状态后端配置
Flink
状态管理及状态后端配置目录
Flink
状态管理及状态后端配置1.什么是状态2.为什么需要管理状态3.
Flink
中的状态分类4.ManagedState的分类5.算子状态的使用案例1:列表状态案例
大数据面壁者
·
2023-11-24 06:58
flink
flink
【
Flink
】Standalone运行模式
2、单作业模式部署
Flink
的Standalone集群并不支持单作业模式部署。因为单作业模式需要借助一些
lxtx-0510
·
2023-11-24 06:57
flink
大数据
java
Flink
状态管理和容错
Flink
状态管理和容错一有状态的计算1.1原生方式1.2托管方式1.2.1keyedstate1.2.1.1ValueState1.2.1.2ListState1.2.1.3ReducingState1.2.1.4MapState
m0_夏黎
·
2023-11-24 06:54
大数据
flink
【
Flink
】状态管理
目录1、状态概述1.1无状态算子1.2有状态算子2、状态分类编辑2.1算子状态2.1.1列表状态(ListState)2.1.2联合列表状态(UnionListState)2.1.3广播状态(BroadcastState)2.2按键分区状态2.2.1值状态(ValueState)2.2.2列表状态(ListState)2.2.3Map状态(MapState)2.2.4归约状态(ReducingSt
lxtx-0510
·
2023-11-24 06:47
flink
大数据
java
intellij-idea
Kafka集成
Flink
集成
Flink
一、
Flink
环境准备二、
Flink
生产者1.在包名下创建java类:
Flink
KafkaProducer三、
Flink
消费者
Flink
是一个在大数据开发中非常常用的组件。
Smartaotao
·
2023-11-24 04:46
Kafka
kafka
Hbase - 自定义Rowkey规则
>在
Flink
中我们有时候需要分析数据1点到2点的范围,可是经过Region又比较慢,这时候我们就可以定制`TableInputFormat`来实现我们的需求了,我们还可以采用
Flink
的`DataSet
kikiki5
·
2023-11-23 23:03
使用JMX监控ZooKeeper和Kafka
JVM默认会通过JMX的方式暴露基础指标,很多中间件也会通过JMX的方式暴露业务指标,比如Kafka、Zookeeper、ActiveMQ、Cassandra、Spark、Tomcat、
Flink
等等。
跟着大数据和AI去旅行
·
2023-11-23 23:16
大数据企业级实战
zookeeper
kafka
监控
flink
quick start
1.
flink
安装与环境变量配置1.1下载安装
flink
https://www.apache.org/dyn/closer.lua/
flink
/
flink
-1.11.1/
flink
-1.11.1-bin-scala
夏天_edbf
·
2023-11-23 23:59
Flink
替换 Logstash 解决日志收集丢失问题
在某客户日志数据迁移到火山引擎使用ELK生态的案例中,由于客户反馈之前Logstash经常发生数据丢失和收集性能较差的使用痛点,我们尝试使用
Flink
替代了传统的Logstash来作为日志数据解析、转换以及写入
字节跳动云原生计算
·
2023-11-23 18:31
flink
大数据
Kallisto原理及应用
《Near-optimalprobabilisticRNA-seqquantification》(http://dx.doi.org/10.1038/nbt.3519)这款软件对比TopHat+cuf
flink
s
小潤澤
·
2023-11-23 09:44
Flink
CDC + OceanBase 全增量一体化数据集成方案
本文整理自OceanBase技术专家王赫(川粉)在5月21日
Flink
CDCMeetup的演讲。
Apache Flink
·
2023-11-23 09:44
数据库
java
mysql
大数据
flink
基于流计算 Oceanus(
Flink
) CDC 做好数据集成场景
作者:黄龙,腾讯CSIG高级工程师数据时代,企业对技术创新和服务水准的要求不断提高,数据已成为企业极其重要的资产。无论是在在企业数据中台的建设,亦或者是打造一站式数据开发和数据治理的PASS平台。首先需要做的就是进行跨应用的数据融合计算,需要将数据从孤立的数据源中采集出来,汇集到可被计算平台高效访问的目的地。此过程称之为ETL。通常所说的同步大致分为离线全量ETL、离线增量+离线全量的ETL、实时
腾讯云大数据
·
2023-11-23 09:07
数据库
大数据
分布式
编程语言
hadoop
实时数仓:基于
Flink
CDC 实现 Oracle 数据实时更新到 Kudu
作者:于乐,腾讯CSIG工程师解决方案描述概述
Flink
CDC于2021年11月15日发布了最新版本2.1,该版本通过引入内置Debezium组件,增加了对Oracle的支持。
腾讯云大数据
·
2023-11-23 09:07
数据库
大数据
hadoop
java
mysql
基于
Flink
CDC 打造企业级实时数据集成方案
本文整理自
Flink
数据通道的
Flink
负责人、
Flink
CDC开源社区的负责人、Apache
Flink
社区的PMC成员徐榜江在云栖大会开源大数据专场的分享。
阿里云大数据AI技术
·
2023-11-23 09:05
flink
mfc
大数据
Flink
水位线传递
1、水位线概述因为之前在面试的过程中,被问到了水位线传递的原理,所以做一次总结。我们知道水位线是数据流中插入的一个标记,用来表示事件时间的进展,它会随着数据一起在任务间传递。如果只是直通式(forward)的传输,那很简单,数据和水位线都是按照本身的顺序依次传递、依次处理的;一旦水位线到达了算子任务,那么这个任务就会将它内部的时钟设为这个水位线的时间戳。在这里,“任务的时钟”其实仍然是各自为政的,
wenlongxunmeng
·
2023-11-23 09:01
flink
flink
大数据
Flink
水位线
在数据实时分析的时候,关注的是数据的顺序性,特别是用
Flink
接收数据的时候考虑到流量在突然到来的峰值,
flink
反压导致了数据到达处理task的时候时间怎么对齐的问题。
Norris Huang
·
2023-11-23 09:58
flink
watermark
Flink
水位线之watermark原理及实战
watermark概念
Flink
实际上是用watermarks来实现Event-Time的功能。watermark在
Flink
中也属于特殊事件,其精髓在于当某个运算值收到。
不看白不看,看了不白看
·
2023-11-23 09:28
Flink系列
flink
分享一份京东大数据技术官私藏:Kafka核心设计与实践原理
目前Kafka已经定位为一个分布式
流式处理
平台,它以高吞吐、可持久化、可水平扩展、支持流数据处理等多种特性而被广泛使用。
m0_64926671
·
2023-11-23 09:53
Java
kafka
big
data
java
使用 JMX-Exporter 监控 Kafka 和 Zookeeper
JVM默认会通过JMX的方式暴露基础指标,很多中间件也会通过JMX的方式暴露业务指标,比如Kafka、Zookeeper、ActiveMQ、Cassandra、Spark、Tomcat、
Flink
等等。
夜莺云原生监控
·
2023-11-23 09:23
kafka
zookeeper
运维
jvm
Flink
CDC实现主数据与各业务系统数据的一致性(瀚高、TIDB)
文章末尾附有
flink
cdc对应瀚高数据库
flink
-cdc-connector代码下载地址1、业务需求目前项目有主数据系统和N个业务系统,为保障“一数一源”,各业务系统表涉及到主数据系统的字段都需用主数据系统表中的字段进行实时覆盖
陆继森
·
2023-11-23 09:22
tidb
flink
数据仓库
几分钟明白
Flink
水位线
Flink
水位线1、
Flink
中不同的事件概念Processingtime(处理时间):即事件被机器处理的时间,事件流向某个算子的系统时间EventTime(事件时间):事件时间是再某个生产设备上发生时间
每日小新
·
2023-11-23 09:51
Java+大数据之旅
日常一学
Flink
watermark
【
FLink
】水位线(Watermark)
目录1、关于时间语义1.1事件时间1.2处理时间编辑2、什么是水位线2.1顺序流和乱序流2.2乱序数据的处理2.3水位线的特性3、水位线的生成3.1生成水位线的总体原则3.2水位线生成策略3.3
Flink
lxtx-0510
·
2023-11-23 09:45
大数据之Flink
flink
大数据
【
Flink
】Process Function
目录1、ProcessFunction解析1.1抽象方法.processElement()1.2非抽象方法.onTimer()2、
Flink
中8个不同的处理函数2.1ProcessFunction2.2KeyedProcessFunction2.3ProcessWindowFunction2.4ProcessAllWindowFunction2.5CoProcessFunction2.6Proce
lxtx-0510
·
2023-11-23 09:15
大数据之Flink
flink
大数据
java
程序人生
flink
1.13.6版本的应用程序(maven版)
问题想要一个指定
flink
版本的java计算任务helloworld最简工程。
亚林瓜子
·
2023-11-23 07:51
maven
java
flink
Flink
实时数仓项目—DWD层设计与实现
Flink
实时数仓项目—DWD层设计与实现前言一、功能三:订单宽表1.需求描述2.需求分析3.思路分析与代码实现3.1实体类的创建3.2读取Kafka订单数据和订单明细数据3.3双流Join—关联事实表
自学大数据的菜鸡
·
2023-11-23 07:17
大数据项目
Flink
实时数仓
大数据
数据仓库
flink
实时数仓维度关联的旁路缓存与异步IO
因此Hbase的读数据速度就不能满足时效性要求,上游kafka数据发送过多而下游处理时间不够导致
flink
反压机制触发,任务处于亚健康状态。
菜鸟一枚7
·
2023-11-23 07:16
缓存
数据库
redis
(一)
flink
介绍
文章目录1.1:
FLINK
简介1:特性2:
flink
的状态和容错checkpoint2.1:状态1:OperatorState算子状态2:KeyedState状态3:状态后端(存储状态)2.2:
flink
猿来如此dj
·
2023-11-23 07:44
flink
flink
big
data
java
Flink
异步IO查询Hbase数据,采用旁路缓存redis
importcom.alibaba.druid.pool.DruidDataSource;importcom.alibaba.druid.pool.DruidPooledConnection;importcom.alibaba.fastjson.JSONObject;importcom.atguigu.utils.DimUtil;importcom.atguigu.utils.DruidDSUti
小总结
·
2023-11-23 07:12
redis
缓存
flink
hbase
Flink
内核原理与实现-核心抽象
Flink
API提供了开发的接口,此外,为了实现业务逻辑,还必须为开发者提供自定义业务逻辑的能力。。
857技术社区
·
2023-11-23 07:09
Flink
Flink
内核原理与实现
Flink
实时数仓完结
文章目录主要框架版本选型集群服务器规划实时架构架构的选择分层分析
Flink
CDC的选取旁路缓存优化异步查询优化先看项目成品的效果GitHub地址:https://github.com/GTyingzi/
未来影子
·
2023-11-23 07:09
Flink
大数据项目
flink
kafka
大数据
Flink
优化
标准的
Flink
任务提交脚本(GenericCLI模式)从1.11开始,增加了通用客户端模式,参数使用-D指定bin/
flink
run\-tyarn-per-job\-d\-p3\指定并行度-Dyarn.application.queue
Lan_feng_kang
·
2023-11-23 07:02
flink
大数据
关于
Flink
的旁路缓存与异步操作
1.旁路缓存1.什么是旁路缓存?将数据库中的数据,比较经常访问的数据,保存起来,以减少和硬盘数据库的交互比如:我们使用mysql时经常查询一个表,而这个表又一般不会变化,就可以放在内存中,查找时直接对内存进行查找,而不需要再和mysql交互2.旁路缓存例子使用dim层使用的是hbase存储,因为dim层可能会出现大表,出现数据量过大,所以存储到磁盘合适,使用hbase而dwd的连接,dwd是从ka
叫我莫言鸭
·
2023-11-23 06:29
flink
缓存
大数据
上一页
33
34
35
36
37
38
39
40
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他