E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Flink流处理
《十堂课学习
Flink
SQL》第一章:引言和背景
第一章是关于
Flink
SQL课程的引言和背景。这一章旨在概述有关大数据处理、
流处理
以及
Flink
SQL的基础知识,以便接下来能够更好地结合上下文进行学习。
smile-yan
·
2023-11-24 06:05
学习
flink
sql
Flink
的状态管理
目录
Flink
中的状态管理状态的原因
Flink
的状态分类ManagedState和RawStateOperatorStateKeyedState状态一致性原文地址:https://program-park.github.io
大Null
·
2023-11-24 06:01
Flink
flink
Flink
状态管理之状态清除StateTtlConfig
1、
Flink
状态去重场景在
Flink
运行的时候,往往是无休止的运行,在整个
Flink
程序运行的长河中,往往会出现很多状态的出现,那么状态的生命周期,也就是创建、使用和销毁,那么在我们写
flink
程序过程中
中国好胖子、
·
2023-11-24 06:29
Flink
flink
状态
state
flink
状态管理
flink
的状态管理机制由于
flink
考虑到程序可能会因为某些不可预知的问题导致任务失败,而恢复作业又需要找到上次任务的断点,因此引出了
flink
状态机制。
呆呆敲代码敲到呆
·
2023-11-24 06:29
Flink(java版)心得
flink
java
Flink
状态管理及状态后端配置
Flink
状态管理及状态后端配置目录
Flink
状态管理及状态后端配置1.什么是状态2.为什么需要管理状态3.
Flink
中的状态分类4.ManagedState的分类5.算子状态的使用案例1:列表状态案例
大数据面壁者
·
2023-11-24 06:58
flink
flink
【
Flink
】Standalone运行模式
2、单作业模式部署
Flink
的Standalone集群并不支持单作业模式部署。因为单作业模式需要借助一些
lxtx-0510
·
2023-11-24 06:57
flink
大数据
java
Flink
状态管理和容错
Flink
状态管理和容错一有状态的计算1.1原生方式1.2托管方式1.2.1keyedstate1.2.1.1ValueState1.2.1.2ListState1.2.1.3ReducingState1.2.1.4MapState
m0_夏黎
·
2023-11-24 06:54
大数据
flink
【
Flink
】状态管理
目录1、状态概述1.1无状态算子1.2有状态算子2、状态分类编辑2.1算子状态2.1.1列表状态(ListState)2.1.2联合列表状态(UnionListState)2.1.3广播状态(BroadcastState)2.2按键分区状态2.2.1值状态(ValueState)2.2.2列表状态(ListState)2.2.3Map状态(MapState)2.2.4归约状态(ReducingSt
lxtx-0510
·
2023-11-24 06:47
flink
大数据
java
intellij-idea
Kafka集成
Flink
集成
Flink
一、
Flink
环境准备二、
Flink
生产者1.在包名下创建java类:
Flink
KafkaProducer三、
Flink
消费者
Flink
是一个在大数据开发中非常常用的组件。
Smartaotao
·
2023-11-24 04:46
Kafka
kafka
逸学java【初级菜鸟篇】9.3 Stream流
流处理
我们首先理解什么是
流处理
,它类似于sql语句,可以执行非常复杂的过滤,映射,查找,收集等功能,且代码很少,但是可读性不高。字如其名,它的处理如同流淌的水一样,或者可以理解为流水线一样。
逸尘666
·
2023-11-24 02:05
逸学JAVA
java
基础
java
开发语言
Hbase - 自定义Rowkey规则
>在
Flink
中我们有时候需要分析数据1点到2点的范围,可是经过Region又比较慢,这时候我们就可以定制`TableInputFormat`来实现我们的需求了,我们还可以采用
Flink
的`DataSet
kikiki5
·
2023-11-23 23:03
使用JMX监控ZooKeeper和Kafka
JVM默认会通过JMX的方式暴露基础指标,很多中间件也会通过JMX的方式暴露业务指标,比如Kafka、Zookeeper、ActiveMQ、Cassandra、Spark、Tomcat、
Flink
等等。
跟着大数据和AI去旅行
·
2023-11-23 23:16
大数据企业级实战
zookeeper
kafka
监控
flink
quick start
1.
flink
安装与环境变量配置1.1下载安装
flink
https://www.apache.org/dyn/closer.lua/
flink
/
flink
-1.11.1/
flink
-1.11.1-bin-scala
夏天_edbf
·
2023-11-23 23:59
Flink
替换 Logstash 解决日志收集丢失问题
在某客户日志数据迁移到火山引擎使用ELK生态的案例中,由于客户反馈之前Logstash经常发生数据丢失和收集性能较差的使用痛点,我们尝试使用
Flink
替代了传统的Logstash来作为日志数据解析、转换以及写入
字节跳动云原生计算
·
2023-11-23 18:31
flink
大数据
HDFS分布式原理---概念篇
分布式系统2018年10月9日11:50什么是大数据:短时间内快速的产生海量的多种多样的有价值的数据大数据的技术:分布式存储分布式计算分布式批处理数据积攒一段时间,在未来某一时刻一次性计算一批数据分布式
流处理
数据实时进行计算
hjy1821
·
2023-11-23 14:16
HDFS原理
HDFS
分布式存储原理
大数据
Kallisto原理及应用
《Near-optimalprobabilisticRNA-seqquantification》(http://dx.doi.org/10.1038/nbt.3519)这款软件对比TopHat+cuf
flink
s
小潤澤
·
2023-11-23 09:44
Flink
CDC + OceanBase 全增量一体化数据集成方案
本文整理自OceanBase技术专家王赫(川粉)在5月21日
Flink
CDCMeetup的演讲。
Apache Flink
·
2023-11-23 09:44
数据库
java
mysql
大数据
flink
基于流计算 Oceanus(
Flink
) CDC 做好数据集成场景
作者:黄龙,腾讯CSIG高级工程师数据时代,企业对技术创新和服务水准的要求不断提高,数据已成为企业极其重要的资产。无论是在在企业数据中台的建设,亦或者是打造一站式数据开发和数据治理的PASS平台。首先需要做的就是进行跨应用的数据融合计算,需要将数据从孤立的数据源中采集出来,汇集到可被计算平台高效访问的目的地。此过程称之为ETL。通常所说的同步大致分为离线全量ETL、离线增量+离线全量的ETL、实时
腾讯云大数据
·
2023-11-23 09:07
数据库
大数据
分布式
编程语言
hadoop
实时数仓:基于
Flink
CDC 实现 Oracle 数据实时更新到 Kudu
作者:于乐,腾讯CSIG工程师解决方案描述概述
Flink
CDC于2021年11月15日发布了最新版本2.1,该版本通过引入内置Debezium组件,增加了对Oracle的支持。
腾讯云大数据
·
2023-11-23 09:07
数据库
大数据
hadoop
java
mysql
基于
Flink
CDC 打造企业级实时数据集成方案
本文整理自
Flink
数据通道的
Flink
负责人、
Flink
CDC开源社区的负责人、Apache
Flink
社区的PMC成员徐榜江在云栖大会开源大数据专场的分享。
阿里云大数据AI技术
·
2023-11-23 09:05
flink
mfc
大数据
Flink
水位线传递
1、水位线概述因为之前在面试的过程中,被问到了水位线传递的原理,所以做一次总结。我们知道水位线是数据流中插入的一个标记,用来表示事件时间的进展,它会随着数据一起在任务间传递。如果只是直通式(forward)的传输,那很简单,数据和水位线都是按照本身的顺序依次传递、依次处理的;一旦水位线到达了算子任务,那么这个任务就会将它内部的时钟设为这个水位线的时间戳。在这里,“任务的时钟”其实仍然是各自为政的,
wenlongxunmeng
·
2023-11-23 09:01
flink
flink
大数据
Flink
水位线
在数据实时分析的时候,关注的是数据的顺序性,特别是用
Flink
接收数据的时候考虑到流量在突然到来的峰值,
flink
反压导致了数据到达处理task的时候时间怎么对齐的问题。
Norris Huang
·
2023-11-23 09:58
flink
watermark
Flink
水位线之watermark原理及实战
watermark概念
Flink
实际上是用watermarks来实现Event-Time的功能。watermark在
Flink
中也属于特殊事件,其精髓在于当某个运算值收到。
不看白不看,看了不白看
·
2023-11-23 09:28
Flink系列
flink
分享一份京东大数据技术官私藏:Kafka核心设计与实践原理
目前越来越多的开源分布式处理系统如Cloudera、Storm、Spark、
Flink
等都支持与Kafk
m0_64926671
·
2023-11-23 09:53
Java
kafka
big
data
java
使用 JMX-Exporter 监控 Kafka 和 Zookeeper
JVM默认会通过JMX的方式暴露基础指标,很多中间件也会通过JMX的方式暴露业务指标,比如Kafka、Zookeeper、ActiveMQ、Cassandra、Spark、Tomcat、
Flink
等等。
夜莺云原生监控
·
2023-11-23 09:23
kafka
zookeeper
运维
jvm
Flink
CDC实现主数据与各业务系统数据的一致性(瀚高、TIDB)
文章末尾附有
flink
cdc对应瀚高数据库
flink
-cdc-connector代码下载地址1、业务需求目前项目有主数据系统和N个业务系统,为保障“一数一源”,各业务系统表涉及到主数据系统的字段都需用主数据系统表中的字段进行实时覆盖
陆继森
·
2023-11-23 09:22
tidb
flink
数据仓库
几分钟明白
Flink
水位线
Flink
水位线1、
Flink
中不同的事件概念Processingtime(处理时间):即事件被机器处理的时间,事件流向某个算子的系统时间EventTime(事件时间):事件时间是再某个生产设备上发生时间
每日小新
·
2023-11-23 09:51
Java+大数据之旅
日常一学
Flink
watermark
【
FLink
】水位线(Watermark)
目录1、关于时间语义1.1事件时间1.2处理时间编辑2、什么是水位线2.1顺序流和乱序流2.2乱序数据的处理2.3水位线的特性3、水位线的生成3.1生成水位线的总体原则3.2水位线生成策略3.3
Flink
lxtx-0510
·
2023-11-23 09:45
大数据之Flink
flink
大数据
【
Flink
】Process Function
目录1、ProcessFunction解析1.1抽象方法.processElement()1.2非抽象方法.onTimer()2、
Flink
中8个不同的处理函数2.1ProcessFunction2.2KeyedProcessFunction2.3ProcessWindowFunction2.4ProcessAllWindowFunction2.5CoProcessFunction2.6Proce
lxtx-0510
·
2023-11-23 09:15
大数据之Flink
flink
大数据
java
程序人生
flink
1.13.6版本的应用程序(maven版)
问题想要一个指定
flink
版本的java计算任务helloworld最简工程。
亚林瓜子
·
2023-11-23 07:51
maven
java
flink
Flink
实时数仓项目—DWD层设计与实现
Flink
实时数仓项目—DWD层设计与实现前言一、功能三:订单宽表1.需求描述2.需求分析3.思路分析与代码实现3.1实体类的创建3.2读取Kafka订单数据和订单明细数据3.3双流Join—关联事实表
自学大数据的菜鸡
·
2023-11-23 07:17
大数据项目
Flink
实时数仓
大数据
数据仓库
flink
实时数仓维度关联的旁路缓存与异步IO
因此Hbase的读数据速度就不能满足时效性要求,上游kafka数据发送过多而下游处理时间不够导致
flink
反压机制触发,任务处于亚健康状态。
菜鸟一枚7
·
2023-11-23 07:16
缓存
数据库
redis
(一)
flink
介绍
文章目录1.1:
FLINK
简介1:特性2:
flink
的状态和容错checkpoint2.1:状态1:OperatorState算子状态2:KeyedState状态3:状态后端(存储状态)2.2:
flink
猿来如此dj
·
2023-11-23 07:44
flink
flink
big
data
java
Flink
异步IO查询Hbase数据,采用旁路缓存redis
importcom.alibaba.druid.pool.DruidDataSource;importcom.alibaba.druid.pool.DruidPooledConnection;importcom.alibaba.fastjson.JSONObject;importcom.atguigu.utils.DimUtil;importcom.atguigu.utils.DruidDSUti
小总结
·
2023-11-23 07:12
redis
缓存
flink
hbase
Flink
内核原理与实现-核心抽象
Flink
API提供了开发的接口,此外,为了实现业务逻辑,还必须为开发者提供自定义业务逻辑的能力。。
857技术社区
·
2023-11-23 07:09
Flink
Flink
内核原理与实现
Flink
实时数仓完结
文章目录主要框架版本选型集群服务器规划实时架构架构的选择分层分析
Flink
CDC的选取旁路缓存优化异步查询优化先看项目成品的效果GitHub地址:https://github.com/GTyingzi/
未来影子
·
2023-11-23 07:09
Flink
大数据项目
flink
kafka
大数据
Flink
优化
标准的
Flink
任务提交脚本(GenericCLI模式)从1.11开始,增加了通用客户端模式,参数使用-D指定bin/
flink
run\-tyarn-per-job\-d\-p3\指定并行度-Dyarn.application.queue
Lan_feng_kang
·
2023-11-23 07:02
flink
大数据
关于
Flink
的旁路缓存与异步操作
1.旁路缓存1.什么是旁路缓存?将数据库中的数据,比较经常访问的数据,保存起来,以减少和硬盘数据库的交互比如:我们使用mysql时经常查询一个表,而这个表又一般不会变化,就可以放在内存中,查找时直接对内存进行查找,而不需要再和mysql交互2.旁路缓存例子使用dim层使用的是hbase存储,因为dim层可能会出现大表,出现数据量过大,所以存储到磁盘合适,使用hbase而dwd的连接,dwd是从ka
叫我莫言鸭
·
2023-11-23 06:29
flink
缓存
大数据
软考-系统架构设计师-大数据架构设计理论与实践-练习题2
(1)A.批处理层B.
流处理
层C.加速层D.存储层(2)A.批处理层B.服务层C.加速层D.视图层(3)A.视图层B.
流处理
层C.服务层D.存储层答案ACC关键词-概念Lambda架
shumeizwb
·
2023-11-23 06:04
软考-系统架构设计师
大数据
系统架构设计师
软考
flink
sqlClient提交hiveIceberg
flink
sqlClient提交hiveIceberg环境准备sqlclient启动前准备启动sqlclientinit.sqlinsert.sql环境准备组件名版本
flink
客户端1.14.4-2.12hadoop
sxau_zhangtao
·
2023-11-23 05:55
flink
大数据
iceberg
【Python大数据笔记_day11_Hadoop进阶之MR和YARN&ZooKeeper】
MR单词统计流程已知文件内容: hadoophivehadoopsparkhive
flink
hivelinuxhivemysqlinput结果: k1(行偏移量) v1(每行文本内容) 0
LKL1026
·
2023-11-22 21:37
Python大数据学习笔记
hadoop
大数据
笔记
计算机毕业设计之Python+Spark+
Flink
考研测与推荐系统 考研大数据分析 考研推荐系统 考研预测系统 考研大数据可视化 考研爬虫可视化 考研数据分析
开发技术前端:vue.js后端:springboot+mybatis-plus数据库:mysql算法(机器学习、深度学习):协同过滤算法(基于用户、基于物品全部实现)、KNN爬虫:python、requests、chrome_driver大数据分析:spark、echarts特色/创新点结合百度地图api展示大学地理位置信息;通过KNN等机器学习深度学习算法进行预测;通过协同过滤算法(基于用户+基
计算机毕业设计大神
·
2023-11-22 21:10
Hive VS Spark
类似于spark的计算引擎还有很多,像mapreduce,
flink
等等。类似于hive的存储框架也是数不胜数,比如pig。最底层的存储往往都是使用hdfs。
AII派森
·
2023-11-22 16:55
hive
spark
hadoop
flink
1.10袋鼠云 迁移
flink
1.15原生环境 事项汇总
)修改适配1DDL语法不通用(袋鼠云DDL中支持给别名DDL采用数据中台生成的模板,并把老版本DDL中的配置通过到相应参数中)2袋鼠云DDL支持给别名sql中字段和DDL中字段不一致.两种解决方案:1
Flink
SQL
Thomas2143
·
2023-11-22 14:04
总结
flinksql
袋鼠云
Sylph平台自定义数据源hdfs数据源
Sylph是一个一站式的大数据流计算平台,通过编译StreamSQL,sylph会自动生成Apache
Flink
等分布式程序到ApacheYarn集群运行。
cherishpf
·
2023-11-22 14:24
DataWorks实践笔记-从入门到精通
在这个基础上,有Datahub数据总线引擎,实时计算
Flink
引擎
qq_43548990
·
2023-11-22 13:58
云计算
Flink
之状态TTL机制
在
Flink
状态使用过程中有时需要清除State中不许需要的数据,否则State中的数据会越来越多,既增加了内存压力,也降低了计算效率.而TTL机制可以很好的帮我们解决这个分体,利用TTL机制可以将状态中的冷热数据分离
飞天小老头
·
2023-11-22 12:26
FLink
flink
java
大数据
Flink
源码之 Side Output 踩坑
Flink
源码分析系列文档目录请点击:
Flink
源码分析系列文档目录问题背景
Flink
的sideoutput为我们提供了数据分类输出的方式,根据条件将一个流分为多个数据流。
AlienPaul
·
2023-11-22 12:57
Flink
:背压,busy time和延迟之间的关系探究
1.BackPressure(背压)在算子层面上很好理解,背压的出现代表下游的消费者的消费速度小于上游生产者的生产速度;但实际上在
Flink
的runtime中,每个算子由subtask组成,背压更多是一个
韩澈
·
2023-11-22 12:37
flink
连接kafka报错
问题描述:通过本地idea方式连接kafka,报如下错误:可能原因:本地程序会查询本地配置,看是否存在ip映射,可能是本地ip映射不存在,导致连接kafka失败。(主要是由于kafka的server.properties文件中的zookeeper.connect配置的是主机名导致)解决办法:在本地hosts文件中配置ip与主机名的映射关系。
是爱学习的编程大白哦
·
2023-11-22 09:43
kafka
flink
分布式
上一页
37
38
39
40
41
42
43
44
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他