E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
flink实时数仓
docker搭建Dinky —— 筑梦之路
简介Dinky是一个开箱即用、易扩展,以Apache
Flink
为基础,连接OLAP和数据湖等众多框架的一站式实时计算平台,致力于流批一体和湖仓一体的探索与实践。
筑梦之路
·
2024-01-04 03:40
Java技术
大数据
docker
容器
运维
Flink
应用介绍
前言:
Flink
自2014年开源以来,网上对
Flink
的介绍不可胜数;作为一个灵活的实时计算框架,
Flink
到底能用来做什么?
i7杨
·
2024-01-04 03:37
Flink
flink
大数据
在与面试官面试之后的某些回想
4.我感觉在面试官说完后,我还是很懵,比如人家说
flink
架构时,我回答的是运行架构,
劝学-大数据
·
2024-01-03 17:22
心得体会
大数据
基于
Flink
的百亿数据去重实践
在工作中经常会遇到去重的场景,例如基于App的用户行为日志分析系统,用户的行为日志从手机客户端上报到Nginx服务端,通过Logstash、Flume或其他工具将日志从Nginx写入到Kafka中。由于用户手机客户端的网络可能出现不稳定,所以手机客户端上传日志的策略是:宁可重复上报,也不能丢日志。所以导致Kafka中必然会出现日志重复的情况,即:同一条日志出现了2条或2条以上。通常情况下,Flin
zhisheng_blog
·
2024-01-03 16:52
大数据实时计算引擎
Flink
实战与性能优化
Flink
维表关联方案
Flink
维表关联方案1、
Flink
DataStream关联维表1)概述1.分类实时数据库查找关联(Per-RecordReferenceDataLookup)预加载维表关联(Pre-LoadingofReferenceData
猫猫爱吃小鱼粮
·
2024-01-03 16:49
flink
数据库
大数据
Flink
-Paimon 案例
Flink
-Paimon案例1、下载
Flink
Jar包并解压tar-xzf
flink
-*.tgz2、下载PaimonJar包放进
Flink
的lib中cppaimon-
flink
-*.jar/lib/3、
猫猫爱吃小鱼粮
·
2024-01-03 16:49
flink
大数据
数睿通2.0功能更新:支持多版本
Flink
切换,新增数据标签模块
文章目录引言支持多版本
Flink
切换功能展示使用方法数据标签合并微服务Bug修复,细节优化结语引言小伙伴们,大家好,数睿通2.0数据中台迎来了12月份的更新,由于年底工作繁忙,所以本次更新内容稍微少了点
小螺旋丸
·
2024-01-03 10:22
大数据
springboot
flink
大数据
数据仓库
数睿通2.0数据接入、数据开发、系统权限、集群监控全面升级
引言数睿通2.0数据中台迎来了11月份的更新,感谢大家的支持,本次更新主要包括以下内容:数据库支持MongoDB数据接入支持MongoDB,支持自定义SQL采集,支持停止运行中的任务数据生产支持
Flink
Jar
小螺旋丸
·
2024-01-03 10:21
数据中台
大数据
数据库
数据仓库
新年快乐—数睿通2.0数据中台全新功能模块发布
文章目录引言数据集成数据库管理文件管理数据接入贴源数据数据开发数据生产sql作业开发
Flink
Sql作业开发调度中心运维中心资源中心配置中心其他模块结语引言离上次发文已经有接近三个月了,这三个月主要在开发数睿通的数据生产模块
小螺旋丸
·
2024-01-03 10:43
大数据
springcloud
java
数据库
大数据
云计算
Flink
-【时间语义、窗口、水位线】
1.时间语义1.1事件时间:数据产生的事件(机器时间);1.2处理时间:数据处理的时间(系统时间)。:可乐可乐的生产日期=事件时间(可乐产生的时间);可乐被喝的时间=处理时间(可乐被处理【喝掉=处理】的时间)。机器时间:可能不准确(例如:A可乐厂的时钟比较慢,B可乐厂的时钟比较快,但实际上B产生可乐的时间比A产生可乐的时间慢,却被先处理了)系统时间:相对准确(处理机器设置的时间,一般无误【当然分布
可乐manman
·
2024-01-03 09:58
大数据处理
flink
大数据
Flink
的检查点算法
Flink
的恢复机制基于应用状态的一致检查点。在有状态的流应用中,一个一致性检查点是:在所有tasks处理了一个(相同的)输入后,当前时间点每个task的state副本。
XueminXu
·
2024-01-03 09:52
flink
大数据
checkpoint
检查点
Chandy-Lamport
Flink
实时电商数仓(十)
common模块回顾appBaseApp:作为其他子模块中使用
Flink
-StreamAPI的父类,实现了StreamAPI中的通用逻辑,在其他子模块中只需编写关于数据处理的核心逻辑。
十七✧ᐦ̤
·
2024-01-03 09:50
flink
大数据
计算机毕业设计吊打导师hadoop+spark+hive知识图谱医生推荐系统 医生数据分析可视化大屏 医生爬虫 医疗可视化 医生大数据 机器学习 大数据毕业设计
中的医生数据进行数据分析,使用高德地图解析地理位置,并将结果转入.csv文件同时上传到hdfs文件系统;3.使用hive建库建表,导入.csv数据集;4.一半指标使用离线数仓hive_sql分析,一半指标使用
实时数仓
实时计算
计算机毕业设计大神
·
2024-01-03 07:53
如何在
Flink
SQL中轻松实现高效数据处理:最佳实践揭秘Protobuf自定义格式
目录
Flink
SQLProtobufFormat设计要点1.引言2.为什么需要自定义Protobuf格式3.自定义Protobuf格式的
数据与后端架构提升之路
·
2024-01-03 00:39
#
Flink
flink
sql
大数据
Flink
学习-处理函数
简介处理函数是
Flink
底层的函数,工作中通常用来做一些更复杂的业务处理,处理函数分好几种,主要包括基本处理函数,keyed处理函数,window处理函数。
demon7552003
·
2024-01-02 17:29
大数据
flink
java
【
flink
番外篇】9、
Flink
Table API 支持的操作示例(11)- Group Windows(tumbling、sliding和session)操作
Flink
系列文章一、
Flink
专栏
Flink
专栏系统介绍某一知识点,并辅以具体的示例进行说明。1、
Flink
部署系列本部分介绍
Flink
的部署、配置相关基础内容。
一瓢一瓢的饮 alanchan
·
2024-01-02 14:22
flink
示例专栏
flink
大数据
kafka
flink
hive
flink
sql
flink
流批一体
flink
kafka
【
flink
番外篇】9、
Flink
Table API 支持的操作示例(8)- 时态表的join(scala版本)
Flink
系列文章一、
Flink
专栏
Flink
专栏系统介绍某一知识点,并辅以具体的示例进行说明。1、
Flink
部署系列本部分介绍
Flink
的部署、配置相关基础内容。
一瓢一瓢的饮 alanchan
·
2024-01-02 14:21
flink
示例专栏
flink
大数据
kafka
flink
kafka
flink
流批一体化
scala
flink
时态表
【
flink
番外篇】9、
Flink
Table API 支持的操作示例(10)- 表的OrderBy、Offset 和 Fetch、insert操作
Flink
系列文章一、
Flink
专栏
Flink
专栏系统介绍某一知识点,并辅以具体的示例进行说明。1、
Flink
部署系列本部分介绍
Flink
的部署、配置相关基础内容。
一瓢一瓢的饮 alanchan
·
2024-01-02 14:21
flink
示例专栏
flink
大数据
kafka
flink
sql
flink
hive
flink
kafka
flink
大数据
【
flink
番外篇】9、
Flink
Table API 支持的操作示例(9)- 表的union、unionall、intersect、intersectall、minus、minusall和in的操作
Flink
系列文章一、
Flink
专栏
Flink
专栏系统介绍某一知识点,并辅以具体的示例进行说明。1、
Flink
部署系列本部分介绍
Flink
的部署、配置相关基础内容。
一瓢一瓢的饮 alanchan
·
2024-01-02 14:49
flink
示例专栏
flink
大数据
kafka
flink
hive
flink
sql
flink
实时计算
flink
大数据
Flink
自定义MySQLSource读取MySQL数据
先查看数据库连接池实现MySQL连接池MySQL表student的实体采用caseclass定义objectDomain{caseclassAccess(time:Long,domain:String,traffic:Long)caseclassStudent(id:Int,name:String,age:Int)}实现RichSourceFunction来自定义MySQLSourcepackag
喵星人ZC
·
2024-01-02 10:51
大数据学习入门到实战教程,精心整理万字长文入门,老奶奶看了都说学会了
换个角度说,大数据是:1、有海量的数据2、有对海量数据进行挖掘的需求3、有对海量数据进行挖掘的软件工具(hadoop、spark、storm、
flink
、tez
悦悦学Python
·
2024-01-02 08:59
最容易出错的 Hive Sql 详解
前言在进行数仓搭建和数据分析时最常用的就是sql,其语法简洁明了,易于理解,目前大数据领域的几大主流框架全部都支持sql语法,包括hive,spark,
flink
等,所以sql在大数据领域有着不可替代的作用
奔跑者-辉
·
2024-01-02 07:30
hive
hive
sql
大数据
Flink
的window机制(二) 窗口函数
WindowFunction前面指定了窗口的分配器,接着我们需要来指定如何计算,这事由windowfunction来负责.一旦窗口关闭,windowfunction去计算处理窗口中的每个元素.windowfunction可以是ReduceFunction,AggregateFunction,orProcessWindowFunction中的任意一种.ReduceFunction,Aggregate
万事万物
·
2024-01-02 05:34
Apache
Flink
连载(二十三):
Flink
HA -
Flink
基于Yarn HA
个人主页:IT贫道_大数据OLAP体系技术栈,ApacheDoris,Clickhouse技术-CSDN博客私聊博主:加入大数据技术讨论群聊,获取更多大数据资料。博主个人B栈地址:豹哥教你大数据的个人空间-豹哥教你大数据个人主页-哔哩哔哩视频目录1.YarnHA配置2.启动测试</
IT贫道
·
2024-01-02 04:42
大数据计算体系技术栈
Apache
Flink
apache
flink
大数据
Apache
Flink
连载(二十二):
Flink
HA -
Flink
基于Standalone HA
博主个人B栈地址:豹哥教你大数据的个人空间-豹哥教你大数据个人主页-哔哩哔哩视频目录
Flink
基于StandaloneHA1.StandaloneHA配置2.启动测试
Flink
基于Standalon
IT贫道
·
2024-01-02 04:11
大数据计算体系技术栈
Apache
Flink
apache
flink
大数据
flink
连接 hdfs 读取文件配置
flink
连接hdfs读取文件配置hadoop版本为2.7.3window系统本地运行
flink
程序读取hdfs文件配置1,请导入hadoop和httpclient的包org.apache.
flink
flink
-hadoop-fs
eagle隼
·
2024-01-02 02:06
PiflowX组件-JDBCRead
计算引擎
flink
有界性ScanSource:BoundedLookupSource:SyncMode组件分组Jdbc端口Inport:默认端口outport:默认端口组件属性名称展示名称默认值允许值是否必填描述例子
暗影八度
·
2024-01-01 23:36
大数据
spark
big
data
flink
hadoop
PiflowX组件-ReadFromUpsertKafka
计算引擎
flink
有界性Unbounded组件分组kafka端口Inport:默认端口outport:默认端口组件属性名称展示名称默认值允许值是否必填描述例子kafka_hostKAFKA_HOST“”
暗影八度
·
2024-01-01 23:06
大数据
spark
big
data
flink
hadoop
PiflowX组件-WriteToUpsertKafka
计算引擎
flink
有界性StreamingUpsertMode组件分组kafka端口Inport:默认端口outport:默认端口组件属性名称展示名称默认值允许值是否必填描述例子kafka_hostKAFKA_HOST
暗影八度
·
2024-01-01 23:05
PiflowX
大数据
spark
flink
数据库
hdfs
etl
PiflowX组件-JDBCWrite
计算引擎
flink
有界性Sink:BatchSink:StreamingAppend&UpsertMode组件分组Jdbc端口Inport:默认端口outport:默认端口组件属性名称展示名称默认值允许值是否必填描述例子
暗影八度
·
2024-01-01 23:01
spark
flink
big
data
大数据
hadoop
Flink
学习-时间和窗口
在流数据处理应用中,一个很重要、也很常见的操作就是窗口计算。所谓的“窗口”,一般就是划定的一段时间范围,也就是“时间窗”;对在这范围内的数据进行处理,就是所谓的窗口计算。所以窗口和时间往往是分不开的。时间语义事件时间(EventTime):每个事件在对应的设备上发生的时间,也就是数据生成的时间。处理时间(ProcessingTime):执行处理操作的机器的系统时间摄取时间(IngestionTim
demon7552003
·
2024-01-01 22:04
大数据
flink
大数据
时间和窗口
20200912 001_
Flink
-
Flink
简介
20200912001_
Flink
-
Flink
简介第一章
Flink
简介主要内容•
Flink
是什么•为什么要用
Flink
•流处理的发展和演变•
Flink
的主要特点•
Flink
vsSparkStreaming1.1
强哥带你飞
·
2024-01-01 13:02
Flink
Flink
大数据
flink
有什么优势值得大家这么热衷
flink
通过实现了GoogleDataflow流式计算模型实现了高吞吐、低延迟、高性能兼具实时流式计算框架。
KK架构
·
2024-01-01 13:32
Flink
flink
实时计算
实时仓库
Flink
的特点以及优势
Flink
的优势、数据量&吞吐量&延迟性
Flink
的流处理引擎只需要很少配置就能实现高吞吐率和低延迟。2、支持EventTime和乱序事件
Flink
支持了流处理和EventTime语义的窗口机制。
DemonHunter211
·
2024-01-01 13:32
Hadoop
Flink
的优势
主要应用场景包括
实时数仓
、实时大屏、实时推荐、实时报表、实时风控和实时监控,当然还有其他一些应用场景。总之,实时计算的业务需求,一般都会用
Flink
进行开发。
有味青年
·
2024-01-01 13:01
笔记
相比于其他流处理技术,
Flink
的优点在哪?
Apache
Flink
是一个开源的流处理框架,用于在高吞吐量和低延迟的情况下进行大规模数据流的处理。
KevinAha
·
2024-01-01 13:31
flink
大数据
Flink
Job 执行流程
Flink
OnYarn模式基于Yarn层面的架构类似SparkonYarn模式,都是由Client提交App到RM上面去运行,然后RM分配第一个container去运行AM,然后由AM去负责资源的监督和管理
程序猿进阶
·
2024-01-01 12:24
Flink
flink
大数据
java
面试
后端
性能优化
spark
聊聊
flink
Table的Joins
序本文主要研究一下
flink
Table的Joins实例InnerJoinTableleft=tableEnv.fromDataSet(ds1,"a,b,c");Tableright=tableEnv.fromDataSet
go4it
·
2024-01-01 12:42
flink
run -C 与 -c
-C可用来添加外部依赖jar包,如自己开发的工具jar包,一个个添加,不能是目录-c指定main()所在的类正确用法
flink
run-d\-C"file:///DSJ/
flink
-1.11.1/ep/xxxx1
luohaifang
·
2024-01-01 11:29
大数据
flink
run
-C
Flink
学习排查问题---
Flink
部署web端无法连接问题
项目场景:
Flink
部署web端无法连接问题问题描述:电脑:win10虚拟机:centos7
flink
:1.10.1在默认配置环境下,正常启动
Flink
显示启动成功后,访问localhost:8081无法正常访问但是输入网站
文耳_lzl
·
2024-01-01 11:29
问题解决
linux
flink
centos
Flink
Kafka[输入/输出] Connector
本章重点介绍生产环境中最常用到的
Flink
kafkaconnector。使用
Flink
的同学,一定会很熟悉kafka,它是一个分布式的、分区的、多副本的、支持高吞吐的、发布订阅消息系统。
程序猿进阶
·
2024-01-01 11:58
Flink
flink
kafka
linq
大数据
java
面试
后端
Flink
|《
Flink
官方文档 - 概念透析 -
Flink
架构》学习笔记
学习文档:概念透析-
Flink
架构学习笔记如下:
Flink
集群剖析客户端(Client):准备数据流程序并发送给JobManager(不是
Flink
执行程序的进程)JobManager:协调
Flink
应用程序的分布式执行
长行
·
2024-01-01 11:28
Flink
flink
架构
集群
CDH 6.3.2集成
flink
1.18 zookeeper版本不匹配
Flink
-yarn启动失败
CDH6.3.2集成
flink
1.18zookeeper版本不匹配
Flink
-yarn不能正常启动,而在CHDWeb页面,
flink
日志报错提示不明确,不能定位具体错误。
qq_21480329
·
2024-01-01 10:05
flink
zookeeper
大数据
Flink
整合面向用户的数据流SDKs/API(
Flink
关于弃用Dataset API的论述)
动机
Flink
提供了三种主要的sdk/API来编写程序:TableAPI/SQL、DataStreamAPI和DataSetAPI。
另存為
·
2024-01-01 05:28
Flink
内容分享(二十八):深度解析
Flink
是如何管理好内存的?
目录前言数据对象直接放在堆内存中
Flink
是怎么做的?
Flink
如何分配内存?
Flink
如何序列化对象?
Flink
如何对二进制数据进行操作?
之乎者也·
·
2024-01-01 05:23
Flink
内容分享
大数据(Hadoop)内容分享
flink
大数据
Flink
内容分享(二十七):Hadoop vs Spark vs
Flink
——大数据框架比较
大数据开发离不开各种框架,我们通过学习ApacheHadoop、Spark和
Flink
之间的特征比较,可以从侧面了解要学习的内容。
之乎者也·
·
2024-01-01 05:52
Flink
内容分享
大数据(Hadoop)内容分享
大数据
flink
hadoop
[
Flink
]
Flink
的waterMark的通俗理解
导读
Flink
为实时计算提供了三种时间,即事件时间(eventtime)、摄入时间(ingestiontime)和处理时间(processingtime)。
延眠万里
·
2024-01-01 05:37
Java程序员:世界有三个伟大的发明「火、轮子、kafka」
在流式计算中,Kafka一般用来缓存数据,例如
Flink
通过消费Kafka的数据进行计算。关于Kafka,我们最先需要了解的是以下四点:Java程序员:世界有三个伟大的发明「火、轮子、kafka」A
Java旺
·
2024-01-01 04:17
Flink
内容分享(十八):基于
Flink
+Iceberg构建企业数据湖实战
目录前言ApacheIceberg的优势ApacheIceberg经典业务场景应用ApacheIceberg的准备工作创建和使用CatalogIcebergDDL命令IcebergSQL查询IcebergSQL写入使用DataStream读取使用DataStream写入前言随着大数据存储和处理需求的多样化,如何构建一个统一的数据湖存储,并在其上进行多种形式的数据分析成了企业构建大数据生态的一个重要
之乎者也·
·
2023-12-31 11:21
Flink
内容分享
大数据(Hadoop)内容分享
flink
大数据
Flink
内容分享(十七):基于
Flink
的“批处理”尝试
目录背景实现方法一VirtualKey方法二算子状态方法三无状态的snapshot引言
Flink
可以说是当下最流行的分布式流数据处理引擎。
之乎者也·
·
2023-12-31 11:51
Flink
内容分享
大数据(Hadoop)内容分享
flink
分布式
linq
上一页
17
18
19
20
21
22
23
24
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他