E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
flink数据仓库
9、
Flink
SQL 流式概念之Compiled Plan详解
生成CompiledPlan配置过程首先会使用COMPILEPLAN语句生成一个JSON文件,它表示了序列化后的执行计划。COMPILEPLAN不支持查询语句SELECT...FROM...。执行COMPILEPLAN语句TableEnvironmenttableEnv=TableEnvironment.create(EnvironmentSettings.inStreamingMode());t
猫猫爱吃小鱼粮
·
2024-08-25 20:53
Flink
SQL
flink
sql
数据库
(十六)
Flink
状态管理
分类状态有效期(TTL)过期数据的清理OperatorStateBroadcastState状态存储StateBackends分类设置StateBackendRocksDBStateBackend详解在
Flink
springk
·
2024-08-25 20:22
Flink全景解析
flink
大数据
实时数据
实时数据处理
状态管理
flink状态管理
数据仓库
系列总结
一、
数据仓库
架构1、
数据仓库
的概念
数据仓库
(DataWarehouse)是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。
大数据00
·
2024-08-25 10:17
数据仓库
数据仓库
数据仓库
中的表设计模式:全量表、增量表与拉链表
在现代
数据仓库
中,管理和分析海量数据需要高效且灵活的数据存储策略。全量表、增量表和拉链表是三种常见的数据存储模式,各自针对不同的数据管理需求提供了解决方案。
isNotNullX
·
2024-08-25 09:45
数据仓库
设计模式
spark
Flink
CDC Standalone模式部署及
Flink
CDC Job提交
目录部署规划
Flink
CDC下载
Flink
CDC安装安装包解压添加connector包添加MySQL驱动提交
Flink
CDC任务独立模式(Standalonemode)是
Flink
最简单的部署模式。
L(刘二宝)
·
2024-08-24 13:41
Flink
CDC
Flink
CDC
MySQL
Doris
从零到一建设数据中台 - 关键技术汇总
数据中台关键技术汇总语言框架:Java、Maven、SpringBoot数据分布式采集:Flume、Sqoop、kettle数据分布式存储:HadoopHDFS离线批处理计算:MapReduce、Spark、
Flink
我码玄黄
·
2024-08-24 12:09
数据中台
数据挖掘
数据分析
大数据
Apache Doris + Iceberg 快速搭建指南|Lakehouse 使用手册(三)
湖仓一体(DataLakehouse)融合了
数据仓库
的高性能、实时性以及数据湖的低成本、灵活性等优势,能够更加便捷地满足各种数据处理分析的需求。
SelectDB技术团队
·
2024-08-24 10:25
iceberg
doris
lakehouse
湖仓一体
数据库
Flink
流转表,表转流,watermark设置
流转表首先创建一个流@Data@AllArgsConstructor@NoArgsConstructorpublicstaticclassNan{privateStringxing;privateStringname;privateLongts;}StreamExecutionEnvironmentenv=StreamExecutionEnvironment.getExecutionEnviron
qzWsong
·
2024-08-24 02:59
flink
flink
大数据
【数据库和
数据仓库
】
数据仓库
和数据库主要有以下区别:一、用途不同数据库:就像一个日常的储物间,主要用于存储和管理日常业务操作中的各种数据,比如电商网站中用户的下单信息、银行系统中客户的交易记录等。
W Y
·
2024-08-23 22:03
数据库
数据仓库
大数据
通俗易懂理解
Flink
水位线
理解水位线之前,我们先得理解
Flink
中的时间语义。
SunnyRivers
·
2024-08-23 16:29
Flink必知会
flink
水位线
自定义水位线
水位线传递
时间语义
Flink
开发语言选择 —— Java vs Scala
引言Apache
Flink
是一个用于处理无界和有界数据流的开源分布式计算框架。随着
Flink
的日益流行,越来越多的开发者开始考虑使用哪种编程语言来进行
Flink
应用程序的开发。
不知名靓仔
·
2024-08-22 07:04
scala
Apache Paimon:实时湖仓架构构建工具
ApachePaimon:实时湖仓架构构建工具paimonApachePaimonisalakeformatthatenablesbuildingaRealtimeLakehouseArchitecturewith
Flink
andSparkforbothstreamingandbatchoperations
乔如黎
·
2024-08-22 03:15
探索实时湖仓架构的新星:Apache Paimon
探索实时湖仓架构的新星:ApachePaimonpaimonApachePaimonisalakeformatthatenablesbuildingaRealtimeLakehouseArchitecturewith
Flink
andSparkforbothstreamingandbatchoperations
幸愉旎Jasper
·
2024-08-22 03:39
什么是湖仓一体
在数据湖的基础之上引入事务层,把数据湖和
数据仓库
的优点有机结合在一起,形成了一个可以同时支持数据分析、数据科
修破立生
·
2024-08-21 21:03
湖仓
数据仓库
big
data
数据库
大数据
flink
经典实战案例
一、java版
flink
-wordcount-离线计算版1.1maven构建
flink
,加入依赖org.apache.
flink
flink
-java${
flink
.version}provided-->
不 爱吃肉肉
·
2024-08-21 20:59
flink
big
data
java
scala
Flink
中的SQL Client和SQL Gateway
Flink
中的SQLClient和SQLGateway对比目录定义基本原理适用场景主要区别常用运维命令示例官方链接正文1.定义SQLClient:
Flink
SQLClient是一种用于提交和执行
Flink
SQL
BigDataMLApplication
·
2024-03-29 14:20
flink
flink
sql
gateway
数据仓库
——事务、快照和累积快照事实表
事务、快照和累积快照事务事实表跟踪定义业务过程的个体行为,并且支持几种描述这种行为事实。可以提供丰富的分析型能力,时常充当原子数据的粒度化仓库快照事实表周期性地采样状态度量,这些度量与一系列事务的累积效果相当,但是这些事务的格式不易进行研累积快照事实表用来跟踪通过一系列处理步骤的个体项的进展情况,用于研究多数过程中里程碑或者事件的经过时间。这种事实表在单一行中关联多个不同的行为。事务事实表事务事实
墨染丶eye
·
2024-03-28 23:58
背诵
数据仓库
数据库
Flink
算子通用状态应用测试样例
Flink
算子通用状态应用测试样例1.获取
Flink
执行环境finalStreamExecutionEnvironmentenv=StreamExecutionEnvironment.getExecutionEnvironment
公子乂
·
2024-03-27 05:23
flink
java
servlet
关于HDP的20道高级运维面试题
HDP(HortonworksDataPlatform)的主要组件包括Hadoop框架、HDFS、MapReduce、YARN以及Hadoop生态系统中的其他关键工具,如Spark、
Flink
、Hive
编织幻境的妖
·
2024-03-26 15:34
运维
Flink
面试题总结及答案
基础state的分类keystate和operatestatestate的重分布
Flink
状态管理详解:KeyedState和OperatorListState深度解析-掘金checkpoint和savepointhttps
wending-Y
·
2024-03-22 08:55
Flink
入门到实践
flink
大数据
Flink
批作业 消费kafka
文章目录示例代码原理总是kafka数据源可以是有界数据源,也可以是无界数据源示例代码publicstaticvoidmain(String[]args){StreamExecutionEnvironmentenv=StreamExecutionEnvironment.getExecutionEnvironment();env.setParallelism
wending-Y
·
2024-03-22 08:25
Flink
入门到实践
flink
kafka
大数据
Flink
源码-6-JobMaster 启动任务
JobMasterjobmaster负责执行整个任务入口类org.apache.
flink
.runtime.jobmaster.JobMasterpublicCompletableFuturestart
wending-Y
·
2024-03-22 08:25
Flink
入门到实践
flink
服务器虚拟化和云平台,云平台和服务器虚拟化区别
云平台和服务器虚拟化区别内容精选换一换云硬盘(ElasticVolumeService,EVS)可以为云服务器提供高可靠、高性能、规格丰富并且可弹性扩展的块存储服务,可满足不同场景的业务需求,适用于分布式文件系统、开发测试、
数据仓库
以及高性能计算等场景
木子Hui
·
2024-03-20 05:14
服务器虚拟化和云平台
大数据开发(Hive面试真题-卷二)
跟
数据仓库
区别?3、Hive架构?4、Hive数据倾斜以及解决方案?5、Hive如果不用参数调优,在map和reduce端应该做什么?6、Hive的三种自定义函数是什么?实现步骤与流程?
Key-Key
·
2024-03-20 05:14
大数据
hive
面试
【大数据面试题】014
Flink
CDC 用过吗,请简要描述
Flink
CDC的诞生背景
Flink
CDC的全称是ChangeDataCapture(变更数据捕获)每一项技术的诞生都是为了解决某个问题,某个痛点。
Jiweilai1
·
2024-03-20 04:43
一天一道面试题
flink
大数据
面试
flink
cdc
py
flink
1.18.0 报错 TypeError: cannot pickle ‘_thread.lock‘ object
完整报错Traceback(mostrecentcalllast):File"/Users//1.py",line851,inds1=my_datastream.key_by(lambdax:x[0]).process(MyProcessFunction())#返回元组即:f0f1f2三列File"/Users/thomas990p/bigdataSoft/minicondaarm/minicon
Thomas2143
·
2024-03-19 18:31
总结
pyflink
【
Flink
SQL】
Flink
SQL 基础概念(五):SQL 时区问题
《
Flink
SQL基础概念》系列,共包含以下5篇文章:
Flink
SQL基础概念(一):SQL&Table运行环境、基本概念及常用API
Flink
SQL基础概念(二):数据类型
Flink
SQL基础概念(三
G皮T
·
2024-03-19 13:24
#
Flink
SQL
flink
sql
大数据
时区
TIMESTAMP_LTZ
TIMESTAMP
【大数据】
Flink
SQL 语法篇(五):Regular Join、Interval Join
《
Flink
SQL语法篇》系列,共包含以下10篇文章:
Flink
SQL语法篇(一):CREATE
Flink
SQL语法篇(二):WITH、SELECT&WHERE、SELECTDISTINCT
Flink
SQL
G皮T
·
2024-03-19 07:16
#
Flink
SQL
大数据
flink
sql
Regular
Join
Interval
Join
双流Join
大数据开发(Kafka面试真题-卷一)
5、
Flink
checkpoint和Kafkaoffset的关联是什么?
Key-Key
·
2024-03-18 23:05
大数据
kafka
面试
数据挖掘-数据预处理的必要性及主要任务
(2)数据集成:将数据由多个数据源合并成一个一致的数据存储,如
数据仓库
。(3)数据归约:可以通过如狙击、删除冗余特征或聚类来降低数据的规模。(4)数据变换:
嘣嘣嚓
·
2024-03-17 10:16
数据挖掘
数据仓库
数据库
数据分析
人工智能
flink
: 自定义表函数的用法
packagecn.edu.tju.demo3;importorg.apache.
flink
.api.common.functions.MapFunction;importorg.apache.
flink
.api.java.tuple.Tuple2
amadeus_liu2
·
2024-03-17 03:37
flink
flink
python
大数据
flink
:自定义函数的简单用法
packagecn.edu.tju.demo3;importorg.apache.
flink
.api.common.functions.MapFunction;importorg.apache.
flink
.streaming.api.datastream.DataStream
amadeus_liu2
·
2024-03-17 03:07
flink
flink
大数据
MySQL建表以及excel内容导入
一个数据库从逻辑上来说是由一个或多个表空间所组成,表空间是数据库中物理编组的
数据仓库
。每一个表空间是由段所组成,一个表空间存放一个或多个数据库的物理文件。一个数据库中的
jameszjd
·
2024-03-17 00:03
mysql
excel
oracle
数据仓库
的设计开发应用(三)
目录五、
数据仓库
的实施(一)
数据仓库
的创建(二)数据抽取转换加载六、
数据仓库
系统的开发(一)开发任务(二)开发方法(三)系统测试七、
数据仓库
系统的应用(一)用户培训(二)决策支持(三)维护评估 五、
数据仓库
的实施
Francek Chen
·
2024-03-16 14:22
数据仓库与数据挖掘
数据仓库
大数据
数据仓库设计
数据库开发
flink
状态后端和检查点的关系
在Apache
Flink
中,检查点(Checkpoints)和状态后端(StateBackend)是两个核心概念,它们之间有着紧密的联系。为了更好地理解这种联系,我们首先需要分别了解这两个概念。
后季暖
·
2024-03-16 08:12
flink
大数据
Flink
异步io关联Hbase
主程序publicstaticvoidmain(String[]args)throwsException{//1.获取流执行环境StreamExecutionEnvironmentenv=StreamExecutionEnvironment.getExecutionEnvironment();env.setParallelism(1);SimpleDateFormatformatter=newSi
//承续缘_纪录片
·
2024-03-16 05:06
#
Flink
flink
hbase
大数据
03hive数仓安装与基础使用
hiveHive概述Hive是基于Hadoop的一个
数据仓库
工具。
daydayup9527
·
2024-03-14 13:39
hadoop_hive
运维
hadoop
flink
重温笔记(十五):
flink
SQL 顶层 API ——实时数据流转化为SQL表的操作
Flink
学习笔记前言:今天是学习
flink
的第15天啦!
那就学有所成吧(˵¯͒¯͒˵)
·
2024-03-13 09:32
Flink重温笔记
flink
笔记
sql
大数据
学习方法
数据库
KAFKA
Flink
CDC快速搭建实现数据监控
引入依赖4.0.0com.sand
flink
cdc1.0-SNAPSHOTjar
Flink
QuickstartJobUTF-81.17.11.14.4-->1.82.12${target.java.version
tianqi11
·
2024-03-12 05:20
flink
java
Apache Paimon 使用之Creating Catalogs
1.使用FilesystemMetastore创建Catalog
Flink
引擎
Flink
SQL注册并使用名为my_catalog的P
猫猫爱吃小鱼粮
·
2024-03-12 03:48
Paimon
apache
hive
hadoop
Spark从入门到精通29:Spark SQL:工作原理剖析以及性能优化
SparkSQL工作原理剖析1.编写SQL语句只要是在数据库类型的技术里面,例如MySQL、Oracle等,包括现在大数据领域的
数据仓库
,例如Hive。
勇于自信
·
2024-03-11 00:20
ETL策略
数据仓库
平台,ETL是很重要一环,看ETL的发展史,最初使用表格,人工从系统下载,在excel匹配,然后加载到
数据仓库
平台,到后来开始出现ETL工具,大概分为两个派别,以ETL架构的datastage,
朱先生_hfm
·
2024-03-10 13:11
etl
数据仓库
Flink
学习 | 在集群上的,部署模式及运行模式
Client将作业提交给JobManager,JobManager将作业分发给很多个TaskManager开始干活。部署模式有三种(会话模式_session,单作业模式_per_job,应用模式_application)主要区别是生命周期及资源的分配方式,以及应用的main方法到底在哪里执行,是客户端还是JobManager。会话模式需要先启动一个集群,保持一个会话。但启动集群时,资源是共享的,会
狻猊来当程序媛
·
2024-03-08 23:51
flink
学习
大数据
sprintboot集成
flink
快速入门demo
一、
flink
介绍
Flink
是一个批处理和流处理结合的统一计算框架,其核心是一个提供了数据分发以及并行化计算的流数据处理引擎。它的最大亮点是流处理,是业界最顶级的开源流处理引擎。
AskHarries
·
2024-03-07 04:55
flink
大数据
【
数据仓库
作业】第1章 绪论
三、简述
数据仓库
的定义。四、简述
数据仓库
的特征。五、简述主题的定义。六、简述元数据的概念。七、简述数据挖掘的主要任务。八、简述数据挖掘的主要步骤。九、下列活动是否属于数据挖掘任务,并简述其理由。
Francek Chen
·
2024-03-06 06:28
数据仓库与数据挖掘
数据仓库
数据库
数据挖掘
让数据用起来:数据中台建设的评估与选择(第4章)
开始构建企业级
数据仓库
,使用BI工具、大屏等。第三个阶段:数据驱动。加强业务与数据融合,利用大数据、机器学习、深度学习等技术进行精准营销、信用风险控制等。第四个阶段:运营优化。
小阳阳兄
·
2024-03-03 02:20
读书笔记
产品经理
数据分析
大数据
【大数据】
Flink
SQL 语法篇(七):Lookup Join、Array Expansion、Table Function
《
Flink
SQL语法篇》系列,共包含以下10篇文章:
Flink
SQL语法篇(一):CREATE
Flink
SQL语法篇(二):WITH、SELECT&WHERE、SELECTDISTINCT
Flink
SQL
G皮T
·
2024-03-01 02:40
#
Flink
SQL
大数据
flink
sql
Lookup
Join
Array
Expansion
Table
Function
维表
Join
【
Flink
精讲】
Flink
单机安装步骤
Flink
单机安装步骤获取
Flink
安装包:Indexof/
flink
解压缩:tar-zxvf
flink
-1.17.2-bin-scala_2.12.tgz修改配置文件:conf/
flink
-conf.yaml
话数Science
·
2024-02-29 13:22
Flink
Flink精讲
大数据
flink
大数据
EMR StarRocks实战——Mysql数据实时同步到SR
文章摘抄阿里云EMR上的StarRocks实践:《基于实时计算
Flink
使用CTAS&CDAS功能同步MySQL数据至StarRocks》前言CTAS可以实现单表的结构和数据同步,CDAS可以实现整库同步或者同一库中的多表结构和数据同步
爱吃辣条byte
·
2024-02-28 09:49
#
StarRocks
数仓建设
大数据
数据仓库
Hive
数据仓库
行转列
查了很多资料发现网上很多文章都是转发和抄袭,有些问题。这里分享一个自己项目中使用的行转列例子,供大家参考。代码如下:SELECTmy_id,nm_cd_map['A']ASmy_cd_a,nm_cd_map['B']ASmy_cd_b,nm_cd_map['C']ASmy_cd_c,nm_num_map['A']ASmy_num_a,nm_num_map['B']ASmy_num_b,nm_num
XueminXu
·
2024-02-28 07:47
大数据
hive
行转列
str_to_map
COLLECT_LIST
STRUCT
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他