E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Iceberg
数据湖真的能取代数据仓库吗?【SNP SAP数据转型 】
数据湖是近两年中比较新的技术在大数据领域中,对于一个真正的数据湖应该是什么样子,现在对数据湖认知还是处在探索的阶段,像现在代表的开源产品有
iceberg
、hudi、DeltaLake。
snpgroupcn
·
2023-08-08 14:49
数据仓库
数据湖
iceberg
-day02-Hive与
Iceberg
整合
hive整合
iceberg
1.6Hive与
Iceberg
整合
Iceberg
就是一种表格式,支持使用Hive对
Iceberg
进行读写操作,但是对Hive的版本有要求,如下:操作Hive2.xHive3.1.2CREATEEXTERNALTABLE
a-tao必须奥利给
·
2023-08-06 11:38
hive
hadoop
大数据
数据仓库
hdfs
iceberg
对比hive优势
1.事务性从事务性上来说,
iceberg
具有更高的数据质量。因为
iceberg
本质是一种tableformat,屏蔽了底层的存储细节,写入数据时候需要严格按照schema写入。
bitcarmanlee
·
2023-08-03 18:08
hive
iceberg
hive
流批一体
CHD6.2.1集群 Hive开启
Iceberg
下载jar包https://repo1.maven.org/maven2/org/apache/
iceberg
/
iceberg
-hive-runtime/1.0.0/
iceberg
-hive-runtime
行路见知
·
2023-07-29 10:27
hive
hadoop
数据仓库
字节跳动 EB 级
Iceberg
数据湖的机器学习应用与优化
本文将介绍字节跳动如何通过
Iceberg
数据湖支持EB级机器学习样本存储,实现高性能特征读取和高效特征调研、特征工程加速模型迭代。机器学习样本存储:背景与趋势在字节跳动,机器学习模型的应用
字节跳动云原生计算
·
2023-07-27 19:09
机器学习
人工智能
大数据
Iceberg
从入门到精通系列之十八:一篇文章深入了解Flink对
Iceberg
的支持
Iceberg
从入门到精通系列之十八:一篇文章深入了解Flink对
Iceberg
的支持一、Flink支持的
iceberg
功能二、使用FlinkSQLClient时的准备三、Flink'sPythonAPI
最笨的羊羊
·
2023-07-20 11:54
日常分享专栏
Iceberg
Flink
iceberg
-flink 八:累积窗口使用。(CUMULATE)
一:为什么出现累计窗口(CUMULATE)在flink中有滑动窗口,滚动窗口,会话窗口。前俩者是公司常用的,他们统计的是某个时间段内的数据。但是我们有些时候,有需求,求每一天,从当天0:00开始,进行计算,例如:双十一,统计当天的销售额度。遇到这种需求,前俩者解决此类问题会比较麻烦。所以在新版本的flink当中,开源了CUMULATE窗口。二:CUMULATE是什么窗口。可以将CUMULATE窗口
宇智波云
·
2023-07-20 06:56
flink
iceberg
flink
iceberg
大数据
iceberg
集成Hive
添加jar包wgethttps://repo1.maven.org/maven2/org/apache/
iceberg
/
iceberg
-hive-runtime/0.13.1/
iceberg
-hive-runtime
贾斯汀玛尔斯
·
2023-07-19 13:07
数据湖
hadoop
hive
hadoop
iceberg
Iceberg
从入门到精通系列之十七:Apache InLong往
Iceberg
同步数据
Iceberg
从入门到精通系列之十七:ApacheInLong往
Iceberg
同步数据一、概览二、版本支持三、依赖项四、SQLAPI用法五、多表写入六、动态表名映射七、动态建库、建表八、动态schema
最笨的羊羊
·
2023-07-19 01:49
日常分享专栏
Iceberg
Apache
InLong
往Iceberg同步数据
Iceberg
初见
Iceberg
是一个开源的大数据存储和计算平台,它的设计目标是为了解决传统数据仓库在处理大规模数据时的性能问题。本文将介绍
Iceberg
的基本概念、架构和特点,并讨论它在大数据领域的应用场景。
GP0000968523
·
2023-07-18 01:25
大数据
Iceberg
从入门到精通系列之十六:Flink
Iceberg
Connector
Iceberg
从入门到精通系列之十六:FlinkConnector一、FlinkIcebergConnector二、在Hive目录中管理的表三、在自定义目录中管理表四、一个完整的例子一、FlinkIcebergConnectorApacheFlink
最笨的羊羊
·
2023-07-16 06:17
日常分享专栏
Iceberg
Flink
Connector
iceberg
-flink 十:idea将下载jar包,加载到idea。
q=
iceberg
-flinkhttps://repo1.maven.org/maven2/org/apache/
iceberg
/
iceberg
-flink-runtime-1.13/0.13.2/二:
宇智波云
·
2023-07-15 16:49
iceberg
flink
intellij-idea
flink
jar
迁移
iceberg
:一.查看所需要的资源。
一:内存,CPU,核数,线程,硬盘。1.cpu,核素,线程。cpucpu就相当于人类的大脑,是处理数据的地方。cpu由以下三个组成。控制器。由控制单元、指令译码器、指令寄存器组成。运算器。运算器的核心是算术逻辑运算单元。寄存器。高速缓存。一般来讲,我们普通电脑只能有一个cpu卡槽,所以只能有一个cpu。但是在服务器上可以有多个cpu卡槽,来增加处理速度。核数,线程从一开始,一个cpu只有一个核数。
宇智波云
·
2023-07-15 16:49
迁移iceberg
大数据
iceberg
-flink 十:flink 窗口,事件时间,处理时间。
flink窗口窗口的开始和结束的时间,是按照服务器当前的时间进行统计的。比如,当前时间为2023-03-2816:23按照五分钟进行开窗。那么当前的开窗就是2023-03-2816:20到2023-03-2816:25。如果进行savepoint进行补数,那么在savepoint中保存的当时的时间,窗口会按照保存的时间开始进行开窗。事件时间事件时间就是这个事件真实发生的时间。处理时间处理时间就是数
宇智波云
·
2023-07-15 16:19
flink
大数据
深度对比 Delta、
Iceberg
和 Hudi 三大开源数据湖方案
深度对比Delta、
Iceberg
和Hudi三大开源数据湖方案目前市面上流行的三大开源数据湖方案分别为:Delta、ApacheIceberg和ApacheHudi。
岁月的眸
·
2023-06-24 08:39
大数据
kafka
大数据
分布式
Iceberg
从入门到精通系列之一:
Iceberg
核心概念理解
Iceberg
从入门到精通系列之一:
Iceberg
核心概念理解一、
Iceberg
核心概念二、
Iceberg
表结构三、数据文件四、表快照Snapshot五、清单列表Manifestlist六、表快照、数据文件和清单列表之间的关系七
最笨的羊羊
·
2023-06-23 11:23
日常分享专栏
Iceberg
Iceberg核心概念理解
Iceberg
从入门到精通系列之二:
Iceberg
集成Hive
Iceberg
从入门到精通系列之二:
Iceberg
集成Hive一、Hive引入
Iceberg
的jar包二、修改hive-site.xml三、启动hadoop集群四、启动hive元数据服务五、进入Hive
最笨的羊羊
·
2023-06-23 10:22
日常分享专栏
Iceberg
Iceberg集成Hive
火山引擎
Iceberg
数据湖的应用与实践
而
Iceberg
作为一种云原生的表格式,可以很好地应对这些挑战。本文将介绍火山引擎在云原生计算产品上使用
Iceberg
的实践,和大家分享高效查询、存储和治理
Iceberg
数据的方法。
字节跳动云原生计算
·
2023-06-20 22:04
火山引擎
大数据
数据库
FlinkSQL写入
iceberg
—Windows环境下
前置条件Flink运行版本13.1,
iceberg
依赖版本:1.0.0依赖FlinkSQL运行环境略。注意版本匹配,采用不合适版本可能导致无法读写。
长臂人猿
·
2023-06-16 00:42
Flink
大数据
windows
hadoop
大数据
直播预告 | 博睿学院:算法平台底座-数据湖应用
数据湖的三种常用管理工具分别是Delta、Hudi和
Iceberg
。那么,究竟哪一种管理工具才是最优解呢?本期课程从7个维度对比上述三种管理工具,为大家讲解
Iceberg
的框架、优势以及应用实践。
·
2023-06-13 18:32
运维微服务服务器devops
【硬刚大数据之面试篇】2021年从零到大数据专家面试篇之
IceBerg
篇
欢迎关注博客主页:https://blog.csdn.net/u013411339欢迎点赞、收藏、留言,欢迎留言交流!本文由【王知无】原创,首发于CSDN博客!本文首发CSDN论坛,未经过官方和本人允许,严禁转载!本文是对《【硬刚大数据之学习路线篇】2021年从零到大数据专家的学习指南(全面升级版)》的面试部分补充。硬刚大数据系列文章链接:2021年从零到大数据专家的学习指南(全面升级版)2021
王知无(import_bigdata)
·
2023-06-13 17:03
大数据成神之路
硬刚大数据系统性专栏
大数据
flink
spark
数据湖
小米基于 Flink 的实时数仓建设实践
本篇内容主要分为四个部分:小米数仓架构演变Flink+
Iceberg
架构升级实践流批一体实时数仓探索未来展望点击查看原文视频&演讲PPT一、小米数仓架构演变1.1数仓架构现状在介绍演变前,我们先来了解下小米当前的技术现状
·
2023-06-13 16:44
后端flink大数据实时计算
基于 Flink CDC 的实时同步系统
我主要负责基于Flink、
Iceberg
、K8s的底层基础设施建设。今
·
2023-06-13 16:08
后端flink大数据实时计算
数据湖与数据仓库区别
数据湖是近两年中比较新的技术在大数据领域中,对于一个真正的数据湖应该是什么样子,现在对数据湖认知还是处在探索的阶段,像现在代表的开源产品有
iceberg
、hudi、DeltaLake。
000X000
·
2023-06-08 22:49
数据仓库
实战
数据湖
数据仓库
数据库
数据湖与数据仓库区别
小米基于 Flink 的实时数仓建设实践
本篇内容主要分为四个部分:小米数仓架构演变Flink+
Iceberg
架构升级实践流批一体实时数仓探索未来展望点击查看原文视频&演讲PPT一、小米数仓架构演变1.1数仓架构现状在介绍演变前,我们先来了解下小米当前的技术现状
·
2023-06-08 20:58
后端flink大数据实时计算
千亿级爱奇艺数据湖平台建设实践
导读本文将介绍
Iceberg
在爱奇艺的落地与实践。
架构师小秘圈
·
2023-06-07 14:32
大数据
kafka
hadoop
spark
分布式
Iceberg
+Flink+CDH+Trino+Hive
Iceberg
+Flink+CDH+Trino+Hive集群环境名称版本描述flink1.3.2开源版本cdh6.3.2开源版本hive2.1.1-cdh6.3.2cdh6.3.2中版本hadoop3.0.0
我去探险了
·
2023-04-20 05:37
数据湖技术
Iceberg
数据仓库
big
data
cloudera
Spark+Flink+
Iceberg
打造湖仓一体架构实践探索
数据湖-大数据生态杀青数据湖-大数据生态杀青数据仓库的痛点只能存储结构化数据,无法采集存储非结构化数据无法存储原始数据,所有的数据须经过ETL清洗过程离线数仓的数据表牵一发而动全身,数据调整工程量大实时数仓存储空间有限,无法采集和存储海量实时数据回溯效率低下,实时数据和离线数据计算接口难以统一Kafka做实时数仓,以及日志传输。Kafka本身存储成本很高,且数据保留时间有时效性,一旦消费积压,数据
架构师老狼
·
2023-04-15 23:13
排序对parquet 文件大小的影响
背景公司hive数仓全面迁移到
iceberg
后,发现存储空间比hive要大,并且文件格式都是parquet分析
iceberg
存储空间比hive表大,最主要的原因是因为压缩算法不一样,然后也发现
iceberg
shengjk1
·
2023-04-15 12:39
工作之行
parquet
数仓
排序
数据仓库
iceberg
实践数据湖
iceberg
第三十六课 基于数据湖icerberg的流批一体架构--update mysql select from icberg语法是增量更新测试
系列文章目录实践数据湖
iceberg
第一课入门实践数据湖
iceberg
第二课
iceberg
基于hadoop的底层数据格式实践数据湖
iceberg
第三课在sqlclient中,以sql方式从kafka读数据到
*星星之火*
·
2023-04-14 03:24
iceberg
flink
flink
实践数据湖
iceberg
第四十一课
iceberg
的实时性-业界的checkpoint配置
系列文章目录实践数据湖
iceberg
第一课入门实践数据湖
iceberg
第二课
iceberg
基于hadoop的底层数据格式实践数据湖
iceberg
第三课在sqlclient中,以sql方式从kafka读数据到
*星星之火*
·
2023-04-14 03:24
iceberg
大数据
hadoop
hive
实践数据湖
iceberg
第四十二课(业界视野)业界的流批一体架构
系列文章目录实践数据湖
iceberg
第一课入门实践数据湖
iceberg
第二课
iceberg
基于hadoop的底层数据格式实践数据湖
iceberg
第三课在sqlclient中,以sql方式从kafka读数据到
*星星之火*
·
2023-04-14 03:24
iceberg
flink
架构
大数据
hadoop
实践数据湖
iceberg
第三十五课 基于数据湖icerberg的流批一体架构--测试增量读是读全量还是仅读增量
系列文章目录实践数据湖
iceberg
第一课入门实践数据湖
iceberg
第二课
iceberg
基于hadoop的底层数据格式实践数据湖
iceberg
第三课在sqlclient中,以sql方式从kafka读数据到
*星星之火*
·
2023-04-14 03:54
flink
iceberg
架构
kafka
hive
实践数据湖
iceberg
第二十七课 flink cdc 测试程序故障重启:能从上次checkpoint点继续工作
系列文章目录实践数据湖
iceberg
第一课入门实践数据湖
iceberg
第二课
iceberg
基于hadoop的底层数据格式实践数据湖
iceberg
第三课在sqlclient中,以sql方式从kafka读数据到
*星星之火*
·
2023-04-14 03:53
iceberg
flink
flink
实践数据湖
iceberg
第二十八课 把公有仓库上不存在的包部署到本地仓库
系列文章目录实践数据湖
iceberg
第一课入门实践数据湖
iceberg
第二课
iceberg
基于hadoop的底层数据格式实践数据湖
iceberg
第三课在sqlclient中,以sql方式从kafka读数据到
*星星之火*
·
2023-04-14 03:23
iceberg
maven
flink
实践数据湖
iceberg
第二十九课 如何优雅高效获取flink的jobId
系列文章目录实践数据湖
iceberg
第一课入门实践数据湖
iceberg
第二课
iceberg
基于hadoop的底层数据格式实践数据湖
iceberg
第三课在sqlclient中,以sql方式从kafka读数据到
*星星之火*
·
2023-04-14 03:23
iceberg
flink
flink
实践数据湖
iceberg
第二十四课
iceberg
元数据详细解析
系列文章目录实践数据湖
iceberg
第一课入门实践数据湖
iceberg
第二课
iceberg
基于hadoop的底层数据格式实践数据湖
iceberg
第三课在sqlclient中,以sql方式从kafka读数据到
*星星之火*
·
2023-04-14 03:53
iceberg
flink
数据湖
iceberg
flink
实践数据湖
iceberg
第二十五课 后台运行flink sql 增删改的效果
系列文章目录实践数据湖
iceberg
第一课入门实践数据湖
iceberg
第二课
iceberg
基于hadoop的底层数据格式实践数据湖
iceberg
第三课在sqlclient中,以sql方式从kafka读数据到
*星星之火*
·
2023-04-14 03:53
flink
iceberg
hadoop
hdfs
kafka
实践数据湖
iceberg
第二十六课 checkpoint设置方法
系列文章目录实践数据湖
iceberg
第一课入门实践数据湖
iceberg
第二课
iceberg
基于hadoop的底层数据格式实践数据湖
iceberg
第三课在sqlclient中,以sql方式从kafka读数据到
*星星之火*
·
2023-04-14 03:53
iceberg
hadoop
实践数据湖
iceberg
第二十二课 flink1.13.5 +
iceberg
0.131 CDC(CRUD测试成功)
系列文章目录实践数据湖
iceberg
第一课入门实践数据湖
iceberg
第二课
iceberg
基于hadoop的底层数据格式实践数据湖
iceberg
第三课在sqlclient中,以sql方式从kafka读数据到
*星星之火*
·
2023-04-14 03:52
flink
iceberg
iceberg
数据湖
实践数据湖
iceberg
第二十一课 flink1.13.5 +
iceberg
0.131 CDC(测试成功INSERT,变更操作失败)
系列文章目录实践数据湖
iceberg
第一课入门实践数据湖
iceberg
第二课
iceberg
基于hadoop的底层数据格式实践数据湖
iceberg
第三课在sqlclient中,以sql方式从kafka读数据到
*星星之火*
·
2023-04-14 03:22
iceberg
flink
spark
数据湖
iceberg
实践数据湖
iceberg
第二十课 flink +
iceberg
CDC场景(版本问题,测试失败)
系列文章目录实践数据湖
iceberg
第一课入门实践数据湖
iceberg
第二课
iceberg
基于hadoop的底层数据格式实践数据湖
iceberg
第三课在sqlclient中,以sql方式从kafka读数据到
*星星之火*
·
2023-04-14 03:52
iceberg
flink
spark
flink
iceberg
实践数据湖
iceberg
第十六课 通过spark3打开
iceberg
的认知之门
系列文章目录实践数据湖
iceberg
第一课入门实践数据湖
iceberg
第二课
iceberg
基于hadoop的底层数据格式实践数据湖
iceberg
第三课在sqlclient中,以sql方式从kafka读数据到
*星星之火*
·
2023-04-14 03:51
iceberg
spark
数据湖
iceberg
spark
flink
实践数据湖
iceberg
第十七课 hadoop2.7,spark3 on yarn运行
iceberg
配置
系列文章目录实践数据湖
iceberg
第一课入门实践数据湖
iceberg
第二课
iceberg
基于hadoop的底层数据格式实践数据湖
iceberg
第三课在sqlclient中,以sql方式从kafka读数据到
*星星之火*
·
2023-04-14 03:51
iceberg
spark
数据湖
iceberg
yarn
spark
实践数据湖
iceberg
第十九课 flink count
iceberg
,无结果问题
系列文章目录实践数据湖
iceberg
第一课入门实践数据湖
iceberg
第二课
iceberg
基于hadoop的底层数据格式实践数据湖
iceberg
第三课在sqlclient中,以sql方式从kafka读数据到
*星星之火*
·
2023-04-14 03:51
iceberg
flink
iceberg
数据湖
flink
实践数据湖
iceberg
第十五课 spark3安装与集成
iceberg
0.13 (jersey包冲突,安装完成)
系列文章目录实践数据湖
iceberg
第一课入门实践数据湖
iceberg
第二课
iceberg
基于hadoop的底层数据格式实践数据湖
iceberg
第三课在sqlclient中,以sql方式从kafka读数据到
*星星之火*
·
2023-04-14 03:50
iceberg
flink
spark
数据湖
iceberg
实践数据湖
iceberg
第十八课 多种客户端与
iceberg
交互启动命令(常用命令)
系列文章目录实践数据湖
iceberg
第一课入门实践数据湖
iceberg
第二课
iceberg
基于hadoop的底层数据格式实践数据湖
iceberg
第三课在sqlclient中,以sql方式从kafka读数据到
*星星之火*
·
2023-04-14 03:20
iceberg
flink
hive
iceberg
数据湖
实践数据湖
iceberg
第十二课 catalog是什么
系列文章目录实践数据湖
iceberg
第一课入门实践数据湖
iceberg
第二课
iceberg
基于hadoop的底层数据格式实践数据湖
iceberg
第三课在sqlclient中,以sql方式从kafka读数据到
*星星之火*
·
2023-04-14 03:50
iceberg
flink
数据湖
iceberg
flink
实践数据湖
iceberg
第十三课 metadata比数据文件大很多倍的问题
系列文章目录实践数据湖
iceberg
第一课入门实践数据湖
iceberg
第二课
iceberg
基于hadoop的底层数据格式实践数据湖
iceberg
第三课在sqlclient中,以sql方式从kafka读数据到
*星星之火*
·
2023-04-14 03:50
iceberg
kafka
hive
big
data
实践数据湖
iceberg
第十四课 元数据合并(解决元数据随时间增加而元数据膨胀的问题)
系列文章目录实践数据湖
iceberg
第一课入门实践数据湖
iceberg
第二课
iceberg
基于hadoop的底层数据格式实践数据湖
iceberg
第三课在sqlclient中,以sql方式从kafka读数据到
*星星之火*
·
2023-04-14 03:50
iceberg
flink
数据湖
iceberg
flink
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他