E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数据湖数据仓库
数据湖
实操讲解【 AI 训练加速】第十八讲:Fluid + JindoFS 对海量小文件的训练加速...
数据湖
技术圈本期导读:【AI训练加速】第十八讲主题:Fluid+JindoFS对海量小文件的训练加速讲师:辰山,阿里巴巴计算平台事业部EMR技术专家内容框架:海量小文件难题FluidJindoRuntime
Apache Spark中国社区
·
2023-11-15 22:41
html
大数据
python
tensorflow
github
数据湖
实操讲解【 AI 训练加速】第十七讲:Fluid + JindoFS 对 HDFS 上的数据进行训练加速...
数据湖
技术圈本期导读:【AI训练加速】第十七讲主题:Fluid+JindoFS对HDFS上的数据进行训练加速讲师:辰山,阿里巴巴计算平台事业部EMR技术专家内容框架:什么是Fluid+JindoFS(JindoRuntime
Apache Spark中国社区
·
2023-11-15 22:41
编程语言
kubernetes
github
html
大数据
Flink 1.12的CDC
基于Flink构建流批一体的实时数仓是目前
数据仓库
领域比较火的实践方案。随着Flink的不断迭代,其提供的一系列技术特性使得用户构建流批一体的应用变得越来越方便。
'煎饼侠
·
2023-11-15 19:56
Flink
数据仓库
入门简介
一,数组仓库介绍
数据仓库
(英语:DataWarehouse,简称数仓、DW)是一个为数据分析而设计的企业级数据管理系统。它旨在支持企业决策过程中的数据分析和业务智能。
浮生夢
·
2023-11-15 17:12
数据仓库
企业级
数据仓库
是什么
一、
数据仓库
定义简单理解:
数据仓库
就是整合多个数据源的历史数据进行细粒度的、多维的分析,帮助高层管理者或者业务分析人员做出商业战略决策或商业报表。
靠谱杨
·
2023-11-15 17:10
数据仓库
大数据清洗、转换工具——ETL工具概述
ETL的实现架构但在
数据仓库
中,ETL有几个特点,一是数据同步,它不是一次性倒完数据就拉到,
阿拉伯梳子
·
2023-11-15 15:54
办公应用
企业信息化
大数据
etl
数据仓库
Hive
数据仓库
建模
1、基于Hive
数据仓库
建模
数据仓库
的发展大致经历了这样的三个过程:报表——>集市——>仓库简单报表阶段:这个阶段,系统的主要目标是解决一些日常的工作中业务人员需要的报表,以及生成一些简单的能够帮助领导进行决策所需要的汇总数据
小洲C
·
2023-11-15 10:01
#
hive
服务器
java
运维
hive olap
数据仓库
_我在hive上搭建
数据仓库
一般将hive作为大数据中离线数据的存储,并把hive作为构建
数据仓库
的环境。可我们也要了解一个事实,hive不支持行级操作,无法像RMDB那样进行updata、delete,add操作。
weixin_39875192
·
2023-11-15 10:00
hive
olap
数据仓库
Hive中的数据分层
理论上一般分为三个层:ODS数据运营层、DW
数据仓库
层、ADS数据服务层。基于这个基础分层之上,再提交信息的层次,来满足不同的业务需求。
小申.
·
2023-11-15 10:54
大数据
hive
数据仓库
Hive
数据仓库
Hive
数据仓库
1什么是
数据仓库
数据仓库
,英文名称为DataWarehouse,可简写为DW或DWH。
数据仓库
,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。
Lv_Hulk
·
2023-11-15 10:23
Hive
数据仓库的特点
数据库和数据仓库的区别
元数据介绍
数据仓库架构分层
星型模型和雪花模型
大数据管理与分析 第六章 Hive和
数据仓库
Hive和
数据仓库
数据仓库
和OLAP
数据仓库
是独立的
数据仓库
多层架构Hive基本工作原理Hive的组成模块Hive的数据模型数据的物理分布
数据仓库
和OLAP定义:
数据仓库
是一个面向主题的、集成的、时变的
黄昏贩卖机
·
2023-11-15 10:22
大数据管理与分析
数据仓库
hive
数据库
Hive
数据仓库
基础知识
2数据库三范式2.1首先看第一范式(1NF):2.2第二范式(2NF)2.3第三范式(3NF)3维度建模模型3.1星型模型和雪花模型3.1.1星型模型3.1.2雪花模型4
数据仓库
分层设计1事实表、维度表首先我们来看两个名词
赵广陆
·
2023-11-15 10:20
hive
java
大数据
es
数据湖
架构
数据湖
架构介绍
数据湖
(DataLake)是一个存储大量结构化和非结构化数据的集中式数据存储库。与传统的
数据仓库
不同,
数据湖
采用扁平化结构,将数据存储在原始形式下,不需要进行预处理或转化。
溟有常青木
·
2023-11-15 07:47
python
python
探索
数据湖
和大数据在亚马逊云服务云存储服务上的威力
数据湖
和亚马逊云服务云存储服务上的大数据是一个强大的组合,使组织能够充分发挥其数据的潜力。亚马逊云科技开发者社区为开发者们提供全球的开发技术资源。
亚马逊云开发者
·
2023-11-15 05:02
大数据
AWS 大数据实战 - 环境准备(一)
实验介绍本次实战内容将教大家如何使用AWS的大数据和
数据湖
的相关服务和组件,顺利完成大数据的收集,存储,处理,分析和可视化的完整的流程,主要会介绍以下几个AWS大数据服务:Lab1:实时流数据处理,基于
wzlinux
·
2023-11-15 03:34
数据库
可视化
大数据
java
数据分析
大数据调度系统对比
0.前言有了数据平台,有了
数据仓库
,那就需要一个系统来调度和管理数仓的任务,因此调度系统的地位可见之重要。
Impl_Sunny
·
2023-11-14 21:01
调度管理
#
对比&选型
调度系统
Azkaban
数据仓库
笔记
目录第二章
数据仓库
第三章数据预处理第四章特征化和区分数据挖掘第五章关联规则挖掘第六章分类挖掘第七章聚类挖掘第二章
数据仓库
1、B树索引考题:为何B树等在数据库中广泛使用的索引技术无法直接被引入
数据仓库
?
0xac001d09
·
2023-11-14 15:28
期末
数据挖掘
数据仓库
数据仓库
基础信息
数据仓库
数据仓库
概述什么是数据库什么是数据集市什么是
数据仓库
数据仓库
和数据库的对比什么是
数据湖
数据存储架构数据处理工具聚焦如何把数据搬到湖里关注如何对湖中的数据进行分析、挖掘、利用
数据湖
和
数据仓库
的对比
数据仓库
的特点
数据仓库
是集成的
数据仓库
的数据是稳定的
daladalabao
·
2023-11-14 11:50
数据仓库
BI系统是如何进行数据分析的?
现在的BI系统可以对接很多类型的
数据仓库
,大大提高了效率。下一步就是找到可能影响数据质量的问题,消除错误和重复数据,这在Smartbi中可以很容易实现,建立自助数据集即可。
思迈特Smartbi
·
2023-11-14 10:44
数据仓库
大数据
数据分析
数据库理论 —— 数据库设计六大范式
前言笔者遇到范式是在
数据仓库
建模时,以前对范式的理解比较浅显,且只了解前三范式,对后面三个范式并不了解,趁此机会和大家一起把其他范式学习下。
扫地增
·
2023-11-14 10:24
数据仓库
数据库
范式理论
大数据
Hive工具的介绍(一)
一、Hive是什么要了解Hive是什么得先了解一下数仓(
数据仓库
)的概念,什么又是
数据仓库
呢?
xiaoxie_advent
·
2023-11-14 09:15
大数居
hadoop
数据仓库
大数据
Hive
数据仓库
、数仓分层 01
1.
数据仓库
的基本概念
数据仓库
,英文名称为DataWarehouse,可简写为DW或DWH。
数据仓库
的目的是构建面向分析的集成化数据环境,为企业提供决策支持(DecisionSupport)。
啊策策
·
2023-11-14 06:17
Hive
数据仓库
数仓主要特征
数仓分层
数仓分层的好处
,方便定位问题2,减少重复开发:规范数据分层,通过中间层数据,能够减少极大的重复计算,增加计算一次的结果的重复性3,隔离原始数据:不论是数据的异常还是数据的敏感性,使真实数据与统计数据解耦开数据集市和
数据仓库
的区别
Alienware^
·
2023-11-14 06:17
数据仓库
数据仓库
数仓分层总结
数据仓库
分为四层ods、dwd、dws、adsods层上是一些原始的数据,存放原始数据,直接加载原始日志、数据(事件表),保持数据原貌不作处理,也就是做一个备份的作用,不要解析数据创建支持LZO压缩的表
月升11
·
2023-11-14 06:41
数据仓库
hive
大数据
数据仓库
数据仓库
之数仓分层及hive分层
目录一、
数据仓库
之数仓分层(一)为什么要分层?
javastart
·
2023-11-14 06:09
数据仓库
数据仓库
数据库
大数据
简单搞定数仓搭建:数仓分层
我们建议将
数据仓库
分为三层,自下而上为:数据引入层(ODS,OperationDataStore)、数据公共层(CDM,CommonDataModel)和数据应用层(ADS,ApplicationDataService
白枭
·
2023-11-14 06:08
数仓
bigdata
大数据开发
数据建模
数据仓库
数仓分层介绍
常见的数据分层ODS层:源数据层DW层:
数据仓库
层(也叫作集团数据中心)DA(app)层:数据应用层更加细分的数仓分层方案1ODS数据源2DW
数据仓库
2.1DWD明细层:2.2DWB基础数据层:2.3DWS
程少亭
·
2023-11-14 06:36
数据仓库
big
data
etl
数仓(一)数据分层
文章目录数据分层好处数据运营层
数据仓库
层数据应用层事实表`(FactTable)`维表层(`Dimension`)表命名规则聚合粒度以及加工频率字段说明抽取方式字段命名规范数据表名命名规范表分区字段说明任务命名规范大厂分层架构爱奇艺
666呀
·
2023-11-14 06:05
数仓
数据仓库
数据挖掘
big
data
【
数据仓库
】数仓分层方法
2.减少重复开发3.方便数据血缘追踪4.把复杂问题简单化5.屏蔽原始数据的异常6.
数据仓库
的可维护性二.如何进行数仓分层?
roman_日积跬步-终至千里
·
2023-11-14 06:01
数据仓库
数据仓库
spark
大数据
亚马逊云科技 2022 年 3 月新服务新功能强势来袭
从计算、存储和数据库等基础设施技术,到机器学习、人工智能、
数据湖
和分析以及物联网等新兴技术,亚马逊云科技为客户提供多样的服务及功能。
亚马逊云开发者
·
2023-11-14 03:53
服务
亚马逊
【大数据技术】爆肝3天 7个章节 Hive 3.1.3详解
大数据技术之Hive01hive入门1.1什么是Hive1)Hive简介Hive是由Facebook开源,基于Hadoop的一个
数据仓库
工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。
左美美  ̄
·
2023-11-13 21:10
大数据
(十一)Hive
数据仓库
的使用
目录一、目的及要求:目的:要求:二、环境要求:所需环境:集群规划:三、详细步骤:步骤一:启动步骤二:
数据仓库
的使用1、查看表信息2、hive常用命令3、Hive的数据模型_内部表;4、Hive的数据模型
T.machine
·
2023-11-13 21:06
Hive数据仓库的使用
云存储技术
Hive建表语法和参数记录
Hive是一个基于Hadoop的
数据仓库
工具,可以将结构化数据映射到HDFS存储(建表对应在HDFS建了一个文件夹),并提供类SQL查询语言-HiveQL,Hive可以将HQL语句转换为MR任务执行。
Forge_ahead
·
2023-11-13 20:11
work_efficiency
Study
hive
hadoop
数据仓库
数仓hive锁(Hive Lock)
昨天
数据仓库
hive中一张中间表lock,导致所有依赖这个表的任务失败。影响挺大,借此总结一下以备后面查用。
Vincer_DB
·
2023-11-13 16:34
大数据
hive
hive锁
大数据系统建模方法论简谈
基本上只要详细了解企业业务战略线就能得出总线矩阵,它对应着企业每一个业务单元,提取业务单元中的一致性维度和事实量值组组合成企业总线矩阵也就是多维分析模型;总线矩阵也是BI项目实施交付的必要成果之一,它与
数据仓库
的概念模型非常吻合
Vincer_DB
·
2023-11-13 16:30
spark
大数据
分布式
Day10:YARN与Hive入门
:MapJoin知识点06:YARN:功能与应用场景知识点07:YARN:集群架构知识点08:YARN:MR提交运行流程知识点09:YARN:资源管理配置知识点10:YARN:任务调度机制知识点11:
数据仓库
的介绍知识点
人间清醒vv子
·
2023-11-13 12:08
hive
yarn
大数据
数据仓库
【大数据之Hive】
一、Hive基本概念Hive是基于Hadoop的一个
数据仓库
工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。
JMFFFFF
·
2023-11-13 12:37
hive
大数据
hadoop
详解
数据仓库
之拉链表(原理、设计以及在Hive中的实现)
近几天也会安排朋友圈点赞赠书活动(ง•̀_•́)ง0x00前言本文将会谈一谈在
数据仓库
中拉链表相关的内容,包括它的原理、设计、以及在我们大数据场景下的实现方式。
小小哭包
·
2023-11-13 12:29
大数据
数据仓库
拉链表
HIVE
【
数据仓库
-Hive】笔记(未完)
文章目录PART1
数据仓库
-PART2Hive的基本概念一.Hive简介二.Hive架构三.Hive与Hadoop的关系四.Hive与传统数据库对比五.Hive的安装六.Hive的交互方式PART3Hive
Mercy92
·
2023-11-13 08:45
大数据
AIGC ChatGPT 4 总结出
数据仓库
中各不同类型表区别
在
数据仓库
中最常用的是,全量表,增量表,拉链表,切片表,那么这个表设计之间的关系及区别是什么呢?我们一起来让ChatGPT4来帮我们总结一下。
阿里数据专家
·
2023-11-13 05:41
ChatGPT实战案例
ChatGPT
AIGC
数据仓库
人工智能
chatgpt
大数据
spark
2023.11.13 hive
数据仓库
之分区表与分桶表操作,与复杂类型的运用
目录0.hadoophive的文档1.一级分区表2.一级分区表练习23.创建多级分区表4.分区表操作5.分桶表6.分桶表进行排序7.分桶的原理8.hive的复杂类型9.array类型:又叫数组类型,存储同类型的单数据的集合10.struct类型:又叫结构类型,可以存储不同类型单数据的集合11.map类型:又叫映射类型,存储键值对数据的映射(根据key找value)0.hadoophive的文档hi
白白的wj
·
2023-11-13 02:01
数据仓库
hive
hadoop
数据库篇-MySQL
安装在操作系统中的一种
数据仓库
、软件。b.数据库分类关系型数据库:SQL(StructuredQueryLanguage)。
小吴的知识仓库
·
2023-11-12 23:50
MySQL
数据库
java
mysql
《ClickHouse原理解析与应用实践》读书笔记(1)
1.1传统BI系统之殇为了解决数据孤岛的问题,人们提出了
数据仓库
的概念。即通过引入一个专门用于分析类场景的数据库,将分散的数据统一汇聚到一处。于20世纪90年代,有人第一次提出了BI(商业智能)
Aiky哇
·
2023-11-12 14:15
clickhouse
读书笔记
大数据
clickhouse
从Hadoop到对象存储,抛弃Hadoop,
数据湖
才能重获新生?
Hadoop与
数据湖
的关系1、Hadoop时代的落幕2、Databricks和Snowflake做对了什么3、Hadoop与对象存储(OSD)4、Databricks与Snowflake为什么选择对象存储
对许
·
2023-11-12 05:15
#
数据湖仓
hadoop
大数据
数据仓库
Iceberg 学习笔记
本博客对应于B站尚硅谷教学视频尚硅谷
数据湖
Iceberg实战教程(尚硅谷&ApacheIceberg官方联合推出),为视频对应笔记的相关整理。
第一片心意
·
2023-11-11 19:46
iceberg
Iceberg
数据清洗有哪些方法?
例如,需要从
数据仓库
中提取
明月说数据
·
2023-11-11 16:55
big
data
数据清洗
数仓建设中,数据治理如何切入
摘要随着数据的快速增长和企业对数据的依赖度不断提高,建立高效的
数据仓库
(DataWarehouse)已经成为了企业发展中的重要一环。
云长歌
·
2023-11-11 10:14
大数据
限时领票|走进 2023 · 云栖大会,看大咖对话开源
扫描议程底部二维码,或点击「阅读原文」领取门票~嘉宾及话题介绍话题一|阿里云开源大数据平台3.0技术解读演讲嘉宾:王峰阿里云研究员,开源大数据平台负责人■话题简介自2009年起,经历了大数据上云的1.0时代,以
数据湖
和实时化为代表的
Apache Spark中国社区
·
2023-11-11 08:49
开源
Paimon 与 Spark 的集成(一)
PaimonApachePaimon(incubating)是一项流式
数据湖
存储技术,可以为用户提供高吞吐、低延迟的数据摄入、流式订阅以及实时查询能力。
Apache Spark中国社区
·
2023-11-11 08:44
spark
大数据
分布式
Hive 知识点八股文记录 ——(一)特性
Hive通俗的特性结构化数据文件变为数据库表sql查询功能sql语句转化为MR运行建立在hadoop的
数据仓库
基础架构使用hadoop的HDFS存储文件实时性较差(应用于海量数据)存储、计算能力容易拓展
JamSlade
·
2023-11-11 06:37
Hive
hive
hadoop
数据仓库
上一页
13
14
15
16
17
18
19
20
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他