E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
etl+数据仓库
数据仓库
Hive
Hive3.1.2目录Hive3.1.21、
数据仓库
概念1.2、传统仓库面临的挑战2、Hive简介2.1、Hive的特点2.2、Hive的优缺点2.3、Hive与Hadoop生态系统中的关系2.4、Hive
忄凝^
·
2023-11-25 09:48
大数据
hadoop
大数据
hive
Hive
数据仓库
工具基本架构和入门部署详解
优质资源分享学习路线指引(点击解锁)知识定位人群定位Python实战微信订餐小程序进阶级本课程是pythonflask+微信小程序的完美结合,从项目搭建到腾讯云部署上线,打造一个全栈订餐系统。Python量化交易实战入门级手把手带你打造一个易扩展、更安全、效率更高的量化交易系统@目录*概述+定义+本质+特点+Hive与Hadoop关系+Hive与关系型数据库区别+优缺点+其他说明架构组成部分数据模
虚幻私塾
·
2023-11-25 09:15
python
数据仓库
hive
架构
计算机
分布式数据恢复-hbase+hive分布式存储误删除如何恢复数据?
hbase+hive分布式存储数据恢复环境:16台某品牌R730XD服务器节点,每台物理服务器节点上有数台虚拟机,虚拟机上配置的分布式,上层部署hbase数据库+hive
数据仓库
。
北亚数据恢复
·
2023-11-25 09:37
服务器数据恢复
数据恢复
存储数据恢复
北亚数据恢复
数据恢复
服务器数据恢复
hbase
hive
DTCC专访:南大通用GBase云上逻辑
数据仓库
助力行业数字化转型升级
日前,在第十二届中国数据库技术大会(DTCC2021)期间,南大通用数据智能产品经营部总经理张绍勇受邀围绕《GBase云上逻辑
数据仓库
助力行业迎接数字化转型新挑战》的演讲主题进行专题访谈。
GBASE数据库
·
2023-11-25 09:23
GBASE新闻
sql
数据库
人工智能
(二)大数据---Hadoop组件介绍,区别
分布式资源管理MapReduce、Spark、Flink:分布式计算框架Yarn/Mesos:分布式资源管理器zookeeper:分布式协作服务sqoop:数据同步工具hive/Impala基于Hadoop的
数据仓库
(─__─)
·
2023-11-25 07:37
Hadoop
hadoop
big
data
大数据
常用数据存储格式介绍:Excel、CSV、JSON、XML
然而,在提取数据之后,并将其加载到数据库或
数据仓库
之前,需要将数据转化为可用的数据存储格式。
PDF Reader Pro
·
2023-11-24 19:06
excel
json
xml
csv
数据库
大数据之Hadoop流存储
通过对Hadoop分布式计算平台最核心的分布式文件系统HDFS、MapReduce处理过程,以及
数据仓库
工具Hive和分布式数据库Hbase的介绍,基本涵盖了Hadoop分布式平台的所有技术核心。
陌名_9b41
·
2023-11-24 18:01
熵简技术谈 | 熵简科技在资管数据中台的探索与实践
本文将从
数据仓库
建设、数据管理和开发和数据服务体系三个维度介绍数据中台在资管场景下的落地规范和方案。作者信息:熵简科技Airworks团队,团队致力于打
熵简科技Value Simplex
·
2023-11-24 17:46
数据中台
科技
数据仓库
big
data
数据挖掘
数据分析
【黑马甄选离线数仓day03_数仓设计和维度域开发】
1.数仓基本概念1-什么是
数据仓库
呢?存储数据的仓库,主要用于存储过去历史发生过的数据,面向主题,对数据进行统计分析的操作,从而能够对未来提供决策支持2-
数据仓库
最大的特点是什么呢?
LKL1026
·
2023-11-24 16:37
数据仓库
大数据
笔记
AnalyticDB for PostgreSQL 实时
数据仓库
上手指南
AnalyticDBforPostgreSQL实时
数据仓库
上手指南2019-04-016601版权本文涉及的产品云原生
数据仓库
ADBPostgreSQL,4核16G50GB1个月推荐场景:构建的企业专属
行走在云端z
·
2023-11-24 16:05
postgresql
数据仓库
etl
猿创征文|Apache Doris物化视图介绍
众所周知ApacheDoris是一款MPP分析型
数据仓库
,仅需压秒级就可以快速响应用户的查询需求。
码猿小站
·
2023-11-24 16:59
Doris
数据库
数据仓库
big
data
【文档笔记】doris
数据仓库
-数据表设计:Rollup 与查询
Rollup与查询基本概念Aggregate和Unique模型中的ROLLUPDuplicate模型中的ROLLUPROLLUP使用说明基本概念ROLLUP在多维分析中是“上卷”的意思,即将数据按某种指定的粒度进行进一步聚合。Rollup可以理解为Table的一个物化索引结构。物化是因为其数据在物理上独立存储,而索引的意思是,Rollup可以调整列顺序以增加前缀索引的命中率,也可以减少key列以增
KevinBrain
·
2023-11-24 16:44
大数据
数据仓库
doris
大数据
数据库架构
etl工程师
数据仓库
建设体系
数据仓库
概念:英文名称为DataWarehouse,可简写为DW或DWH。
数据仓库
的目的是构建面向分析的集成化数据环境,为企业提供决策支持(DecisionSupport)。
000X000
·
2023-11-24 12:00
数据仓库
实战
数据分析
数据仓库建设体系
数据仓库
数据仓库建设
大数据
数据仓库
建设流程概述
数据仓库
的逻辑分层架构:想看懂
数据仓库
的逻辑分层架构,必须先弄懂以下4大概念。
000X000
·
2023-11-24 12:00
数据中台
数据仓库
实战
数据仓库
big
data
hadoop
大数据基础中台-
数据仓库
建设
一、数据模型架构原则数仓分层原则优秀可靠的数仓体系,往往需要清晰的数据分层结构,即要保证数据层的稳定又要屏蔽对下游的影响,并且要避免链路过长。那么问题来了,一直在讲数仓要分层,那数仓分几层最好?目前市场上主流的分层方式眼花缭乱,不过看事情不能只看表面,还要看到内在的规律,不能为了分层而分层,没有最好的,只有适合的。分层是以解决当前业务快速的数据支撑为目的,为未来抽象出共性的框架并能够赋能给其他业务
SmartBrain
·
2023-11-24 12:22
大数据平台架构设计
数据仓库
big
data
hadoop
数据仓库
建模理论及实践-从0到1
目录1.
数据仓库
的概念1.1
数据仓库
的核心架构1.2
数据仓库
建模的意义1.2
数据仓库
建模方法论1.2.1ER模型1.2.2维度模型1.3维度建模之事实表1.3.1事务事实表1.3.2快照事实表1.3.3
OhTango
·
2023-11-24 12:21
数据仓库建模
数据仓库
大数据
数据分析
数据挖掘
3、如何从0到1去建设
数据仓库
1、数仓实施过程1.1数据调研数据调研包括:业务调研、需求调研业务调研需要调研企业内有哪些业务线、业务线的业务是否还有相同点和差异点各个业务线有哪些业务模块,每个模型下有哪些业务流程,每个流程下产生的数据是怎样存储的业务调研完后的产出:业务调研表、各个业务流程图需求调研主要调研分析师、运营人员的数据需求和现有报表系统中的数据需求1.2数仓架构设计数据域(主题域)的划分进行数据调研后,需要对业务过程
广阔天地大有可为
·
2023-11-24 12:50
数据仓库建设与企业案例
数据仓库
spark中write算子和format算子详解
在spark中,想要往数据库或者某sink路径里面写数据,存到外部存储系统,如文件系统、数据库或
数据仓库
,经常会用到write算子。
后季暖
·
2023-11-24 11:02
spark
大数据
分布式
MySQL 日期表制作
日期维度表是
数据仓库
设计中的重要部分,它在数据分析和商业智能领域有着很广泛的应用:数据完整性和一致性:日期维度表提供了一系列连续的日期值,确保
数据仓库
中时间维度的完整性和一致性。
有请小发菜
·
2023-11-24 09:06
Mysql
mysql
数据库
数据中台建设方法论
2、
数据仓库
中的常见的模型:1、心型模型:中间是一张事实表,周围都是维度表。
新手小农
·
2023-11-24 02:08
数据仓库
大数据
HiveSQL解析原理:包括SQL转化为MapReduce过程及MapReduce如何实现基本SQL操作
Hive是基于Hadoop的一个
数据仓库
系统,在各大公司都有广泛的应用。美团
数据仓库
也是基于Hive搭建,每天执行近万次的HiveETL计算流程,负责每天数百GB的数据存储和分析。
数仓大山哥
·
2023-11-24 02:00
hive
hive
mapreduce
sql执行原理
代码思路分享 计算机毕业设计Python+Hadoop+Spark+Hive旅游可视化 旅游数据分析
数据仓库
旅游推荐系统 旅游大数据 大数据毕业设计 大数据毕设
涉及技术hadoophiveazkabanpython爬虫huesqoopmysql运行截图
haochengxu2022
·
2023-11-24 00:09
推荐系统
机器学习
数据分析
大数据
hive
hadoop
大数据-数仓-数据采集-业务数据(三):增量同步采集【MySQL-(Maxwell)->Kafka-(Flume)->HDFS】【每日增量:每天只将业务数据中新增及变化的数据同步到
数据仓库
】
增量同步策略解释:每日增量,就是每天只将业务数据中的新增及变化的数据同步到
数据仓库
中,适用:表数据量大,且每天只会有新的数据插入的场景,特点:采用每日增量的表,通常会在首日先进行一个全量同步。
u013250861
·
2023-11-23 18:41
#
大数据
2023.11.22 -
数据仓库
的概念和发展
spm=1001.2014.3001.55011经典传统数仓架构2离线大数据数仓架构3
数据仓库
三层数据运营层,源数据层(ODS)(OperationalDataStore)
数据仓库
层(DW)(DataWarehouse
白白的wj
·
2023-11-23 16:16
数据仓库
hdfs
hadoop
大数据
sql
database
2023.11.22
数据仓库
2-维度建模
目录1.数仓建设方案2.数仓结构图,项目架构图2.1项目架构图2.2数仓结构图3.建模设计4.维度建模什么是事实表:什么是维度表:数据发展模式y以及对应的模型5.数仓建设规范数据库划分规范表命名规范表字段类型规范1.数仓建设方案ODS:源数据层(临时存储层)贴源层作用:对接数据源,用于将数据源的数据完整的导入到ODS层中,一般ODS层的数据和数据源的数据保持一致,类似于一种数据迁移的操作,一般在O
白白的wj
·
2023-11-23 16:14
数据仓库
大数据
数据库
hadoop
hive
sql
big
data
2、数仓理论概述与相关概念
1、问:
数据仓库
建设过程中经常会遇到那些问题?
广阔天地大有可为
·
2023-11-23 12:39
数据仓库建设与企业案例
大数据
20.大数据---Hive基础介绍
Hive是基于Hadoop的一个
数据仓库
工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。
学无止境的大象
·
2023-11-23 12:07
#
大数据
hive
big
data
hadoop
大数据开发之Hive优化篇6-Hive on spark
备注:Hive版本2.1.1一.HiveonSpark介绍Hive是基于Hadoop平台的
数据仓库
,最初由Facebook开发,在经过多年发展之后,已经成为Hadoop事实上的SQL引擎标准。
只是甲
·
2023-11-23 12:06
大数据和数据仓库
#
Hive
hive
on
spark
hadoop
hive
spark
大数据最佳实践-hive on spark
它最初是作为
数据仓库
(DW)工具构建的,现在它具有轻松交换执行引擎的功能,因此更具吸引力。简而言之,使用HiveonSpark,您的查
WakeUpCcc
·
2023-11-23 12:33
大数据
hive
spark
hadoop
数据仓库
数据仓库
岗面试
1.自我介绍2.求用户连续登录3天,要讲出多种解法解法1(使用SQL):SELECTuseridFROMloginrecordWHEREDATEDIFF(day,time,LAG(time)OVER(PARTITIONBYuseridORDERBYtime))=1ANDDATEDIFF(day,LAG(time)OVER(PARTITIONBYuseridORDERBYtime),TIME)=2;
ChlinRei
·
2023-11-23 11:36
数据仓库
面试
职场和发展
企业如何选择一款高效的ETL工具
在企业发展至一定规模后,构建
数据仓库
(DataWarehouse)和商业智能(BI)系统成为重要举措。
ETLCloud数据集成社区
·
2023-11-22 18:26
etl
数据仓库
数仓问答篇(一)
有些大数据
数据仓库
产品也采用混合架构,以融合两者的优点,例如Impala、Presto等都是基于HDFS的MPP分析引擎,仅利用HDFS实现分区容错性,放弃MapReduce计算模型,在面向OLAP场景时可实现更好的性能
AII派森
·
2023-11-22 16:36
大数据
知乎热议:
数据仓库
、数据湖、湖仓一体,究竟有什么区别?
来源:知乎作者:十叶心全文共14108个字,建议阅读20分钟一、基本概念1.1数仓发展历史数据湖是以集中方式存储各种类型数据,提供弹性的容量和吞吐能力,能够覆盖广泛的数据源,支持多种计算与处理分析引擎直接对数据进行访问的统一存储平台。它能够实现数据分析、机器学习,数据访问和管理等细粒度的授权、审计等功能。数据湖对存取的数据没有格式类型的限制,数据产生后,可以按照数据的原始内容和属性,直接存储到数据
浪尖聊大数据-浪尖
·
2023-11-22 13:30
数据库
大数据
hadoop
devops
java
数据仓库
工具之Hive的架构原理
1.Hive的本质Hive是基于Hadoop的一个
数据仓库
工具,它的本质是将HQL语句转化成MapReduce程序.在它的底层,HDFS负责存储数据,YARN负责进行资源管理,MapReduce负责数据处理
GuangHui
·
2023-11-22 13:05
阿里大数据工程师:教你如何快速的搭建数据库
数据仓库
,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。
yoku酱
·
2023-11-22 13:03
服务器能不能用普通硬盘,服务器硬盘是什么 与普通硬盘区别
如果说服务器是网络数据的核心,那么服务器硬盘就是这个核心的
数据仓库
,所有的软件和用户数据都存储在这里。对用户来说,储存在服务器上的硬盘数据是特别宝贵的,因此硬盘的可靠性是特别重要的。
老先队员
·
2023-11-22 10:39
服务器能不能用普通硬盘
浅谈
数据仓库
建设中的数据建模方法
周三保(
[email protected]
)IBM软件部信息技术专家.简介:本文的主要内容不是介绍现有的比较流行的主要行业的一些数据模型,而是将笔者在
数据仓库
建设项目中的一些经验,在这里分享给大家。
wer0735
·
2023-11-22 06:27
数据仓库~大数据
数据仓库方法论
数据仓库
一.各种名词解释1.1ODS是什么?ODS层最好理解,基本上就是数据从源表拉过来,进行etl,比如mysql映射到hive,那么到了hive里面就是ods层。ODS全称是OperationalDataStore,操作数据存储.“面向主题的”,数据运营层,也叫ODS层,是最接近数据源中数据的一层,数据源中的数据,经过抽取、洗净、传输,也就说传说中的ETL之后,装入本层。本层的数据,总体上大多是按照源
qq_44949002
·
2023-11-22 06:23
mysql
数据仓库
数据仓库
架构之详解Kappa和Lambda
目录一、前言二、架构详解1Lambda架构1.1Lambda架构组成1.2Lambda特点1.3Lambda架构的优点1.4Lambda架构的不足2Kappa架构2.1Kappa架构的核心组件2.2Kappa架构优点2.3Kappa架构的注意事项三、区别对比四、选择时考虑因素一、前言在大数据处理领域,有两种突出的数据架构已成为处理大量数据的流行选择:Lambda架构和Kappa架构。这两种架构为实
醉酒的戈多
·
2023-11-22 06:45
数据仓库
数据治理
大数据
数据仓库
数据仓库
模式之详解 Inmon 和 Kimball
目录一、前言二、企业信息工厂(Inmon)2.1概念2.2主要组件2.3流程三、多维
数据仓库
(Kimball)3.1概念3.2核心组件3.3流程四、异同及用途对比4.1异同对比4.2特征比较一、前言大部分关于
数据仓库
构建与讨论
醉酒的戈多
·
2023-11-22 06:41
数据仓库
数据治理
数据仓库
大数据
数据中台架构原理与开发实战:数据中台面临的挑战与解决方案
作者:禅与计算机程序设计艺术1.背景介绍数据中台是一种以
数据仓库
、数据湖、数据集市和分析平台等多种技术组件组合而成的大型IT系统,能够提供企业数据存储、加工、分析、应用的综合化服务,能够实现“智能4.0
禅与计算机程序设计艺术
·
2023-11-21 23:38
大数据AI人工智能
大数据
人工智能
语言模型
Java
Python
架构设计
数据湖学习笔记No.03(
数据仓库
)
数据仓库
资料链接:https://cloud.fynote.com/share/d/f3WMWzN数据分析业务痛点分析业务系统数据:存放在关系数据库中用户日志数据:用户在系统中产生javaweb为什么需要大数据
SEUsmith
·
2023-11-21 22:34
大数据学习
数据仓库
学习
数据库
万字详解大数据架构新概念
▲点击上方“老于的笔记”关注公众号回复1,免费获取B端运营地图正文来了随着近几年数据湖概念的兴起,业界对于
数据仓库
和数据湖的对比甚至争论就一直不断。
于连林_
·
2023-11-21 22:53
大数据
架构
数仓理论基础
数据仓库
的主体hive两种建模方式:ER和维度ER模型实体关系模型:将复杂的数据抽象为实体和关系。实体表示一个对象,关系指的是两个实体之间的关系,比如学生和班级之间的从属关系。
Made in Program
·
2023-11-21 19:15
数据仓库
hive
数据库
数据仓库
理论
修改记录时间内容2020年9月13日第一次发布推荐书:《
数据仓库
工具书》(纯理论)、大数据之路-阿里巴巴大数据实践、一、数仓相关概念
数据仓库
:英文DataWareHouse,
数据仓库
是面向主题,为分析数据而设计的
宇宙中的Philip
·
2023-11-21 17:43
数仓理论
数据仓库
大数据
hive
数据仓库
_模型设计_学习目录
前言:1、问什么要写这篇博客?随着自己在`数仓`岗位工作的年限增加,对数仓的理解和认知也在发生着变化所有用这篇博客来记录工作中用到的`知识点`与`经验`2、这篇博客主要记录了那些内容?主要会记录一些`数仓建设方法论`和工作技巧目录:
广阔天地大有可为
·
2023-11-21 13:47
数据仓库建设与企业案例
数据仓库
数据仓库
高级面试题
数仓高内聚低耦合是怎么做的定义高内聚:强调模块内部的相对独立性,要求模块内部的元素尽可能的完成一个功能,不混杂其他功能,从而使模块保持简洁,易于理解和管理。低耦合:模块之间的耦合度要尽可能的低,避免模块之间的复杂依赖,使得每个模块都可以独立存在,从而减少模块间的相互影响,提高系统的可维护性。做到低耦合、高内聚一般复杂的公共逻辑可以采用抽象类和抽象方法的方式下沉到共有模块中,然后由相关子类去实现抽象
小小哭包
·
2023-11-21 13:16
大数据
大数据
spark
分布式
数据仓库
GreenPlum数据库调研及架构介绍
docs-cn.greenplum.org/v6/admin_guide/intro/arch_overview.htmlGreenplum数据库是一种大规模并行处理(MPP)数据库服务器,其架构特别针对管理大规模分析型
数据仓库
以及商业智能工作负载而设计
Aiky哇
·
2023-11-21 11:48
数据库架构
测试调研
olap
数据仓库
pyspark案例系列5-Spark ETL将MySQL数据同步到Hive
文章目录一.需求二.解决方案2.1全量同步2.2增量同步备注:Spark2.4.0一.需求最近做
数据仓库
项目的时候,觉得sqoop有点慢,然后想尝试使用Spark来做ETL。
只是甲
·
2023-11-21 10:33
大数据和数据仓库
#
Spark
hive
spark
mysql
pyspark案例系列6-将Hive表数据写入MySQL
文章目录一.需求二.解决方案一.需求我们做
数据仓库
的时候,一般是将源系统的数据(如MySQL)抽取到Hive中,然后在Hive中做ETL后,最后将处理完的数据从Hive再抽回到MySQL。
只是甲
·
2023-11-21 10:33
大数据和数据仓库
#
Spark
hive
mysql
spark
上一页
9
10
11
12
13
14
15
16
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他