E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
--------【数据仓库】
大
数据仓库
之Hive@2019-06-05
基础https://blog.csdn.net/s646575997/article/details/51469104进阶https://blog.csdn.net/s646575997/article/details/51471000对SDE的解释http://www.it610.com/article/4630706.htmsparkSQLhttps://www.cnblogs.com/had
dataHunter
·
2023-03-24 00:26
Chapter 1 大数据处理框架概览
关系型数据库解决了关系型数据的存储与OLTP(On-lineTranscationProcessing,在线事务处理)问题,
数据仓库
解决了数据建模及OLAP(On-lineAnalyticalProcessing
溱溱~
·
2023-03-23 22:28
大数据处理框架Apache
Spark
设计与实现
大数据
hive部署的3种模式,及应用差异
1、hive的技术原理hive是基于Hadoop的
数据仓库
系统,可以查询、分析和存储在HDFS分布式文件系统中的数据,将结构化的数据文件映射为一张数据库表,转换SQL语句为MapReduce任务运行,对外提供完整的
沉思的雨季
·
2023-03-23 22:15
数仓理论及建模方法
1.数仓概述
数据仓库
:
数据仓库
是一个面向主题的、集成的、非易失的、随时间变化的数据集合。
JOEL-T99
·
2023-03-23 19:22
BigData
数据仓库
数据库
big
data
hive架构初步梳理
hive由Facebook开源用于解决海量结构化日志的数据统计工具,或者说是
数据仓库
的工具,其最大的作用就是将HQL转化成MapReduce程序,然后对数据进行处理,如下是其实现的流程。
@anSon_
·
2023-03-23 19:50
hive
大数据
hive架构详解
hive是一个基于大数据技术的
数据仓库
(DataWareHouse)技术,主要是通过将用户书写的SQL语句翻译成MapReduce代码,然后发布任务给MR框架执行,完成SQL到MapReduce的转换。
张凯生
·
2023-03-23 19:50
hive
hive
【分析函数】一文遍识开窗函数
引言数据库中的窗口函数也叫分析函数,顾名思义,窗口函数可用于一些复杂的统计分析计算,另外,窗口函数还具有优越的性能表现,可以节约时间和资源,因此窗口函数经常用于
数据仓库
和大型报表应用中。
Axlsss
·
2023-03-23 18:41
数据库
数据库
oracle
hive的体系架构
(*)Hive是基于HDFS之上的一个
数据仓库
HiveHDFS表目录数据文件分区目录桶文件(*)Hive是一个翻译器,默认,把SQL---->MapReduce(*)Hive支持SQL的一个子集。
枣泥馅
·
2023-03-23 18:59
大数据hadoop
hadoop
hive
Hive架构图
hive是基于hadoop的一个
数据仓库
工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在hadoop、中的大规模数据的机制。
秃头小宝贝儿i
·
2023-03-23 18:24
大数据
hive
hadoop
Hive架构简述及工作原理
Hive是基于Hadoop的一个
数据仓库
管理工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL(HQL)查询功能。本质是将SQL转换为MapReduce程序(默认)。
思屿`
·
2023-03-23 18:20
Hadoop
hive
架构
hadoop
一篇文章搞懂 Hive 的系统架构
本专栏目录结构和参考文献请见1000个问题搞定大数据技术体系正文Hive是底层封装了Hadoop的
数据仓库
处理工具,它运行在Hadoop基础上,其系统架构组成主要包含4个部分,分别是用户接口、跨语言服务
Shockang
·
2023-03-23 18:34
大数据技术体系
大数据
hive
实时
数据仓库
的发展、架构和趋势
当前基于Hive的离线
数据仓库
已经非常成熟,数据中台体系也基本上是围绕离线数仓进行建设。
TASKCTL
·
2023-03-23 17:33
数据仓库
建模——维度建模
数据仓库
的建模方法有很多种,常见的有维度建模法、范式建模法、实体建模法等,下面主要介绍一下维度建模法。
Q以梦为马
·
2023-03-23 16:26
数据库,
数据仓库
,数据湖......下一个是啥?
经过这些年的快速发展,云计算不但成为数字化的基础设施,更是企业持续创新和精益运营的关键支撑。能否从云上获取更多价值,将成为企业能否在数字时代拥有一席之地、持续领先领跑的关键。而云原生对基础设施的革新,带来了一系列“蝴蝶效应”。随着云原生技术已在互联网、金融等行业“落地开花”,云原生基础设施不仅可以丰富数字化应用场景的多元化实践,也将为企业发展提供可持续的内生动力,“智能湖仓”便是其中最为重要的技术
码农翻身
·
2023-03-23 15:24
数据库
数据仓库
2019年目标
2019年目标0.excel学习1.把.net高级语法学一遍2.学会
数据仓库
3.人工智能课程4.找个女朋友过日子
VicmLee
·
2023-03-23 10:01
Flink 入门(一):Flink 背景、架构以及基本知识点
今年Flink火的一塌糊涂,一些大厂比如阿里巴巴也都开始使用Flink构建实时
数据仓库
。一、什么是Flink?
alexlee666
·
2023-03-23 07:08
Doris vs ClickHouse vs GreenPlum
Doris构建
数据仓库
:ClickHouse和DorisDB的对比:标准SQL语言支持ClickHouse:不支持标准SQL语言,无法直接对接主流的BI系统。
严国华
·
2023-03-23 06:30
MySQL基础学习笔记
概述为什么要学数据库大数据时代,所有最后落地最普遍的便是数据库数据库是所有软件体系中最核心的存在什么是数据库数据库——DataBase——DB,
数据仓库
,用于存储和管理数据。
卡斯特梅的雨伞
·
2023-03-22 23:47
MySql - 课程学习
标准SQL数据语言支持多系统,支持多种语言支持大型数据库,支持5000w条记录
数据仓库
,32位系统表文件支持4G,64位支持8TG。
点滴积累慢慢学习
·
2023-03-22 21:46
数据仓库
概述
本人从事通信行业
数据仓库
系统集成服务已有10年,从数据分析挖掘(BI)到数据库维护管理再到ETL过程开发和hadoop生态使用和开发,随着开源技术的发展和盛行,
数据仓库
也在随之发生着变化,但其存在意义还是为了企业的决策支持
Mr_Yu_1024
·
2023-03-22 15:40
九、大数据技术之Hive
Hive是基于Hadoop的一个
数据仓库
工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。
@我不是大鹏
·
2023-03-22 11:20
大数据技术
hive
big
data
hadoop
大数据技术之Hive(二)Hive入门
1.1.2什么是hivehive是一个构建在Hadoop上的
数据仓库
工具(框架),可以将hdfs上的结构化的数据文件映射成一张数据表,并可以使用类SQL语句来对这样的数据文件
five小点心
·
2023-03-22 11:44
大数据
大数据
hive
Hive与HBase的区别及应用场景
一、定义Hive是基于Hadoop的一个
数据仓库
工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,默认情况下可以将sql语句转换为MapReduce任务进行运行。
6个日的梦想
·
2023-03-22 10:30
大数据学习整理
hive
hbase
hadoop
dubbo如何使用
相关工具的概念1.dubbo:是管理中间层的工具,在业务层到
数据仓库
间有非常多服务的接入和服务提供者需要调度,dubbo提供一个框架解决这个问题。
a86e8e27fc21
·
2023-03-22 09:45
阿里巴巴大数据实践(数据管理篇)
元数据打通了源数据、
数据仓库
、数据应用,记录了数据从产生到消费的全过程。元数据主要记录
数据仓库
中模型的定义、各层级间的映射关系、监控
数据仓库
的数据状态及ETL的任务运行状态。
天线嘟嘟茄
·
2023-03-22 07:33
2020-11-29 实时同步
背景数据源进入
数据仓库
,需要一步ETL操作,传统通过离线的方式,将前一天T+1的数据导入到ODS层中。
LancerLin_LX
·
2023-03-22 03:25
数据仓库
理论第一炮
在Kimball和Inmon是两种主流的
数据仓库
方法论,分别由RalphKimball和BillInmon提出,在实际
数据仓库
建设中,业界往往会相互借鉴使用两种开发模式。
孤城心
·
2023-03-21 08:36
日更 | 高级项目管理师复习第一章
共21个考点:1.国家信息化体系六要素2.信息系统的生命周期3.信息系统开发方法4.OSI七层5.网络存储技术6.数据库管理系统7.
数据仓库
技术8.中间件层次9.需求分析10.UML11.软件架构风格12
原色世界
·
2023-03-21 00:39
hbase权威指南
离线批量处理的存储可以用hive(
数据仓库
),pig(数据分析引擎)等工具。第一章简介1.1海量数据的黎明在面对一些特殊的场景时关系模型并不是最佳的解决方案。Hadoop这样的系统可以提供PB
496f92d634c1
·
2023-03-20 19:18
自研云原生
数据仓库
AnalyticDB再破权威评测TPC-DS世界纪录!
作者:南仙,阿里云数据库高级技术专家北京时间2020/5/4青年节,TPC(全球最知名非盈利的数据管理系统评测基准标准化组织)官网正式上线AnalyticDBTPC-DS成绩,AnalyticDB通过严苛的TPC-DS全流程测试,性能QphDS分数为14895566,性价比分数为0.08CNY,相比较基于Spark深度优化版的前世界纪录性能提升29%并且单位成本仅为其1/3,成为TPC-DS官方榜
阿里云数据库
·
2023-03-19 21:34
大数据分析入门知识
大数据包含太多东西了,从
数据仓库
、hadoop、hdfs、hive到spark、kafka等,每个要详细的说都会要很久的,所以我不认为这里面有一个答案是合理的。
奔跑的苏立
·
2023-03-19 14:32
33.flink cdc 实时数据同步利器
有这样一个需求,比如在mysql数据库中存在很多数据,但是公司要把mysql中的数据同步到
数据仓库
(starrocks),
数据仓库
你可以理解为存储了各种各样来自不同数据库中表。
以后不会再写文章了
·
2023-03-19 11:22
flink
数据库
数据仓库
Greenplum 架构详解 & Hash Join 算法介绍
Greenplum数据库是一种大规模并行处理(MPP)数据库服务器,其架构特别针对管理大规模分析型
数据仓库
以及商业智能工作负载而设计。
禅与计算机程序设计艺术
·
2023-03-19 10:09
数据仓库
建模
这篇文章主要讲述的是
数据仓库
建模的一些基本概念,包括:实体、属性、域、关系、键、约束、范式、命名规范等。
BI_通古知今
·
2023-03-19 07:49
数据 数据中台
比如说原来最早的时候,有非常多的数据报表数据可视化,然后到后来,有了商业智能,有了DataWarehouse(就是
数据仓库
),然后数据挖掘。
流浪山人
·
2023-03-19 05:34
数据仓库
基于onedata的实施过程
本节重点讲解怎么使用OneData这套体系和相配套的工具实施数据系统的模型建设,在讲解中会以阿里巴巴的具体业务进行说明指导方针首先,在建设大数据
数据仓库
时,要进行充分的业务调研和求分析。
叫兽吃橙子
·
2023-03-18 13:45
数据库 VS
数据仓库
数据库和
数据仓库
这几个字看起来都差不多,不就多个仓字嘛,又不是多了苍老师?从本质上来说,数据库和
数据仓库
都是数据的集合。没什么不同。但是它们的定位确是不一样。
飞鸟不急
·
2023-03-18 13:30
数据仓库
、数据湖、数据中台一文读懂【2】
大数据封面.png4.1概述Pentaho首席技术官JamesDixon创造了“数据湖”一词。它把数据集市描述成一瓶水(清洗过的,包装过的和结构化易于使用的)。而数据湖更像是在自然状态下的水,数据流从源系统流向这个湖。用户可以在数据湖里校验,取样或完全的使用数据。这个也是一个不精确的定义。数据湖还有以下特点:从源系统导入所有的数据,没有数据流失。数据存储时没有经过转换或只是简单的处理。数据转换和定
笔名辉哥
·
2023-03-18 12:13
<
数据仓库
和数据挖掘> 第二章 联机分析处理
是针对特定问题的联机数据访问和分析处理.通过对信息的多种可能形式进行快速,稳定,一致的交互式存取,允许决策者对数据进行深入的观察.1.OLAP的相关概念.多维数据集:(数据立方体).多维数据集是一个数据集合,通常从
数据仓库
子集构造
向暖而生
·
2023-03-18 06:14
BI:一本被念歪了的经书
BI(BusinessIntelligence)即商业智能,这个概念最早是在1996年提出的,当时将商业智能定义为一类由
数据仓库
(或数据集市)、查询报表、数据分析、数据挖掘等部分组成的、以帮助企业决策为目的技术及其应用的技术组合体
戎码半生
·
2023-03-18 06:00
Hive入门学习记录
一、概述Hadoop的发音是[hædu:p]Hive是构建在hadoopHDFS上的一个
数据仓库
。
一只疯兔的迭代记录
·
2023-03-18 01:38
java大数据之greenplum
主要用在
数据仓库
中,做大规模数据和复杂的查询功能所涉及。1.5Greenplum总体架构数据库由MasterSevers
这一刻_776b
·
2023-03-17 12:46
大数据知识点分享:大数据平台应用 17 个知识点汇总
一、大数据中的
数据仓库
和Mpp数据库如何选型?在Hadoop平台中,一般大家都把hive当做
数据仓库
的一种选择,而Mpp数据库的典型代表就是impala,presto。
haotian1685
·
2023-03-17 07:27
大数据
大数据
大数据学习
hadoop
spark
听说你还在为海量数据构建不同
数据仓库
?华为云学院DataLake了解一下!
By:FYS_CMSS的CSDN博客“Adatalakeisamethodofstoringdatawithinasystemorrepository,initsnaturalformat,thatfacilitatesthecollocationofdatainvariousschemataandstructuralforms,usuallyobjectblobsorfiles”数据湖是在系统或
舒意从生
·
2023-03-16 15:15
oracle没有引擎概念
OLAP是
数据仓库
系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂
奋豆来袭
·
2023-03-16 09:20
数据库
数据仓库
oracle
【Hive】MR 工作流程(数据流转)
Hive是基于Hadoop的一个
数据仓库
工具。通过hive,我们可以方便地进行ETL的工作。
CLOcean
·
2023-03-15 16:59
如何在GitLab上传本地项目
项目的步骤目录介绍:一、配置SSH秘钥(仅针对本机首次上传GitLab项目)二、上传项目1、新建一个空文件夹,并在该文件夹下右键打开GitBash2、在GitBash中进行登录操作3、下拉文件到本地4、上传文件到
数据仓库
浩·
·
2023-03-15 14:15
Git
git
github
Python数据分析理论与实战完整版本
Python数据分析基础一、Python数据分析初探二、数据获取2.1数据获取的手段2.2
数据仓库
2.3检测与抓取2.4填写、埋点、日志2.5计算2.6数据学习网站三、单因子探索分析与可视化3.1理论铺垫
Geek_bao
·
2023-03-15 09:18
利用Python进行数据分析
数据分析
python数据分析实战
python
基于Apache Hudi构建智能湖仓实践(附亚马逊工程师代码)
本文来源于网络,如有侵权,联系浪尖删除:langjianliaodashuju转自:hudi
数据仓库
的数据体系严格、治理容易,业务规模越大,ROI越高;数据湖的数据种类丰富,治理困难,业务规模越大,ROI
浪尖聊大数据-浪尖
·
2023-03-15 08:50
大数据
hadoop
数据库
java
分布式
[实战系列]SelectDB Cloud Flink Connector 最佳实践
而云原生实时数仓的出现,让传统的
数据仓库
无论是成本、灵活性还是开放性等方面都显露出不足。拥有高性能、高可用性、可伸缩性、高安全性等特征的云原生数据库,正在成为企业的首选。
hf200012
·
2023-03-15 07:04
doris
SelectDB
flink
上一页
48
49
50
51
52
53
54
55
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他