E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
041-数据仓库
Hive3.x数仓开发
文章目录一、数仓仓库概念二、
数据仓库
分层架构ODS\DW\DA(ADS)ETL\ELT三、ApacheHive概述为什么使用HiveHive和Hadoop关系四、ApacheHive架构、组件组件五、ApacheHive
_七七
·
2023-10-20 01:24
大数据数仓
数据仓库
学习
hive
【Hive】(二十二)往 Hive 表中插入与导出数据方式load 、insert 、sqoop 等方式详解
hive表中导入数据三、通过查询insert....select的形式往hive中导入数据四、使用create....as语句往hive表里装载数据五、从hive表里导出数据到文件系统一、前言往hive
数据仓库
的表中导入数据
云 祁
·
2023-10-20 01:20
#
----
Hive
hive
数据仓库
Hive篇面试题+详解
Hive是一个基于Hadoop的
数据仓库
工具,它提供了一个类SQL的查询语言(HiveQL)来查询和分析存储在Hadoop集群中的大规模数据。
Young_IT
·
2023-10-19 22:39
大数据开发
hadoop
hive
大数据
【转】数据库、数据湖、
数据仓库
、湖仓一体、智能湖仓,分别都是什么鬼?
这个都立意到了数据中台和智能湖仓了,算是一个阶段的总结?URL:https://www.sohu.com/a/470290853_258957文中划重点:“湖仓一体”只是开局,智能湖仓才是终极智能湖仓并非单一产品,它描述的是一种架构。这套架构,以数据湖为中心,把数据湖作为中央存储库,再围绕数据湖建立专用“数据服务环”,环上的服务包括了数仓、机器学习、大数据处理、日志分析,甚至RDS和NOSQL服务
万州客
·
2023-10-19 22:56
7000字,详解仓湖一体架构!
本文转载自公众号:数据学堂全文共7110个字,建议阅读15分钟在了解湖仓一体化之前,我们先来看一则有关
数据仓库
的有趣故事吧~沃尔玛拥有世界上最大的
数据仓库
系统,它利用数据挖掘方法对交易数据进行分析后发现
浪尖聊大数据-浪尖
·
2023-10-19 18:09
数据仓库
大数据
编程语言
hadoop
数据库
科杰科技:基于湖仓一体架构的Hudi技术实现
一湖仓一体架构的定义和特点湖仓一体架构是一种结合数据湖和
数据仓库
的数据管理架构。它的核心思想是将数据湖和
数据仓库
合并为一个整体,实现数据的统一管理和分析。
科杰科技
·
2023-10-19 17:34
架构
数据仓库
数据库架构
大数据
基于flink 的LakeHouse 2.0湖仓一体架构
基于flink的LakeHouse2.0湖仓一体架构简介Lakehouse是一种结合了数据湖和
数据仓库
优势的新范式,解决了数据湖的局限性。
活在风浪里~
·
2023-10-19 17:03
大数据架构
flink
架构
数据仓库
hadoop
大数据
湖仓一体架构的特性
湖仓一体架构是一种数据架构模式,具有以下特性:统一存储:湖仓一体架构将数据湖和
数据仓库
合并为一个整体,将结构化数据和非结构化数据存储在同一个存储系统中,如Hadoop分布式文件系统(HDFS)或云存储服务
abckingaa
·
2023-10-19 17:55
DB
DB
hive往es映射表写数据报错
hive是基于Hadoop的一个
数据仓库
工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。
jiedaodezhuti
·
2023-10-19 16:59
elasticsearch
hadoop
hive
elasticsearch
hadoop
Hive知识梳理(好文)
Hive是建立在Hadoop上的
数据仓库
基础构架。可以将SQL查询转换为MapReduce的job在Hadoop集群上执行。
英雄111888
·
2023-10-19 13:20
hive
hadoop
数据仓库
【
数据仓库
】hadoop生态圈与
数据仓库
文章目录1.大数据定义2.Hadoop与
数据仓库
3.关系数据库的可扩展性瓶颈4.CAP理论5.Hadoop
数据仓库
工具5.1.RDS和TDS5.2.抽取过程5.3.转换与装载过程5.4.过程管理和自动化调度
roman_日积跬步-终至千里
·
2023-10-19 11:12
数据仓库
数据仓库
hadoop
大数据
数据研发面经
数据仓库
12.658同城面经多益网络1.数据库索引的类型包括:**唯一索引、主键索引、聚集
只会收藏他人资料的卑微嘎
·
2023-10-19 07:42
链表
数据结构
算法
数据仓库
技术
数据仓库
基础
数据仓库
的价值
数据仓库
的源数据类型
数据仓库
的基本架构
数据仓库
的多维数据模型数据立方体与OLAP维(Dimension)和立方(Cube)
数据仓库
的基本特征
数据仓库
元数据管理
数据仓库
概述
数据仓库
与数据集市建模
数据仓库
系统的实现与使用基于
o黄裳元吉o
·
2023-10-19 05:49
Hadoop之MapReduce基本简介
目录1、MapReduce的基本概念2、MapReduce的工作流程3、MapReduce与Yarn5、基于
数据仓库
的Hive1、MapReduce的基本概念1.1基本概念Mapreduce是一个分布式运算程序的编程框架
下一秒,待续
·
2023-10-19 04:19
大数据
浅谈
数据仓库
(DW & BI)(三)
回顾一下之前的内容:#42浅谈
数据仓库
(DW&BI)(一):
数据仓库
发展起源及概述#43浅谈
数据仓库
(DW&BI)(二):粒度、存储、3NF、星型模型、雪花模型
数据仓库
相关内容,现在我还没有形成一个逻辑清晰的叙述思路
小杨_1858
·
2023-10-19 02:24
hadoop和hive、spark、presto、tez是什么关系
Hive是一个基于Hadoop的
数据仓库
系统,它允许用户使用SQL语言来查询和分析大型数据集。Hive通过将SQL查询转换为MapReduce任务来实现。
草履虫稽亚娜
·
2023-10-19 02:55
hadoop
hive
spark
大数据
分布式
基于hive的日志数据统计实战
基于hive的日志数据统计实战一、hive简介hive是一个基于hadoop的开源
数据仓库
工具,用于存储和处理海量结构化数据。
ych0108
·
2023-10-18 20:56
BigData
hive
hive入门
hive日志分析
hive读取mysql日志_基于hive的日志分析系统
hive简介hive是一个基于hadoop的开源
数据仓库
工具,用于存储和处理海量结构化数据。
Aviationbamboo
·
2023-10-18 20:25
hive读取mysql日志
基于Hadoop的
数据仓库
Hive的介绍、安装与基本应用
文章目录基于Hadoop的
数据仓库
Hive的介绍、安装与基本应用一、概述二、Hive系统架构三、Hive工作原理四、HiveHA基本原理五、Impala六、Hive安装七、Hive编程实战附一:管理表(
珞清殇
·
2023-10-18 20:53
大数据
Note
hive
Hive
前言Hive是建立在Hadoop基础上的
数据仓库
基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。
两只手
·
2023-10-18 20:23
Hive简介
一、Hive简介Hive是一个基于hadoop的开源
数据仓库
工具,用于存储和处理海量结构化数据。
needle2
·
2023-10-18 20:51
hadoop
2010
csv
数据库
table
xml
基于 hive 的日志数据统计实战
基于hive的日志数据统计实战一、hive简介hive是一个基于hadoop的开源
数据仓库
工具,用于存储和处理海量结构化数据。
jiangkai_nju
·
2023-10-18 20:20
hadoop学习之路
hadoop
2010
csv
数据库
table
xml
系统架构师上午题部分知识点汇总
系统架构师系统架构师上午题知识树系统架构师计算机组成与体系结构计算机系统组成存储器系统流水线操作系统操作系统的类型与结构操作系统的基本原理数据库系统数据库管理系统的类型数据库的模式与范式数据库设计事物管理分布式数据库系统
数据仓库
数据挖掘
Miaow.Y.Hu
·
2023-10-18 11:50
软考
系统架构
联邦学习中的攻击手段和防御机制
联邦学习产生的背景:海量数据的生成和这些数据的后续处理往往需要一个
数据仓库
并在仓库内汇总数据。
白兔1205
·
2023-10-18 08:34
笔试
人工智能
数据仓库
系列4-维度表
一.维度表技术基础1.1维度表结构 每个维度表都包含单一的主键列。维度表的主键可以作为与之关联的任何事实表的外键,维度表行的描述环境应与事实表行完全对应。维度表通常比较宽,是扁平型非规范表,包含大量的低粒度的文本属性。操作代码与指示器可作为属性对待,最强有力的维度属性采用冗余的描述填充。维度表属性是查询及BI应用的约束和分组定义的主要目标。报表的描述性标识通常是维度表属性领域值。image.pn
只是甲
·
2023-10-18 07:55
BI数据工程师--55、SSAS在商业决策中的重要性
BI数据工程师--医疗数据源下载BI数据工程师--医疗绩效PPT与医疗指标文档下载BI数据工程师--医疗
数据仓库
模型下载BI数据工程师--01、教程介绍BI数据工程师--02、BI数据工程师的特点BI数据工程师
focusBI
·
2023-10-18 06:42
数仓建设(三)
4.DWS公共汇总层设计规范
数据仓库
的性能是
数据仓库
建设是否成功的重要标准之一。聚集主要是通过汇总明细粒度数据来获得改进查询性能的效果。
未来在这儿
·
2023-10-18 06:10
数仓
大数据
数据库
数据仓库
121-124-Hadoop-MapReduce-etl:
ETL一词较常用在
数据仓库
,但其对象并不限于
数据仓库
在运行核心业务MapReduce程序之前,往往要先对数据进行清洗,清理掉不符合用户要求的数据。清理的过
镇魂Boby
·
2023-10-18 03:35
hadoop
大数据
hadoop
mapreduce
etl
【大数据之Hadoop】十七、MapReduce之数据清洗ETL
ETL是将业务系统的数据经过抽取、清洗转换之后加载到
数据仓库
的过程,目的是将分散、零乱、标准不统一的数据整合到一起,为决策提供分析依据。ETL的设计分三部分:数据抽取、数据的清洗转换、数据的加载。
阿宁呀
·
2023-10-18 03:04
hadoop
大数据
hadoop
mapreduce
etl
Hadoop3教程(十九):MapReduce之ETL清洗案例
ETL主要应用于
数据仓库
,但不只是应用于
数据仓库
,毕竟这个更像是一类思想。在运行核心的MR程序之前,往往要对数据进行清理,清除掉不符合用户要求的数据,
经年藏殊
·
2023-10-18 03:01
大数据技术
mapreduce
大数据
hadoop
搜狐智能媒体
数据仓库
体系建设实践
分享嘉宾:翟东波搜狐媒体编辑整理:王洪达出品平台:DataFunTalk、AI启蒙者导读:本次分享的主题为搜狐智能媒体
数据仓库
体系建设实践,会对
数据仓库
中的基本概念进行简单梳理,明确
数据仓库
体系建设涵盖的相关流程
浪尖聊大数据-浪尖
·
2023-10-17 17:28
数据仓库
kafka
数据仓库
大数据
编程语言
数据库
数据分析
GBase 8a MPP产品简介
2、应用场景GBase8aMPPCluster用于支撑各类
数据仓库
系统、BI系统和决策支持系统。3、技术特点GBase8a
wangzhejijie
·
2023-10-17 17:18
国产数据库
数据仓库
big
data
数据库
MyCAT:回顾当年的热潮,探寻这款备受欢迎的数据库中间件的核心特性
可以替代MySQL的加强版数据库一个可以视为MySQL集群的企业级数据库,用来替代昂贵的Oracle集群一个融合内存缓存技术、NoSQL技术、HDFS大数据的新型SQLServer结合传统数据库和新型分布式
数据仓库
的新一代
技术琐事
·
2023-10-17 16:13
分布式
数据库
java
maven
数据库、数据中台、
数据仓库
、数据湖区别
数据时代,各行业的企业都已经开始通过数据库来沉淀数据,但是真的论起数据库、
数据仓库
、数据中台,还是新出现的数据湖,它们的概念和区别,可能知道的人就比较少了,今天我们详细来比较了解一下。
那小子、真烦
·
2023-10-17 13:06
数据库
数据仓库
与ETL
什么是
数据仓库
一种用于存储和管理数据的系统,提供一种统一方式,将不同来源、不同方式、不同时间的数据集成在一起。
数据仓库
结构主题域:一个特定领域的数据集,比如营销、销售、客户、库存等。
超级无敌暴龙战士塔塔开
·
2023-10-17 13:03
数据
数据仓库
etl
数据挖掘 (二)
一,体系结构典型数据挖掘系统数据的来源数据库服务器,数据库数据挖掘的引擎数据挖掘的模式数据可视化技术的展示二,数据类型关系数据库使用最广泛
数据仓库
各个分立的数据库统一事务数据库高级数据库系统和信息库空间数据库时间数据库和时间序列数据库时间数据库和时间序列数据库都存放与时间有关的数据
行走记忆时光
·
2023-10-17 12:13
Maxcompute批量分区删除
ps:Maxcompute
数据仓库
建设的分享。
Wesin
·
2023-10-17 10:41
大数据开发复习(1)
就业岗位介绍面试流程最重要的是简历基础复习JavamysqlLinuxday02HDFSMapReducehive(sqlboy)HBASEday03kafkaredisesday04scalasparkflinkday05etl
数据仓库
小码上线
·
2023-10-17 09:55
JavaSE
java
数据批处理速度慢?不妨试试这个
大部分业务统计都会要求以某日作为截止点,而且为了不影响生产系统的运行,跑批任务一般会在夜间进行,这时候才能将生产系统当天产生的新明细数据导出来,送到专门的数据库或
数据仓库
完成跑批
字母哥课堂
·
2023-10-17 08:47
金融用户实践|分布式存储支持
数据仓库
业务系统性能验证
作者:深耕行业的SmartX金融团队闫海涛估值是指对资产或负债的价值进行评估的过程,这对于投资决策具有重要意义。每个金融公司资管业务人员都期望能够实现实时的业务估值,快速获取最新的数据和指标,从而做出更明智的投资决策。为了更好地实现实时估值,某金融客户使用SmartX分布式块存储产品SMTXZBS进行系统性能优化探索,并与本地硬盘环境进行了对比测试。本文将重点分享客户在估值业务系统效率提升方向上所
志凌海纳SmartX
·
2023-10-17 01:22
金融
分布式
数据仓库
什么是商业智能(BI),就看这篇文章足够了
百度商业智能BI有很多很多官方的定义,各种解释,实际上从这么多年的经验出发,对商业智能BI的定义我认为不需要弄得很复杂,就三条:第一,商业智能BI是一套完整的由
数据仓库
、查询报表、数据分析等组成的数据类技术解决方案
派可数据BI可视化
·
2023-10-17 00:50
数据要素
商业智能
数字化转型
商业智能BI
数据分析
数据仓库
数据仓库
的基本概述之扫盲系列
数据仓库
的诞生原因随着互联网的普及,信息技术已经深入到各行各业,并逐步融入到企业的日常运营中。然而,当前企业在信息化建设过程中遇到了一些困境与挑战。1、历史数据积存。
派可数据BI可视化
·
2023-10-17 00:50
商业智能
数据要素
数字化转型
数据仓库
spark
大数据
商业智能BI
数字化转型
数据分析
数字化时代,
数据仓库
究竟是干什么的?
无论你是否专门从事大数据开发,作为一个开发人员,应该都听说过
数据仓库
的概念,那你知道为什么会出现
数据仓库
?
数据仓库
究竟是干嘛的吗?有什么价值和意义呢?那么本文就带到入门,揭开
数据仓库
的面纱。
派可数据BI可视化
·
2023-10-17 00:16
数据可视化
商业智能
数据仓库
数据仓库
商业智能BI
数据分析
信息可视化
大数据
数仓建设规范说明书
概述本⽂档是
数据仓库
规范设计说明书,旨在规范化、统⼀化
数据仓库
整体建设。通过数仓架构设计、数仓模型设计、数仓开发规范、数据质量规范这四个⽅⾯对整体数仓建设做好规范化的指导。
贾斯汀玛尔斯
·
2023-10-16 18:39
hadoop
数据湖
大数据
分布式
hadoop
LAS Spark 在 TPC-DS 的优化揭秘
TPC-DS是一个模拟复杂
数据仓库
环境的测试基准,LASSpark通过采用规则优化、缓存优化和运行时优化三类优化策略,实现了超越社区版本的巨大性能提升,且已在内部生产环境得到验证。文末更有专属彩
字节数据平台
·
2023-10-16 14:26
大数据
分布式
数据库
火山引擎
云原生
数据研发
「数仓建设」主题域划分
一、前言
数据仓库
具有面向主题的特性,那么就会有主题的概念,数仓建设是遵循纵向分层开发,横向划分主题域设计,数仓分层就不在这次谈了,这次我会结合本人数仓工作实践总结的经验来聊聊数仓主题域划分,同时会引申出主题划分
大数据阶梯之路
·
2023-10-16 12:38
SQL Server 2005 中的商务智能和
数据仓库
SQLServer2005中的商务智能和
数据仓库
(1)【导读】本文概述了SQLServer2
yangwl
·
2023-10-16 09:19
DataMining
with
SqlServer
sql
server
数据仓库
microsoft
数据库
数据挖掘
服务器
【大数据】 Hive安装 【学习笔记】
什么是HiveHive是一个
数据仓库
基础设施工具,用于处理Hadoop中的结构化数据。它位于Hadoop的顶部,用于汇总大数据
一个平凡de人
·
2023-10-16 06:31
大数据
hadoop
hive
大数据
Hive-SQL学习笔记
HIVE-SQLDDL(DataDefinationLanguage)DML(Datamanipulationlanguage)DQL(dataquerylanguage)Hive是基于Hadoop的一个
数据仓库
工具
Sais_Z
·
2023-10-16 06:00
数据库相关
大数据相关
hive
大数据
数据库
大数据--hive学习笔记
一、Hive简介建立在Hadoop之上的
数据仓库
架构hive的设计目标:可伸缩、可扩展、容错及输入格式松耦合!一套方便的实施数据抽取(ETL)的工具。一种让用户对数据描述其结构的机制。
TaroLee
·
2023-10-16 06:29
大数据系列
hive
hadoop
大数据
上一页
16
17
18
19
20
21
22
23
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他