E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
041-数据仓库
在window10上安装apache-hive-3.1.3
一、hive介绍hive是什么:hive是基于Hadoop的一个
数据仓库
工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。
爱上雪茄
·
2023-11-09 09:22
大数据
JAVA知识
apache
hive
hadoop
如何从优化SQL入手提高
数据仓库
的ETL效率
1引言
数据仓库
建设中的ETL(Extract,Transform,Load)是数据抽取、转换和装载到模型的过程,整个过程基本是通过控制用SQL语句编写的存储过程和函数的方式来实现对数据的直接操作,SQL
码农中的战斗鸡
·
2023-11-09 05:22
ETL
ssis
sqlserver
SQL Server数据库及SSIS优化攻略
SSIS是MicrosoftSQLServerIntegrationServices的简称,是生成高性能数据集成解决方案(包括
数据仓库
的提取、转换和加载(ETL)包)的平台。
chuyang2652
·
2023-11-09 05:46
数据库
数据仓库
工具箱The Data Warehouse Toolkit 阅读笔记 (三:零售业务)
第三章目录前言一、维度模型构建的4个步骤1.选择业务过程2.声明粒度3.确定维度4.确定事实二、维度表设计细节1.日期维度2.读入数据总结前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。一、维度模型构建的4个步骤强烈抵制仅仅考虑数据来源来建模数据。讲注意力放在数据上可能不会像雨商业用
Dear Slim.
·
2023-11-09 04:50
数据仓库/BI
数据建模
《
数据仓库
工具箱》- 第三章零售业务中的知识点汇总
维度模型设计的4步过程1.选择业务过程业务过程通常用行为动词标示由某个操作型系统支撑,如订单和购买系统业务过程建立获取关键性能度量业务过程通常由输入激活,产生输出度量应该将注意力放在业务过程,而不是放在功能化的部门,可以更方便的获得一致的企业信息2.声明粒度粒度代表事实表中的每一行代表什么3.确定维度维度定义的是谁,什么时候,在哪的问题,作为聚合查询中的查询条件,分组条件,排序条件4.确定事实事实
weixin_34409741
·
2023-11-09 04:50
人工智能
数据库
后端
《
数据仓库
ETL工具箱》读书笔记
在本书中,你将学习到以下内容:规划&设计你的ETL系统从多种可能的架构中选出最合适的对实施过程进行管理管理日常的操作为ETL过程建立开发/测试/生产环境理解不同的后台数据结构,包括平面文件、规范化框架、XML框架和星型连接(维度)框架分析和抽取源数据创建完整的数据清洗子系统将数据结构化为维度框架,以便更有效提交给最终用户、商务智能工具、数据挖掘工具、OLAP立方体和分析应用系统
weixin_30535565
·
2023-11-09 04:20
数据结构与算法
数据库
运维
大数据从业者必读书籍《
数据仓库
工具箱》-第三章笔记
背景行业:零售行业详细信息:由100个分布在5个州的分店组成,每个商店都有完整的部门。包括杂货、冷冻食品、日常生活用品、肉类、农产品、烘烤食品、花卉、保健/美容产品等。每个商品包含被称为产品统一编号(SKU)的60000种不同的上架产品管理重点:对订单、库存、销售产品的组织工作目的:实现利润最大化,利润最终来源于赚取每种商品尽可能多的差价,降低获得产品的开销,提供具有较强竞争力的环境以吸引更多的顾
寒 暄
·
2023-11-09 04:49
☺技巧
大数据
数据仓库
数据仓库
工具箱 第10节 金融服务
文章目录
数据仓库
工具箱第10节金融服务银行案列研究与总线矩阵对维度进行分类以避免维度太少的陷阱家庭维度多值维度与权重因子报表的动态范围值实时
数据仓库
工具箱第10节金融服务金融服务涉及各行业,如信用卡公司
CODE20220318
·
2023-11-09 04:19
HADOOP
数据仓库
数据仓库
工具箱-学习笔记7-使用一致性维度
2.4使用一致性维度维度建模目的:集成来自不同商业过程的数据,且定义了简单而强大的解决方案。一、一致性维度不同的维度表的属性具有相同的列名和领域内容时,称维度表具有一致性。有利于事实表的重用,减少开发开销和重新创表、数据对不齐的开发症结。二、缩减维度在特定的需求下,我们需要进行缩减维度,由基本列or行的子集构成。例如按月和品牌进行预测报表,我们不需要将销售相关的终极原子的数据拉出来,只需要使用聚合
hxhh
·
2023-11-09 04:19
数据仓库
数据仓库
《
数据仓库
工具箱》-sql2005 定义业务需求
商业智能价值:输送业务价值1、获得赞助商关系2、定义企业级业务需求(1)建立初始化项目作用域(2)收集和归档企业级业务需求引导采访、提取分析主题、标识支持业务、业务过程放入初始化矩阵(3)区分优先级过程(4)项目规划(5)收集项目需求3、零售行业分析(1)了解公司背景策略文档、年度报表、市场计划、竞争分析、来自高层管理的年度现场基本业务信息:销售产品、产品销售地点及渠道(2)采访规划分清采访对象、
congtu3206
·
2023-11-09 04:48
数据仓库
工具箱-零售业务
文章目录一、维度模型设计的4步过程1.1第一步:选择业务过程1.2第二步:声明粒度1.3第三步:确定维度1.4第四步:确定事实二、零售业务案例研究2.1第一步:选择业务过程2.2第二步:声明粒度2.3第三步:确定维度2.4第四步:确定事实三、维度表设计细节3.1日期维度3.2产品维度3.3商店维度3.4促销维度3.5其他零售业维度3.6事务号码的退化维度四、实际的销售模式(星型模型)五、零售模式的
m0_46218511
·
2023-11-09 03:16
数据仓库
数据仓库
零售
数仓经典面试题
1.什么是
数据仓库
?请谈谈你对
数据仓库
的理解。
Young_IT
·
2023-11-09 03:04
大数据开发
1024程序员节
数据仓库
etl
大数据
数仓面经大框架
Hadoop:HDFS(重点),MapReduce(重点),YarnSparkHive从功能,原理,组成,运行流程调优(重点),Hive调优(参数、sql),Spark调优(资源、开发算子、数据倾斜、参数)3.
数据仓库
Young_IT
·
2023-11-09 02:03
大数据开发
大数据
数据仓库
数据分析
mysql
数据仓库
搭建_搭建
数据仓库
的流程简介
如何搭建一个
数据仓库
?下面大体说明了搭建的流程。
数据仓库
的结构用一幅图来表示:
数据仓库
的好处
数据仓库
是一套体系。
诗语情柔
·
2023-11-09 01:08
mysql数据仓库搭建
mysql
数据仓库
指南
出处:http://blog.chinaunix.net/uid-43642-id-2124570.html把前面的补上,脑子不好使了前言欢迎使用mysql多维
数据仓库
指南。
青云小凡
·
2023-11-09 01:34
mysql
mysql多维数据仓库
mysql
数据仓库
阿里云认证 | 2023年ACP认证考试大揭秘
它涵盖了大数据计算服务、大数据开发与治理平台、实时计算、实时
数据仓库
、检索分析服务、数据湖、大数据分析与可视化等多个方面的内容。
HCIE考证研究所
·
2023-11-08 16:24
网络工程师
运维
华为认证
网络
服务器
阿里云
ACP
校园招聘管理系统的设计与实现毕业设计源码161815
摘要由于数据库和
数据仓库
技术的快速发展,校园招聘信息系统建设越来越向模块化、智能化、自我服务和管理科学化的方向发展。
yuyuxun1
·
2023-11-08 10:45
java
spring
boot
idea
php
vue.js
springboot+校园招聘管理 毕业设计-附源码161815
校园招聘管理系统的设计与实现摘要由于数据库和
数据仓库
技术的快速发展,校园招聘信息系统建设越来越向模块化、智能化、自我服务和管理科学化的方向发展。
weixin_61498557
·
2023-11-08 10:45
spring
boot
java
idea
spring
jvm
数据仓库
认识
1、通用数据仓分层设计,主要分成五层:1、基础数据层(ODS):将数据采集过来最先存放的地方,一般和最原始的数据会保持一致ETL:萃取(Extract)、转置(Transform)及加载(Load)主要的作用是:保持数据的原样,压缩采用LZO,压缩比是100:10左右、创建分区表2、明细数据层(DWD):主要是做数据清洗、过滤、对一些敏感的数据例如手机号,省份证进行脱敏、对业务传输过过来的数据进行
新手小农
·
2023-11-08 09:53
数据仓库
数据仓库
Python量化
数据仓库
搭建3:数据落库代码封装
Python量化
数据仓库
搭建3:数据落库代码封装本系列教程为量化开发者,提供本地量化金融
数据仓库
的搭建教程与全套源代码。我们以恒有数(UDATA)金融数据社区为数据源,将金融基础数据落到本地数据库。
恒生LIGHT云社区
·
2023-11-08 08:07
金融
技术
金融科技
python
数据仓库
开发语言
Python量化
数据仓库
搭建系列3:数据落库代码封装
Python量化
数据仓库
搭建系列3:数据落库代码封装本系列教程为量化开发者,提供本地量化金融
数据仓库
的搭建教程与全套源代码。
算法爱好者。
·
2023-11-08 08:37
量化投资
python
数据仓库
开发语言
基于亚马逊云科技Serverless架构的实时数仓架构
要实现数据价值,建设
数据仓库
是在数字化转型过程中不得不面对的一项任务。
数据仓库
汇聚各个业务部门数据,避免数据孤岛,使
Discovering_
·
2023-11-08 05:50
科技
serverless
架构
达梦DMETL快速入门
DMETL创新的将传统ETL工具与分布式大数据处理平台相结合,实现对数据同步、数据处理以及数据共享交换的一站式服务,适合数据中心、
数据仓库
和数据湖的建设与运维等应用场景。
lushanglou
·
2023-11-08 03:12
DMETL4简介及安装配置指导
:DMETL(目前的版本是4.0)是达梦数据库有限公司在上十年数据处理经验的基础上,研制开发的具有自主版权的、商品化的数据集成软件,实现了对数据抽取、传输、整合、以及装载的一站式支持,是构建数据中心、
数据仓库
DM fans
·
2023-11-08 03:41
etl
Apache Doris 是什么
ApacheDoris是一个开源的、基于MPP(MassivelyParallelProcessing)架构的SQL
数据仓库
。它旨在提供高性能、高可靠性的数据分析服务,特别适合处理大规模数据集。
舒一笑
·
2023-11-07 18:14
一笑的代码架构道途
apache
Apache
Doris
Haddop,HDFS和MapDeduce简单理论
搭建大型
数据仓库
,PB级数据的存储,处理,分析,统计等业务。优势:高扩展,低成本,成熟的生态圈。hive:将sql语句转成hadoop任务去执行,降低hadoop的门槛
杰KaMi
·
2023-11-07 06:25
linux
hadoop
大数据
【系统集成项目管理工程师】——6.习题一
软件开发产品质量——管理标准3.下列关于
数据仓库
描述不正确的是()A、集成的;B、相对稳定的;C、不随
Bee.Bee.
·
2023-11-07 03:57
备考系统集成项目管理工程师
职场和发展
Apache Doris在美团外卖数仓中的应用实践
来自:美团技术团队美团外卖
数据仓库
通过MOLAP+ROLAP双引擎模式来适配不同应用场景。MOLAP引擎使用了ApacheKylin。ROLAP我们经过综合考虑,选择了ApacheDoris。
架构师小秘圈
·
2023-11-07 03:25
【数据开发】大数据平台架构,Hive / THive介绍
其中,Hive是一种基于Hadoop的
数据仓库
工具,可以将结构化的数据映射到Hadoop的分布式文件系统上,并提供类SQL查询功能。
小哈里
·
2023-11-06 23:12
#
后端开发
大数据
架构
hive
Hive从入门到大牛【Hive 学习笔记】
文章目录什么是HiveHive的数据存储Hive的系统架构MetastoreHiveVSMysql数据库VS
数据仓库
Hive安装部署Hive的使用方式命令行方式JDBC方式Set命令的使用Hive的日志配置
小崔的技术博客
·
2023-11-06 22:25
大数据学习
hive
学习
笔记
大数据平台架构--学习日记(一)
何谓五横,基本还是根据数据的流向自底向上划分五层,跟传统的
数据仓库
其实很类似,数据类的系统,概念上还是相通的,分别为数据采集层、数据处理层、数据分析层、数据访问层及应用层。
slipper520
·
2023-11-06 21:37
大数据
数字化时代,
数据仓库
是什么?有什么用?
在整个数据价值生产链路中,
数据仓库
的主要作用就是中心化分发,将原始数据与数据价值挖掘活动隔离。所有的原始数据都会进入
数据仓库
,再由
数据仓库
统一分发给下游的数据使用者。
派可数据BI可视化
·
2023-11-06 18:28
数据仓库
数据可视化
商业智能
spark
大数据
分布式
商业智能BI
数据仓库
数据分析
一图搞懂多维数据模型各种类型(星型、雪花、星座、交叉连接)
采用星形模式设计的
数据仓库
的优点是由于数据的组织已经过预处理,主要数据都在庞大的事实表中,所以只要扫描事实表就可以进行查询,而不必把多个庞大的表联接起来,查询访问效率较高,同时由于维表一般都很小
pandazdy
·
2023-11-06 10:32
MYSQL
经验分享
MySQL 面试之基础知识篇
广泛应用于OLTP场景(支持事务);拓展OLTP:联机事务处理,是传统的关系型数据库的主要应用,用于基本的事务处理;【日常处理】OLAP:联机分析处理,
数据仓库
系统的主要应用;支持复杂的分析操作,侧重决策支持
D老歪
·
2023-11-06 05:52
性能优化专题
mysql
面试
数据库
大数据数据中台之数据处理
文章目录前言一、
数据仓库
是什么?二、使用步骤1.创建任务2.发布规则配置3.任务安全机制4.查看任务依赖和执行情况总结前言数据模型就是数据组织和存储方法,它强调从业务、数据存取和使用角度合理存储数据。
u010715427
·
2023-11-05 23:15
大数据
数据仓库
、大数据平台、数据中台演进之路
数据中台演进的四个阶段:数据库阶段(OLTP联机事务处理)、
数据仓库
阶段(OLAP联机分析处理)、大数据平台阶段、数据中台阶段。
dehuisun
·
2023-11-05 23:44
架构方案杂谈
大数据
数据中台
数据平台、大数据平台、数据中台
数字化运营不同阶段,运营手段各尽所能随着大数据技术的不断更新与迭代,数据管理工具得到了飞速的发展,从数据库、
数据仓库
、数据集市与数据湖,再到大数据平台与如今的数据中台,其实将它们比喻成一场“数据的旅程”
DemonHunter211
·
2023-11-05 23:37
大数据
数据仓库
数据库
big
data
Flink + Iceberg 数据湖探索与实践
01
数据仓库
平台建设的痛点痛点一:我们凌晨一些大的离线任务经常会因为一些原因出现延迟,这种延迟会导致核心报表的产出时间不稳定,有些时候会产出比较早,但是有时候就可能会产出比较晚,业务很难接受。
'煎饼侠
·
2023-11-05 22:58
Hive数据库实现分区表的创建及数据插入
Hive数据库实现分区表的创建及数据插入在大数据领域中,Hive是一种基于Hadoop的
数据仓库
工具,用于处理和分析大规模结构化数据。
艾丽丝的爱情
·
2023-11-05 22:28
hive
数据库
hadoop
大数据
大数据数据中台之数据采集
数据仓库
的重要数据来源就是业务数据,业务数据有结构化的例如:商品,厂家,交易订单等等,还有非结构化的访问日志
u010715427
·
2023-11-05 22:27
大数据
大数据平台之数据存储
文章目录1.大数据生态技术2.数据存储3.数据存储的发展3.1
数据仓库
3.2数据湖4.数据存储的方式4.1批处理的数据存储4.2实时处理的数据存储1.大数据生态技术数据存储处理:清洗,关联,规范化,组织建模
959y
·
2023-11-05 22:25
hadoop大数据
数据仓库
大数据
Data Vault
数据仓库
模型构建-2
相关概念DataVault原始数据模型:当大多数人说"数据库"时,他们指的是我们现在可能称之为原始保管库的东西。在添加业务保管库之前,原始保险库被普遍称为"数据库",添加了"原始"一词,以便我们可以清楚地知道我们正在讨论的架构的哪一部分。RawVault原始数据:它是来自源的未经过滤的原始数据,即加载到基于业务密钥的集线器、链接和卫星中的数据格式。BusinessVault业务数据模型它是原始保管
NEO_X
·
2023-11-05 19:32
【数据结构与算法笔试】途家1105秋招笔试
一、题目描述:你作为一个数据工程师,正在为
数据仓库
设计一个工具,该工具的主要功能是从给定的SQL查询语句中解析出所涉及的所有表名。SQL查询语句可能涉及多个表,并且一个表可能在查询语句中出现多次。
CS_木成河
·
2023-11-05 17:55
算法程序设计
算法
java
大数据-Hive相关知识点介绍
Hive是基于Hadoop的一个
数据仓库
工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。基于一个统一的查询分析层,通过SQL语句的方式对HDFS上的数据进行查询、统计和分析。
ziania_cumt
·
2023-11-05 16:12
hive
大数据
hive知识点
Hive知识点1.hive定义hive是基于Hadoop的一个
数据仓库
工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能本质:将HQL转化成MapReduce程序2.hive优缺点优点:①
^ω^菁菁
·
2023-11-05 16:41
笔记
hive
big
data
hadoop
Hive知识点总结
Hive™
数据仓库
软件有助于使用SQL读取,编写和管理驻留在分布式存储中的大型数据集。可以将结构投影到已存储的数据中。提供了命令行工具和JDBC驱动程序以将用户连接到Hive。
有风微冷
·
2023-11-05 16:08
hive
HIve
hive分桶
hive分区
hive知识点总结
MySQL表的各种类型
一、常用类型存储引擎事务锁颗粒主要应用忌用MYISAM不支持支持并发插入的表级锁SELECT,INSERT读写操作频繁MRG_MYISAM不支持支持并发插入的表级锁分段归档,
数据仓库
全局查找过多的场景Innodb
houxin
·
2023-11-05 08:50
【数据库技术】金管局计算机岗位——
数据仓库
(⭐⭐⭐⭐)
数据库技术
数据仓库
数据仓库
的定义
数据仓库
的作用
数据仓库
的特点(⭐⭐⭐⭐)
数据仓库
的主要功能(⭐⭐⭐⭐)OLTP:联机事务处理(⭐⭐⭐⭐⭐)OLAP:联机分析处理(⭐⭐⭐⭐⭐)OLAP的基本多维分析操作(
sakura欣悠
·
2023-11-05 01:42
数据库
数据仓库
2022系统架构设计师(高级)下午论文真题
2022年软考系统架构师(软件级别最高的)下午论文题目,拿到自己一个比较擅长的题目,大数据,
数据仓库
方面的,以前公司项目接触过,加上平时看了些这方面的书,所以写起来非常顺手,结果也论文这块也顺利通过了。
YiWait
·
2023-11-04 23:51
系统架构
系统架构
数据仓库
Hive安装部署与测试练习
环境说明10.176.2.101(10.176.2.121)master10.176.2.103zjx0310.176.2.105zjx05cent-os6.5zookeepercdh3.4.5hadoopapache2.7.7jdk1.8.191mysql5.17sqoop1.4.7hbase1.2.7hiveapache2.3.4安装部署wgethttps://mirrors.tuna.tsi
zwb_jianshu
·
2023-11-04 15:21
上一页
12
13
14
15
16
17
18
19
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他