E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
--------【数据仓库】
数据仓库
-
数据仓库
主要特征
目录2.
数据仓库
的主要特征2.1面向主题2.2集成性2.3非易失性(不可更新性)2.4时变性2.
数据仓库
的主要特征
数据仓库
是面向主题的(Subject-Oriented)、集成的(Integrated)
anniewhite
·
2023-02-02 09:20
大数据
数据仓库
数据库
大数据
数据分析
数据仓库
-数据质量管理
一、数据质量管理定义数据质量管理(DataQualityManagement),是指对数据从计划、获取、存储、共享、维护、应用、消亡生命周期的每个阶段里可能引发的各类数据质量问题,进行识别、度量、监控、预警等一系列管理活动,并通过改善和提高组织的管理水平使得数据质量获得进一步提高。数据质量管理不是一时的数据治理手段,而是循环的管理过程。其终极目标是通过可靠的数据,提升数据在使用中的价值,并最终为企
大数据点滴
·
2023-02-02 09:17
数据中台
数据仓库
大数据面试
数据仓库
大数据
数据质量管理
数据分析:大数据分析师必备技能【统计分析、可视化辅助工具、大数据处理框架、数据库、
数据仓库
、数据挖掘工具、机器学习、挖掘算法、编程语言】
9种技能:统计分析:大数定律、抽样推测规律、秩和检验、回归、预测;可视化辅助工具:excel、BI工具、python大数据处理框架:Hadoop、storm、spark数据库:SQL、MySql、DB
数据仓库
u013250861
·
2023-02-02 09:14
大数据
数据分析
数据挖掘
数据仓库
大数据
算法
软考高项:信息系统与信息化模拟试题
1.商业智能系统应具有的主要功能不包括______A.
数据仓库
B.数据ETLC.分析功能D.联机实务处理OLTP2.商业智能将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策,包括理、建立数据模型
香水有毒吖
·
2023-02-02 09:38
经验
项目管理
试题
数据仓库
数据挖掘
数据库
经验分享
信息与通信
离线和实时
离线和实时一、数仓基本概念1.
数据仓库
架构我们在谈数仓之前,为了让大家有直观的认识,先来谈数仓架构,“架构”是什么?这个问题从来就没有一个准确的答案。
jerry-89
·
2023-02-02 08:59
实时数仓
数据仓库
数据库
数据中台、
数据仓库
、数据平台的关系你明白了吗?
进入大数据时代,很多企业都开始或多或少的利用大数据所产生的价值。对于企业来说,大数据能够起到的角色和分量因企业本身而异。但是有一点可以肯定的是,大多数企业尤其是依靠数据或互联网兴起的产业一定是需要赶上大数据这一趟高铁,否则就可能被时代抛弃或错失商机。自阿里提出“大中台,小前台”的口号以来,数据中台成为企业解决数字化手段之一。数据中台是什么数据中台是指通过数据技术,对海量数据进行采集、计算、存储、加
9c436208eb55
·
2023-02-02 08:57
如何轻松做数据治理?开源技术栈告诉你答案
元数据治理系统是所有
数据仓库
、数据库、表、仪表板、ETL作业等的目录接口(catalog),有了
·
2023-02-01 16:36
Python3数据分析与挖掘建模实战 笔记
第2章数据获取数据获取手段:
数据仓库
监测与抓取填写、埋点、日志计算
数据仓库
将所有业务数据经汇总处理,构成
数据仓库
(DW)全部事实的记录部分维度与数据的整理(数据集市-DM)数据库VS仓库数据库面向业务存储
柠檬红茶cc
·
2023-02-01 14:04
信息系统基础
信息系统工程总体规划方法论2.信息系统的生命周期和各阶段的目标三.政府信息化与电子政务1.电子政务的组成2.电子政务的内容3.企业源计划(ERP)4.客户关系管理(CRM)5.供应链管理(SCM)6.
数据仓库
superSmart_Dong
·
2023-02-01 09:52
软考——软件设计师
系统架构设计师
软件项目管理
信息系统
软考
集成
IT技术包括什么
应用、评估信息的各种软件,它包括我们通常所指的ERP(企业资源计划)、CRM(客户关系管理)、SCM(供应链管理)等商用管理软件,也包括用来加强流程管理的WF(工作流)管理软件、辅助分析的DW/DM(
数据仓库
和数据
sas???
·
2023-02-01 01:37
数仓模型设计详细讲解
一、维度建模基本概念维度模型是
数据仓库
领域大师RalphKimall所倡导,他的《
数据仓库
工具箱》,是
数据仓库
工程领域最流行的数仓建模经典。
大数据老哥
·
2023-02-01 01:05
商务智能-第六章 数据挖掘
Lecture6-DataMining1.数据挖掘在数据库及
数据仓库
中存贮有大量的数据,它们具有规范的结构形式与可靠的来源,且数量大、保存期间长,是一种极为宝贵的数据资源。
SpriCoder
·
2023-01-31 09:44
商务智能课程笔记
数据挖掘
数据仓库
数据库
技术架构
UI、摄像头视觉识别人机界面、语音交互人机界面2.逻辑层:面向对象技术/组件技术/SOA服务中间件/微服务中间件技术、人工智能NLP/机器学习3.数据层:SQL数据库/NOSQL数据库、大数据计算平台/
数据仓库
数据湖
spring_m
·
2023-01-31 08:32
数据仓库
规范
模型设计模型设计概述为什么需要模型设计?Linux的创始人Torvalds有一段关于“什么才是优秀程序员”的话:“烂程序员关心的是代码,好程序员关心的是数据结构和它们之间的关系”,其阐述了数据模型的重要性。有了适合业务和基础数据存储环境的模型,那么大数据就能获得以下好处。性能:良好的数据模型能帮助我们快速查询所需要的数据,减少数据的吞吐。成本:良好的数据模型能极大地减少不必要的数据冗余,也能实现计
Aidon-东哥博客
·
2023-01-31 08:21
数据仓库
数据仓库
数据仓库规范
数据仓库建模
数据仓库分层
数仓规范
数据仓库
数据仓库
数仓分层目的通过分层,可以让复杂混乱的数据体系内部的依赖结构变得层次分明,具体好处如下:(1)清晰的数据结构,每个数据层都有自己的作用域和职责(2)减少重复开发,开发一些通用的中间层数据,能够减少重复计算
md_2014
·
2023-01-31 07:05
大数据
数据仓库
Presto初体验
0-前言Facebook的
数据仓库
存储在少量大型Hadoop/HDFS集群。Hive是Facebook在几年前专为Hadoop打造的一款
数据仓库
工具。
mysia
·
2023-01-31 03:18
PostgreSQL 数据库的可用集群技术
详情:https://wiki.postgresql.org/wiki/Bucardo2、GridSQL一个开源的,我共享的集群数据库系统,可用于PostgreSQL
数据仓库
,具有智能的,平行的做到多个数据库之间的访问
飞稀饭你的微笑
·
2023-01-30 23:59
大数据课程综合实验案例:网站用户行为分析
大数据课程综合实验案例1案例简介1.1案例目的1.2适用对象1.3时间安排1.4预备知识1.5硬件要求1.6软件工具1.7数据集1.8案例任务1.9实验步骤2本地数据上传到
数据仓库
Hive2.1实验数据集的下载
刷题致富
·
2023-01-30 22:17
大数据技术
big
data
hbase
数据库
mysql
大数据
Druid简介
ApacheDruid是开源的分布式存储,核心设计吸取了
数据仓库
、时序数据、搜索系统思想,在实时分析体系里面创造了广泛的用户实例。
似水之星
·
2023-01-30 19:03
Hadoop离线_网站流量日志数据分析系统_数据入库
数据入库ETL1.
数据仓库
设计2.本项目中
数据仓库
的设计3.创建ODS层数据表4.导入ODS层数据5.生成ODS层明细宽表1.
数据仓库
设计1.1维度建模概述维度建模(dimensionalmodeling
_WeiA
·
2023-01-30 15:22
hadoop离线数据分析全套
hadoop
etl
万字详解数仓分层设计架构 ODS-DWD-DWS-ADS
一、数仓建模的意义,为什么要对
数据仓库
分层?只有数据模型将数据有序的组织和存储起来之后,大数据才能得到高性能、低成本、高效率、高质量的使用。
架构文摘
·
2023-01-30 15:21
数据仓库
大数据
webgl
glassfish
entity
数据中台如何搭建
天启,奇点云数据模型架构专家、原海尔集团数据架构师、原阿里巴巴政务团队数据架构师,精通
数据仓库
建模理论及数据开发技术,具备零售、政务、医药、制造等多个领域数仓和数据中台建设经验,及PB级
数据仓库
与数据中台建设经验
山野市民
·
2023-01-30 15:49
数据仓库
数据库
大数据
湖仓一体电商项目(一):项目背景和架构介绍
项目背景介绍湖仓一体实时电商项目是基于某宝商城电商项目的电商数据分析平台,本项目在技术方面涉及大数据技术组件搭建,湖仓一体分层数仓设计、实时到离线数据指标分析及数据大屏可视化,项目所用到的技术组件都从基础搭建开始,目的在于湖仓一体架构中
数据仓库
与数据
普通网友
·
2023-01-30 15:16
面试
学习路线
阿里巴巴
android
前端
后端
aws的EMR搭建Hadoop集群
AmazonEMR可用于各种应用程序中,包括日志分析、Web索引、
数据仓库
、机器学习、财务分析、科学模拟和生物信息学。具体的功能特性可以直接到官网查阅。
m0_61022194
·
2023-01-30 15:44
hadoop
mapreduce
big
data
Amazon Redshift构建新一代数据分析BI系统
导读本文主要介绍了AmazonRedshift新一代企业级云平台
数据仓库
服务,并结合实际的客户使用案例与场景描述了如何基于AmazonRedshift构建高可靠,性能优化,并且成本节约的
数据仓库
系统。
chenni6626
·
2023-01-30 14:12
大数据综合项目--网站流量日志数据分析系统(详细步骤和代码)
文章目录前言:基本概述Sqoop概述什么是SqoopFlume概述什么是Flume为什么需要flumeHIve概述什么是Hive系统背景:模块开发数据采集使用Flume搭建日志采集系统数据预处理实现数据预处理
数据仓库
开发数据导出日志分析系统报表展示前言
为java献身
·
2023-01-30 14:41
big
data
hadoop
hdfs
数据仓库
之建设
背景篇目前所在项目中,人员配置:项目经理(4)业务分析师报表开发工程师(2,4)etl工程师大数据开发工程师(4)人员压缩可参考括号内分析篇从人员配置可知,现在企业对人员的要求比较高,恨不得你啥都会每个人最好了解业务,会提升做事效率(知道别人的需求)理念篇会写代码会提高效率(python解析Excel、批量执行存储过程、日志解析)初期业务分析占比很大,需要需求方和解决方共同出力,打好数仓根基数据质
OverLight
·
2023-01-30 14:53
管理ETL的处理过程需要哪些子系统(从那几个角度入手)
可用性:
数据仓库
必须满足其承诺的服务级别可管理型:成功的
数据仓库
是永远无法实现的。将随着业务的发展而不断发展变化。ETL过程需要不断改进。
数据僧
·
2023-01-30 09:46
Data Lakehouse (湖仓一体) 到底是什么
0、背景DataLakehouse(湖仓一体)是新出现的一种数据架构,它同时吸收了
数据仓库
和数据湖的优势,数据分析师和数据科学家可以在同一个数据存储中对数据进行操作,同时它也能为公司进行数据治理带来更多的便利性
Impl_Sunny
·
2023-01-30 07:06
#
数据存储与管理方案
#
概念
data
lakehouse
湖仓一体
7000字,详解仓湖一体架构!
全文共7110个字,建议阅读15分钟在了解湖仓一体化之前,我们先来看一则有关
数据仓库
的有趣故事吧~沃尔玛拥有世界上最大的
数据仓库
系统,它利用数据挖掘方法对交易数据进行分析后发现"跟尿布一起购买最多的商品竟是啤酒
zhisheng_blog
·
2023-01-30 07:05
数据仓库
大数据
编程语言
hadoop
数据库
湖仓一体数据平台架构
随着数字化技术的更新迭代,数据库、
数据仓库
、数据湖等各种概念层出不穷,MPP数据库、Hadoop、对象存储、Hudi等各种数据技术不断涌现,湖仓一体概念逐步被人们所关注,在国际知名机构Gartner发布的
zxfBdd
·
2023-01-30 07:05
大数据
架构
大数据
数据仓库
什么是湖仓一体
在数据湖的基础之上引入事务层,把数据湖和
数据仓库
的优点有机结合在一
zxfBdd
·
2023-01-30 07:05
大数据
数据仓库
数据挖掘
数据库
Databricks说的Lakehouse是什么?
数据仓库
在决策支持和商业智能应用方面有着悠久的历史。自20世纪80年代末问世以来,
数据仓库
技术一直在持续不断的发展,并且MPP体系架构使系统能够处理更大的数据量。
大数据学习与分享
·
2023-01-30 07:32
大数据
大数据
Lakehouse
数据湖
databricks
什么是湖仓一体?
在决策支持和商业智能应用方面,
数据仓库
有着悠久的历史。
数据仓库
技术,自上世纪80年代末出现以来,经历了不断地发展。同时,MPP架构的出现,也使得系统能够处理更大规模的数据量。
巨杉数据库SequoiaDB
·
2023-01-30 07:28
数据仓库
数据库
数据湖
湖仓一体
巨杉数据库
数据仓库
是什么?
本专栏目录结构和文献引用请见100个问题搞定大数据理论体系解答
数据仓库
(DataWarehouse),可简写为DW或DWH。
Shockang
·
2023-01-30 07:28
大数据理论体系
大数据
大数据架构系列:如何理解湖仓一体?
引言这十多年大数据技术蓬勃发展,从市场的表现来看基于大数据的数据存储和计算是非常有价值的,其中以云
数据仓库
为主打业务的公司Snowflake市值最高(截止当前44
腾讯云开发者
·
2023-01-30 07:58
数据仓库
腾讯
大数据
编程语言
java
湖仓一体(Lakehouse)是什么?
本专栏目录结构和参考文献请见大数据理论体系WHAT湖仓一体(Lakehouse)是一种新的大数据存储架构,结合了
数据仓库
和数据湖的最佳功能。关于
数据仓库
请参考我的这篇博客——
数据仓库
是什么?
Shockang
·
2023-01-30 07:56
大数据理论体系
数据仓库
数据湖
湖仓一体
Hadoop历史、HDFS特点及对大数据时代的意
现今企业
数据仓库
和关系型数据库擅长处理结构化数据,
摩羯青春我掌握
·
2023-01-30 06:21
认识数据挖掘
数据挖掘的方向数据库技术角度统计学角度机器学习角度一,数据挖掘的发展动力1,数据量的增长自动数据收集工具和成熟的数据库技术使得大量的数据被收集,存储在数据库、
数据仓库
或其他信息库中以待分析。
行走记忆时光
·
2023-01-30 06:52
关于hbase和hive的选择
hive是一个
数据仓库
,它的主要作用是统计分析,当然也可以做查询,响应速度非常慢。那么我们到底是用hbase,还是用hive,还是hiveoverhbase呢?
思想决定架构
·
2023-01-29 18:38
数据分析详解(数据预处理+基于随机森林特征工程+机器学习完全版)
存在不完整的、含噪声的和不一致的数据是现实世界大型的数据库或
数据仓库
的共同特点。一些比较成熟的算法对其处理的数据集合一般有一定的要求,如数据完整性好、数据的冗余性小、属性之间的相关性小。
Zouia Gail
·
2023-01-29 11:02
机器学习
数据挖掘
数据分析
python
随机森林
你不得不知道的大数据知识点
商务智能:指用现代
数据仓库
技术、线上分析处理技术、数据挖掘和数据展现技术进行数据分析以实现商业价值。敏捷商务智能:传统BI的技术水平无法处理海量数据,而敏捷BI采用了分布式计算、内存计算、列存储
回锅肉不回锅了
·
2023-01-29 07:12
8.1
数据仓库
Hive
一、
数据仓库
概述1.概念
数据仓库
是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合目的:支持商业分析和管理决策2.典型结构包括四个层次:数据源->数据存储和管理->分析和挖掘引擎->应用3.特点
大白猿学习笔记
·
2023-01-29 06:11
利用MongoShake进行Mongodb数据的实时变更处理
最近在做
数据仓库
相关的项目,需要对各业务系统异构数据进行统一归集,不同业务系统以及相同异构系统不同功能模块用到的数据存储方式不尽相同,其中有一些功能模块采用的数据存储方式为Mongodb,为了能够实时对
阿炎
·
2023-01-29 03:55
武凯
近期贴上该标签的公司也越来越多:应用层做大数据营销、风控SaaS的公司;技术底层做
数据仓库
、开发平台的公司,如星环科技;一些转型云服务的传统软件商,如用友、金蝶,纷纷宣布开辟了数据中台业务。
云起君
·
2023-01-28 23:44
Hive整合hbase及导入数据测试
1,Hive与Hbase的区别1.1Hive(
数据仓库
)Hive是由Facebook实现并开源,是基于Hadoop的一个
数据仓库
工具,底层依赖于HDFS存储数据,利用MapReduce进行计算,可以将结构化的数据映射为一张数据库表
一曲逍遥游
·
2023-01-28 16:58
hive
hbase
hadoop
Hive函数大全–完整版(一)
现在虽然有很多SQLONHadoop的解决方案,像SparkSQL、Impala、Presto等等,但就目前来看,在基于Hadoop的大数据分析平台、
数据仓库
中,Hive仍然是不可替代的角色。
ws的大数据田地
·
2023-01-28 16:27
SQL
Hive
hive
大数据
hadoop
Hive整合Hbase
目录简介实验步骤1.配置文件2.复制jar包3.创建映射表4.导入数据5.注意事项总结1.优点2.缺点简介Hive是建立在Hadoop之上的
数据仓库
基础构架、是为了减少MapReduce编写工作的批处理系统
香草冰淇淋OcO
·
2023-01-28 16:56
hbase
hive
数据仓库
Hive入门
一、什么是
数据仓库
数据仓库
(DataWarehouse,DW),是一种用于存储、分析和报告的数据系统,其目的是构建面向分析的集成化数据环境,其本身不产生数据,也不消费数据。
文景大大
·
2023-01-28 15:49
初始装载
初始装载在
数据仓库
可以使用前,需要装载历史数据。这些历史数据是导入进
数据仓库
的第一个数据集合。首次装载被称为初始装载,一般是一次性工作。由最终用户来决定有多少历史数据进入
数据仓库
。
zealscott
·
2023-01-28 12:39
上一页
53
54
55
56
57
58
59
60
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他