E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
--------【数据仓库】
亚马逊云科技智能湖仓架构实践:利用Amazon Redshift的流式摄取构建实时数仓
AmazonRedshift是一种快速、可扩展、安全且完全托管的云
数据仓库
,可以帮助用户通过标准SQL语言简单、经济地分析各类数据。
m0_72973530
·
2022-12-30 17:28
其他
数据湖正成为新的
数据仓库
数据仓库
是再度扮演重要角色,还是说奄奄一息?如果你在这个问题上有点困惑,那也情有可原。一方面,
数据仓库
无疑似乎炙手可热。作为一名长期的行业观察人士,我看到这个行业创新不断,创业活动高潮迭起
新睿云.任义兵
·
2022-12-30 17:58
数据湖仓这对CP有了新进展,亚马逊云科技“智能湖仓”来了
导读:在大数据领域,
数据仓库
和数据湖就像一对CP,缺一不可且优势互补。社会发展到今天,全世界每个小时产生的数据已经比20年前每年产生的数据还要多。
AImatters
·
2022-12-30 17:28
数据湖
大数据
aws
数据仓库
理论知识
数据仓库
1.1数仓基础知识1.1.1.为什么要有
数据仓库
通常
数据仓库
的数据来自各个业务应用系统。
南潇如梦
·
2022-12-30 16:25
大数据那些事
大数据
数据库开发
数据库
数据仓库
查询聚集:congressional samples for approximate answering of group-by queries
作者:InformationSciencesResearchCenter,BellLaboratories会议:SIGMOD2000Abstract在大型
数据仓库
环境中,使用预先计算的汇总统计数据(如样本
糖小豆子
·
2022-12-30 00:35
论文翻译
数据库
学习大数据必须掌握的五大核心技术,你都知道哪些?
大数据技术的体系庞大且复杂,基础的技术包含数据的采集、数据预处理、分布式存储、NoSQL数据库、
数据仓库
、机器学习、并行计算、可视化等各种技术范畴和不同的技术层面。
乐姐
·
2022-12-29 23:42
大数据
大数据
大数据学习
大数据开发
大数据入门
人工智能
数据治理:90%的人搞不清的事情
【与数据同行】已开通综合、
数据仓库
、数据分析、产品经理、数据治理及机器学习六大专业群,加微信号frank61822701为好友后入群。
傅一平
·
2022-12-29 23:23
大数据
编程语言
机器学习
人工智能
数据分析
正式毕业!Apache Kyuubi 成为 Apache 基金会顶级项目!
ApacheKyuubi是一个分布式和多租户网关,用于在
数据仓库
和湖仓上提供无服务器SQL。
·
2022-12-29 17:46
大数据hive(一):hive的基本概念
什么是Hive2、Hive的优缺点3、Hive的特点二、Hive架构1、架构图2、基本组成3、Hive与传统数据库对比Hive基本概念一、Hive介绍1、什么是HiveHive是一个构建在Hadoop上的
数据仓库
框架
肥宅小谢
·
2022-12-29 13:38
hive
hive
大数据
数据仓库
大数据之Hive详解
1.Hive是什么Hive是基于Hadoop的
数据仓库
解决方案。由于Hadoop本身在数据存储和计算方面有很好的可扩展性和高容错性,因此使用Hive构建的
数据仓库
也秉承了这些特性。这是来自官方的解释。
qingdsj
·
2022-12-29 13:00
大数据
人工智能
互联网
hive
大数据
大数据学习
大数据开发
大数据入门
【Hive学习一】Hive概述,Hive是什么
1.Hive是什么Hive是基于Hadoop的
数据仓库
解决方案。由于Hadoop本身在数据存储和计算方面有很好的可扩展性和高容错性,因此使用Hive构建的
数据仓库
也秉承了这些特性。这是来自官方的解释。
WakeUpCcc
·
2022-12-29 13:30
hive
学习
hadoop
大数据
数据仓库
Hive是啥? 大数据技术之Hive
Hive是基于Hadoop的一个
数据仓库
工具(E抽取T转换L加载),可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。
lljazxx
·
2022-12-29 13:59
hive
大数据
Hive是啥
Hive原理
Hive详解
大数据技术之Hive
计算机毕业设计django基于python仓库管理系统
采用当前流行的B/S模式以及3层架构的设计思想通过Python技术来开发此系统的目的是建立一个配合网络环境的仓库管理系统的平台,这样可以有效地解决
数据仓库
系统混乱的局面。
qq_1262330535
·
2022-12-28 11:41
python
计算机毕业设计
python
django
开发语言
如何轻松做数据治理?开源技术栈告诉你答案
元数据治理系统是所有
数据仓库
、数据库、表、仪表板、ETL作业等的目录接口(catalog),有了
图数据库NebulaGraph
·
2022-12-28 07:19
Nebula
Graph
开源
数据库
数据仓库
面试官:说一下数仓宽表的优缺点吧
在
数据仓库
建设中,组织相关和相似数据,采用明细宽表,复用关联计算,减少数据扫描,提高明细数据表的易用性在汇总数据层,加群指标的维度退化,采取更多的宽表化手
大数据私房菜
·
2022-12-27 21:40
数据仓库
Hive
实时数仓宽表加工解决方案
一.实时
数据仓库
与离线
数据仓库
由于离线数据每天凌晨拉去线上生成数据库(凌晨请求较少,减少线上库压力),导致数据是T+1,而对于一些时效性要求较强的场景。
诸葛子房_
·
2022-12-27 21:08
大数据
Flink
数据仓库
之宽表
宽表:从字面意义上讲就是字段比较多的数据库表。通常是指业务主题相关的指标、维度、属性关联在一起的一张数据库表。由于把不同的内容都放在同一张表存储,宽表已经不符合三范式的模型设计规范,随之带来的主要坏处就是数据的大量冗余,与之相对应的好处就是查询性能的提高与便捷。这种宽表的设计广泛应用于数据挖掘模型训练前的数据准备,通过把相关字段放在同一张表中,可以大大提高数据挖掘模型训练过程中迭代计算时的效率问题
Studying Zhou
·
2022-12-27 21:08
数据仓库
数据仓库
中宽表的设计原则_实际项目中交互设计原则的运用
在实际项目中设计交互行为方式的时候,我们该怎么去运用的这些交互设计原则呢?通常我们在设计过程中,会提到设计要满足一定的交互设计原则,而对于一名交互设计师来说,原则是在设计过程中遵循的一种大众认可的,经过可用性测试过的一些在pc端,移动端形成的一种定义性的标准。在不改变用户固有习惯的前提下,仅可能的采用符合用户行为习惯和用户感知的方式去实现我们的设计意图。所谓的原则不外乎是大家都知道影响交互设计的尼
weixin_39896839
·
2022-12-27 21:07
数据仓库中宽表的设计原则
浅谈
数据仓库
前言写该篇文章有2个目的:1、输出倒逼输入,对工作学习做一个总结、查漏补缺2、帮助刚入行的同学建立对数仓的初步认识一、数仓是啥要解释这个问题,首先先思考下"仓库"的含义。我们能够想到,仓库一般有一下几个特点:1、接受货物;2、存放货物;3、分发货物;4、。。。;数仓的功能非常类似,核心也就是下面的功能:1、采集数据;2、存储数据;3、分发数据;4、。。。地方这样一看,数仓其实跟实体仓库从本质上看没
吕归尘0
·
2022-12-27 21:07
数据仓库
数据仓库
big
data
浅谈
数据仓库
分层
一、目标了解数仓的“层”以及如何分层二、什么是“层”一组对象的集合,包括了表、视图、ETL脚本、调度作业、实施规范等等,因为数仓核心功能之一是存储数据,所以通常层就是指一批表的集合;详细解释:1、DB对象表、视图、触发器、存储过程、序列等等,设计时会为同层对象规划独立的路径(例如,Hive的库、Oracle的Schema等);2、ETL封装好的一组sql代码或者ETL工具的作业,核心就是加工数据;
吕归尘0
·
2022-12-27 21:07
数据仓库
数据仓库
etl
hive
数据仓库
物理分层_【数据中台】关于
数据仓库
分层的争论
今天就与领导关于针对阿里提出的OneDataOneID的理论体系以及
数据仓库
的分层方式如何在实际项目进行落地进行了一番争论。
全自動資本主義
·
2022-12-27 21:37
数据仓库物理分层
数据仓库
中宽表的设计原则_宣传册设计中封面的构思方法和原则
如果说宣传册是企业营销展示的窗口,那么封面就是这个窗口形象的重中之重。俗话说:“货卖一张皮”,好的封面创意甚至直接提供了受众是否还有必要继续阅读的理由。好的创意宣传册设计封面一方面要涵盖企业理念、精神等感性信息。一方面也要讲背景、实力、行业、卖点等理性信息。这就需要设计从信息整合、构思、创意、展现等多个环节形成严谨的作业闭环。下面内容我们就从最初“构思”的这个环节入手来探讨如何做好宣传册封面设计。
weixin_39842611
·
2022-12-27 21:37
数据仓库中宽表的设计原则
【大数据技术】大数据技术之数仓宽表和窄表的区别
由于把不同的内容都放在同一张表存储,宽表已经不符合
数据仓库
三范式的模型设计规范,将大量不同范畴的字段放到一张表里,故随之带来的主要坏处就是数据的大量冗余,但也带来了好处,与之相对应的好处就是查询性能的提高与便捷
daydayup-2016
·
2022-12-27 21:36
大数据技术
数据挖掘
人工智能
数据仓库
大数据
(转载)实时数仓宽表加工解决方案
一.实时
数据仓库
与离线
数据仓库
由于离线数据每天凌晨拉去线上生成数据库(凌晨请求较少,减少线上库压力),导致数据是T+1,而对于一些时效性要求较强的场景。
moose_killer
·
2022-12-27 21:04
hbase
big
data
数据仓库
宽表和窄表的建设该如何选择?
这个问题相信纠结了很多从是数据库开发、
数据仓库
开发和后台开发人员;单单考虑这个问题,难给出一个绝对的答案;本人从事
数据仓库
开发工作到现在已经有一年半时间了,对于这个问题,我也曾经纠结过,但是是否有绝对的答案呢
codemosi
·
2022-12-27 21:32
大数据项目经验
数据仓库
数据仓库
【什么是宽表?什么是窄表?宽表和窄表的区别、优点、缺点及各自用处】
宽表:从字面意义上讲就是字段比较多的数据库表。通常是指业务主题相关的指标、维度、属性关联在一起的一张数据库表。由于把不同的内容都放在同一张表存储,宽表已经不符合三范式的模型设计规范,随之带来的主要坏处就是数据的大量冗余,与之相对应的好处就是查询性能的提高与便捷。这种宽表的设计广泛应用于数据挖掘模型训练前的数据准备,通过把相关字段放在同一张表中,可以大大提高数据挖掘模型训练过程中迭代计算时的效率问题
程序员学习圈
·
2022-12-27 21:31
#
数据仓库
数据中台
数仓大宽表
数据仓库
模型一般有四种:宽表模型,星型模型,雪花模型,星座模型。四种模型定义如下:宽表模型(单例模型),通常是指业务主体相关的指标、维度、属性关联在一起的一张数据库表。星型
小金子的夏天
·
2022-12-27 21:31
数据仓库
数据仓库
big
data
数据挖掘
数据仓库
宽表
1.构建宽表的目的讲宽表我想从为什么需要宽表入手,而不是一上来就抠概念。因为我觉得一门知识叫什么名字并不是最核心的,关键是搞清楚它的诞生背景以及如何在特定场景用好它。构建宽表的目的很简单,就是为了"一站式"尽可能多的展示我们需要的数据。因为在数据库中,不同的数据通常是存放在不同的数据表中的,关联起来非常不方便,既费时又费力还容易犯错。那么如果我们将数据提前串联好存在一张数据表中,岂不是完美的解决了
吕归尘0
·
2022-12-27 21:30
数据仓库
数据仓库
big
data
使用 DataWorks 将 PolarDB-X 中的数据同步到 MaxCompute
MaxCompute是适用于数据分析场景的云
数据仓库
,适用于大型互联网企业的
数据仓库
和BI分析、网站的日志分析、电子商务网站的交易分析、用户特征和兴趣挖掘等。
·
2022-12-27 18:01
数据库数据库开发云计算阿里云
使用 DataWorks 将 PolarDB-X 中的数据同步到 MaxCompute
MaxCompute是适用于数据分析场景的云
数据仓库
,适用于大型互联网企业的
数据仓库
和BI分析、网站的日志分析、电子商务网站的交易分析、用户特征和兴趣挖掘等。
·
2022-12-27 17:29
数据库数据库开发云计算阿里云
卓越实力备受认可 HashData再获权威大奖
经过专家评委层层遴选,由酷克数据联合建信金融科技有限责任公司、恒丰银行股份有限公司申报的“建设银行25000节点超大规模云化
数据仓库
系统”、“恒丰银行弹性MPP
数据仓库
系统”同时获得“2022科技赋能金融业数字化转型突出贡献奖
·
2022-12-27 17:57
数据库金融科技
(附源码)springboot员工管理系统 毕业设计 021430
员工管理系统的设计与实现摘要由于数据库和
数据仓库
技术的快速发展,企业员工管理系统建设越来越向模块化、智能化、自我服务和管理科学化的方向发展。
普通网友
·
2022-12-27 14:43
java
spring
boot
python
html
php
如何轻松做数据治理?开源技术栈告诉你答案
元数据治理系统是所有
数据仓库
、数据库、表、仪表板、ETL作业等的目录接口(catalog),有了
·
2022-12-27 14:42
数据采集的方法
1、离线搜集:工具:ETL;在
数据仓库
的语境下,ETL基本上便是数据搜集的代表,包括数据的提取(Extract)、转换(Transform)和加载(Load)。
qq^^614136809
·
2022-12-27 14:52
python
oushudb丨偶数科技为辽宁农信数字化进程添加新动能
斗转星移,数据急剧膨胀2016年辽宁农信上线了基于关系型数据库的
数据仓库
,实现了各源系统的数据汇集。与此同时上线了大数据平台,实现了审计系统对各源系统贴源层数据的存储、整合、查询相关需求。
·
2022-12-26 16:21
oushudb-hawq
偶数科技为辽宁农信数字化进程添加新动能
斗转星移,数据急剧膨胀2016年辽宁农信上线了基于关系型数据库的
数据仓库
,实现了各源系统的数据汇集。与此同时上线了大数据平台,实现了审计系统对各源系统贴源层数据的存储、整合、查询相关需求。
·
2022-12-26 16:19
oushudb-hawq
oushudb丨偶数科技为辽宁农信数字化进程添加新动能
斗转星移,数据急剧膨胀2016年辽宁农信上线了基于关系型数据库的
数据仓库
,实现了各源系统的数据汇集。与此同时上线了大数据平台,实现了审计系统对各源系统贴源层数据的存储、整合、查询相关需求。
·
2022-12-26 16:46
oushudb-hawq
Hive
数据仓库
1.1认识
数据仓库
数据仓库
的目的是构建面向分析的集成化数据环境,为组织或企业提供决策支持。
数据仓库
是一个面向主题的、数据集成的、时变的、非易失的数据集合。数据库应用是以业务流程来划分应用程序和数据库。
晁晁我呀最讨厌期末了
·
2022-12-26 15:44
hive
数据仓库
北邮数据挖掘文本分类实验
首先需要说明的是,这是北邮王晓茹老师的数据挖掘与
数据仓库
这门课的文本分类的实验。
反身而诚、
·
2022-12-25 09:21
NLP
北邮数据挖掘与
数据仓库
期末考试形式和主要内容
2019-2020学年秋季学期
数据仓库
与数据挖掘本文适合北邮研究生秋季学期王晓茹老师的数据挖掘和
数据仓库
期末复习其他老师的同名课程我并未参加,这篇文章可能并不适用在复习的时候,在网上查阅数据挖掘的资料,
Colaaaaaaaaaa
·
2022-12-25 09:51
数据仓库
数据库
机器学习
flinkx-web管理界面-LarkMidTable数据中台篇
LarkMidTable是一站式开源的数据中台,实现元数据管理,
数据仓库
开发,数据质量管理,数据的可视化,实现高效赋能数据前台并提供
踏雪无痕2019
·
2022-12-25 03:07
flinkx-web
flinkx
数据中台
大数据
数据仓库
数据库
数据质量管理—2、数据审核(Data Auditing)
前一篇文章介绍了数据质量的一些基本概念,数据质量控制作为
数据仓库
的基础环节,是保障上层数据应用的基础。
huryer
·
2022-12-25 03:32
etl
数据质量管理
数据审核
完整性
一致性
准确性
【观察】亚马逊云科技:“Zero ETL”迈出关键一步,数据由此实现“无感知”流动...
今天,各行各业正在由过去“粗放式”的增长向着数据支撑的“精细化”运营转型,但随之而来的是ETL任务的激剧膨胀,企业的整个
数据仓库
可能充斥着数百万张表,而无数个ETL任务不仅会让重复操作变得过多,操作过程复杂
申耀的科技观察
·
2022-12-24 14:44
科技
etl
数据仓库
大数据
《Designing Data-Intensive Application》03存储与检索
数据仓库
OLTP数据库和
数据仓库
之间的分歧星型和雪花
更新失败
·
2022-12-24 13:44
architecture
nosql
memcached
elasticsearch
redis
大数据
DLF +DDI 一站式数据湖构建与分析最佳实践
传统
数据仓库
模式的成本高、响应慢、格式少等问
阿里云云栖号
·
2022-12-24 12:35
云栖号技术分享
数据湖
6000字详解
数据仓库
建设
另外,互联网行业的业务变化非常快,不可能像传统行业一样,可以使用自顶向下的方法建立
数据仓库
,一劳永逸,它要求新的业务很快能融入
数据仓库
中来,老的下线的业务,能很方便的从现有的
数据仓库
中下线。
公众号:肉眼品世界
·
2022-12-24 12:03
数据仓库
大数据
编程语言
hadoop
数据库
基于阿里OneData思想,深入剖析
数据仓库
方法论(建议收藏)
摘要:今天分享的主要内容是基于百度的
数据仓库
方法论(精华版)分享时间:2021年6月2号分享内容:石老师摘要整理:皮卡丘主要内容:1.数据中台简介2.
数据仓库
方法论3.
数据仓库
项目实践一、数据中台简介1.1
学而知之@
·
2022-12-24 12:01
数据仓库
数据库
大数据
人工智能
数据分析
数仓建设(离线和实时)
文档大纲:一、数仓基本概念1.
数据仓库
架构我们在谈数仓之前,为了让大家有直观的认识,先来谈数仓架构,“架构”是什么?这个问题从来就没有一个准确的答案。
ashansmile
·
2022-12-24 12:28
big
data
数据仓库
hive
数据分析实战45讲(12) 数据集成
数据集成就是将多个数据源合并存放在一个数据存储中(如
数据仓库
),从而方便后续的数据挖掘工作。
amorcyc
·
2022-12-24 12:56
数据分析实战45讲(笔记)
数据分析
数据分析基础篇16讲之12数据集成:这些大号一共20亿粉丝?
数据集成:就是将多个数据源合并存放在一个数据存储中(如
数据仓库
),从而方便后续的数据挖掘工作。大数据项目中的数据集成包括有:数据清洗、数据抽取、数据集成和数据变换等操作。
jianhao93
·
2022-12-24 12:26
数据分析知识
数据分析实战45讲
极客时间
上一页
56
57
58
59
60
61
62
63
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他