E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
--------【数据仓库】
Hadoop之HIVE和HBASE区别
ApacheHive是一个构建在Hadoop基础设施之上的
数据仓库
。通过Hive可以使用HQL语言查询存放在HDFS上的数据。
爱吃炒饭的逗比小豆豆
·
2022-07-11 09:19
hadoop
大数据
hadoop
数据挖掘基础知识点总结
第一章
数据仓库
和数据挖掘概述一、概念题1、
数据仓库
的定义是什么?答:
数据仓库
是面向主题的、集成的、稳定的、不同时间的数据集合,用于支持经营管理中央决策制定过程。2、
数据仓库
的特点是什么?
陈小虾
·
2022-07-08 22:53
数据挖掘与数据竞赛
数据挖掘知识点
隐私计算FATE-核心概念与单机部署
一、说明Fate是一个工业级联邦学习框架,所谓联邦学习指的就是可以联合多方的数据,共同构建一个模型;与传统数据使用方式相比,它不需要聚合各方数据搭建
数据仓库
,联邦学习在联合计算建模的过程中,多方机构之间的数据是不会进行共享的
zlt2000
·
2022-07-08 18:33
隐私计算
隐私计算
联邦学习
Fate
大数据----
数据仓库
设计基础(实列演示)
文章目录关系数据模型关系数据模型中的结构关系完整性规范化关系数据模型与
数据仓库
维度数据模型维度数据模型建模过程维度规范化维度数据模型的特点星型模式雪花模式DataVault模型DataVault模型DataVault
noworldling
·
2022-07-08 14:18
大数据
数据仓库
数据结构
数据仓库
大数据
数据挖掘
大数据--
数据仓库
--数据同步方式
第四章:同步策略/存储方式4.1数据存储方式概述首先弄清楚,增量同步,快照同步,增量表,全量表,拉链表之间的关系。4.2全量全量表无分区,每天凌晨流程执行完后,表中的数据是截至到前一天的全部MySQL数据。全量表可能会update数据,即对某条历史数据进行更新,保存最新的那条数据,一般只包含一个文件。如果需要追溯历史数据,需要存快照表进行操作。当然对于某些业务流水数据库只会新增,不会删改,或者我们
斑马!
·
2022-07-08 14:48
大数据
#
数据仓库
mysql
数据库
big
data
大数据----Hadoop与
数据仓库
Hadoop与
数据仓库
传统
数据仓库
一般建立在Oracle、MySQL这样的关系数据库系统之上。关系数据库主要的问题是不好扩展,但Hadoop的数据和计算都是分布式的,可以处理海量数量。
noworldling
·
2022-07-08 14:48
hadoop
大数据
数据仓库
大数据
hadoop
数据仓库
大数据之路:数据同步
目录1.数据同步基础2.阿里
数据仓库
的同步方式3.数据同步遇到的问题和解决方案1.数据同步基础大数据的数据同步主要包括从分布式业务系统同步进入
数据仓库
和数据从
数据仓库
同步进入数据应用和数据服务两个方面。
嗯嗲和滴
·
2022-07-08 14:17
大数据之路:阿里巴巴大数据实践
大数据
数据库
数据同步
大数据之路----3.数据同步
文章目录数据来源数据同步直连同步数据文件同步数据库日志解析同步
数据仓库
同步方式批量数据同步实时数据同步数据同步遇到的问题和解决办法分库分表的处理增量与全量同步的合并数据漂移的处理数据来源关系型数据库的结构化数据
noworldling
·
2022-07-08 14:17
大数据
数据仓库
数据结构
大数据
数据仓库
数据库
大数据架构师——音乐数据中心平台离线数仓综合项目(一)
1NF):原子性,字段不可分第二范式(2NF):唯一性,一个表只能说明一个事物,有主键,非主键字段依赖主键第三范式(3NF):非主键字段不能相互依赖,不存在传递依赖反范式ER实体模型ER实体关系模型案例
数据仓库
与维度建模
数据仓库
意义什么是
数据仓库
yangwei_sir
·
2022-07-08 11:05
大数据
大数据
数据仓库
数仓分层设计
Java 如何远程调用 SPL 脚本
实现思路通过下图一目了然:部署服务器服务器是运行在Java平台上面向分析型的高性能数据库,作为高性能计算
数据仓库
,服务器可以在离线跑批、在线查询、多维分析和内存计算等方面提供高效的计算输出,帮助用户解决计算中的多种问题
润乾软件
·
2022-07-08 07:06
JAVA计算
spl
java
数据分析
集算器
esProc
同程数科基于 Apache Doris 的
数据仓库
建设
导读:同程数科成立于2015年,是同程集团旗下的旅游产业金融服务平台。2020年,同程数科基于ApacheDoris丰富的数据接入方式、优异的并行运算能力、极简运维等特性,引入ApacheDoris进行数仓架构2.0的搭建。本文详细讲述了架构1.0到2.0的演进过程及Doris的应用实践,希望对大家有所帮助。作者|同程数科大数据高级工程师王星业务背景业务介绍同程数科是同程集团旗下的旅游产业金融服务
·
2022-07-07 19:29
【面试突击】mysql相关知识
是在Web、
数据仓库
和其他应用环境下最常使用的存储引擎之一。具有较高的插入和查询速度,不支持事务。数据
无聊到想学习
·
2022-07-07 17:14
笔记
Hive简单使用
1、
数据仓库
与数据库区别数据库与
数据仓库
的区别实际讲的是OLTP与OLAP的区别。
捡黄金的少年
·
2022-07-07 10:05
大数据
Hive 常用核心技能
@羲凡——只为了更好的活着Hive是一个非常常用的
数据仓库
,任何一家公司都会有,只是用的深浅的区别。
羲凡丞相
·
2022-07-07 10:03
hive
传递参数
加载函数
修改location
hive常用技能
为什么越来越多的企业选择云数据存储而放弃本地数据存储?
本文将会探讨企业在收集和分析大数据时可能面临的主要挑战,以及将企业
数据仓库
部署到本地或云数据存储的选择。
云联壹云
·
2022-07-07 09:48
云计算
实时
数据仓库
本篇文章只是对自己的一些实时数仓经验的一些总结,就架构和数据流向而言其实和离线
数据仓库
大同小异,但是实时处理有自己的特殊性为什么要有实时数仓?
这个程序猿可太秀了
·
2022-07-05 19:12
数据中台
大数据
分布式
flink
实时数据仓库
数仓建模—指标体系
数据仓库
系列文章数仓架构发展史数仓建模方法论数仓建模分层理论数仓建模—宽表的设计数仓建模—指标体系一文搞懂ETL和ELT的区别数据湖知识点技术选型|OLAP大数据技术哪家强?
·
2022-07-04 18:32
数据仓库
数仓建模—宽表的设计
数据仓库
系列文章数仓架构发展史数仓建模方法论数仓建模分层理论数仓建模—宽表的设计数仓建模—指标体系一文搞懂ETL和ELT的区别数据湖知识点技术选型|OLAP大数据技术哪家强?
·
2022-07-04 18:02
数据仓库
数仓建模—数据集市
数据仓库
系列文章(持续更新)数仓架构发展史数仓建模方法论数仓建模分层理论数仓建模—宽表的设计数仓建模—指标体系
数据仓库
之拉链表数仓—数据集成数仓—数据集市数仓—商业智能系统数仓—埋点设计与管理数仓—IDMapping
·
2022-07-04 18:01
2021年十大数据分析工具排行榜出炉
尤其是在数据采集,数据清理,
数据仓库
,数据分析,以及数据可视化方面。近几年,数据驱动对IT创新和企业业务发展都有好处,它从数据信息中获取价值,理解数据及其模式,然后从中预测和产生结果。
学掌门
·
2022-07-04 15:23
IT
数据分析
数据分析
数据分析师
数据仓库
建设流程及概念
数据仓库
建设流程及概念(学习记录)该文章为自己学习整理总结内容有不正之处请谅解文章目录
数据仓库
建设流程及概念(学习记录)第一章:
数据仓库
概述1.1
数据仓库
概念1.2
数据仓库
核心架构1.2.1框架架构明细第
赵一一3306
·
2022-07-04 12:57
数据仓库
数据仓库
理论篇
数据仓库
DataWarehouse-数仓是一种思想,数仓是一种规范,数仓是一种解决方案
数据仓库
之父BillInmon将
数据仓库
描述为一个面向主题的、集成的、随时间变化的、非易失的数据集合,用于支持管理者的决策过程
HikZ.919
·
2022-07-04 12:54
hadoop
Flume
数据库
数据分析
数据仓库
架构
大数据架构演变(数仓架构演变)传统离线大数据架构21世纪初随着互联网时代的到来,数据量暴增,大数据时代到来。Hadoop生态群及衍生技术慢慢走向“舞台”,Hadoop是以HDFS为核心存储,以MapReduce(简称MR)为基本计算模型的批量数据处理基础设施,围绕HDFS和MR,产生了一系列的组件,不断完善整个大数据平台的数据处理能力,例如面向KV操作的HBase、面向SQL分析的Hive、面向工
Keven He
·
2022-07-04 12:53
#
数仓
数据仓库
第一章
数据仓库
理论
数据仓库
理论第1节
数据仓库
1.1什么是
数据仓库
1988年,为解决全企业集成问题,IBM公司第一次提出了信息仓库(InformationWarehouse)的概念。
微毂
·
2022-07-04 12:51
大数据
数据仓库
数据仓库
大数据
数据仓库
理论与实践
数据仓库
理论与实践(用户画像)文章目录
数据仓库
理论与实践(用户画像)一、数仓理论1.1数据库和
数据仓库
的区别1.2数据建模理论1.3维度建模的步骤二、数据采集2.1通用数据采集框架2.2日志服务器日志采集工具
oahaijgnahz
·
2022-07-04 12:51
大数据相关
面试
flink
hadoop
大数据
经验分享
数据仓库
数据仓库
理论介绍
文章目录一.
数据仓库
1.什么是
数据仓库
1)面向主题2)集成3)非易失4)随时间变化二.
数据仓库
和数据库的区别三.
数据仓库
的架构四.
数据仓库
的建模1.选择业务流程2.声明粒度3.确认维度4.确认事实5.星型模型特点
sun_0128
·
2022-07-04 12:21
数仓项目
数据仓库
数据仓库
与数据挖掘 2
数据仓库
的概念、特点与组合
数据仓库
的组成
数据仓库
数据库(核心,数据信息存放的地方);数据抽取工具;元数据:技术元数据(开发和管理)与业务元数据(单位业务);访问工具;数据集市(DataMarts)(特定的应用目的
启迪小天才
·
2022-07-04 12:20
数据仓库与数据挖掘
数据挖掘
数据库
big
data
数据仓库
数据仓库
总结
1.
数据仓库
1.1什么是
数据仓库
数据仓库
,英文名为DataWarehouse,简写为DW或DWH。
GoAI
·
2022-07-04 12:19
数据库
大数据笔记
数据仓库
数据分析
大数据
数据库
数据仓库
理论
1.1什么是
数据仓库
1988年,为解决全企业集成问题,IBM公司第一次提出了信息仓库(InformationWarehouse)的概念。
五公里在路上丶
·
2022-07-04 12:49
数据仓库
大数据
数仓理论- 02
数据仓库
架构
3架构3.1架构图3.1.1说明不同企业存在差异,例如:命名不一样,或者是定制的,主流以阿里的参考3.1.2内容ETL,ODS,CDM(DWS,DWD),ADS3.1.3ETL:数据同步模块从业务数据库(即数据源)抽取数据extract交互转换:进行清洗一级标准化transform加载load使用的工具:Sqoop,Kettle,Flume/Logstash(日志,文件等非结构化,半结构化的数据)
:Concerto
·
2022-07-04 12:18
数据仓库
架构
数据挖掘
数据仓库
理论知识
数据仓库
理论知识为什么要分层分层的主要原因是在管理数据的时候,能对数据有一个更加清晰的掌控,详细来讲,主要有下面几个原因:清晰数据结构:每一个数据分层都有它的作用域,这样我们在使用表的时候能更方便地定位和理解
时光带不走丶年少轻狂
·
2022-07-04 12:17
数据仓库
big
data
数据分析
大数据——
数据仓库
理论介绍
数据仓库
为什么学习
数据仓库
数据仓库
(DW)面向主题提取主题(一)提取主题(二)集成非易失随时间变化
数据仓库
和数据库的区别OLTP和OLAP的区别
数据仓库
分层
数据仓库
结构(一)
数据仓库
架构(二)
数据仓库
架构
蜂蜜柚子加苦茶
·
2022-07-04 12:47
数据仓库
大数据
hive
hadoop
数据分析
数据仓库
理论篇与Flume
数据仓库
理论篇
数据仓库
DataWarehouse-数仓是一种思想,数仓是一种规范,数仓是一种解决方案数据处理方式数据处理大致可以分为两大类:联机事务处理OLTP(On-LineTransactionprocessing
HikZ.919
·
2022-07-04 12:46
Flume
数据仓库
数据挖掘
人工智能
Hadoop总结
目录大数据概述Hadoop大数据开发平台资源管理YARN分布式文件系统HDFS非关系型数据库NOSQL分布式数据库HBASE批处理和MapReduce
数据仓库
查询分析和Hive基于内存计算的Spark流计算和
ArimaMisaki
·
2022-07-03 13:55
大数据
hadoop
大数据
分布式
16-
数据仓库
之数据建模、数据建模表的分类、数据建模步骤、数据分层的原因和优点
九、
数据仓库
9.1数据处理方式9.1.1OLTP定义理解OLTP的全称是On-lineTransactionProcessing,中文名称是联机事务处理特点主要用于管理事物,用来处理高并发且数据量级不大的查询此类系统专注于
大数据下的画像人
·
2022-07-02 09:53
大数据
数据仓库
数据挖掘
数据库
17-ETL工具、大数据架构、Flume介绍、Flume组件介绍
9.8ETL9.8.1概念描述ETL理解ETL是将业务系统的数据经过抽取、清洗转换之后加载到
数据仓库
的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据设计分为3部分数据抽取数据的清洗转换数据的加载对
大数据下的画像人
·
2022-07-02 09:20
大数据
大数据
etl
架构
HashData助力企业构建数据分析新范式
面对日益增加的数据规模和数据类型多元化的发展趋势,企业数据分析复杂度不断提升,传统MPP
数据仓库
平台,在资源弹性、成本等方面已经很难适应企业业务需求。近日,HashDa
·
2022-07-01 15:55
mysql数据库json
【系统分析师之路】2008年上系统分析师上午综合知识真题
【系统分析师之路】2008年上系统分析师上午综合知识真题章节No章节总分数获得分考点心得3企业信息化战略74企业应用集成,信息系统概述,企业应用系统开发,
数据仓库
数据挖掘,企业会计系统,企业业务活动,信息资源规划数据集成是基础
进击的横打
·
2022-06-30 17:35
#
系统分析师---历年真题
数据仓库
系统架构
软考系分
小迈科技 X Hologres:高可用的百亿级广告实时数仓建设
作者:李云,小迈高级
数据仓库
开发工程师,
数据仓库
负责人雷文,小迈数仓开发工程师;一、业务介绍小迈科技成立于2015年1月,是一家致力以数字化领先为优势,实现业务高质量自增长的移动互联网科技公司。
·
2022-06-30 15:59
数据挖掘存储大数据
MySQL+JDBC学习笔记(狂神)
和给前端传递数据))数据库(存数据)1.为什么学习数据库岗位需求现在的世界,大数据时代,得数据者得天下被迫需求:存数据数据库是所有软件体系中最核心的存在2.什么是数据库数据库(DB,database)概念:
数据仓库
程序猿tu
·
2022-06-29 09:48
数据库
mysql
数据库
学习
2_1 (Oracle/MySQL/SQLServer)数据类型之长度、精度、标度
2.1SQLServer数据类型2.2Oracle数据类型三.获取表结构信息F附录F.1表字段syscolumns字典参考文章相关链接Excel目录一.前言在进行数据采集工作前—需要调研上游表结构这样在
数据仓库
的
GroupiesM
·
2022-06-28 19:46
二.Database
数据库
sqlserver
oracle
ddl
【从0到1学会云原生系列】之云原生应用基础和入门
去年9月,一家名为Snowflake的云原生
数据仓库
厂商上市,当天市值即涨破
王大梨
·
2022-06-27 22:22
云计算
云原生
cloud
native
云计算
前端项目设计
webpack/vite代码规范eslintstyleint提交规范husky/lint-staged/commitlint模块化公共库组件,业务组件公共方法ajax请求接口列表路由,权限路由store
数据仓库
设计模式常用业务布局音频
rongmingye
·
2022-06-27 09:58
项目管理
前端
数据仓库
1.0
该文章来源于我的hexo博客,简单地描述了
数据仓库
系统构建流程,例如etl,数据建模,缓慢变化维,数据治理,元数据管理等等ODS->DWD(用户行为数据分析)维度集成GeoHash编码//经纬度字典表存入数据库
冰菓_
·
2022-06-26 16:32
破解湖+仓混合架构顽疾,星环科技推出自主可控云原生湖仓一体平台
单一数据湖和
数据仓库
已不能顺应数据分析的发展趋势,越来越多企业开始基
·
2022-06-24 11:23
大数据
hive
数据仓库
新增字段方法
目录新增字段1、方法1cascade知识2、方法2(适用于外部表)3、方法3(下下策)修改字段删除列新增字段1、方法1altertable表名addcolumns(列名stringCOMMENT'新添加的列')CASCADE;altertable表名addcolumns(列名stringCOMMENT'新添加的列');hive表中指定位置增加一个字段分两步,先添加字段到最后(addcolumns)
·
2022-06-23 15:36
Hive HQL支持2种查询语句风格
目录背景风格一风格二两种风格的区别背景在平时业务运营分析中经常会提取数据,也就是大家俗称的SqlBoy,表哥表姐,各大公司数据中台现在大部分用的都是基于Hadoop的分布式系统基础架构,用的比较多的有Hive
数据仓库
工具
·
2022-06-23 13:51
C#连接SQL Sever数据库与数据查询实例之
数据仓库
详解
目录前言1.下载后打开选择登录:Windows身份验证2.创建登录的账号和密码(右键创建)3.创建数据库表表的右键新建即可4.导入数据这里以信息表为例子C#连接数据库1.创建连接2.打开连接3.查询数据总结前言大数据时代在编程可能需要用到一些文本内容,不可能全部写到代码里,不好更改,用户也不方便使用所以需要用到我们的数据库来保存这些数据,直接更改数据SQL:下载地址:https://www.mic
·
2022-06-23 13:48
关于 Data Lake 的概念、架构与应用场景介绍
当时核心要解决的问题是传统
数据仓库
报表分析面临的两个问题:只使用一部分属性,这些数据只能回答预先定义好(pre-determined)的问题。数据被聚合了,最低层级的细节丢失了,能回答的问题被
·
2022-06-22 18:28
后端
数据仓库
(05)数仓Kimball与Inmon架构的对比
数据仓库
主要有四种架构,Kimball的DW/BI架构、独立数据集市架构、辐射状企业信息工厂Inmon架构、混合Inmon与Kimball架构。不过不管是那种架构,基本上都会使用到维度建模。
·
2022-06-21 17:21
上一页
70
71
72
73
74
75
76
77
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他