E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数据仓库
Hive
数据仓库
介绍
目录编辑一、Hive概述1.1Hive产生的原因1.2Hive是什么?1.3Hive特点1.4Hive生态链关系二、Hive架构2.1架构图2.2架构组件说明2.2.1Interface2.2.1.1CLI2.2.1.2JDBC/ODBC2.2.1.3WebUI2.2.2MetaData2.2.3MetaStore2.2.4Hiveserver22.2.5Driver2.2.5.1解释器2.2.5
夜夜流光相皎洁_小宁
·
2023-09-20 00:29
#
Hive
大数据
数据仓库
hive
hadoop
如果人工智能的上半场是分类,那么下半场就是聚类
也学了一堆不扎实的计算机:计算机图形学、计算机视觉、人工智能、数据挖掘、
数据仓库
、数据库、专家系统等等现在研究人工智能,最后想想,拼的还是基础数学。
david_lv
·
2023-09-19 20:14
人工智能
算法
神经网络
聚类
机器学习
架构问题:技术选型
适用场景:Web网站系统、日志记录系统、
数据仓库
系统、嵌入式系统2.Oracle:全球最大的商业数据库软件公司之一,提供各种可扩展的解决方案,适用于从小型应用到大
青鱼入云
·
2023-09-19 19:54
架构
面试
视频结构化
视频被结构化后,存入相应的结构化
数据仓库
,存储的容量极大降低。
oldms
·
2023-09-19 09:57
数据治理-
数据仓库
和商务智能
数据仓库
的作用减少数据冗余,提高信息一致性,让企业能够利用数据做出更优决策的方法,
数据仓库
是企业数据管理的核心。
世润
·
2023-09-19 08:15
数据仓库
大数据
数据治理-
数据仓库
环境
数据仓库
环境包括一系列组织起来以满足企业需求的架构组件,从源系统流动到数据暂存区,数据可以在这里被清晰,当数据集成并存储在
数据仓库
或操作数据存储中时,可以对其进行补充丰富。
世润
·
2023-09-19 07:41
数据治理
数据仓库
大数据
数据治理
关于Amazon Redshift性能调优的十大Tips
AmazonRedshift是一套全托管PB级大规模并行
数据仓库
,拥有极低的上手难度与出色的性能表现。
亚马逊云开发者
·
2023-09-19 05:57
驱动程序
数据仓库
大数据
数据库
人工智能
Paimon+StarRocks 湖仓一体数据分析方案
本文整理自阿里云高级开发工程师曾庆栋(曦乐)在StreamingLakehouseMeetup分享的内容,深入探讨了传统
数据仓库
分析、Paimon+StarRocks湖仓一体数据分析、StarRocks
StarRocks_labs
·
2023-09-19 04:35
程序人生
【大数据】Doris 构建实时数仓落地方案详解(一):实时
数据仓库
概述
Doris构建实时数仓落地方案详解(一):实时
数据仓库
概述1.
数据仓库
的发展历程2.
数据仓库
技术的发展3.数仓的相关技术栈4.OLAP查询5.MPP架构6.实时数仓定义7.实时数仓的难点
数据仓库
的概念可以追溯到
G皮T
·
2023-09-19 04:45
大数据
大数据
数据仓库
Doris
实时数仓
MPP架构
Hadoop
HDFS
No.13软件集成技术
EAI所连接的应用包括各种电子商务系统、ERP、CRM、SCM、OA、数据库系统和
数据仓库
等。表示集成表示集成也称为界面集成,这是比较原始和最浅层次的集成,这种方法将用户界面作为公共的
科技男code
·
2023-09-19 00:08
高项笔记
数据库
数据仓库
数据挖掘
关于
数据仓库
、数据湖、数据平台和数据中台的概念和区别
我们谈论数据中台之前,我们也听到过数据平台、
数据仓库
、数据湖的相关概念,它们都与数据有关系,但他们和数据中台有什么样的区别,下面我们将分别介绍数据平台
数据仓库
数据湖和数据中台。
weixin_42073629
·
2023-09-18 23:36
框架案例
新一代
数据仓库
SnowFlake
SnowFlake概念Snowflake弹性
数据仓库
,简称Snowflake。
凌健文Lieo
·
2023-09-18 23:36
数据仓库SNOWFLAKE
笔记
数据仓库
数据库
sql
数据湖与
数据仓库
大家好,本期Jesse想跳脱开TSDB领域,来聊一聊数据湖与
数据仓库
的话题,Jesse作为局外人也想大体介绍一下二者的情况。
CnosDB
·
2023-09-18 23:06
局外Jesse论_Infra
数据仓库
物联网
时序数据库
数据库
数据仓库
,数据湖
1.
数据仓库
早期系统采用数据库来管理和存放数据,但随着大数据技术的兴起,大家想要通过大数据技术来找到数据之间可能存在的关系,所以大家设计了一套新的数据存储管理系统,把所有的数据全部存储到
数据仓库
,然后统一对数据处理
乐十九
·
2023-09-18 23:06
笔记
数据仓库
数据挖掘
人工智能
【数据湖仓架构】数据湖和仓库:Databricks 和 Snowflake
我们比较了Databricks和Snowflake,以评估基于数据湖和基于
数据仓库
的解决方案之间的差异。在这篇文章中,我们将介绍基于
数据仓库
和基于数据湖的云大数据解决方案之间的区别。
架构师酒馆
·
2023-09-18 23:35
架构
数据仓库
大数据
数据库
数据挖掘
开箱即⽤!HashData 云数仓上线华为蓝鲸应⽤商城
近⽇,经过华为对企业技术、产品和服务能⼒的综合评估,酷克数据企业级云原⽣
数据仓库
HashData通过与华为OceanStorPacific分布式存储的适配与优化,形成⼀体化解决⽅案,成功上线华为蓝鲸应⽤
·
2023-09-18 16:34
数据库运维
hive
数据仓库
hivehive
数据仓库
1.启动hadoop2.开启mysql服务3.启动hive4.hive的操作(1)创建数据库(2)查找hive数据库(3)设置属性信息(4)修改属性(5)删除数据库5.内部表与外部表
LMY~~
·
2023-09-18 08:40
mysql
hive
【Doris全面解析】存储层设计介绍2——写入流程、删除流程分析
本文转自开源中国ZhangYu0123博客1整体介绍Doris是基于MPP架构的交互式SQL
数据仓库
,主要用于解决了近实时的报表和多维分析。Doris高效的导入、查询离不开其存储结构精巧的设计。
ApacheDoris
·
2023-09-18 08:36
大数据
分布式
数据库
python
mysql
使用mobx
mobx树型结构组织项目状态管理遵循mobx定义数据存储一个简单的mobx
数据仓库
:classPlayer{@observablename="charten"@observableposition=[0,0
CharTen
·
2023-09-18 05:23
数据仓库
之高级事实表
事实表代理键代理键可用作所有维度表的主键。不与任何维度关联的事实表代理键,是在ETL加载过程中顺次分配的,可用于作为事实表的唯一主键列;在ETL中,用作事实表行的直接标识符,不必查询多个维度;允许将事实表更新操作分解为风险更小的插入和删除操作。蜈蚣事实表一些设计者为多对一层次的每层建立不同的规范化维度,例如,日期维度、月份维度、季度维度和年维度,并将所有外键包含在一个事实表中。这将产生蜈蚣事实表,
afansdie
·
2023-09-18 03:42
基于hadoop生态圈的
数据仓库
实践 —— OLAP与数据可视化(二)
二、Hive、SparkSQL、Impala比较Hive、SparkSQL和Impala三种分布式SQL查询引擎都是SQL-on-Hadoop解决方案,但又各有特点。前面已经讨论了Hive和Impala,本节先介绍一下SparkSQL,然后从功能、架构、使用场景几个角度比较这三款产品的异同,最后附上分别由cloudera公司和SAS公司出示的关于这三款产品的性能对比报告。1.SparkSQL简介S
xuzhichao1231
·
2023-09-17 19:33
hadoop生态圈
hadoop
spark
数据可视化
数据仓库
生态圈
复杂SQL查询和可视化报表构建
更多AnalyticDBMySQL相关至阿里云体验实验室简介目标是让云上
数据仓库
用户及开发者通过简单的步骤体验基于AnalyticDBMySQL版和DMS构建云原生
数据仓库
的主要流程,活动将通过实例的开通
阿里云云起实验室
·
2023-09-17 19:02
体验场景
可视化
数据仓库
数据库
大数据
mysql
数据仓库
模型设计(收藏版)
一、
数据仓库
构建需要考虑的问题与数据库的单表基于ER模型构建思路不同,其面向特定业务分析的特性,决定了它的构建需要整合多套数据输入系统,并输出多业务条线的、集成的数据服务能力,需要考虑更全面的因素,包括
000X000
·
2023-09-17 15:13
数据仓库
实战
数据建模
数据仓库
数据库
系统架构
Flink CDC 2.0 详解
CDC技术的应用场景非常广泛:数据同步:用于备份,容灾;数据分发:一个数据源分发给多个下游系统;数据采集:面向
数据仓库
/数据湖的ETL数据集成,是非常重要的数据源。CDC的技术方案非常
000X000
·
2023-09-17 15:43
实战
Apache
Flink
实时数仓
flink
big
data
hive
数据仓库
之ODS层设计概要
常常被作为
数据仓库
的过渡,也是
数据仓库
项目的可选项之一。而Kimball的定义:操作型系统的集成,用于当前、历史以及其它细节查询(业务系统的一部
000X000
·
2023-09-17 15:12
数据仓库
实战
数据建模
数据仓库
ODS层
(三十一)大数据实战——一键式DolphinScheduler高可用工作流任务调度系统部署安装
前言DolphinScheduler(DolphinScheduler)是一个分布式、易扩展的开源DAG(有向无环图)工作流任务调度系统,可用于构建大规模数据处理、
数据仓库
、ETL等复杂的数据处理和数据分析场景
北溟溟
·
2023-09-17 10:12
大数据
大数据
火山引擎 ByteHouse:ClickHouse 如何保证海量数据一致性
基于高性能、分布式特点,ClickHouse可以满足大规模数据的分析和查询需求,因此字节研发团队以开源ClickHouse为基础,推出火山引擎云原生
数据仓库
ByteHouse。
字节跳动技术团队
·
2023-09-17 10:02
火山引擎
clickhouse
企业级
数据仓库
-理论知识
D3AM大数据中间件Hive:将SQL转化成分布式Map/Reduce进行运算,也支持转换成Spark,需要单独安装Hive集群才能访问Spark,支持60%的SQL,延迟比较大。SparkSQL:属于Spark生态圈,HiveonSqark。HBase:NoSQL,高并发读,适合表结构频繁变动。Impala:MPP架构的数据查询引擎,低层兼容Hive、SparkSQL,快速交互查询服务。HAWQ
beyond_champion
·
2023-09-17 03:39
数据仓库
大数据
数据分析
数据仓库
企业级
数据仓库
-数仓实战
数仓实战安装包大小安装清单环境搭建一、环境搭建01(机器准备)准备好三台虚拟机,并进行修改hostname、在hosts文件增加ip地址和主机名映射。1、设置每个虚拟机的hostnamevi/etc/sysconfig/network修改HOSTNAME=node02修改hostnamehostnamectlset-hostnamenode022、设置每个虚拟机的ip地址和主机名映射cat>>/e
beyond_champion
·
2023-09-17 03:06
数据仓库
数据仓库
数据库
hadoop
big
data
文本数据清洗(小技巧)
今天80%的数据是非结构化的——或者存在于
数据仓库
里,或者分散在不同的存储设备中。数据就像我们说话一样,一直在产生——从社交媒体中我们进行的每次对话,到从新数据源生成的每个内容。
马力_Panotech
·
2023-09-17 02:01
PostgreSQL 物化视图快速入门
主要用于需要快速访问数据的场景,如
数据仓库
和商务智能应
梦想画家
·
2023-09-17 00:50
PostgreSQL
浅谈
数据仓库
体系(2)
如上文所说,一个基本的
数据仓库
分为贴源层,历史层,数据模型层本文主要来讲一下贴源层(ODS),重点是如下三个方面1.贴源层的数据清洗2.贴源层的数据存储3.贴源层的数据校验一.数据清洗贴源层,一般来说抽取的是源系统的数据
半个程序员
·
2023-09-16 23:38
数据仓库
模型设计V2.0
一、数仓建模的意义数据模型就是数据组织和存储方法,它强调从业务、数据存取和使用角度合理存储数据。只有将数据有序的组织和存储起来之后,数据才能得到高性能、低成本、高效率、高质量的使用。高性能:良好的数据模型能够帮助我们快速查询所需要的数据。低成本:良好的数据模型能减少重复计算,实现计算结果的复用,降低计算成本。高效率:良好的数据模型能极大的改善用户使用数据的体验,提高使用数据的效率。高质量:良好的数
000X000
·
2023-09-16 21:46
数据仓库
数据建模
实战
数据仓库
spark
大数据
数据仓库模型设计V2.0
Hive参数与性能调优-V2.0
Hive作为大数据平台举足轻重的框架,以其稳定性和简单易用性也成为当前构建企业级
数据仓库
时使用最多的框架之一。
000X000
·
2023-09-16 21:54
数据仓库
HIVE
大数据
hive
数据仓库
Hive参数与性能调优
Spark sql 数据迁移
一、迁移一张表查看表结构:desctabletb1;查看建表sql语句:showcreatetabletb1;1.同一个
数据仓库
中复制表和数据,使用CTAS语句;常用的三种方案:a.完全复制拷贝:createtabletb2assele
LuoZhao
·
2023-09-16 20:49
Hive
Hive产生背景MapReduce编程的不便性HDFS上的文件缺少SchemaHive是什么1)由Facebook开元,最初用于解决海量结构化的日志数据统计问题2)构建在Hadoop之上的
数据仓库
3)Hive
捕猎者
·
2023-09-16 16:51
Data Lakehouse的未来-开放
这些数据湖为关键任务大规模数据分析、商业智能(BI)和机器学习用例(包括企业
数据仓库
)提供动力。
大数据杂货铺
·
2023-09-16 09:22
大数据之Hive
Hive入门Hive是FaceBook开源,基于Hadoop的一个
数据仓库
工具,可以将结构化的数据映射为一张表,并提供类SQL查询功能。
十七✧ᐦ̤
·
2023-09-16 08:18
大数据
hive
hadoop
数据仓库
介绍及应用场景
数据仓库
(DataWarehouse)是一个用于存储、管理、检索和分析大量结构化数据的集中式数据库系统。
今晚务必早点睡
·
2023-09-16 08:42
数据仓库
【数据网格架构】分布式数据网格作为集中式数据单体的解决方案
随着数据变得越来越普遍,传统的
数据仓库
和数据湖架构变得不堪重负,无法有效扩展。Dehghani认为,分布式数据网格方法可以通过采用面向领域的数据所有权来克服这些固有的低效率。“我建议下一个企业数据平台
架构师酒馆
·
2023-09-15 18:41
架构
分布式
数据网格架构
数据架构
大数据开发:Hive DDL操作入门
Hive针对于数据管理操作,提供了类SQL语言HQL,在Hadoop生态当中,Hive定位为
数据仓库
工具,对于数据的各种操作,也就是使用HQL来完成。
成都加米谷大数据
·
2023-09-15 11:31
开箱即⽤!HashData 云数仓上线华为蓝鲸应⽤商城
近⽇,经过华为对企业技术、产品和服务能⼒的综合评估,酷克数据企业级云原⽣
数据仓库
HashData通过与华为OceanStorPacific分布式存储的适配与优化,形成⼀体化解决⽅案,成功上线华为蓝鲸应⽤
HashData酷克数据
·
2023-09-15 08:47
华为
数据仓库
数据库
数据治理-数据管理角色
无论是直接角色(如设计
数据仓库
的数据架构师),还是间接角色(如开发网站的Web开发人员),所有IT角色都可以映射到数据生命周期的某个点,因此他们都会影响数据管理。
世润
·
2023-09-15 07:02
数据治理
大数据
数据治理
数据仓库
主题一(宽表模型设计)
一、典型的
数据仓库
建模思想一般主流分为两种第一种ER模型是
数据仓库
之父父Billlnmon提出的建模方法是从全企业的高度设计3NF模型,用实体关系(EntityRelationship,ER)模型描述企业业务
lianchaozhao
·
2023-09-15 07:04
数据仓库
hive
数据建模
大数据
GaussDB(DWS)云原生数仓技术解析:湖仓一体,体验与大数据互联互通
文章目录前言一、关于
数据仓库
需求场景分类二、
数据仓库
线下部署场景2.1、线下部署场景介绍及优劣势说明2.2、线下部署场景对应的客户需求三、
数据仓库
公有云部署场景3.1、公有云部署场景介绍及优劣势说明3.2
白鹿第一帅
·
2023-09-15 07:56
企业级开发业务解决方案
大数据入门与高阶开发(Big
Data)
白鹿第一帅
gaussdb
云原生
云原生数仓技术解析
湖仓一体
DWS
大数据
BI与数据治理以及
数据仓库
有什么区别
你可能已经听说过BI、数据治理和
数据仓库
这些术语,它们在现代企业中起着重要的作用。虽然它们都与数据相关,但它们之间有着明显的区别和各自独特的功能。
qingyunliushuiyu
·
2023-09-15 06:42
数据仓库
数据治理
BI
T-ETL和ELT区别
ETLETL,即抽取、转换、加载,是从不同的数据源抽取信息,将其转换为根据业务定义的格式,然后将其加载到其他数据库或
数据仓库
中。
ELI_He999
·
2023-09-15 06:38
2023ARTS打卡
大数据
etl
数据仓库
arts挑战
火山引擎 ByteHouse:两个关键技术,揭秘 OLAP 引擎中的数据导入技术
作为一款OLAP引擎,火山引擎云原生
数据仓库
ByteHouse源于开源ClickHouse,在字节跳动多年打磨下,提供更丰富的能力和更强性能,能为用户带来极速分析体验,支撑实时数据分析和海量离线数据分析
字节数据平台
·
2023-09-14 19:28
火山引擎
大数据
数据研发
云原生
大数据-Hive
Hive简介Hive是基于Hadoop的一个【
数据仓库
工具】,可以将结构化和半结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能。
HikZ.919
·
2023-09-14 06:35
hadoop
大数据
hive
hadoop
【
数据仓库
设计基础1】关系数据模型理论与
数据仓库
Inmon方法论
关系数据模型中的结构1.关系2.属性3.属性域4.元组5.关系数据库6.关系表的属性7.关系数据模型中的键二.关系完整性1.空值(NULL)2.关系完整性规则3.业务规则4.关系数据库语言三.规范化四.关系数据模型与
数据仓库
关系模型被广泛应用于数据处理和数据存储
roman_日积跬步-终至千里
·
2023-09-14 05:26
数据仓库
数据仓库
上一页
25
26
27
28
29
30
31
32
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他