E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
--------【数据仓库】
Apache Doris 巨大飞跃:存算分离新架构
ApacheDoris创始人历史上,数据分析需求的不断提升(更大的数据规模、更快的处理速度、更低的使用成本)和计算基础设施的不断进化(从专用的高端硬件、到低成本的商用硬件、到云计算服务),这两大因素推动
数据仓库
的架构大体经历了三个时代
SelectDB技术团队
·
2023-08-01 21:53
apache
大数据
数据仓库
数据分析
doris
架构
国产ETL调度管理工具神器- TASKCTL
在众多大大小小的
数据仓库
、数据集市以及各类数据池中,是批量调
TASKCTL
·
2023-08-01 14:28
多事务事实表实践
一:企业级数仓多事务事实表的重要性整个企业级的
数据仓库
,从表的性质来分,有维度表和事实表,事务表又分为多事务事实表,累积快照事实表,周期型快照表,这些不同种类的事实表,其实在数仓里面都扮演者不同的角色。
愤怒的谜团
·
2023-08-01 13:10
《大数据开发》Hive
Hive是基于Hadoop的一个
数据仓库
工具;提供Sql(hiveSql)查询功能;数据是存储在hdfs上,hive本身不存储数据,构建表的逻辑存在指定数据库(mysql)。
Steve_Abelieve
·
2023-08-01 12:40
大数据
hadoop
hive
数据仓库
-Hive基础(五)Hive 的基本操作
1.数据库操作1.1创建数据库createdatabaseifnotexistsmyhive;usemyhive;说明:hive的表存放位置模式是由hive-site.xml当中的一个属性指定的hive.metastore.warehouse.dir/user/hive/warehouse1.2创建数据库并指定位置createdatabasemyhive2location'/myhive2';1.
做个合格的大厂程序员
·
2023-08-01 03:46
企业转型中,如何区别数据信息化和数字化
数据存储和管理:将采集到的数据存储在合适的数据库或
数据仓库
中,并
派可数据BI可视化
·
2023-07-31 20:49
数字化转型
数据可视化
商业智能
大数据
信息可视化
数据分析
商业智能BI
大数据架构图
平台数据架构流程图标准大数据平台架构,标准大数据平台架构,大数据平台架构,
数据仓库
,数据集市,大数
ixiaoyang8
·
2023-07-31 17:10
在线画流程图
大数据
架构图
流程图
思维导图
项目管理
大数据计算技术架构解析
数据计算处理系统3数据存储系统3.1功能3.1.1数据清洗、抽取和建模3.1.1.1建模3.1.1.1.1概念模型3.1.1.1.2逻辑模型3.1.1.1.3物理模型(存储)3.1.2数据存储架构3.1.3
数据仓库
和数据服务
风吹海洋浪
·
2023-07-31 17:40
大数据
big
data
架构
云计算
大数据部分总结
分布式文件系统)ARN(运算资源调度系统)MAPREDUCE(分布式运算编程框架)重点组件:HDFS:分布式文件系统MAPREDUCE:分布式运算程序开发框架HIVE:基于大数据技术(文件系统+运算框架)的SQL
数据仓库
工具
DHRJFH
·
2023-07-31 09:14
大数据
hadoop
big
data
hadoop
Hive教程_编程入门自学教程_菜鸟教程-免费教程分享
教程简介Hive是基于Hadoop的一个
数据仓库
工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。
IT民工爱搬砖
·
2023-07-31 06:26
笔记
这一篇对项目的优化实战,能让你面试加分30%!
项目简介首先,整个系统是基于Dubbo的分布式系统架构,数据存储统一存储在
数据仓库
。
数据仓库
提供多种存储方式,包括MySQL、HDFS、HBSE、Hive、Impala、Spark、Ela
nFishCoder
·
2023-07-30 21:26
初步理解 Dubbo 与 Zookeeper
Dubbo是管理中间层的工具,在业务层到
数据仓库
间有非常多服务的接入和服务提供者需要调度,dubbo提供一个框架解决这个问题。
web13618542420
·
2023-07-29 19:47
java
java
后端
数据仓库
理论
一、数仓简介1、历史演进1)
数据仓库
最早可以追溯到20世纪70年代,希望将业务处理系统和分析处理系统分成不同的层次;2)1991年BillInmon在《BuildingtheDataWarehouse》
莫待花无空折枝
·
2023-07-29 14:55
大数据
spark
分布式
【读书笔记】用户画像方法论与工程化解决方案
1)架构层:在画像系统的架构层,本书首先介绍了画像
数据仓库
的架构,进一步介绍了数据存储的技术选型,在什么场景下使用Hive、MySQL、HBase、Elasticsearch等工具存储数据,用户标签开发
若小鱼
·
2023-07-29 12:01
读书笔记
大数据
用户画像
大
数据仓库
技术实训任务2
大
数据仓库
技术实训——任务2请按照要求完成以下内容:1.启动hadoop,hivestart-all.shhive2.在hive中创建数据库empdb和empdb1createdatabaseempdb
陈希瑞
·
2023-07-29 09:15
hive
数据仓库
hive
大数据-数仓-数据采集-业务数据(二):全量同步采集【MySQL<-->DataX(全量)<-->HDFS】【每日全量:每天都将业务数据库中全部数据同步到
数据仓库
,是保证两侧数据同步的最简单方式】
DataX源码地址:GitHub-alibaba/DataX:DataX是阿里云DataWorks数据集成的开源版本。一、第1章DataX介绍1.1DataX概述1.介绍:DataX是阿里巴巴开源的一个异构数据源离线同步工具,致力于实现包括关系型数据库(Mysql、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。2.特点:①DataX侧
u013250861
·
2023-07-29 08:12
#
数据库
大数据
数据仓库
可否取代
数据仓库
?
什么是数据湖?数据湖是一个集中的存储库,允许您以任何规模存储所有结构化和非结构化数据。您可以按原样存储数据,而不必首先构造数据,并运行不同类型的分析—从仪表板和可视化到大数据处理、实时分析和机器学习,以指导更好的决策。为什么需要数据湖?通过数据成功创造商业价值的组织将胜过同行。Aberdeen的一项调查表明,实施数据湖的组织比同类公司在有机收入增长方面高出9%。这些领导者能够进行新类型的分析,例如
产品经理自我修养
·
2023-07-29 07:25
大数据
数据库
超融合架构下 Oracle
数据仓库
跑批性能如何?
本次,我们将介绍SmartX超融合对Oracle
数据仓库
跑
志凌海纳SmartX
·
2023-07-29 01:59
oracle
超融合
【
数据仓库
】Apache Hive初体验
为什么使用Hive?使用HadoopMapReduce直接处理数据所面临的问题:人员学习成本太高需要掌握ava语言MapReduce实现,复杂查询逻辑开发难度太大!1,使用Hive处理数据的好处操作接口采用类SQL语法,提供快速开发的能力(简单、容易上手)避免直接写MapReduce,减少开发人员的学习成本支持自定义函数,功能扩展很方便2,背靠Hadoop,擅长存储分析海量数据集合。什么是Hive
wenchun001
·
2023-07-28 21:52
数据仓库
软件研发
数据仓库
大数据
数据库
数据仓库
Data warehouse
数据仓库
产生背景大规模数据被存储在数据库中,一些非热点数据需要我们对其进行处理计算,根据这些数据得出一些我们在某个时间段或某个背景下想要得到的数据。
爱过java
·
2023-07-28 20:52
数据仓库
数据分割
数据分割使
数据仓库
的开发人员和使用者具有更大的灵活性。数据分割的标准可以根据实际情况来确定,通常可选择按日期、地域、业务领域或组织单位等来进行分割,也可以按多个分割标准的组合来进行,但一般情况下,分
popSCorn30
·
2023-07-28 20:22
大数据处理架构详解:Lambda架构、Kappa架构、流批一体、Dataflow模型、实时数仓
本专栏目录结构和参考文献请见大数据理论体系姊妹篇《分布式数据模型详解:OldSQL=>NoSQL=>NewSQL》《分布式计算模型详解:MapReduce、数据流、P2P、RPC、Agent》《大数据存储架构详解:
数据仓库
Shockang
·
2023-07-28 15:34
大数据理论体系
架构
大数据
数据仓库
HTAP数据库系列 | 数据湖时代的数据库如何选择?
《福布斯》杂志将数据湖与
数据仓库
相比定义为:“数据湖与
数据仓库
的区别在于
数据仓库
中的数据在输入点被预先分类,这可以决定如何对其进
天云数据
·
2023-07-28 08:56
1.初识Mysql数据库
被迫需求数据库是所有软件体系中最核心的存在1.2、什么是数据库数据库(DB,DataBase)概念:
数据仓库
,
Topon1
·
2023-07-28 07:28
新人3.11
数据库
mysql
database
编写一个Dag作业Demo
得出以下指标:总销售额总订单数每种商品的销售额和销售数量排名每个省份的销售额和销售数量排名我们可以使用Airflow编写一个DAG作业,每天自动运行,将数据从数据源抽取并进行转换和计算,最后将结果存储到
数据仓库
中
、小H
·
2023-07-28 03:05
python
MapReduce(九):开发总结及数据清洗(ETL)
ETL较常见在数据库,但其对象不限于
数据仓库
。在运行核心业务MapReduce程序之前,往往要先对数据进行清洗,清理掉不符合用户要求的数据。
Tuzki眯眼看世界
·
2023-07-27 23:38
[翻译]2007年Gartner
数据仓库
DBMS魔法四分区
翻译:CheneyShue发表于:博客园2007年10月10日DonaldFeinberg,MarkA.BeyerGartnerRASCoreResearchNoteG00151490因为新的厂商参与,
数据仓库
weixin_34345753
·
2023-07-27 19:28
数据库
运维
前端
ViewUI
从
数据仓库
到大数据平台再到数据中台(内附13张架构图)
,顶层的有数字城市、智慧地球、智慧城市、城市大脑…企业层面的有数字化转型、互联网经济,数字经济、数字平台…平台层面的有物联网,云计算,大数据,5G,人工智能,机器智能,深度学习,知识图谱…技术层面的有
数据仓库
Leo.yuan
·
2023-07-27 14:42
报表开发
数据分析
数据仓库
big
data
数据库
免费开放|一站式集群管理神器 Cluster Manager for Apache Doris,轻松提升运维效率
作为广受认可的开源实时
数据仓库
,ApacheDoris以性能突出和极简易用著称,而运维的便捷性也是核心优势之一。
SelectDB技术团队
·
2023-07-27 13:29
apache
运维
大数据
数据库
后端
数据分析
【无标题】
经常会碰到有人问BI和
数据仓库
(DW)有什么区别,实际上这个问题的背后能反映出来一些朋友对BI的理解还是有些不准确和偏差,这个问题从概念上把BI和
数据仓库
人为的割裂了。
亿信华辰软件
·
2023-07-27 12:33
数据仓库
商业智能
数仓学习---15、
数据仓库
工作流调度
1、
数据仓库
工作流调度1.1调度工具部署工具部署链接1.2新数据生成1.2.1用户行为日志1、启动日志采集通道,包括Kafka、Flume等(1)启动Zookeeperzk.shstart(2)启动Kafkakf.shstart
星光下的赶路人star
·
2023-07-27 08:34
数仓学习
学习
数据仓库
大数据
Hive
数据仓库
数据仓库
概念与起源发展由来数仓概念
数据仓库
(英语:DataWarehouse,简称数仓、DW),是一个用于存储、分析、报告的数据系统。
火眼猊
·
2023-07-27 06:19
数据仓库
hive
hadoop
山东大学2022-2023
数据仓库
挖掘期末考题回忆
2023.2.14一、1.数据预处理的过程和解决问题2.什么是离群点,检测离群点的四个方法3.
数据仓库
的四个特点,画出
数据仓库
结构图4.维度归约的两个方法及区别。
ponytaill
·
2023-07-27 05:52
数据仓库
数据库
Hadoop生态体系-2
目录标题1、MapReduce介绍2、
数据仓库
3、HIVE4、HQL4.1hive读写文件机制4.2Hive数据存储路径1、MapReduce介绍思想:分而治之map:“分”,即把复杂的任务分解为若干个
海星?海欣!
·
2023-07-27 03:58
大数据开发
hadoop
大数据
分布式
Spark Join优化-BucketJoin实现
偶然读取到了字节跳动关于Spark做的一些优化,发现其中一项被称为BuckedtJoin的优化项传送门:SparkSQL在字节跳动
数据仓库
领域的优化实践而我曾经也实现过一个类似的解决方案,现在才知道这种方案有一个专业的名词
蠟筆小噺没有烦恼
·
2023-07-26 21:36
数仓--DW--Hadoop数仓实践Case-16-迟到的事实
迟到的事实概述
数据仓库
通常建立于一种理想的假设情况下,这就是
数据仓库
的度量(事实记录)与度量的环境(维度记录)同时出现在
数据仓库
中。
李小李的路
·
2023-07-26 20:52
数据仓库
基础知识
什么是
数据仓库
?数仓,DataWarehouse,是一个面向主题的、集成的、稳定的、与时间相关的数据集合。而这个数据集合的建立,是为了支持管理者的决策过程。
产品经理自我修养
·
2023-07-26 14:22
spark
大数据
分布式
数仓主题域与主题划分
一、前言
数据仓库
具有面向主题的特性,那么就会有主题的概念,数仓建设是遵循纵向分层开发,横向划分主题域设计,数仓分层就不在这次谈了,这次我会结合本人数仓工作实践总结的经验来聊聊数仓主题域划分,同时会引申出主题划分
产品经理自我修养
·
2023-07-26 14:52
spark
大数据
分布式
数据仓库
分层架构
1分层实现
数据仓库
一般分为三层,自上而下分别为数据贴源层(ODS,OperationDataStore)、数据公共层(CDM,CommonDataModel)和数据应用层(ADS,ApplicationDataService
产品经理自我修养
·
2023-07-26 14:52
大数据
数据仓库
_LT,留存,回访的设计思路
今天面试问到了一个问题,假设我们的用户信息是天级别统计的,那么如果计算多天的留存与回访就需要扫描多个分区,这样计算资源比较多,如何进行优化。首先要介绍一下,留存,回访,lt这3个基本概念基本概念n日留存:n日后是否访问appn日回访:n日活是否访问某个业务模块(app中的某一板块,当这个板块为app时,留存==回访),类似于留存lt:用户的生命周期,相当于整体的活跃天数。详细参考:用户全生命周期价
高达一号
·
2023-07-26 13:28
数仓设计
大数据
数据仓库
MySQL技术探究(2)「主从架构」这也许是你的知识盲区-主从架构以及[半同步机制]
复制的功能不仅有利于构建高性能应用,同时也是高可用、可扩展性、灾难恢复、备份以及
数据仓库
等工作的基础。
洛神灬殇
·
2023-07-26 11:44
2018-09-12医院呼叫中心应具备的功能
它可以把从用户那里所获得的各种信息、数据全部储存在庞大的
数据仓库
(DataWareh
李飘飘_52c6
·
2023-07-26 09:52
SQL数据库-------专业术语学习
数据库管理员DBMS数据库管理系统RDBMS关系数据库管理系统ODBMS开放式数据库管理系统SQL结构化查询语句OLTP联机事务处理过程DDS直接数字频率合成器E-R实体-联系图DFD数据流图DD数据字典DW
数据仓库
木木不会
·
2023-07-26 02:44
SQL数据库
数据库
sql
Hive 调优集锦(1)
一、前言1.1概念Hive依赖于HDFS存储数据,Hive将HQL转换成MapReduce执行,所以说Hive是基于Hadoop的一个
数据仓库
工具,实质就是一款基于HDFS的MapReduce计算框架,
星如雨グッ!(๑•̀ㅂ•́)و✧
·
2023-07-25 23:56
大数据
hive
hadoop
数据仓库
产品经理常用词汇(二)
商业智能(BusinessIntelligence,简称:BI),又称商业智慧或商务智能,指用现代
数据仓库
技
PM_崧崧
·
2023-07-25 23:19
IPFS会变成地球上最快、最可靠、最大的
数据仓库
!
区块链是一项革命性技术!从其对不同行业和部门的潜在影响来看,这种状况恰好与互联网发展初期的情况极为类似。贵州中创思维社区的共识:区块链技术有望解决目前学术研究和学术交流中所面临的一些最突出的瓶颈问题,包括学术交流成本、开放性和科学信息的传递等等。2018年7月17日星期二在区块链上工作,意味着无论何时何地,研究人员以任何方式在任何阶段创建的内容或与内容进行的交互,都将存储在一个平台中。**其实,更
中创思维
·
2023-07-25 21:15
Hive基本介绍
介绍facebook开源设计目的:Hive期初是为了提供给那些精通sql但是java编程能力相对较弱的数据工程师能够对facebook上存放的HDFS的大规模数据集进行查询Hive是构建在hdfs上的
数据仓库
框架计算框架为
焱三土
·
2023-07-25 20:08
大数据技术之Hive1
1、Hive基本概念1.1定义hive是基于hadoop的一个
数据仓库
工具,可以将结构化数据文件映射成一张表,并提供类SQL查询功能。
海星?海欣!
·
2023-07-25 17:51
#
大数据
-
Hive
大数据
hive2.3.7安装部署-问题:show databases;没反应
安装包准备二、安装mysql三、hive安装四、hive启动五、问题环境:CentOS7.2.xx、hadoop2.6.4、jdk1.8.0xx、mysql-5.7.38hive是基于Hadoop的一个
数据仓库
工具
lurenyi168
·
2023-07-25 12:10
大数据#hadoop
hive
数据仓库
C# 使用SQLsugar搭建
数据仓库
通过NuGet获取SqlSugarSqlsugarClient访问类publicclassSugarFactory{privatestaticstringstrConnectionString=string.Empty;#region数据库访问对象//////数据库访问对象///privatestaticSqlSugarClientdb=null;#endregion数据库访问对象#region私
glmushroom
·
2023-07-25 09:48
C#
数据库
sql
数据库
上一页
30
31
32
33
34
35
36
37
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他