E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数仓(
【数据仓库】
数仓
维度建模中的事实表核心概念与实践案例
数仓
维度建模中的事实表核心概念与实践案例在数据仓库的维度建模中,事实表(FactTable)是分析系统的核心,用于存储业务过程的量化度量(如销售额、订单数量),并通过外键关联维度表(如时间、产品、客户)
小技工丨
·
2025-03-25 03:34
大数据随笔
数据仓库
大数据
spark
大数据学习(82)-
数仓
详解
如果觉得博主的文章还不错的话,请点赞+收藏⭐️+留言支持一下博主哦一、什么是数据仓库数据仓库(下文以“
数仓
”称),顾名思义,存放数据的仓库,它集合了各个业务系统的数据,以金融业为例,
数仓
包含了贷款业务、
viperrrrrrr
·
2025-03-24 20:41
大数据
学习
数仓
读书笔记五 ---大数据之路--
数仓
分层
数据分层在流式数据模型中,数据模型整体上分为五层。ODS层跟离线系统的定义一样,ODS层属于操作数据层,是直接从业务系统采集过来的最原始数据(进行了数据清洗),包含了所有业务的变更过程,数据粒度也是最细的。在这一层,实时和离线在源头上是统一的,这样的好处是用同一份数据加工出来的指标,口径基本是统一的,可以更方便进行实时和离线问数据比对。例如:原始的订单变更记录数据、服务器引擎的访同日志。(原始数据
qq_38215991
·
2025-03-23 08:11
big
data
大数据
LakeHouse湖仓一体成为下一站灯塔,
数仓
、数据湖架构即将退出群聊
摘要:当前的大数据技术应用趋势表明,客户对单一的数据湖和
数仓
架构并不满意。
科杰科技
·
2025-03-21 17:26
大数据
数据仓库
尚硅谷电商
数仓
6.0,hive on spark,spark启动不了
在datagrip执行分区插入语句时报错[42000][40000]Errorwhilecompilingstatement:FAILED:SemanticExceptionFailedtogetasparksession:org.apache.hadoop.hive.ql.metadata.HiveException:FailedtocreateSparkclientforSparksessio
新时代赚钱战士
·
2025-03-20 20:57
hive
spark
hadoop
数仓
建模—Data Warebase AI 时代数据平台应当的样子
DataWarebaseAI时代数据平台应当的样子引言:在这个AI技术飞速发展的时代,我们有能力更深入地发掘数据潜在的价值,而数据处理不应当成为阻碍。云原生分布式DataWarebase将开启处理数据的新范式,它让数据的使用返璞归真,不论是存储还是查询,一个系统满足业务全方位数据需求。打破复杂数据架构的束缚,大大降低数据的使用门槛,释放数据潜能,让数据涌现智能。背景近二十年大数据发展史2002年我
不二人生
·
2025-03-20 18:43
数仓建模
人工智能
数据仓库
数仓建模
快速上手系列丨如何管理 PieCloudDB Database 虚拟
数仓
PieCloudDB社区版提供免费下载,可用于体验产品新特性、个人学习、PoC验证等场景,方便社区用户快速体验领先的
数仓
虚拟化技术。PieCloudD
·
2025-03-20 14:53
云原生数据库教程管理
SelectDB 实时分析性能突出,宝舵成本锐减与性能显著提升的双赢之旅
BOCDOP宝舵早期基于TiDB构建实时
数仓
,随着数据量增长,在数据处理效率、OLAP能力扩展、功能支持、成本与资源方面存在一定优化空间。
SelectDB技术团队
·
2025-03-20 00:11
大数据
物联网
doris
selectdb
人工智能
电商场景
数据分析
为什么要进行数据仓库分层?
有以下好处:减少重复开发,提升研发效率从
数仓
模型角度能够提升数据一致性。减少了冗余计算,高频查询或者高频开发无需使用原始数据,直接使用公共的数据模型查询或者开发即可,减少了对计算资源
BenBen尔
·
2025-03-15 11:04
#
建模方法
spark
大数据
分布式
数仓
建模—手把手教你用 DeepSeek 打造高效数据治理体系
数仓
建模—手把手教你用DeepSeek打造高效数据治理体系在这个数字化转型的时代,数据治理已经成为企业提升竞争力的核心能力之一。然而,对于很多企业来说,数据治理仍然是一项复杂而艰巨的任务。
不二人生
·
2025-03-14 06:31
大模型
数仓建模
大模型
deepseek
初识开源云原生
数仓
Databend
Databend是一款开源的数据仓库产品,主要定位于OLAP场景,采用云原生架构理念(可对比snowflake),有非常好的扩展性、同时具备低成本、高性能的优势,兼容MySQL协议。Stars数8,245Forks数765主要特点针对对象存储平台进行优化的云原生架构。符合SQL:2011标准,支持复杂查询和数据版本回溯(时间旅行)功能。与流行的商业智能(BI)、提取、转换和加载(ETL)以及数据科
开源项目精选
·
2025-03-12 14:22
云原生
数据湖架构与实时
数仓
实践:Hudi、Iceberg、Kafka + Flink + Spark
1.引言:数据湖与数据仓库的融合趋势在大数据时代,传统的数据仓库(DataWarehouse,DW)因其强一致性和高效查询能力,一直是企业数据分析的核心。然而,随着数据量和数据类型的爆炸式增长,传统数据仓库的存储成本和数据管理难度逐渐增加。为了解决这些问题,数据湖(DataLake)概念应运而生。数据湖能够存储原始数据,支持半结构化和非结构化数据,提供更灵活的计算框架,但其缺乏事务管理和数据一致性
晴天彩虹雨
·
2025-03-10 03:22
架构
kafka
flink
数据仓库
阿里云MaxCompute面试题汇总及参考答案
目录简述MaxCompute的核心功能及适用场景,与传统数据仓库的区别解释MaxCompute分层架构设计原则,与传统
数仓
分层有何异同MaxCompute的存储架构如何实现高可用与扩展性解析伏羲(Fuxi
大模型大数据攻城狮
·
2025-03-06 10:05
阿里云
odps
云计算
机器学习
大数据面试
大数据面经
增量数据
国产化替代 | 星环科技TDH替代IBM
数仓
,助力城商行构建湖仓一体平台
城商行构建湖仓一体平台|TDH替代IBM
数仓
IBM的
数仓
NetezzaEOL是2023年,
数仓
Netezza生命周期结束了。
数仓
产品停止提供支持和更新,不再为该产品提供修复漏洞或功能改进的服务。
·
2025-03-05 11:08
ibm
小白进阶高手:使用Flink开发实时
数仓
的经验与技巧(理论结合超多实例)
Flink作为一种流处理框架,在实时
数仓
的开发中发挥着关键作用。它能够处理大量实时数据流,支持复杂的事件处理、实时计算和监控,具有高吞吐、低延迟的优势。
大模型大数据攻城狮
·
2025-03-05 11:43
flink
大数据
flink开发
CEP
flink反压
flink多流
flink容错
大数据技术学习框架(更新中......)
Hadoop相关HDFS分布式文件系统MR(MapReduce)离线数据处理MR-图解YARN集群资源管理ZooKeeperZooKeeper分布式协调框架Hive相关Hive-01之
数仓
、架构、数据类型
小技工丨
·
2025-03-03 04:05
大数据技术学习
大数据
学习
重磅活动!3.14,与数智领袖共探 NoETL 指标平台最佳实践
AloudataCAN以强大的指标定义和查询加速能力,直连
数仓
公共层明细数据,自动化代持宽表与汇总表开发,实现了NoSQL指标定义、NoETL指标开发、统一指标管理,一举解决了指标“开发周期长、口径不统一
·
2025-02-28 20:34
【数据仓库】
数仓
分层设计
一、为何分层?随着信息技术的快速发展,传统数据库已经无法存储和处理海量的数据,数据仓库应运而生。官方说明:数据仓库是用于支持企业决策制定和分析,它通过将不同来源的数据整合在一起,为用户提供一致、全面且易于访问的数据视图。可以简单理解为数据仓库就是专门用来存储和分析海量的历史数据,让数据真正地产生价值,为企业赋能。之前看到过一句话说的很不错,数据仓库的第一性原理是什么?就是以通过整合、优化和管理数据
·
2025-02-28 02:35
数据仓库数据分析
最全
数仓
实践:总线矩阵设计_
数仓
总线矩阵(2)
所以,总线矩阵和一致性维度、一致性事实共同组成了Kimball的多维体系结构基础。在这种多维体系结构(MD)的数据仓库架构中,主导的思想便是分步建立数据仓库,并由数据集市组合成企业的数据仓库。但是,在建立第一个数据集市前,架构师首先要做的就是设计出在整个企业内具有统一解释的标准化的维度和事实,即一致性维度和一致性事实,而开发团队必须严格的按照这个体系结构来进行数据集市的迭代开发。如果我们在建立数据
2401_84170391
·
2025-02-26 15:09
程序员
矩阵
大数据
spark
数据仓库面试题集锦(附答案和
数仓
知识体系),面试必过
数据仓库模型的选择是灵活的,不局限与某种模型方法;数据仓库数据是灵活的,以实际需求场景为导向;
数仓
设计要兼顾灵活性、可扩展性、要考虑技术可靠性和实现成本1)调研:业务调研、需求调研、数据调研2)划分主题域
m0_60635001
·
2025-02-26 13:20
2024年程序员学习
数据仓库
面试
spark
preview_220624,Day08_DM层建设实战,
一些公司早期的数据集市后期可能会演变成为
数仓
系统。本项目中在数据集市层面主要进行粗粒度汇总,也可以将这些功能下放至DWS层完成。
啊六六六
·
2025-02-26 04:51
Python
大数据
数据挖掘
数据仓库
数仓
建模—数据管理能力成熟度评估模型(DCMM)
文章目录
数仓
建模—数据管理能力成熟度评估模型(DCMM)数据管理能力成熟度研究现状国外研究现状国内研究现状DCMM与其他数据管理体系有什么区别什么是DCMMDCMM包含哪些内容DCMM等级评估等级划分什么样的企业可以申请
不二人生
·
2025-02-26 02:07
数仓建模
数据仓库
数仓建模
简单搞定
数仓
搭建:
数仓
规范
1.数据模型架构规范1.1数据层次的划分ODS:OperationalDataStore,操作数据层,在结构上其与源系统的增量或者全量数据基本保持一致。它相当于DW数据的一个数据准备区,同时又承担着基础数据的记录以及历史变化。其主要作用是把基础数据引入到DMP。CDM:CommonDataModel,公共维度模型层,又细分为DWD和DWS。它的主要作用是完成数据加工与整合,建立一致性的维度,构建可
白枭
·
2025-02-26 01:59
大数据开发
数仓
hive
数仓
搭建实操(传统
数仓
orale):DM数据集市层
需求:根据映射表建表个贷客户违约信息表建表CREATETABLEDM.PERSON_LOAN_WY_INFO(DATE_DTDATE,CUST_CUNTNUMBER,CUST_FINNUMBER,CUST_BADNUMBER,CUST_FIN_PERVARCHAR2(30),CUST_BAD_PERVARCHAR2(30),CUST_EXC_RATVARCHAR2(30));COMMENTONCO
想做富婆
·
2025-02-25 20:54
数仓
大数据
数仓
大数据MaxCompute教程(阿里云离线
数仓
项目)学习笔记20231127
1数据仓库概念数据仓库定义(DataWarehouse),是为企业所有决策制定过程,提供所有系统数据支持的战略集合。AI:数据仓库是一个大型、集中、主题导向的数据库系统,用于支持企业决策制定、分析和报告的需要。它统一了来自不同数据源的数据,并将其在一个可查询的数据模型中进行了整合和转换,以便于分析和报告。数据仓库还包括数据清洗、抽取、转换和加载(ETL)的过程,以保证数据的准确性、一致性和完整性。
多刷亿点题⑧
·
2025-02-22 22:54
云原生
数据仓库
大数据-257 离线
数仓
- 数据质量监控 监控方法 Griffin架构
点一下关注吧!!!非常感谢!!持续更新!!!Java篇开始了!目前开始更新MyBatis,一起深入浅出!目前已经更新到了:Hadoop(已更完)HDFS(已更完)MapReduce(已更完)Hive(已更完)Flume(已更完)Sqoop(已更完)Zookeeper(已更完)HBase(已更完)Redis(已更完)Kafka(已更完)Spark(已更完)Flink(已更完)ClickHouse(已
m0_74823705
·
2025-02-22 21:50
面试
学习路线
阿里巴巴
大数据
架构
数仓
实战05:
数仓
搭建-DWS层
1.业务术语1)用户用户以设备为判断标准,在移动统计中,每个独立设备认为是一个独立用户。Android系统根据IMEI号,IOS系统根据OpenUDID来标识一个独立用户,每部手机一个用户。2)新增用户首次联网使用应用的用户。如果一个用户首次打开某APP,那这个用户定义为新增用户;卸载再安装的设备,不会被算作一次新增。新增用户包括日新增用户、周新增用户、月新增用户。3)活跃用户打开应用的用户即为活
曾牛
·
2025-02-21 23:41
数仓
ClickHouse
数仓
ClickHouse是OLAP并且面向列的数据管理系统.具有高性能分析任何应用,从是嵌入式服务到成百台服务器.开源并且面向列的SQL存储ClickHouse首先是一个开源的SQL
数仓
,并且带有高性能,成熟
大怀特
·
2025-02-20 04:56
bigdata
database
software
architecture
java
数据库
阿里云 MaxCompute MaxQA 开启公测,解锁近实时高效查询体验
MCQA2.0)查询加速功能,在独享的查询加速资源池的基础上,对管控链路、查询优化器、执行引擎、存储引擎以及缓存机制等多个环节进行全面优化,显著减少了查询响应时间,适用于BI场景、交互式分析以及近实时
数仓
等对
阿里云大数据AI技术
·
2025-02-20 00:23
阿里云
云原生
MaxCompute
大数据
实时数仓
易点天下与火山引擎ByteHouse共建高性能
数仓
,助力智能营销效率跃升
近日,全球领先的企业国际化智能营销服务商易点天下与火山引擎ByteHouse达成合作,双方将聚焦智能营销场景,建设高性能
数仓
,为海量数据提供更精准、实时性更强的分析服务。
·
2025-02-19 15:35
数据库
酷克数据启动鲲鹏原生应用开发合作
酷克数据将基于鲲鹏硬件底座、OpenEuler、开发套件KunpengDevKit、应用使能套件KunpengBoostKit开展面向金融、政务、电信、能源、交通等重点行业的原生应用开发,打造基于鲲鹏架构的云
数仓
产品解决方案
·
2025-02-19 15:03
数据库
携手鲲鹏昇腾 HashData展现云原生
数仓
创新力量
酷克数据作为华为鲲鹏生态重要合作伙伴,受邀出席本次大会,展示其与鲲鹏昇腾生态联合开发的云
数仓
解决方案及应用案例,与全球开发者共同探讨云原生
数仓
前沿技术。
·
2025-02-19 15:03
数据库
数仓
_数据口径
数仓
_数据口径数据口径含义数据口径包含口径收敛数据口径含义在数据仓库(
数仓
)中,数据口径是指在数据统计和分析过程中,对数据的定义、计算方法、范围和标准等方面的详细规定。
TTXS123456789ABC
·
2025-02-19 06:56
#
XM1离线数仓_金融零售
大数据
Flink SQL 优化实战 - 维表 JOIN 优化
作者:龙逸尘,腾讯CSIG高级工程师背景介绍维表(DimensionTable)是来自
数仓
建模的概念。
腾讯云大数据
·
2025-02-17 04:01
大数据
数据库
flink
sql
数据湖和数据仓库的区别?
不同点:架构上,
数仓
基本要求符合DDL定义的结构,数据湖则湖纳百川。数据上,
数仓
为结构化数据设计,数据湖,湖纳百川。模块上,
数仓
一般
春风不会绿大地
·
2025-02-14 08:25
大数据
数据仓库
Hive数据库及表操作
数仓
原理以及Hive入门:
数仓
原理:
数仓
(DataWarehouse)是用于支持企业决策的数据存储和分析系统。
亦576
·
2025-02-13 07:09
hive
数据库
hadoop
新型大数据架构之湖仓一体(Lakehouse)架构特性说明——Lakehouse 架构(一)
湖仓一体(Lakehouse)——新的大数据架构模式同时具备
数仓
与数据湖的优点湖仓一体架构存储层计算层湖仓一体特性单一存储拥有数据仓库的查询性能存算分离开放式架构支持各种数据源类型支持各种使用方式架构简单数据共享
m0_74825238
·
2025-02-13 05:24
面试
学习路线
阿里巴巴
大数据
架构
hive
数仓
的分层与建模
Hive数据仓库分层和数据建模是一种常见的数据仓库设计方法,旨在通过分层的方式组织数据,提高数据的可维护性、可复用性和查询性能。以下是关于Hive数据仓库分层和数据建模的详细知识:一、Hive数据仓库分层数据仓库通常采用分层架构,目的是将数据按照不同的处理阶段和用途进行划分,便于管理和优化。常见的分层架构包括以下四层:1.ODS(OperationalDataStore,操作数据存储层)作用:OD
korry24
·
2025-02-11 13:04
hive
hadoop
数据仓库
数仓
建模—企业数字化转型的本质
数仓
建模—企业数字化转型的本质数字化转型与数字化、数字化建设、数字化管理到底有什么差别?企业的数字化建设重点关注哪两个层面的实现?数字化转型中的“转型”到底指的是什么?
不二人生
·
2025-02-09 15:00
数仓建模
数仓建模
数据仓库
企业数字化
StarRocks实战——贝壳找房
数仓
实践
1.2.3StarRocks的引入二、StarRocks在贝壳的分析实践2.1指标分析2.2实时业务2.3可视化分析三、未来规划3.1StarRocks集群的稳定性3.2StarRocks新特性采用原文大佬的这篇贝壳找房
数仓
实践的文章整体写的很深入
吵吵叭火
·
2025-02-08 19:00
大数据
#
StarRocks
数据仓库
大数据
大数据-267 实时
数仓
- ODS Lambda架构 Kappa架构 核心思想
点一下关注吧!!!非常感谢!!持续更新!!!Java篇开始了!MyBatis更新完毕目前开始更新Spring,一起深入浅出!目前已经更新到了:Hadoop(已更完)HDFS(已更完)MapReduce(已更完)Hive(已更完)Flume(已更完)Sqoop(已更完)Zookeeper(已更完)HBase(已更完)Redis(已更完)Kafka(已更完)Spark(已更完)Flink(已更完)Cl
m0_74823336
·
2025-02-07 16:57
面试
学习路线
阿里巴巴
大数据
架构
中国城商行信贷业务
数仓
建设白皮书(第二期:信贷主题域建模)
一、信贷业务主题域设计方法论1.1四维建模体系采用"AARRR+T"模型构建信贷数据关系网: ┌───────────┐ │客户获取 │ │(Acquisition)←───┐ └─────┬─────┘ │ ↓ │┌─────────────────┐││贷前评估 │││(Activation) ││└─────┬─────┐ ││ │ └──────┘│ ↓
abxzq19870214
·
2025-02-07 14:41
金融系统架构
金融
大数据
数据仓库
数据库
hive
Hive日分区表如何快速导入到StarRocks
数仓
规模60TB,FineBI数据集约8000个,BI挂出报表数约1600个,报表月增幅在40左右。
DawsonSally
·
2025-02-06 13:59
大数据
StarRocks
Java
大数据
hive
hadoop
2天的Flink Forward Asia 有什么值得关注的点
流式湖仓和实时
数仓
是两回事啊。新鲜度上有很大的差别,前者
·
2025-02-06 13:05
Hive分区和分桶
Hive分区和分桶两种用于优化查询性能的数据组织策略,
数仓
设计的关键概念,可提升Hive在读取大量数据时的性能。1分区(Partitioning)根据表的某列的值来组织数据。
码农小旋风
·
2025-02-03 14:51
后端
活动火热报名中 | Data+AI 融合趋势下的智能
数仓
平台建设
MaxCompute作为阿里云最核心的核心战略级云
数仓
产品之一,在Data+AI融合趋势下,通过经典数据仓库能力定义与云数据架构的深刻理解,构建出面向下一代智能云
数仓
,并为用户提供了Data+AI一体化开发体验
·
2025-02-02 11:34
人工智能大数据阿里云数据库数据
Java 大视界 -- Java 大数据实时
数仓
的构建与运维实践(55)
亲爱的朋友们,热烈欢迎你们来到青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客,正是这样一个温暖美好的所在。在这里,你们不仅能够收获既富有趣味又极为实用的内容知识,还可以毫无拘束地畅所欲言,尽情分享自己独特的见解。我真诚地期待着你们的到来,愿我们能在这片小小的天地里共同成长,共同进步。一、欢迎加入【福利社群
青云交
·
2025-02-02 05:40
大数据新视界
Java
大视界
大数据
实时数仓
Flume
Flink
HBase
ClickHouse
Lambda架构
Doris实战——特步集团零售数据仓库项目实践
3.2实时数据接入3.3数据加工3.4BI查询四、实时需求响应五、其他经验5.1DorisBE内存溢出5.2SQL任务超时5.3删除语句不支持表达式5.4Drop表闪回六、未来展望原文大佬的这篇Doris
数仓
建设案例有借鉴意义
吵吵叭火
·
2025-02-01 03:54
#
Doris
大数据
大数据
数据仓库
数仓
ETL测试
提取,转换和加载有助于组织使数据在不同的数据系统中可访问,有意义且可用。ETL工具是用于提取,转换和加载数据的软件。在当今数据驱动的世界中,无论大小如何,都会从各种组织,机器和小工具中生成大量数据。在传统的编程方式中,ETL都提取并进行一些转换操作,然后将转换后的数据加载到目标数据库文件等。为此,需要用任何编程语言编写代码,如Java,C#,C++等。为了避免更多编码和使用库,将通过拖放组件来减少
星月情缘02
·
2025-01-30 03:15
etl
数据仓库
数仓
的数据加工过程-ETL
ETL代表ExtractTransform和Load。ETL将所有三个数据库功能组合到一个工具中,以从一个数据库获取数据并将其放入另一个数据库。提取:提取是从数据库中提取(读取)信息的过程。在此阶段,从多个或不同类型的来源收集数据。转换:转换是将提取的数据从之前的形式转换为所需形式的过程。数据可以放入另一个数据库。可以通过使用规则或查找表或将数据与其他数据组合来进行转换。加载:加载是将数据写入目标
星月情缘02
·
2025-01-30 02:08
ETL技术
etl
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他