E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
●数据仓库
大数据学习(82)-数仓详解
如果觉得博主的文章还不错的话,请点赞+收藏⭐️+留言支持一下博主哦一、什么是
数据仓库
数据仓库
(下文以“数仓”称),顾名思义,存放数据的仓库,它集合了各个业务系统的数据,以金融业为例,数仓包含了贷款业务、
viperrrrrrr
·
2025-03-24 20:41
大数据
学习
数仓
SAP-ABAP:SAP BW模块架构与实战应用详解
SAPBW模块架构与实战应用详解—##一、核心架构分层设计###1.
数据仓库
层(DataWarehousingLayer)|组件|功能说明|典型对象||-------------------|-----
爱喝水的鱼丶
·
2025-03-24 06:40
ABAP开发之必须知道的
VIP详情查看专栏
SAP-ABAP开发基础详解
开发语言
SAP
ABAP
ERP
开发运维
使用 Airbyte Typeform 加载器进行数据文档化
在数据集成的世界中,Airbyte是一个非常强大的平台,它为我们的ETL管道提供了从API、数据库和文件到
数据仓库
和湖泊的连接器。
shuoac
·
2025-03-24 04:55
python
架构师必知必会系列:数据架构与数据管理
数据架构包括数据字典、元数据、数据模型、数据流、
数据仓库
、数据管道、数据服务等。在应用中,将数据按照其自身特性进行划分、分类、归档、清洗和加工,才能
AI天才研究院
·
2025-03-23 22:29
AI大模型企业级应用开发实战
大数据
人工智能
语言模型
Java
Python
架构设计
Hive 分区实战指南:动态分区 vs 静态分区的深度解析
在Hive
数据仓库
中,表数据通常以**分区(Partition)**形式组织。
自然术算
·
2025-03-23 10:22
Hive面试100篇
hive
hadoop
数据仓库
Hadoop 集群规划与部署最佳实践
Hadoop具有高容错性、可靠性、可扩展性、适应性等特征,因而广泛应用于
数据仓库
、日志分析、网络流量监测、推荐引擎、搜索引擎等领域。
AI天才研究院
·
2025-03-23 03:47
Python实战
DeepSeek
R1
&
大数据AI人工智能大模型
自然语言处理
人工智能
语言模型
编程实践
开发语言
架构设计
MySQL 到 Hadoop:Sqoop 数据迁移 ETL
文章目录ETL:Extract-Transform-Load数据迁移过程一、Extract数据抽取1.ODS:OperationalDataStore-可操作数据存储2.DW:DataWarehouse-
数据仓库
Ice星空
·
2025-03-23 03:45
ETL
第三十一篇
数据仓库
(DW)与商业智能(BI)架构设计与实践指南
目录一、DW/BI架构核心理论与选型策略1.1主流架构模式对比(1)Kimball维度建模架构(2)Inmon企业工厂架构(3)混合架构二、架构设计方法论与实施步骤2.1维度建模实战指南(1)模型选择决策树(2)ETL开发规范2.2实时BI技术栈选型三、全链路实施与优化策略3.1五阶段实施框架3.2数据治理体系构建四、行业场景深度实践4.1电商用户行为分析4.2金融风控实时预警五、关键问题解析Q1
随缘而动,随遇而安
·
2025-03-23 02:05
数据库
sql
数据仓库
大数据
数据库架构
AWS SAP学习笔记-概念
ETL(Extract,Transform,Load)应用程序是一种用于数据处理和迁移的工具或程序,它主要负责从多个数据源提取数据,对数据进行转换和清洗,然后将处理后的数据加载到目标
数据仓库
或数据库中。
HainesFreeman
·
2025-03-22 23:16
AWS
aws
基于Azure云平台构建实时
数据仓库
设计Azure云架构方案实现AzureDeltaLake和AzureDatabricks,结合电商网站的流数据,构建实时
数据仓库
,支持T+0报表(如电商订单分析),具以及具体实现的详细步骤和关键PySpark
weixin_30777913
·
2025-03-22 18:15
云计算
azure
开发语言
spark
python
家庭 & 企业
数据仓库
:如何配置和管理 NAS 系统
家庭&企业
数据仓库
:如何配置和管理NAS系统引言在数据为王的时代,我们的照片、视频、文档、代码,甚至企业级文件,都是无价之宝。那么,如何安全、可靠、低成本地存储这些数据?云存储太贵?移动硬盘不方便?
Echo_Wish
·
2025-03-22 18:10
运维探秘
让你快速入坑运维
数据仓库
运维开发
缓存
PostgreSQL_实例项目总述
(如果有人实在搞不懂怎么安装,可以留言)实例项目总述:项目描述:股票日
数据仓库
数据来源:优矿1数据表结构设计
程序猿与金融与科技
·
2025-03-22 15:18
数据库
postgresql
SQLMesh SCD Type 2 深度解析:时间戳与列级跟踪的实战指南
在
数据仓库
架构中,缓慢变化维度(SlowlyChangingDimensions,SCD)是处理历史数据追踪的核心技术。
梦想画家
·
2025-03-22 07:03
数据分析工程
#
python
数据工程
分析工程
sqlmesh
LakeHouse湖仓一体成为下一站灯塔,数仓、数据湖架构即将退出群聊
近年来几乎所有的
数据仓库
都增加了对Parquet和ORC格式的外部表支持,这使数仓用户可以从相同的SQL引擎查询数据湖表,但它不会使数据湖表更易于管理,也不会消除仓库中数据的ETL复杂性、陈旧性和高级分析挑战
科杰科技
·
2025-03-21 17:26
大数据
数据仓库
【赵渝强老师】达梦数据库MPP集群的架构
为了支持海量数据存储和处理等方面的需求,为高端
数据仓库
提供解决方案,达梦数据库提供了大规模并行处理MPP架构,以极低的成本代价,提供高性能的并行计算。
·
2025-03-21 16:12
数据库信创
第二十九篇
数据仓库
与商务智能:技术演进与前沿趋势深度解析
声明:文章内容仅供参考,需仔细甄别。文中技术名称属相关方商标,仅作技术描述;代码示例为交流学习用途,部分参考开源文档(Apache2.0/GPLv3);案例数据已脱敏,技术推荐保持中立;法规解读仅供参考,请以《网络安全法》《数据安全法》官方解释为准。目录一、核心差异:技术定位与实现路径1.1核心能力矩阵二、协同关系:现代数据供应链的双引擎2.1数据价值链协同2.2典型技术栈集成三、前沿技术动态(2
随缘而动,随遇而安
·
2025-03-21 12:18
数据库
数据仓库
大数据
数据库架构
数据库开发
高级管理人员信息系统和
数据仓库
以及外部数据/非结构化数据与
数据仓库
内容目录高级管理人员信息系统和
数据仓库
以及外部数据/非结构化数据与
数据仓库
一、高级管理人员信息系统和
数据仓库
二、外部数据/非结构化数据与
数据仓库
高级管理人员信息系统和
数据仓库
以及外部数据/非结构化数据与
数据仓库
一
牧码文
·
2025-03-21 03:03
数据仓库
hive
数据仓库
数据挖掘
数据库
数据仓库
和非结构化数据。
数据仓库
包含标准化数据。还包含外部数据/非结构化数据如果外部数据量小可以保持数据库内部或者专用服务器。
weixin_30631587
·
2025-03-21 03:33
数据库
如果企业
数据仓库
全部使用 Couchbase Analytics 服务,可能会面临哪些问题?
如果企业
数据仓库
全部使用CouchbaseAnalytics服务,可能会面临哪些问题?一、概述CouchbaseAnalytics服务是一项强大的工具,旨在为NoSQL数据提供近实时的分析能力。
PersistDZ
·
2025-03-20 18:17
数据存储
数据仓库
Flink 通过 Chunjun Oracle LogMiner 实时读取 Oracle 变更日志并写入 Doris 的方案
关键流程3、修复ChunjunOracleLogMiner问题一、技术背景在大数据实时同步场景中,需要将Oracle数据库的变更数据(CDC)采集并写入ApacheDoris,以支持数据分析、BI报表、实时
数据仓库
等应用
roman_日积跬步-终至千里
·
2025-03-20 18:12
#
flink
实战
flink
oracle
大数据
Apache Doris整合Iceberg + Flink CDC构建实时湖仓体的联邦查询分析架构
简介实时湖仓体是一种灵活、可扩展的数据架构,结合了数据湖和
数据仓库
的优势。ApacheDoris是一款开源的分布式SQL引擎,专注于实时分析和查询。Iceberg是一种开放式表格格式
MfvShell
·
2025-03-20 00:10
apache
flink
架构
Flink
Hive函数大全:从核心内置函数到自定义UDF实战指南(附详细案例与总结)
分类二、常用函数详解与实战案例1.数学函数2.字符串函数3.窗口函数4.自定义UDF实战三、总结与优化建议1.核心总结2.性能优化建议3.常问问题背景Hive作为Hadoop生态中最常用的
数据仓库
工具
一个天蝎座 白勺 程序猿
·
2025-03-18 23:45
大数据开发从入门到实战合集
hive
hadoop
数据仓库
hive-进阶版-1
第6章hive内部表与外部表的区别Hive是一个基于Hadoop的
数据仓库
工具,用于对大规模数据集进行数据存储、查询和分析。
数据牧马人
·
2025-03-17 10:59
hive
hadoop
数据仓库
使用 Doris 和 Iceberg
作为一种全新的开放式的数据管理架构,湖仓一体(DataLakehouse)融合了
数据仓库
的高性能、实时性以及数据湖的低成本、灵活性等优势,帮助用户更加便捷地满足各种数据处理分析的需求,在企业的大数据体系中已经得到越来越多的应用
向阳1218
·
2025-03-15 15:10
大数据
doris
使用 Doris 和 LakeSoul
作为一种全新的开放式的数据管理架构,湖仓一体(DataLakehouse)融合了
数据仓库
的高性能、实时性以及数据湖的低成本、灵活性等优势,帮助用户更加便捷地满足各种数据处理分析的需求,在企业的大数据体系中已经得到越来越多的应用
向阳1218
·
2025-03-15 15:10
大数据
doris
为什么要进行
数据仓库
分层?
对
数据仓库
进行分层(如常见的ODS、DWD、DWS、ADS等层次)是为了解决复杂数据处理场景中的效率、可维护性、易用性问题。
BenBen尔
·
2025-03-15 11:04
#
建模方法
spark
大数据
分布式
数据仓库
有哪些建模方法?
数据仓库
的建模方法主要分为关系建模和多维建模两大类,不同方法适用于不同的业务场景和目标。
BenBen尔
·
2025-03-15 09:21
#数据仓库
数据仓库
大数据
现代数据栈:秽土重生?——从 SAP x Databricks 看数据世界的轮回
Snowflake、Databricks、Fivetran、dbt……一众明星公司描绘出一个美好的未来:所有数据汇集到云端
数据仓库
,所有分析、BI和AI应用直接连接仓库数据,再无数据孤岛,数据流转自由,
·
2025-03-15 02:14
数据库
Hive高级SQL技巧及实际应用场景
Hive高级SQL技巧及实际应用场景引言ApacheHive是一个建立在Hadoop之上的
数据仓库
基础设施,它提供了一个用于查询和管理分布式存储中的大型数据集的机制。
小技工丨
·
2025-03-14 07:40
大数据随笔
sql
hive
数据仓库
大数据
如何设计高效的数据湖架构?
相比于传统
数据仓库
,数据湖能够支持结构化、半结构化和非结构化数据,同时提供更灵活的存储与计算能力。
晴天彩虹雨
·
2025-03-14 02:41
架构
大数据
数据仓库
初识开源云原生数仓Databend
Databend是一款开源的
数据仓库
产品,主要定位于OLAP场景,采用云原生架构理念(可对比snowflake),有非常好的扩展性、同时具备低成本、高性能的优势,兼容MySQL协议。
开源项目精选
·
2025-03-12 14:22
云原生
一文理清概念:数据中台(DMP)-
数据仓库
(DW)-数据湖(DL)-湖仓一体-数据治理(DG)
数据仓库
、数据中台、数据湖、湖仓一体是数据管理和分析领域的重要概念,它们在功能、架构和应用场景上各有特点,同时也在演进中相互关联和补充。
Debug_Snail
·
2025-03-11 13:07
Hadoop
Big
Data
Data
Science
数据仓库
大数据
数据中台
数据湖
数据治理
doris:阿里云 MaxCompute
MaxCompute是阿里云上的企业级SaaS(SoftwareasaService)模式云
数据仓库
。什么是MaxCompute连接MaxCompute示例--1.创建Catalog。
向阳1218
·
2025-03-11 07:20
大数据
doris
使用Activeloop Deep Lake构建深度学习
数据仓库
与向量存储
ActiveloopDeepLake是专为深度学习设计的
数据仓库
,可以作为向量存储使用,支持多模态数据的存储和处理,并且可以直接用于细调大型语言模型(LLMs)。
dgay_hua
·
2025-03-11 04:49
深度学习
人工智能
python
数据湖架构与实时数仓实践:Hudi、Iceberg、Kafka + Flink + Spark
1.引言:数据湖与
数据仓库
的融合趋势在大数据时代,传统的
数据仓库
(DataWarehouse,DW)因其强一致性和高效查询能力,一直是企业数据分析的核心。
晴天彩虹雨
·
2025-03-10 03:22
架构
kafka
flink
数据仓库
什么是数据库中的宽表?
宽表常见于
数据仓库
、OLAP(联机分析处理)系统或大数据场景,其核心目标是优化查询性能,尤其是在需要频繁进行复杂分析或生成报表的场景中。
見贤思齊
·
2025-03-08 20:02
数据分析
数据库
【
数据仓库
与数据挖掘基础】第一章 概论/基础知识
知识点复习:事务(关于事务的一些知识点可以点这里)一、
数据仓库
的一些基本的知识1.从数据库到
数据仓库
1.1数据库用于事务处理1.1.1定义:事务处理是指对数据库中数据的操作,这些操作通常包括插入、更新、
精神病不行计算机不上班
·
2025-03-08 16:24
数据仓库与数据挖掘基础
数据挖掘
数据仓库
云数据库是什么数据库?
这就像是把原本需要在自家搭建、维护的“
数据仓库
”搬到了云端的“大型仓储中心”,由专业团队负责管理和维护。与传统数据库相比,云数据库有着诸多明显差异。传统数据库往往需要用户自行购置服务器、存储设备等硬
·
2025-03-07 21:56
云服务器数据库
Kimball维度模型之
数据仓库
灵魂总线架构
目录一总线架构(BusArchitecture)1总线矩阵(BusMatrix)2Mapping文档二一致性维度(ConformedDimension)三一致性事实(ConformedFact)在
数据仓库
领域
ByteCodeLabs
·
2025-03-07 18:22
维度数据仓库设计
数据仓库
架构
湖仓一体化及冷、热、实时三级存储
一、湖仓一体化(Lakehouse)湖仓一体化(Lakehouse)是数据湖(DataLake)与
数据仓库
(DataWarehouse)的结合,旨在解决传统数据架构中数据孤岛、存储冗余、计算性能不足等问题
麦当当MDD
·
2025-03-07 12:24
数据仓库
Spark
大数据
数据库
数据仓库
数据库架构
深入理解Kettle:ETL工具的学习与实践
本文还有配套的精品资源,点击获取简介:Kettle(Spoon)是Pentaho公司开发的开源ETL工具,用于数据整合和
数据仓库
建设。
未知方程 无解
·
2025-03-07 10:14
探索
数据仓库
自动化:ETL流程设计与实践
探索
数据仓库
自动化:ETL流程设计与实践在大数据时代,
数据仓库
已成为企业数据管理和决策支持的核心工具。如何高效地提取、转换和加载数据(ETL),是
数据仓库
建设中的重要环节。
Echo_Wish
·
2025-03-07 08:31
大数据高阶实战秘籍
数据仓库
自动化
etl
基于hive的电信离线用户的行为分析系统
通过收集电信用户的通话记录、上网行为、短信使用等多源数据,利用Hive
数据仓库
工具进行数据存储和处理,采用数据挖掘和机器学习算法对用户行为进行分析。实验结果表明,该系统
赵谨言
·
2025-03-06 17:29
论文
经验分享
毕业设计
阿里云MaxCompute面试题汇总及参考答案
目录简述MaxCompute的核心功能及适用场景,与传统
数据仓库
的区别解释MaxCompute分层架构设计原则,与传统数仓分层有何异同MaxCompute的存储架构如何实现高可用与扩展性解析伏羲(Fuxi
大模型大数据攻城狮
·
2025-03-06 10:05
阿里云
odps
云计算
机器学习
大数据面试
大数据面经
增量数据
国产化替代 | 星环科技TDH替代IBM数仓,助力城商行构建湖仓一体平台
某城市商业银行在此背景下,启动
数据仓库
系统升级项目,将
数据仓库
从IBMNetezza迁移到星环科技大数据基础平台TDH,不但成功实现了
数据仓库
的国产化替代,还建设了新一代的湖仓一体平台,为银行业务发展提供新
·
2025-03-05 11:08
ibm
《
数据仓库
》读书笔记:第11章 非结构化数据和
数据仓库
该系列博文为《
数据仓库
BuildingtheDataWarehouse》一书的读书笔记,笔者将书中重点内容进行概括总结。大致保留书中结构,一部分根据自己的理解进行调整。如发现问题,欢迎批评指正。
search-lemon
·
2025-03-05 03:16
数据仓库
数据仓库
稳定运行的以Redshift
数据仓库
为数据源和目标的ETL性能变差时提高性能方法和步骤
当以AmazonRedshift
数据仓库
为数据源和目标的ETL(Extract,Transform,Load)性能变差时,可能涉及多个方面的优化措施。
weixin_30777913
·
2025-03-04 22:04
数据仓库
云计算
【自学笔记】大数据基础知识点总览-持续更新
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录大数据基础知识点总览1.大数据概述2.大数据处理技术3.
数据仓库
与数据挖掘4.大数据分析与可视化5.大数据平台与架构6.大数据安全与隐私总结大数据基础知识点总览
Long_poem
·
2025-03-03 01:17
笔记
大数据
Airflow和PySPARK实现带多组参数和标签的Amazon Redshift
数据仓库
批量数据导出程序
设计一个基于多个带标签SQL模板作为配置文件和多组参数的PySPARK代码程序,实现根据不同的输入参数,用Airflow进行调度,自动批量地将AmazonRedshift
数据仓库
的数据导出为Parquet
weixin_30777913
·
2025-03-02 17:45
python
spark
云计算
【Apache Paimon】-- 13 -- 利用 paimon-flink-action 同步 mysql 表数据
核心特性同步变更的mysql表结构和数据1、背景信息在Paimon诞生以前,若mysql/pg等数据源的表结构发生变化时,我们有几种处理方式(1)人工通知(比如常规的使用邮件),然后运维人员手动同步到
数据仓库
中
oo寻梦in记
·
2025-03-02 04:51
Apache
Paimon
apache
flink
mysql
apache
paimon
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他