大数据数仓从入门到精通

数仓架构详解

大数据数仓从入门到精通_第1张图片

数仓项目开发的流程

业务建模:需求分析
领域建模:设计部分的概要设计
逻辑建模:设计部分的详情设计(表名、字段、字段的类型、关联关系)。建模工具是PD(PowerDesigner)
物理建模:编码阶段,具体的实施。书写建库,建表语句
2.
数据仓库分层:ODS层、DWD层、DWS层、DM层

事实表、维度表

事实表:用于记录事实上产生数据的表,记录其动作
维度表:对于事实表的说明
大数据数仓从入门到精通_第2张图片
星型模型:适用于业务简单、效率高,但数据有冗余;
雪花模型:适用的场景与星型模型相反
星座模型
在这里插入图片描述

元数据管理

数仓示例

销售系统:客户表、订单表、产品表
(1) 模型设计:PD
(2) 物理实现

你可能感兴趣的:(大数据,数据仓库)