数据仓库模型

什么是数据模型

数据模型是抽象描述现实世界的一种工具和方法,是通过抽象的实体及实体之间联系的形式,来表示现实世界中事务的相互关系的一种映射。

数据仓库建模步骤
  1. 业务建模,划分业务,梳理业务,适用的建模方法:实体建模。demo:
    划分业务:按照业务部门划分
    划分业务主题:xx部门划分为:浏览器/金融/搜索等;

  2. 领域概念建模,将业务建模抽象成实体,适用的建模方法:实体建模,将数据抽象成:实体-事件-说明。demo:
    浏览器o2o打点,deviceid(实体1)-itemid(实体2)-expose(事件)-在20190910 13:44:59的推荐path场景下(说明)

  3. 逻辑建模,实例化(实体的属性及实体之间的联系等),适用的建模方法:范式建模。demo:
    内容池(item实体属性表),用户属性表,ods层o2o表

  4. 物理建模,就是落地。demo:
    选择数据平台,如hive
    创建生成表的脚本,定义字段,规范字段转化的代码等,如:thrift生成hive表
    针对数据集市即(浏览器)的需要,按照维度建模的方法,生成一些事实表(o2o)和一些维表(暂无)

你可能感兴趣的:(数据仓库模型)