元数据的定义和管理

元数据的定义和管理

来自:《数据仓库结构设计与实施——建造信息系统的金字塔》

  1. 源(系统)数据定于与说明
    • 源系统地址、网络连接、访问方式;
    • 计算机系统、操作系统;
    • 数据库服务器名、访问方式、数据结构、有关的表、列

    以上信息都是有可能要变化的,应作为元数据存入数据表,ETL程序和处理过程可以读入这些信息,以进行远程数据链接和数据访问,这大大优化将以上信息写入程序中的那种硬性编程方式;

    • 源数据库链接说明;
    • 逆向工程与源系统设计获取定义说明
    • 元数据交换说明你。
  2. 暂存定义与说明
    • 源至暂存区映像
    • 暂存区只目标区映像
    • 中间文件的传输说明
    • 中间文件的说明及使用
    • 中间文件的前后处理(清理与压缩)说明
    • 暂存区数据库的前后处理和中间处理的说明及使用
  3. 目标模型定义与说明
    • 星型结构;
    • 事实表定义说明,包括:
      • 度量
      • 数字键
      • 交替键
      • 索引
      • 定义数据(如数据类型、数值大小和默认值)
      • 有效性制约
      • 数据域值定义
      • 分区定义说明
      • 存储说明
    • 维表定义与说明,包括:
      • 主键
      • 缓慢变化的维
      • 维的等级/层次
      • 维的共享
      • 维的版本号
      • 数据库的完整性限定
  4. 映像定义与说明
    • 源至目标映像
    • 基本数据到综合数据的映象
    • 标准字典
    • 转换字典
    • 参照表
    • 映象表
  5. ETL定义与说明
    • 转换规则和方法
    • 数据清洗说明
    • 批作业说明
    • 加载频率
    • 累加时间片控制说明
    • 退回说明与准则
    • 剥离与修改数据准则
    • 转换函数库
    • 传输定义与说明
    • 加载定义与说明
    • 会期/对话管理定义与说明,包括以下几个方面
      • 预定作业安排
      • 批作业前后事件说明及处理方法
      • 批作业日志
      • 会期/对话日志
      • 拒收日志
      • 坏数据日志
  6. 综合管理系统的定义与说明
    • 事实表/维度表至总计方阵映像;
    • 总计至总计映像;
    • 总计方阵设计;
    • 聚合定义说明;
    • 实体化视图/方阵定义说明,如:
      • 方阵间关系
      • 嵌入式实体化视图/方阵之间的关系
      • 方阵组
    • 刷新过程的定义与说明,包括以下几个方面:
      • 刷新前后事件处理说明
      • 刷新方法
      • 刷新组
      • 刷新执行顺序
      • 刷新频率
      • 刷新过程处理软件
      • 刷新作业的监控检查
  7. 联机分析(OLAP)的定义与说明
    • 查询机制;
    • 虚拟方阵/视图定义;
    • 访问权限管理说明;
    • 用户接口定义与说明;
    • 访问方式
    • 结果数据提交方法;
    • 结果数据传输定义与说明;
    • 用户登入/登出
    • 用户活动日志以及出错处理
    • 联机分析用户手册
  8. 应用软件说明
    • 软件版本号管理与说明,包括:
      • 数据库应用版号
      • 软件与程序版号
    • 程序与数据的参照说明
    • 包/过程软件函数
    • 函数库
    • 元件
    • 程序调用层次模型定义与说明
    • 2-3级结构
    • 业务规则定义说明,包括:
      • 业务规则表
      • 业务规则表语业务政策的联系
  9. 质量控制与安全说明
    • 安全政策
    • 审计日志
    • 错误捕捉
    • 错误追溯方法及说明
    • 数据库访问及网络交通日志

转自:http://bookcold.com/2010/04/387

你可能感兴趣的:(【DataWarehouse】)