《数据质量征途》

最重要的是看ROI

质量评估

差距分析

  1. 与benchmark的差距
  2. 不同利益方的角色差距 - 如数据管理者和数据消费者。用于判断角色差距是否是基准差距的来源之一。

完整性约束 - P43

对于大多数简单的比例指标,建议使用

数据质量指标 - P44

  1. 列了一堆衡量整体数据的指标
  2. 嵌入过程的数据整体性方法 - P52 表4.1

抽样方法

抽样过程 - P57

  1. 简单随机抽样
  2. 系统抽样
  3. 分层随机抽样
  4. 聚类抽样

数据质量问题模式剖析

数据质量问题的表现

P75 表6.1 十大根源的积极和负面表象

你可能感兴趣的:(《数据质量征途》)