数据治理-数据模型计分卡

        数据模型计分卡方法,用于衡量数据模型质量,其中提供了10个数据模型质量指标,介绍了组成计分卡的10个不同类别的指标及分值;

序号 类别 总分数 模型分数 % 注释
1 模型多大程度上反映了业务需求 15
2 模型的完整性如何 15
3 模型与模式的匹配度是多少 10
4 模型的结构如何 15
5 模型的通用性如何 10
6 模型遵循命名标准的情况如何 5
7 模型的可读性如何 5
8 模型的定义如何 10
9 模型与企业数据架构的一致性如何 5
10 与元数据的匹配程度如何 10
总分 100

        模型分数列包含评审员对特定模型满足评分标准的评估,最高分是总分数列显示的值。

  1. 模型多大程度上反映了业务需求?要确保数据模型代表需求。如果需要获取订单信息,则在评审该项指标时应检查模型中是否包含订单信息。如果需求中要求按学期和专业查看学生人数,则应检查模型中是否支持按照学期和专业查询学生人数的功能;
  2. 模型的完整性如何?这里的完整性有两个方面的要求:需求的完整性和元数据的完整性。需求的完整性意味着已经提出的每个需求都应在模型中得到满足。这意味着数据模型只包含被要求的内容而没有额外的内容。在模型设计时也需要考虑在不久的将来因业务的变化而能够很容易的向模型追加内容,这部分设计在审查过程中也会被注意和考虑。如果建模人员在模型中设计了从未被要求的内容,那么该项目可能变得难以交付。此外,还需要考虑包含未来需求增加所引发的可能成本。元数据的完整性是指模型周围的所有描述性信息也要完整。例如,如果正在评审一个物理数据模型,希望数据格式和允许为空的定义和描述出现在数据模型上。
  3. 模型和模式的匹配度是多少?确保正在审查模型的具象级别(概念模型、逻辑模型或物理模型)和模式(关系、维度、NoSQL)与该类型模型的定义相匹配;
  4. 模型的结构如何?验证用于构建模型的设计时间,以确保最终可以从数据模型构建数据库。这包括避免一些设计问题,如在同一实体中有两个具有相同名称的属性或者在主键中有一个空属性。
  5. 模型的通用性如何?评审模型的扩展性或者抽象程度。例如,从客户位置转到更通用的位置,可以使设计更容易地处理其他类型的位置,如仓库和配送中心;
  6. 模型遵循命名标准的情况如何?确保数据模型采用正确且一致的命名标准。主要关注命名标准的结构、术语和风格。命名标准被正确地应用于实体、关系和属性上。例如,一个属性构造块选用“客户”或“产品”等属性主题。术语意味着为属性或实体被赋予专有名词;术语还包括正确的拼写和缩写要求。风格意味着外观,如大写或驼峰拼写等内容;
  7. 模型的可读性如何?确保数据模型易于阅读,这个问题并不是十大类别中最重要的,但是如果模型难以阅读,则可能无法准确地评估记分卡上其他更重要的类别。将父实体放置在其子实体上方,相关实体显示在一起,并最小化关系线长度都可以提高模型的可读性。
  8. 模型的定义如何?确保定义清晰、完整和准确;
  9. 模型与企业数据架构的一致性如何?确认数据模型中的结构能否在更加广泛和一致的环境中应用,以便在组织中可以使用一套统一的术语和模型结构。主要评审出现在数据模型中的术语和结构与组织中干得相关数据模型中出现的结构是否保持一致。在理想情况下,与企业数据模型(EDM)结合使用为佳;
  10. 与元数据的匹配程度如何?确认存储在模型结构中的数据和实际数据是一致的,例如,客户姓氏这一列是否真的存储的是客户的姓氏数据?数据类别旨在减少这些意外,并有助于确保模型上的结构和这些结构将保存的数据相匹配。

        综上所述,计分卡提供了对模型质量的总体评估方法,并明确支出了针对模型的改进方案。

你可能感兴趣的:(数据治理,架构,数据治理,大数据,数据仓库,数据库)