数据治理-元数据管理-元数据架构类型

        与其他形式的数据一样,元数据也有生命周期,从概念上讲,所有的元数据管理解决方案都包含与元数据生命周期相对应的架构层次。

  1. 元数据创建和采集;
  2. 元数据在一个或多个存储库中存储;
  3. 元数据集成;
  4. 元数据交付;
  5. 元数据使用;
  6. 元数据控制和管理。

        可以采用不同的架构方式获取、存储、集成和维护元数据、供数据消费者访问元数据。

集中式元数据架构

        集中式元数据架构是由单一的元数据存储库组成,包含来自各种不同源的元数据副本。IT资源有限的组织或者哪些追求尽可能实现自动化的组织,可能会选择避免使用此架构选项。在公共元数据存储库中寻求高度一致性的组织,可以从集中式元数据架构中受益;

        集中式存储库的优点是:

  1. 高可用性,因为它独立于源系统;
  2. 快速的元数据检索,因为存储库和查询功能在一起;
  3. 解决了数据库结构问题,使其不受第三方或商业系统特有属性的影响;
  4. 抽取元数据时可进行转换,自定义或使用其他源系统中的元数据进行补充,提高了元数据的质量;

        集中式存储库的缺点:

  1. 必要使用复杂的流程确保元数据源头中的更改能够快速同步到存储库中;
  2. 维护集中式存储库的成本可能很高;
  3. 元数据的抽取可能需要自定义模块或中间件;
  4. 验证和维护自定义代码会增加对内部IT人员和软件供应商的要求;

分布式元数据架构

        一个完全分布式的架构维护了一个单一的接入点。元数据检索引擎通过实时从源系统检索数据来响应用户请求;分布式元数据架构没有持久化的存储库。在这种架构中,元数据管理环境维护必要的源系统目录和查找信息,以有效处理用户查询和搜索。可通过公共对象请求代理或类似的中间件协议访问这些源系统。

        分布式元数据架构的优点包括:

  1. 元数据总是尽可能保持最新且有效,因为它时从其数据源中直接检索的;
  2. 查询是分布式的,可能会提高相应和处理的效率;
  3. 来自专有系统的元数据请求仅限于查询处理,而不需要详细了解专有数据结构,因此最大限度地减少了实施和维护所需的工作量;
  4. 自动化元数据查询处理的开发可能更简单,只需要很少的人工干预;
  5. 减少了批处理,没有元数据复制或同步过程。

        分布式元数据架构的缺点包括:

  1. 无法支持用户定义或手动插入的元数据项,因为没有存储库可以放置这些添加项;
  2. 需要通过统一的,标准化的展示方式呈现来自不同系统的元数据;
  3. 查询功能受源系统可用性的影响;
  4. 元数据的质量完全取决于源系统。

混合式元数据架构

        混合架构结合了集中式和分布式架构的特性,元数据仍然直接从源系统移动到集中式存储库,但存储库设计仅考虑用户添加的元数据、重要的标准化元数据以及来通过自手工来源添加的元数据。

        该架构得益于从源头近乎实时地检索元数据和扩充元数据,可在需要时最有效地满足用户需求,混合方法降低了对专有系统进行手动干预和自定义编码访问功能的工作量。基于用户的优先级和要求,元数据在使用时尽可能是最新且有效的,混合架构不会提高系统可用性;

        但是,源系统的可用性是一个限制,因为后端系统的分布式特性处理查询。在将结果集呈现在最终用户之前,需要用额外的系统开销将这些初始结果与中央存储库中的元数据扩展连接起来。

        许多组织都可以从混合架构中受益,包括那些具有快速变化的操作元数据的组织,需要一致、统一的元数据组织,以及在元数据和元数据源正在大幅增长的组织。对于大多静态元数据或元数据增量的组织来说,可能无法发挥这种架构替代方案的最大潜力。

双向元数据架构

        它允许元数据在架构的任何部分(源、数据集成、用户界面)中更改,然后将变更从存储库(代理)同步到其原始源以实现反馈。

        这种方法显然存在各种挑战,该设计强制元数据存储库包含最新版本的元数据源,并强制对源的更改管理,必须系统地捕获变更,然后加以解决,必须构建和维护附加的一系列处理接口,以将存储库的内容回写至元数据源。

你可能感兴趣的:(数据治理,架构,微服务,云原生)