DAMA数据管理知识体系指南》读书笔记-第四章(数据架构)

目录

  • 一、前言
  • 二、内容结构
  • 三、主要内容
    • 1.引言
    • 2.活动
    • 3.工具
    • 4.方法
    • 5.实施指南
    • 6.数据架构治理
  • 四、思考与总结

一、前言

本文是《DAMA数据管理知识体系指南》第四章的读书笔记,对数据管理中的数据架构构建进行讲解阐述。按照CDMP考试认证的内容占比为6%,虽然占比不高,但是却是较为关键的内容,对大家在进行数据模块架设和规划时有较大的帮助。

二、内容结构

本章主要讲述数据管理中数据架构的相关内容,对数据架构的概念、业务驱动因素、数据架构的类型和设计实施以及架构治理等内容进行讲解。本章内容面向读者更多的是数据平台、数据体系设计相关的同学以及专职的数据管理同学(数据架构师)。其中的内容相对抽象,概念解释性内容较多,案例描述较少,但是其中的架构设计、实施、治理思想对大家应该有较大的帮助。为了方便大家理解,其整体内容结构图如下所示:
DAMA数据管理知识体系指南》读书笔记-第四章(数据架构)_第1张图片

三、主要内容

1.引言

架构是对组件要素有组织地设计,旨在优化整个机构或系统的功能、性能、可行性、成本和用户体验。数据架构的主要目标是有效管理数据,以及有效地管理存储和使用数据的系统。数据架构主要需要考虑如下几个方面:数据架构的成果(也就是常说的数据架构的构建)、数据架构的活动(用于形成、部署、和实现数据架构的目标)以及数据架构的行为。

数据架构是数据管理的基础,由于大多数组织拥有的数据超出了个人可以理解的范围,因此有必要在不同抽象层上描述组织的数据,以便更好地了解数据,帮助管理层做出决策。一个完整的数据架构中的构建应当包括:当前状态的描述、数据需求的定义、数据整合的指引、数据管控策略中要求的数据资产管理规范。

组织的数据架构指不同抽象层级主要设计文档的集合,主要包括数据的收集、存储、使用和删除等标准;详细的数据架构设计文件是正式的企业数据模型,包含数据名称、数据属性和元数据定义、概念和逻辑实体、关系以及业务规则。

1.1业务驱动因素
数据架构的主要目标是在业务战略和技术实现之间建立起一座畅通的桥梁,数据架构是企业架构中的一部分,其主要职责包括:

利用新兴技术所带来的业务优势,从战略上帮助组织快速改变产品、服务和数据;
将业务需求转化为数据和应用需求,以确保能够为业务流程处理提供有效数据;
管理复杂数据和信息,并传递至整个企业;
确保业务和IT技术保持一致;
为企业改革、转型和提高适应性提供支撑。
1.2数据架构成果和实施
数据架构的主要成果包括:1.数据存储和处理需求;2.设计满足企业当前和长期数据需求的结构和规划。

架构师应当寻求一种能够为组织带来价值的方式对组织的数据架构进行设计。这种价值主要通过合适的技术应用、有效运营、项目效率提升以及数据应用能力加强来体现。为实现该目标,要求组织具有良好的设计和计划以及确保设计和计划能够被执行的能力。未达到该目的,数据架构需要定义和维护如下具体事宜:

定义组织中数据的当前状态
提供数据和组件的标准业务词汇
确保数据架构和企业战略及业务架构保持一致
描述组织数据战略需求
高阶数据整合概要设计
整合企业数据架构蓝图
其中,总体数据架构实施内容包括:
使用数据架构(主蓝图)来定义数据需求、指导数据整合、管控数据资产,确保数据项目投入与企业战略保持一致;
与参与改进业务或IT系统开发的利益相关方合作,学习并影响他们;
通过数据架构及通用的数据词汇,搭建企业数据语言。
DAMA数据管理知识体系指南》读书笔记-第四章(数据架构)_第2张图片
1.3基本概念
企业架构类型:数据架构的设计与实施同其他架构紧密相连,企业组织中的架构主要包括:组织架构、业务架构、IT技术架构、数据架构等。每个架构都不是孤立存在的。要么对其他架构产生影响、要么受制于其他架构。
DAMA数据管理知识体系指南》读书笔记-第四章(数据架构)_第3张图片
企业架构框架:企业架构框架是用于开发广泛的相关架构的基础架构。架构框架提供了思考和理解架构的方式,可以理解为一个“架构的架构”。Zachman框架是一个比较有代表性的框架,该架构是一个6*6矩阵构成的一组模型,这组模型可以完整地描述一个企业以及相互之间的关系,框架图如下图所示。
DAMA数据管理知识体系指南》读书笔记-第四章(数据架构)_第4张图片
企业数据架构: 企业数据架构描述必须包括企业数据模型(数据结构和数据规范)和数据流设计。

企业数据模型:是一个整体的、企业级的、独立实施的概念和逻辑数据模型,为企业提供通用的、一致的数据视图;包括数据实体、数据实体间关系、关键业务规则和一些关键属性。

企业主题域的概念
各企业主题域的实体和关系概述(数据模型中会详细讲到)
归属于同一主题域的详细逻辑设计
具体到应用或项目的逻辑和物理模型
DAMA数据管理知识体系指南》读书笔记-第四章(数据架构)_第5张图片
数据流设计:定义数据库、应用、平台和网络(组件)之间的需求和主蓝图,数据流展示了数据在业务流程、不同存储位置、业务角色和技术组件间的流动。

数据流是一种激励数据血缘的数据加工过程,用户描述数据如何在业务流程和系统中流动,数据流映射了数据与以下内容的联系:

业务流程中的应用
某个环境中的数据存储或数据库
网段(有助于安全映射)
业务角色(描述某些角色有职责创建、更新和删除数据)
出现局部差异的位置

2.活动

2.1建立企业数据架构
在理想情况下,数据架构应该是企业架构的组成部分。但是,如果没有企业,则依然可以构建数据架构团队,组织需要设计有助于明确目标和驱动数据架构的框架。数据架构中的视图和分类需要利于不同利益方相关方的沟通,因为数据架构框架致力于业务和系统术语,因此数据架构与业务架构是紧密联系的。

建立企业数据架构通常包括以下工作(这些工作可以串行也可以并行):
战略:选择框架,制定方法,开发路线图
沟通与文化:建立沟通机制,并激励积极参与者
组织:通过明确责任和职责来组织数据框架工作
工作方法:与企业架构保持一致,在开发项目中定义最佳实践并执行数据架构工作
结果:在总体路线图中产出数据架构产品
企业数据架构影响项目和系统开发的范围边界:
定义项目数据需求:通过数据架构为企业提供每个项目的数据需求
评审项目数据设计:通过设计评审来确保概念、逻辑和物理数据模型与架构一致,与组织长期策略一致
确定数据溯源影响:确保数据流在应用中的业务规则一致并可追溯
数据复制控制:数据架构治理能保证充分的复制控制来达到所需的一致性
实施数据架构标准:为企业数据架构生命周期制定和实施标准,标准可表示为原则、流程、指南和规划蓝图
指导数据技术和更新决策:数据架构和企业架构一起管理每个应用的数据技术版本、补丁和数据技术路线图策略。
2.2整合其他企业架构
从主体层面到更细化层面,每个层面都需要建立其与其他类型架构的联系。同时,数据架构可能会影响项目的范围,把企业数据架构问题和项目组合管理进行整合,能促进路线图的实施,有助于获得更好的项目效果。

3.工具

3.1 数据建模工具
很多数据建模工具具有数据血缘和关系跟踪功能,便于架构师能够管理为了不同目的及在不同抽象级中创建的数据模型。

3.2 资产管理软件
资产管理软件用于管理数据资源目录,描述其内容以及跟踪它们之间的关系,利用这些工具可确保组织遵循软件许可相关的合同义务,并收集资产相关的数据,最小化成本,优化IT流程。

3.3 图形设计应用
图形设计应用可以用于创建架构设计图形、数据流、数据价值链和其他架构软件。

4.方法

4.1 生命周期预测
架构设计可以针对当前,也可面向未来,还可是已实施并完成的,甚至为准备退役的产品,无论哪种情况,其工作成果都应该存档管理

当前的:当前支持和使用的产品
部署周期的:未来1~2年内部部署使用的产品
策略周期:未来两年后期待使用的产品
退役的:一年内,组织已经停止使用或打算停止使用的产品
优先性:被多数应用优先使用的产品
限制的:在一定应用中限制使用的产品
新兴的:为将来可能的部署研究和试行的产品
审核的:已评估的产品,评估结果目前不能用于以上状态的产品
4.2 图标使用规范
运用模型和图标呈现信息是指以已定义好的且达成共识的一套图标来表达待说明内容的一种方式,具体使用规范如下:

清晰一致的说明:清洗标识并说明所有对象和线条及图标所代表的内容
所有图标对象与说明相匹配
清洗一致的线条方向:所有线条的流向都应该从某一侧或角开始,尽可能流向对侧或对角。
一致的交叉线显示方法:要清楚交叉点并非连接点,在无法避免交叉的情况下允许线交叉;对同一个方向上的所有先使用跨线;不用将线与线直接连接;尽可能减少线交叉现象出现的次数。
一致的对象属性:对任何大小、颜色、线条粗细等不同的图标均要求表示不同的内容
线性对称:行和列排放整齐的图标比随机摆放的图标易读性更好,更容易理解。

5.实施指南

5.1 就绪评估和风险评估
架构类项目可能相比其他项目容易暴露出更多风险(其实不仅是数据架构类项目的风险,也可以说是数据类项目的风险,甚至更广的范围),最明显风险有:

缺少管理层支持:确保在数据架构开发过程中多寻求一些能够理解数据架构并愿意支持的高层管理人员,这是数据架构成败的关键。
成功与否缺乏证据:需要有明确的目标,长期性的、短期性的都需要有。没有目标的判断依据就难以评价。
缺乏管理者的信任:高层必须允许项目经理和数据架构师在项目中发挥主导作用
文化冲击:数据架构工作文化对那些受数据框架体系影响的人需要有良好的应对措施。
缺乏有经验的项目经理:确保项目经理具有企业数据架构经验,特别是项目具有非常重要的数据组件时。
单一维度视角:有时业务应用的所有者可能会决定他们对整个企业级数据架构的看法,而牺牲一个更平衡、更包容的观点。
5.2 组织和文化
组织架构实施的速度依赖于适应文化的程度,以产品为导向,战略一致的组织能更好地适应架构实施,一个组织接受并实施数据架构的能力依赖于以下几个方面:

对架构方法的接受度
确认数据属于组织的业务资产,而不仅仅是IT的任务
放弃局部数据视角,接受企业级数据视角的能力
将架构交付成果整合到项目实施中的能力
规范数据治理的接受程度
立足企业全局,而不是仅仅局限于项目交付成果和IT解决问题的能力。

6.数据架构治理

数据架构活动能直接支持数据模型不同层级的映射管理及数据控制。在理想情况下,数据架构师和数据管理员应对每个主题域,甚至每个主题域的实体保持一致。数据监督与数据流程保持一致,但是往往事与愿违,因此数据架构在实施和推进过程中也需要进行相应的治理和调整。

6.1 数据架构治理活动
项目监督:包括确保项目符合所需的数据架构活动、使用和提高架构资产,且必须根据架构标准实施。

管理架构设计、生命周期和工具:必须对架构设计进行定义、评估和维护。数据架构师企业长期整合规划“分区规划”之一,数据架构的未来状态不仅影响项目目标,也影响项目在项目群中的优先级。

定义标准:制定数据在组织内如何使用的规则、指南和规范。

创建数据相关构件:支持治理规范的构件。

6.2 度量指标
企业数据架构衡量指标反映了架构目标:架构接受度、实施趋势、业务价值。数据架构衡量工作通常作为项目总体业务客户满意度的一部分,每年开展一次。

架构标准接受率:可以测量项目与已建立数据架构的紧密程度及项目与企业架构参与流程的遵循度。追踪项目预期的衡量指标也有助于理解和采纳执行过程中出现的问题

实施趋势:跟踪企业架构改善组织实施项目能力的程度,至少沿两个方向进行改善。

使用/重用/代替/废弃测量,决定使用新架构构建与重用、代替或废弃构件的比例;
项目执行效率测量,测量项目的交付时间和可重用构件及指导构件的交付改进成本
业务价值度量指标:追踪所期待的业务效果和利益方向的发展过程

业务敏捷性改进:解释生命周期改进或改变的好处,改进延误成本的测量方法
业务质量:测量业务案件是否按期完成;基于新创建或集成的数据导致业务发生的改变,测量项目是否实际交付了这些变更。
业务操作质量:测量改进效率的方法,实例包括准确性改进、时间减少,由于数据错误而导致的纠错费。
业务环境改进:实例包括由于数据错误减少而改变的客户保留率和在递交报告中当局评论的减少率。

四、思考与总结

架构的核心在于对组件要素有组织的设计和集成,优化整个机构或者系统的功能、性能、可行性、成本和用户体验,让整个系统的功能性、稳定性、扩展性更高更强。数据架构的主要目标是有效管理数据,以及有效地管理存储和使用数据的系统。

数据架构的设计是一项富有技术含量和挑战性的工作,需要对业务、数据技术、数据应用场景都有较深的理解,只有这样才能保证数据的有效管理和高效应用,因此需要各位从业同学不断地思考和学习。

数据架构是整个数据体系建立的框架图,包括数据、业务、企业组织等方面,业务流程、资源分配、节奏进展等方面都含括在其中。所以,我们每个人都需要懂一些架构的知识,对我们所面对新的系统、新的环境、组织结构时会更好的上手、深入了解。

关于数据和文章中相关资料和信息的获取直接私信即可,我会第一时间同步到大家。《DAMA数据管理知识体系指南》一书,笔者仅收集到第一版电子版,如有需要第二版的请自行购买。
转载链接:https://mp.weixin.qq.com/s/_XWwawdzoawCtQr2EvhaMw

你可能感兴趣的:(hive,hadoop,big,data)