数据治理工具

Data Governance Tools - Evaluation Criteria, Big Data Governance,

内容:

       前言

       第一部分:导论:

       1:数据治量简介

              定义

案例分析

数据治理的支柱

摘要

       2:企业数据管理参考架构

EDM类别

大数据

数据治理工具

摘要

第二部分:数据管理工具的数据

3:商业词汇表

       Excel,CSV或XML格式的批量加载业务术语

       创建业务术语类别

       促进社会协作

       自动超链接嵌入式商业条款

       将自定义属性添加到业务术语和其他数据工件

       将自定义关系添加到业务术语和其他数据工件

       将自定义角色添加到业务术语和其他数据工件

       将业务术语和列名称链接到关联的参考数据

       将业务术语链接到技术元数据

       支持创建自定义资产类型

       标记关键数据元素

       提供OOTB和自定义工作流来管理业务条款和其他数据工件

       查看业务术语和其他数据工件的更改历史记录

       允许业务用户直接从报告工具链接到词汇表

       搜索商业条款

       将业务术语与关联的非结构化数据集成

       摘要

4:元数据管理

       从数据建模工具中提取逻辑模型

       从数据建模工具中提取物理模型

       从关系数据库中提取元数据

       从数据仓库设备中提取元数据

       集成传统数据源中的元数据

       从ETL工具中提取元数据

       从报告工具中提取元数据

       在元数据工具中反映自定义代码

       从分析工具中提取元数据

              将业务术语与列名相关联

              从数据质量工具中提取元数据

              从大数据源中提取元数据

              提供有关数据沿袭的详细视图

              自定义数据沿袭报告

              管理元数据存储库中的权限

              支持在元数据存储库中搜索资产

              摘要

5:数据分析

       进行柱分析

       发现列的值分布

       发现列的模式分布

       发现列的长度频率

       发现隐藏的敏感数据

       发现列中具有相似声音的值

       同意数据治理计划的数据质量维度

       制定与数据质量维度相关的业务规则

       与数据质量完整性维度相关的配置文件数据

       与数据质量一致性维度相关的配置文件数据

       与数据质量一致性维度相关的概况数据

       与数据质量同步维度相关的配置文件数据

       与数据质量唯一性维度相关的配置文件数据

       与数据质量的及时性维度相关的概况数据

       发现跨列的数据重叠

       发现列之间的隐藏关系

       发现依赖关系

       发现数据转换

       创建可以分析的虚拟联接或逻辑数据对象

       摘要

6:数据质量管理

       将数据转换为标准格式

       提高地址数据的质量

       匹配并合并重复记录

       创建数据质量记分卡

       选择数据域或实体

       定义数据质量的可接受阈值

       选择要为特定数据域或实体测量的数据质量维度

       选择每个数据质量维度的权重

       选择每个数据质量维度的业务规则

       为给定数据质量维度中的每个业务规则分配权重

       将业务规则绑定到相关列

       查看数据质量记分卡

       突出显示与较差数据质量相关的财务影响

       进行时间序列分析

       管理数据质量例外

       摘要

7:主数据管理

定义MDM Hub消耗的业务术语

管理实体关系管理

主数据丰富规则

管理主数据验证规则

管理记录匹配规则

管理记录合并规则

查看杰出数据管理任务列表

管理重复项

查看数据管理仪表板

管理层次结构

提高主数据质量

将社交媒体与MDM集成

管理主数据工作流程

比较主数据的快照

提供主数据更改历史记录

将MDM任务卸载到Hadoop以加快处理速度

摘要

8:参考数据管理

       建立代码表清单

同意每个代码表的主值列表

在主值和相关CodeTable之间构建简单映射

在代码值之间构建复杂映射

管理代码值的层次结构

构建和比较参考数据的快照

可视化参考数据快照之间的跨时间交叉验证

摘要

9:信息政策管理

管理业务术语表中的信息策略,标准和流程

管理业务规则

利用数据治理工具监控和报告合规性

管理数据问题

摘要

 

第三部分:企业数据管理与数据工具之间的整合

       10:数据建模:将逻辑和物理数据模型与元数据存储库集成

              在元数据存储库中公开本体

              使用数据发现工具对跨数据域的统一模式进行原型设计

              建立数据模型以支持主数据管理摘要

       11:数据集成:使用数据集成以集成方式部署数据质量作业

              在MDM或参考数据中心与源系统之间移动数据

              利用数据集成工具使用的参考数据

              将数据集成工具集成到元数据存储库中

              通过利用元数据存储库自动生成数据集成作业

              摘要

12:分析和报告

将数据分析结果导出到报告工具以进行进一步的可视化分析

将数据工件导出到报表工具以实现数据治理指标的可视化

将分析和报告工具与语义上下文的业务术语表集成

摘要

13:业务流程管理

数据治理工作流应该利用BPM功能

主数据工作流应该利用BPM功能

数据治理工具应映射到BPM工具

摘要

14:数据安全和隐私

确定隐私义务

使用数据发现工具发现敏感数据

标记元数据存储库中的敏感数据

在生产环境中屏蔽敏感数据

掩盖非生产环境中的敏感数据

监视特权用户的数据库访问

文档信息策略由数据屏蔽和数据库监视工具实现

使用数据屏蔽工具可以执行的数据发现工具创建完整的业务对象

摘要

15:信息生命周期管理

ILM工具实现的业务术语表中的文档信息策略

发现可以通过ILM工具高效执行的完整业务对象

摘要

第四部分:大数据治理工具

16:Hadoop和NoSQL

在Hadoop中执行数据清单

在Hadoop中分配数据的所有权

在Hadoop中为Analytics提供语义层

查看Hadoop内外数据的沿袭

管理Hadoop的参考数据

在Hadoop中本地配置数据

在Hadoop中本地发现数据

在Hadoop中本地执行数据质量规则

将Hadoop与主数据管理集成

Hadoop的端口数据治理工具可提高性能

管理NoSQL数据库中的数据

在Hadoop中屏蔽敏感数据

摘要

17:流计算

使用数据分析工具来理解输入数据的样本集

管理流计算应用程序使用的参考数据

管理流计算应用程序使用的业务术语

摘要

 

18:文本分析

大数据治理降低充血性心力衰竭患者的再入院率

利用非结构化数据提高稀疏性质量

  填充结构化数据

提取结构化数据中不可用的其他相关预测变量

为关键业务术语定义一致的定义

确保设施中患者主数据的一致性

遵守隐私要求

管理参考数据

摘要

第五部分 - 评估标准和供应商景观

       19:数据治理平台的评估标准

              总拥有成本

数据管理

审批工作流程

数据工件的层次结构

数据治理指标

云端

摘要

20:ASG

ASG- metaGlossary

ASG-Rochade

ASG-becubic

21:Collibra

商业词汇表

参考数据管理

数据管理

工作流程

元数据

             数据分析

 

       22:全球ID

数据分析

数据质量

元数据

23:IBM

元数据

信息集成

             数据质量

主数据管理

数据生命周期管理

隐私和安全

24:Informatica

数据分析和数据质量

元数据和业务术语表

主数据管理

信息生命周期管理

安全和隐私云

25:Orchestra Networks

工作流数据建模

主数据管理

参考数据管理

商业词汇表

26:SAP

内存数据库数据

质量和元数据管理

主数据管理

内容管理

信息生命周期管理

企业建模

数据集成

 

27:Talend

扩展生态系统

大数据

数据集成

数据质量

主数据管理

企业服务总线(ESB)

业务流程管理(BPM)

28: 着名的供应商

Adaptive

BackOffice Associates

Data Advantage Group

Diaku

Embarcadero Technologies

Global Data Excellence

Harte-Hanks Trillium

Oracle

SAS

附录A:缩略语列表

附录B:术语表

附录C:使用工具自动执行的潜在数据治理任务

商业词汇表

元数据管理

数据分析

数据质量管理

主数据管理

参考数据管理

信息政策管理

数据建模数据集成

分析和报告

业务流程管理

数据安全和隐私

信息生命周期管理

Hadoop和NoSQL

流计算

文本分析

索引

你可能感兴趣的:(大数据平台,hadoop,平台,数据建模)