1、数据
是指任何以电子或者其他方式对信息的记录。在计算机科学技术中,“数据”是客观事物的符号表示,指所有可被输入到计算机中并可被计算机程序处理的符号的总称;在管理科学技术中,“数据”是描述事件或事物的属性、过程及其关系的符号序列,比如自然语言符号、科学符号、数字及图形图像等。
2、数据管理
是为了交付、控制、保护并提升数据和信息资产的价值,在其整个生命周期中制定计划、制度、规程和实践活动,并执行和监督的过程。其目的在于充分有效地发挥数据的作用。
3、数据治理
是对整个行业的业务、数据、信息化建设、组织架构等信息的认知、理解、梳理、重定义的过程。最终输出一套规范标准,即通过有效的数据资源控制手段,对数据进行管理和控制,以提升数据质量,进而提升数据变现的能力。
4、数据资源
广义上是指对一个企业而言所有可能产生价值的数据,包括自动化数据与非自动化数据。数据资源也是企业生产及管理过程中涉及的一切文件、资料、图表等数据的总称。它是对数据进行加工处理,使数据之间建立联系,并具有某些意义,贯穿于企业管理的全过程。
5、数据资源管理
致力于发展处理企业数据生命周期的适当的建构、策略、实践和程序。关注数据资源的目的就是去寻找手段,以有效地控制数据资源,并提升数据资源的利用率。
6、数据资产
是指由组织(政府机构、企事业单位等)合法拥有或控制的数据资源,以电子或其他方式记录,例如文本、图像、语音、视频、网页、数据库、传感信号等结构化或非结构化数据,可进行计量或交易,能直接或间接带来经济效益和社会效益。在组织中,并非所有的数据都构成数据资产,数据资产是能够为组织产生价值的数据资源,数据资产的形成需要对数据资源进行主动管理并形成有效控制。
7、数据资产管理
数据资产管理 是指对数据资产进行规划、控制和提供的一组活动职能,包括开发、执行和监督有关数据的计划、政策、方案、项目、流程、方法和程序,从而控制、保护、交付和提高数据资产的价值。数据资产管理须充分融合政策、管理、业务、技术和服务、确保数据资产保值、增值。其核心思路是把数据对象作为一种全新的资产形态,并且以资产管理的标准和要求来加强相关体制和手段。从经济角度,数据资产管理满足对资产运营的各类管理要求。
8、数据要素
是一个经济学术语。指在生产和服务过程中作为生产性资源投入,创造经济价值的数据、数字化信息和知识的集合。数据要素包括原始的数据、衍生数据、数据模型、数据产品和服务等。
9、数据要素化
指数据资源通过与生产经营嵌入融合,并叠加智慧、创意与人工劳动转化为数据要素的过程。例如企业发电量数据,将其加工成企业用电状态标签,用于企业用电风险分析或者催收,对内产生价值。。
10、标准
通过标准化活动,按照规定的程序经协商一致制定,为各种活动或其结果提供规则、指南或特性,供共同使用和重复使用的文件。
11、标准化
为了在既定范围内获得最佳秩序,促进共同效益,对现实问题或潜在问题确立共同使用和重复使用的条款,以及编制、发布和应用文件的活动。
12、标准体系
一定范围内的标准按其内在联系形成的科学的有机整体。标准体系表是一种标准体系模型,通常包括标准体系结构图、标准明细表,还包括标准统计表和编制说明。
13、数据标准
指保障数据定义和使用的一致性、准确性和完整性的规范性约束。对企业而言,通俗地讲,数据标准 数据标准就是对数据的命名、数据类型、长度、业务含义、计算口径、归属部门等,定义一套统一的规范,保证各业务系统对数据的统一理解、对数据定义和使用的一致性。
14、数据标准化
指企业或组织对数据的定义、组织、监督和保护,以及借助技术工具来促成数据标准得以在 IT系统和业务领域实施的整体过程。通过数据标准化,企业的各种重要信息,包括产品、客户、机构、账户、单据、统计指标等,在企业内外的使用和交换都是一致的、准确的。数据 标准化是一项带有系统性、复杂性、困难性、长期性特征的动态管理工作,是对标准在某种 程度上的落地。
15、数据目录
可以分为数据资源目录、数据共享和开放目录、数据资产目录和数据服务目录。它是数字化转型、构建数字孪生的基础,也是数据共享、服务的基础,还是数据资产化、数据资产运营的基础。。
16、数据资源目录
是依据规范的元数据描述数据资源,站在全局视角对所拥有的全部数据资源进行编目,以便对数据资源进行管理、识别、定位、发现、共享的一种分类组织方法,从而达到对数据的浏览、查询、获取等目的。。
17、数据资产目录
指对数据中有价值、可用于分析和应用的数据进行提炼形成的目录体系。数据资产目录构建的角度应该是管理的角度,根据不同数据资产管理范围的划分,由不同的角色进行管理。编制数据资产目录可以给出业务场景和数据资源的关联关系,降低用户理解系统数据的门槛。
18、数据服务目录
是对数据服务依据规范的元数据描述,按照特定的业务场景进行排序和编码的一组信息,用于描述各个数据服务的特征,以便于对数据服务的使用和管理。数据服务目录的建设是基于组织内已梳理的数据资产目录,以业务场景、应用场景为切入,以业务需求、应用需求为导向进行编制的。数据服务目录主要分为两类,其中一类是数据应用服务,包括指标报表、分析报告等可以直接使用的数据应用;另一类是数据接口服务,提供鉴权、加密、计量、标签化等。
19、数据共享开放目录
可以明确数据资源共享和开放的范围与条件,方便数据跨部门、跨单位、跨组织产生价值。
20、数据分类
指按照选定的属性(或特征)区分分类对象,将具有某种共同属性( 或特征)的分类对象集合在一起的过程。
21、源数据
指直接来自源文件(业务系统数据库、线下文件、IOT等)的数据,或者直接复制源文件的“副本数据”。其本质是讲“数据”本身,强调数据状态是“创建”之后的“原始状态”,也就是没有被加工处理的数据。
22、数据源
指数据的来源,也是数据产生和生成的源头。数据源包括内部数据源和外部数据源两大部分内部数据源根据产生来源的不同又可以分成两类,其中一类是业务操作中采集的原始数据,也称基础数据(是指企业运营活动中产生的原始数据,或者进行过简单的清洗处理,但不通过计算得到的数据):另一类是基于业务规则对原始数据加工后生成的结果数据,也称衍生数据。外部数据源指由于企业业务发展的需要,从企业外部政府部门、企事业单位、商业机构等获得数据的来源,如气象数据、经济数据等。
23、元数据
指描述数据的数据,主要是描述数据属性的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能:包括业务元数据、技术元数据和管理元数据。元数据管理是关于元数据的创建、存储、整合与控制等一整套流程的集合。元数据贯穿数据资产管理的全流程,是支撑数据资源化和数据资产化的核心。首先,元数据从业务视角和管理视角出发,通过定义业务元数据和管理元数据,增强了业务人员和管理人员对数据的理解与认识。其次,技术元数据通过自动从数据仓库、大数据平台、ETL 中解析存储和流转过程,追踪和记录数据血缘关系,及时发现数据模型变更的影响,有效识别变更的潜在风险。最后,元数据可作为自动化维护数据资产目录、数据服务目录的有效工具。
24、数据元
也被称为数据元素,是组成实体数据的最小单元,或称原子数据,用一组属性描述定义、标识、表示和允许值的数据单元。数据元由三部分组成:对象、特性、表示。
25、参考数据
指可用于描述或分类其他数据,或者将数据与组织外部的信息联系起来的任何数据。最基本的参考数据由代码和描述组成,但是有些参考数据可能更复杂,还包含映射和层次结构。在很多企业中,常常把参考数据称为配置性主数据,或者公共代码。
26、主数据
指满足跨部门业务协同需要的核心业务实体数据。其长期存在且被应用于多个系统,描述整体业务数据的对象;例如客户、商品、供应商主数据,相对于交易数据而言,其属性相对稳定,对准确度要求更高,可唯一识别。主数据管理是一系列规则、应用和技术,用于协调和管理与企业的核心业务实体相关的系统记录数据。通过对主数据值进行控制,使得企业可以跨系统使用一致和共享的主数据,提供来自权威数据源的协调一致的高质量主数据,降低成本和复杂度,从而支撑跨部门、跨系统数据融合应用。
27、交易数据
又称事务数据,也称业务数据。指在日常业务开展过程中实时产生或交互的业务行为和结果型数据。交易数据对实时性要求较高,主要作用是支撑业务的办理流程。相对于主数据,交易数据具有短期或瞬间的特点,例如采购订单、销售订单。
28、指标数据
指组织在战略发展、业务运营和管理支持各领域业务分析过程中衡量某一个目标或事物的数据。一般由指标名称、时间、指标数值等组成。指标数据管理指组织对内部经营分析所需要的指标数据进行统一规范化定义、采集和应用,用于提升统计分析的数据质量。
29、主题数据
是根据数据分析的需要,按照业务主题对数据所进行的一种组织和管理方式,其本质是为了进行面向主题的分析或加速主题应用的数据。
30、基础数据
指在IT 系统中实现的与企业执行和管理业务过程的业务明细数据相关的代码数据,是企业业务活动在IT 系统中的具体体现。基础数据可分为主数据和交易数据。
31、基础数据标准
是为了统一企业所有业务活动相关数据的一致性和准确性,解决业务之间的数据一致性和数据整合,按照数据标准管理过程制定的数据标准。在各行业实践中,基础数据标准一般包括数据维度标准、主数据标准、主题数据模型标准、逻辑数据模型标准、物理数据模型标准公共代码标准等多种形式。
32、衍生数据
由基础数据通过转化和计算产生。通俗的叫法是: 指标数据、分析数据或者统计数据。
33、数据指标
数据指标,也称指标数据标准,是衡量目标的方法,即预期中打算达到的指数、规格、标准,一般用数据表示。例如:销售收入、活期存款金额、委托贷款余额等。一般分为基础指标标准和计算指标(又称组合指标)标准。基础指标一般不含维度信息,且具有特定业务和经济含义;计算指标通常由两个以上的基础指标计算得出。数据指标管理是指通过对企业若干个核心和关键业务环节相互联系的统计数据指标的全面化、结构化和层次化的系统化构建,满足企业找指标、理指标、管指标、用指标的需要。
34、标签
是一种用来描述业务实体特征的数据形式。通过标签对业务实体进行刻画,从多个角度反映业务实体的特征。比如对用户进行刻画时,包括性别、年龄、地区、兴趣爱好、产品偏好等角度。在日常工作中,经常碰到的业务实体包括用户、商品、商户等,相应的标签分别称为用户标签、商品标签和商户标签。
35、维度
是报表分割显示统计数值的角度,主要用来描述在业务活动中会从哪些角度对标准项进行使用和分析,体现为报表的一行或者表头中的一列。一般来说,维度具有离散化取值的特性,即取值可以枚举。常用的维度包括时间、空间、组织、业务板块、业务阶段等。
36、公共代码
是用于将其他数据进行分类或目录整编的数据,是参考数据的一种形式。其主要指国标和行业标准的代码,如国别代码、邮政编码、行政区域、港口。
37、数据战略
是组织开展数据工作的愿景、目的、目标和原则,包括数据战略规划、数据战略实施和数据战略评估。数据战略是一个用数据驱动业务,为了实现企业业务目标而制定的一系列高层次数据管理战略的组合,指导企业开展数据治理工作,指明企业数据应用的方向。
38、数据质量
既指与数据有关的特征,也指用于衡量或改进数据质量的过程。数据质量不但依赖于数据本身的特征,而且还依赖于使用数据时所处的业务环境,包含数据业务流程和业务用户。衡量数据质量的维度一般有一致性、唯一性、准确性、及时性、完整性、有效性等。
39、数据安全
指通过采取必要措施,确保数据处于有效保护和合法利用的状态,以及具备保障持续安全状态的能力。
40、数据架构
是一套规则、政策、标准和模型,用于管理和定义收集的数据类型,以及如何在组织及其数据库系统中使用、存储、管理和集成数据。它提供了创建和管理数据流,以及如何处理整个组织IT 系统和应用程序的方法。数据架构是实现数据规划的载体,是揭示业务本质、描述公司数据关系的全景视图,是统一数据语言、理顺数据关系、消除信息孤岛、建立数据互联的基础。
41、主题域
提供模型的高阶视图,是类的逻辑分组。根据业务要求将类组织成一些独立、完整的领域,每个主题域对应某一领域所涉及的类对象,并在较高层次上对该领域内的数据进行完整、致的描述。主题域扩展可以根据客观对象、业务关注点定义新的数据对象范围。
42、数据模型
数据模型是指使用结构化的语言对收集到的组织业务经营、管理和决策中使用的数据需求进行综合分析,按照模型设计规范将需求重新组织在一起。从模型覆盖的内容颗粒度看,数据模型一般分为主题域模型、概念模型、逻辑模型和物理模型。主题域模型是最高层级、以主题概念及其关系为基本构成单元的模型,主题是对数据表达事物本质概念的高度抽象;概念模型是以数据实体(类)及其关系为基本构成单元的模型,实体名称一般采用标准的业务术语命名;逻辑模型是在概念模型的基础上细化,以数据属性(元素)为基本构成单元的。
43、数据分布
是针对组织级数据模型中数据的定义,明确数据在系统、组织和流程等方面的分布关系,定义数据类型,明确权威数据源,为数据相关工作提供参考和规范。通过对数据分布关系的梳理,可以定义数据相关工作的优先级,方便指定数据的认责管理人,并进一步优化数据的集成关系。
44、数据流向
是建立企业内各应用系统、各部门之间的数据集成机制,通过企业内部数据集成相关制度标准、技术等方面的管理,促进企业内部数据的互联互通。其体现系统各环节输入和输出的信息项,数据通过系统交互及存储的路径,从数据传递和加工的角度,体现控制流和数据流的方向。
45、实体
指现实世界中客观存在的并可以相互区分的对象或事物。就数据库而言,实体往往指某类事物的集合。其可以是具体的人或事物,也可以是抽象的概念、联系。数据实体对象往往包含指标数据、交易数据、主数据及参考数据等。
46、属性
指某个对象或实体的特征。
47、数据类型
它指定变量具有哪种类型的值及哪种类型的数学、关系或者逻辑运算。数据类型是一种分类它规定了变量或对象在计算机编程中可以包含什么。数据类型具体可被细分为原始类型和构造类型。原始类型包括整型、浮点型、布尔型、字符串型等。构造类型包括枚举、结构体集合等。数据类型定义参照 CIM 准执行。
48、数据项
是数据的不可分割的最小单位。数据项的名称有编号、别名、简述、数据项的长度、类型、数据项的取值范围。数据项是数据记录中最基本的、不可分的有名数据单位,是具有独立含义的最小标识单位。
49、编码
给事物和概念赋予代码的过程。
50、代码
表示特定事物或概念的一个或一组字符。这些字符可以是阿拉伯数字、拉丁字母或便于人和机器识别与处理的其他符号。
51、数据字典
指对数据的数据项、数据结构、数据流、数据存储、处理逻辑等进行定义和描述,其目的是对数据流程图中的各个元素做出详细的说明。数据字典是描述数据的信息集合,是对系综中使用的所有数据元素的定义的集合。
52、数据应用
指对数据的使用,使其发挥价值。其涉及三个领域:数据分析、数据开放共享和数据服务。
53、数据分析
是对企业各项经营管理活动提供数据决策支持而进行的企业内外部数据分析或挖掘建模,以及对应成果的交付运营、评价推广等活动。数据分析能力会影响到企业制定决策、创造价值向用户提供价值的方式。
54、数据开放共享
指按照统一的管理策略对组织内部的数据有选择地对外开放,同时按照相关的管理策略引入外部数据供组织内部应用。数据开放共享是实现数据跨组织、跨行业流转的重要前提,也是数据价值最大化的基础。
55、数据服务
指通过对企业内外部数据的统一加工和分析,结合不同需求方的需要,以数据分析结果的形式对外提供跨领域、跨行业的数据服务。提供数据服务的形式可能有多种,包括数据分析结果、数据服务调用接口、数据产品或数据服务平台等,具体服务的形式取决于企业数据的战略和发展方向。
56、数据生命周期
指数据的获取、存储、整合、分析、应用、呈现、归档和销毁等各种生存形态演变的过程。
57、数据处理
指对数据(包括数值和非数值 )进行分析和加工的技术过程,包括对各种原始数据的分析整理、计算、编辑等的加工和处理。
58、数据需求
指企业对业务运营、经营分析和战略决策过程中产生和使用的数据的分类、含义、分布和流转的描述。数据需求管理过程用于识别所需的数据,确定数据需求优先级并以文档的方式对数据需求进行记录和管理。
59、数据设计和开发
指设计、实施数据解决方案,提供数据应用,持续满足公司的数据需求的过程。数据解决方和开发案包括数据库结构、数据采集、数据整合、数据交换、数据访问及数据产品等方案。
60、数据运维
指数据平台及相关数据服务建设完成上线投入运营后,对数据采集、数据处理、数据存储等过程的日常运行及维护过程,保证数据平台及数据服务的正常运行,为数据应用提供持续用的数据内容。
61、数据退役
指对历史数据的管理,根据法律法规、业务、技术等各方面需求设计历史数据的保留和清防策略,执行历史数据的归档、迁移和清除工作,确保企业对历史数据的管理满足外部监管机构和内部业务用户的需求,而非仅满足信息技术需求。
62、业务术语
指组织中对业务概念的描述,是组织内部理解数据、应用数据的基础,是业务部门和数据部门沟通的桥梁。定义良好的业务术语标准和业务术语字典可以实现对业务术语、元数据的追踪,方便数据治理人员查询使用。业务术语管理指在组织内制定统一的管理制度和流程,并对业务术语的创建、维护和发布进行统一的管理,进而推动业务术语的共享和在组织内部的应用。通过对业务术语的管理能保证组织内部对具体技术名词理解的一致性。
63、业务规则
指描述业务应该如何在内部运行,以便成功地与外部世界保持一致。业务规则通常在软件中实现,或者使用文档模板输入数据,如主数据,通常规定了主数据格式和允许的取值范围。
64、命名规范
指能够完整、准确地表述业务含义。名称应符合行业内通用命名习惯。
65、技术规范
指对标准化的对象提出技术要求,也就是用于规定标准化对象的能力。当这些技术规范在法律上被确认后,就成为技术法规。技术规范是标准文件的一种形式,是规定产品、过程或服务应满足技术要求的文件。它可以是一项标准(即技术标准)、一项标准的一部分或一项标准的独立部分。其强制性弱于标准。
66、数据仓库
是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。数据仓库是数据库的一种概念上的升级,可以说是为满足新需求而设计的一种新数据库,需要容纳更加庞大的数据集。
67、数据湖
数据湖是将来自不同数据源、不同数据类型(结构化、半结构化、非结构化)的数据,以原始格式进行存储的系统,并按原样存储数据,而无须事先对数据进行结构化处理。
68、结构化数据
以关系型或单一数据属性作为数据对象,如银行卡号、日期、财务金额、电话号码、地址产品名称等。它是一种数据表示形式,按此种形式,由数据元素汇集而成的每条记录的结构都是一致的,并且可以使用关系模型予以有效描述。
69、非结构化数据
指不具有预定义模型或未以预定义方式组织的数据,包括所有格式的办公文档、文本、图片XML 文档、HTML 文档、各类报表、图像和音频视频信息等。其用来描述具有高度可变数捷类型和格式的任何数据( 尚未标记或记录于行和列的数据 ),如文件、图形、图像、文字、报表、表格、视频或录音,具有数据格式多样、数据冗余度高、数据规模大等特点。
70、半结构化数据
指介于完全结构化数据(如关系型数据库、面向对象数据库中的数据)和完全非结构化数据(如声音、图像文件等)之间的数据。