GB/T 18391 / ISO/IEC 11179《信息技术 元数据注册系统》对元数据(Metadata)的定义是“定义和描述其他数据的数据”,简单可理解为“关于数据的数据(Data about Data)”。
后一个Data是指被描述的信息资源,前一个Data则是指为理解该信息资源而存储的有关信息。
元数据也是数据,当数据以该种方式使用时,即为元数据;
只有在一定的语境中(特定环境下、特定目的或特定角度),数据才能称为元数据;
元数据说明举例:
以一个学生登记表单为例,表单中包含是学生基本信息,姓名、学号、班级,以及存在一个列表,存放学生的选课信息,课程编号、名称、学分。对于这个表单,假如我们在数据库中设计成两个表,一个是学生基本信息表,另一个是学生选课信息表,则:
姓名、学号、班级、课程、学分都是数据元,这些数据元有自己的元数据,即描述数据,如长度、数据类型、值域等。
对学生基础信息表而言,姓名、学号、班级是描述学生基础信息的数据,是它的元数据;同样,对学生选课信息表而言,课程编号、名称、学分是描述学生选课信息表的数据,是它的元数据。
元数据最大的好处:使信息的描述和分类可以实现结构化,为计算机的处理创造了可能。
元数据也是数据,因此,元数据可以存储在数据库中,并通过模型来组织和管理。
**元数据项类型:**在对元数据进行管理维护时,则存在被管理的元数据项。一般常见管理的元数据项分为分类模式、概念域、数据元概念、数据元、值域、表示类型等。在GB/T 18391 / ISO/IEC 11179中规定了列出部分元管理项的类型(见图1),同时也支持以附件类型进行添加和扩展。
**元数据模型:**用来描述元数据的模型通常称为元模型,改为:是指人们对描述元数据以及元数据之间关系理解的表达,也称为概念模型。如在进行数据元的管理维护时,通用使用GB/T18391 / ISO/IEC 11179中推荐的数据元的元数据模型(见图2)。该模型由概念层和表示层两部分组成,概念层包括数据元概念类和概念域类,都表示概念;表示层包括数据元类、值域类,都表示数据值的容器。
在GB/T 18391(ISO/IEC 11179)中,有一组属性规定其定义、标识、表示和允许值的数据单元,也称为数据元素。在一定语境下,构建一个语义正确、独立且无歧义的特定概念语义的信息单元,同时可理解为数据的基本单元。一个数据元由数据元概念和表示组成。
数据元概念:数据概念是能以一个数据元的形式表示的概念,其描述与任何特定表示法无关。一个数据元概念由以下两部分组成:
a. 对象类:可以对其界限和含义进行明确的标识,且特性和行为遵循相同规则的观念、抽象概念或现实世界中事物的集合;
b. 特性:一个对象类所有成员所共有的特性,
表示:由值域、数据类型、计量单位(如何需要)、表示类型(可选)组成。
我国卫生信息领域的元数据相关标准也都是在参考GB/T 18391 / ISO/IEC 11179《信息技术 元数据注册系统》的基础之上,结合卫生信息领域的元数据特性进行针对性扩展。目前已发布的元数据项类型有:数据元、值域、数据集、统计指标。
1、数据元
我国卫生信息数据元目录标准17个部分,包括1份总则和16份不同类别的数据元内容。已发布的数据元相关标准清单如下:
该标准规范中,将数据元的允许值分为可枚举和不可枚举两种类型:
a. 可选值较少的(如3个或以下):在数据元属性中直接列举;
b. 可选值较多的(如3个以上):在数据元属性中写出所引用的值域代码,若为外部标准,则注明标准号;
2、值域代码
我国卫生信息数据元值域代码标准分为17个部分,包括1份总则、1份标识规则和15份不同类别的值域代码内容。已发布的值域代码相关标准清单如下:
3、数据集
我国卫生信息领域中,为了满足各业务信息系统规范化建设和领域内部以及领域间数据交换与共享需求,设计归纳的各个子系统(或者功能模块)所包含的最小数据元素的集合,即基本数据集。
目前,我国卫生信息基本数据集分为基本信息、卫生服务、卫生管理、卫生综合四大类,其中卫生服务又分为儿童保健、妇女保健、疾病控制、疾病管理、医疗服务五小类;每个分类下包括多个数据集,如卫生综合分类下包括1份居民健康档案基本数据集和17份电子病历基本数据集。已发布的基本数据集相关标准清单如下:
我国卫生信息卫生统计指标标准分为9个部分,包括1份总则和8份不同类别的卫生统计指标内容。已发布的统计指标相关标准清单如下: