元数据的前世今生

什么是元数据

元数据(Metadata)是描述数据的数据。它是一组信息,用于描述数据的特征、属性、结构和内容,以便更好地管理、理解、组织和使用数据。让人们能够清楚拥有什么数据、代表什么、源自何处、如何在系统中移动,以及哪些人可以使用源数据,如何使用。

元数据通常包括以下内容:

  1. 描述性元数据:这种元数据提供有关数据内容的信息,例如标题、作者、创建日期、关键字、摘要等。它有助于用户理解数据的主题和含义。
  2. 结构性元数据:这种元数据描述数据的组织结构,包括数据字段、数据表、数据文件的名称、大小、格式、关系等。它有助于确定数据如何组织和连接。
  3. 技术性元数据:这种元数据包括有关数据存储、访问、处理和管理的信息,如数据文件的位置、访问权限、数据访问方法、数据加工方法等。
  4. 管理元数据:管理元数据包括有关数据的管理和维护信息,例如数据的生命周期、版本控制、数据所有权、许可和合规性信息等。

举例来说

图书馆目录记录

  • 描述性元数据:书籍的标题、作者、出版日期、出版商、摘要、主题关键字。
  • 结构性元数据:图书的ISBN号、页数、章节列表。
  • 技术性元数据:图书的位置、可用性、借阅状态。
  • 管理元数据:借阅历史、图书归还日期、馆藏地点。

数据库表

  • 描述性元数据:表的名称、表说明、字段名称、字段描述。
  • 结构性元数据:

你可能感兴趣的:(hadoop,数据湖,数据治理,数据库,元数据,大数据)