元的中文解释包括第一、根本、源头等,所有大家感觉带元的词语都很牛,比如元首、元帅、元老、元宝等,以及现在非常火的元宇宙。
因此看到元数据这个词,我第一反应是肯定一种比较厉害的数据。那元数据到底怎么认知?它有什么用呢?
一、元数据是什么?
元数据就是对数据进行解释描述的数据。我来举个例子让大家理解一下:
公司市场部招聘了一个新媒体运营的员工,她的信息主要有:
姓名:杨玲
性别:女
年龄:25
学历:本科
工作经验:
2020年6月~2021年12月,在XXX公司任职,只要负责:
1、公众号文案撰写、排版、主题设计。
2、结合热点、公司大事件等进行内容主题策划。
3、对公司相关社群进度细分,并根据情况进行精细化运营。
4、.......
这个例子中的姓名、性别、年龄、学历、工作经验等就是元数据,因为它们是用于描述这个具体员工数据的数据。
因此,一类事务就可以生成一套元数据。元数据在生活中元数据无处不在,在企业中,只要有数据存在的地方都会有对应相关的元数据。
二、元数据有什么用?
元数据最大的好处是:它根据描述和分类格式化了信息,经过结构化数据存储后,能让机器处理分析数据。
尤其是对企业而言,随着BI技术的发展,数据分析越来越能体现其价值,这个时候元数据也体现出其重要的作用,因为只有完整、准确的元数据存在,才能帮助去哦也更好地理解数据,充分对数据的价值进行挖掘。
在数据分析领域,元数据拥有如下特点:
1、元数据是数据建仓的基础。它可以帮助用户对数据仓库中统一的系统模型进行结构和特征的感知,元数据通过统一的系统模型来,从而理解相关数据。
2、元数据通过对数据仓库有效的定义存储和约定管理,生成需要的数据集用来查询分析。
3、元数据通过对数据仓库机构的描述、维度模型的建立来保证数据的质量。
4、元数据具有很强的独立性,独立于平台,可以支持各种情况下的技术需求变化。
元数据的作用可总结一下包括:描述、检索、选择、定位和关联分析等。
资源描述
元数据的最基本的功能就是:对信息资源对象进行描述,即对数据进行解释和说明,比如可以描述信息资源的主题、内容、属性、特点等。
比如,我在大数据分析产品Smartbi系统中创建一个用户,这个用户的名称、别名、所属组、角色、用户属性等信息都以数据的形式存储在知识库中,我们可称之为元数据,这个存储BI系统元数据的数据库,在Smartbi系统中称之为知识库。
资源检索
可以利用元数据更快捷地组织信息资源,并建立各资源对象之间的联系。为用户提供更好的检索方式,从而帮助用户更加快捷的检索出需要的数据。
举例说明:
大数据分析产品Smartbi的搜索是采用全文检索引擎,在索引中通过检测资源ID、名称、别名、描述和内容这五个字段的信息,以便搜索出符合条件的资源。搜索功能有利于用户快速找出资源,并对该资源进行影响性分析和血统分析。
资源选择
元数据可以帮助用户更快的筛选信息。在它的支持下,用户可以通过元数据属性对信息进行基本的了解和认识,并且实现挑选,使得选择信息资源的操作更加快捷。
举例说明:
在Smartbi中选择资源,比如某个可视化大屏、报表,右键选择属性,在资源属性界面就可以查看这个资源的基本信息。
资源定位
元数据可以为用户定位信息资源本身的位置信息,方便获取信息资源所在的位置并进行查询管理。
举例说明:
在Smartbi系统中我们可以通过定位到树,快捷找到资源的位置。如下图,打开资源,点击定位到树操作:
还可以定位到这个资源使用的数据集,用于快速打开数据集进行修改等操作。
关联分析
元数据分析可以朔源到信息或是资源的关联性分析,比如我们根据某个资源找到它的影响性分析和血统分析,这样可以帮助用户寻找源头或被影响的资源信息,就像是通过一个人找到他的家谱树。
如下图,Smartbi地产投资分析平台,我们通过元数据分析的血统分析,可以查看到构建次大屏的数据集、数据源等信息,通过元数据分析的影响性分析,可以看到当前资源如果变更或是删除会影响到哪些资源。
通过血统分析和影响性分析,可以提前预示变更风险,也可以找到问题源头。
你们认为元数据分析还有哪些应用场景呢,欢迎大家来留言讨论~