群体知识图谱:分布式知识迁移与联邦式图谱推理

0 引言

知识图谱(knowledge graph,KG)旨在用图的形式描述客观世界的实体、概念、事件及其之间的关系。实体是客观世界中的具体人物或事物,如篮球运动员姚明、浙江大学等。概念是指人对世界万物的主观概念抽象,如运动员、高等学校等。事件是指客观事物发生的行为及活动,如股价波动、机构兼并等。关系描述实体、概念、事件之间存在的关联关系,如张三毕业于浙江大学、大学是高等学校等。

知识图谱的发展历史源远流长,从经典人工智能阶段的知识工程,到互联网时代的语义Web,再到当下很多领域构建的数千亿级别的现代知识图谱。知识图谱在语义搜索、智能问答、推荐计算、语言理解、大数据分析、设备物联等领域都有广泛应用。

尽管知识图谱技术取得了飞速进步,但其仍面临众多挑战。知识图谱强调将分散的碎片化数据相互关联、链接和融合。即使在单一的企业或机构内部,知识图谱的数据也通常来源于不同部门,知识的生产者应该拥有知识的所有权和控制权,知识图谱的构建及应用通常需要依靠多部门群体协作完成。因此,一个好的知识图谱平台应该是分布式的,而非集中或中心化的。

群体知识图谱是指通过群体协作,以去中心化和分布式方式管理和维护的知识图谱。相比现有的集中式管理的知识图谱,群体知识图谱具备知识确权、隐私保护、众包激励、可信溯责等特点。知识确权指保护知识的所有权和控制权,这也是有效进行知识众包激励的保障。隐私保护指在知识被进一步应用和消费的过程中,更加有效地保护知识中的敏感信息。同时,由于错误、虚假甚至恶意的知识会给下游的知识使用者带来不利后果,因此还需要提供必要的机制来追溯知识的来源,即知识的可信与溯责。具体来说,群体知识图谱是多个在组成部分上相互关联的知识图谱(如部分相同的关系集合或实体集合),并且这些知识图谱可以进行去中心化和分布式管理和维护。

一般来

你可能感兴趣的:(网络通信科学技术专栏,知识图谱,分布式,人工智能)