喜事连连!知识图谱巨大进化了!道翰天琼认知智能机器人平台API接口大脑为您揭秘-69

 

喜事连连!知识图谱巨大进化了!道翰天琼认知智能机器人平台API接口大脑为您揭秘-69_第1张图片

 

 

 

知识图谱本身是一种图结构数据,采用图构建知识和数据之间的关联,应用图神经网络技术,有望结合知识和数据,实现更好的可解释和可信人工智能技术。本文将介绍基于图神经网络的知识图谱学习与计算以及基于图神经网络融合知识图谱信息的应用的研究进展。1

知识图谱与图神经网络

近几年来,人工智能技术得到了飞速发展,其进展突出体现在以知识图谱(Knowledge Graph)为代表的知识工程和以图神经网络(Graph Neural NetWorks, GNN)为代表的深度学习等相关领域。融合知识图谱与图神经网络已然成为研究人员进一步完善知识图谱学习与提升图神经网络模型推理能力的重要技术思路。知识图谱是以图的形式表现客观世界中的实体及其之间关系的知识库,实体可以是真实世界中的物体或抽象的概念,关系则表示了实体间的联系。因此,知识图谱能够以结构化的形式表示人类知识,通过知识表示和推理技术,可以给人工智能系统提供可处理的先验知识,让其具有与人类一样的解决复杂任务的能力[1~3]。如何更好地构建、表示、补全、应用知识图谱,已经成为认知和人工智能领域重要的研究方向之一。图神经网络的概念最早于2005年由戈里(Gori)等人[4]提出,是一种专门用于处理图结构数据的神经网络模型。使用图可以更准确和灵活地对现实应用中的数据建模,如在电子商务领域中的用户–产品交互图、化学领域的分子图、医药领域的药物副作用图等。因此,研究者们设计了多种图神经网络模型,包括图卷积网络(Graph Convolutional Network,GCN)[5~7]、图注意力网络(Graph Attention Network,GAT)[8]等。此外,由于异质图具有更灵活的建模和融合信息的能力[9],研究者们还尝试设计和应用基于异质图的图神经网络模型[10~12]。如何设计更合理的图神经网络模型,使信息沿着图结构更合理地传播,从而提升模型对图结构数据的拟合能力,是人工智能领域的一个热点问题。近年来,描述常识和事实的知识图谱成为了学术界和工业界广泛使用的知识表示方式,图神经网络在信息传播、关系归纳偏置上也展现了优秀的性能[13]。考虑到知识图谱本身恰好就是一种图结构数据,因此采用图构建知识和数据之间的关联,同时应用图神经网络技术,有望结合知识和数据实现更好的可解释和可信人工智能技术。一方面,利用图神经网络在学习节点、边表示上的优势,可以更好地学习知识图谱的实体、关系的嵌入表示,改善关系抽取等任务,帮助构建知识图谱,以及提高链接预测等任务,帮助补全知识图谱;另一方面,利用图神经网络在信息传播和推理上的优势,可以更有效地在应用任务中引入知识图谱中的信息,从而改善如文本挖掘、推荐系统、计算机视觉等领域中的应用效果,提供可解释的模型。本文将对知识图谱与图神经网络模型相融合的方法及应用进行综述。
2

基于图神经网络的知识图谱学习与计算

由于知识图谱可以表征实体之间结构化的关系,如今已经成为认知和人工智能领域重要的研究方向。图神经网络利用深度神经网络对图数据中的拓扑结构信息和属性特征信息进行整合,进而提供更精细的节点或子结构的特征表示,并能很方便地以解耦或端到端的方式与下游任务结合,巧妙地满足了知识图谱对学习实体、关系的属性特征和结构特征的要求。本节主要从知识图谱中的5个典型任务介绍基于图神经网络的知识图谱学习方法。知识图谱表示学习知识图谱表示学习,即为知识图谱中的实体和关系学习出一个低维度的向量表示,同时包含一些语义信息,从而得以在下游任务中更加方便地提取和利用知识图谱中的信息,例如链接预测[10]、常识问答[1]等。通过应用图神经网络,在学习知识图谱的表示时,每个实体都将利用到与其相关的其他实体中的信息,打破了彼此之间的孤立性,从而学得更完整更丰富的实体、关系表示。经典的翻译系列模型在知识表示和推理的问题上显示出强大的学习能力,例如图1(a)中,TransE(Translating Embedding)[14]提出头实体的向量表示加上关系的向量表示,应当等于尾实体的向量表示,通过这种约束,TransE学得了实体之间丰富的语义关系。Cai等人[15]将翻译系列模型的思想引入到了GCN[7]中,提出了TransGCN(如图1(b)所示),综合了TransE模型和图神经网络的优点。考虑到知识图谱中的关系具有不同种类的特点,关系图卷积网络(R-GCN)[10] 使用关系特定的变换矩阵扩展了GCN,如图1(c) 所示,并且为了缓解由于关系种类过于丰富而导致的参数量巨大的问题,提出了基分解和块对角分解两种正则化策略。当出现知识库之外的实体时,一种思路是利用相关的实体和关系学习新实体的表示,例如滨口(Hamaguchi)等人[16]提出使用图神经网络利用邻实体和对应的关系获得新实体的表示,并针对知识图谱的特点,为图神经网络提出了新的传播模型;Wang等人[17]进一步改进了传播模型,即逻辑注意力网络(Logic Attention Network,LAN),以考虑实体邻域的无序性和不平等性质,从而更好地学习实体和对应的邻实体之间的关系。与以上研究不同的是,Hu等人提出了一种利用实体描述作为辅助文本的知识图谱表示学习方法Teger,如图1(d) 所示,它一方面利用GCN对辅助文本中的局部语义关系和长距离语义关系进行编码,另一方面基于TransE学得知识图谱的结构信息,从而通过结合两种途径得到了更精确的实体表示。GENI(GNN for Estimating Node Importance)[18]为了估计知识图谱中实体的重要性,提出了邻实体的重要性分数(而不是邻实体的特征)对中心实体的重要性评估起主要作用的观点,因此设计了预测感知的注意力机制和灵活的中心性调整策略,使重要性分数进行传播,而非实体表示。信息抽取信息抽取是指从非结构化、半结构化文档或句子中提取结构化信息的技术,与知识图谱的构建有着密切的联系,主要包括命名实体识别、实体消歧、关系抽取、指代消解等任务。近年来,已有许多研究将图神经网络应用于知识图谱的关系抽取任务,而在其他任务上对图神经网络的探索还较少。通过图神经网络可以对句子内或句间词与词的关联关系进行有效建模,从而更准确地捕捉实体间的关系。关系抽取,即从文本中识别抽取实体对之间的语义关系。例如,从句子“[贾玲],80后相声新秀,师承中国著名相声表演艺术家[冯巩]”中识别出实体“[贾玲]”和“[冯巩]”之间具有“师生”关系。在关系抽取中,许多工作基于句子的依赖树使用GCN对词之间的依赖关系进行编码,或基于知识图谱表示进行句子编码,从而预测关系类别。如图2(a) 所示&#x

你可能感兴趣的:(神经网络,大数据,python,自然语言处理,机器学习)