深度神经网络特别是图神经网络在方面级情感分析任务上取得了较大进展,但是仍存在未充分利用外部知识信息、句法依赖树的边辨析信息以及知识图谱结构信息的缺陷。
超图中的超边可以同时连接多个节点,比图结构中的普通成对关系的表达能力更强,具备了对数据的高维属性进行建模的能力。
图和超图之间结构的相似性使得图神经网络领域的现有方法更容易通过一些自适应调整后在超图上进行应用。一些现有的工作已经证明了将图领域方法应用到超图领域的可行性和有效性。
注意力机制(attention mechanism)来源于人类最自然的选择性注意的习惯。这种机制可以使模型能够关注大量数据中的重要信息。
知识图谱本质上是语义网络的知识库。
随着信息技术和互联网技术的飞速发展,数据呈现爆炸式增长。虽然这为人们的生活和工作提供了便捷,但与此同时也带来了困扰即信息超载。如何快速而高效地从海量数据中找到用户需要或是感兴趣的信息,成了亟待解决的问题,于是推荐系统应运而生。
众所周知,推荐系统是解决信息超载问题的一种重要工具[1],通过利用各种可用信息来挖掘和学习用户的兴趣或偏好,进而为用户推荐其感兴趣的内容,从而达到推荐的目的[2]。经典的推荐系统通常面向音乐或电影推荐,但近年来,推荐系统已经开始被应用于其他领域,如新闻、电子商务、社会联系、医疗保健和旅游[3-5]。特别地,基于位置的社交网络(location based social networks, LBSN)是一种特殊的社交网络[6],用户可以通过签到来访问特定的兴趣点(POI)。然而,在 LBSN 的应用中,一个非常重要的部分便是 POI 推荐[7]。POI 推荐不仅可以帮助用户探索有吸引力和有趣的地方,还可以为基于位置的服务提供商提供指导,向目标客户投放广告营销,因此具有十分重要的现实意义[8]
图卷积神经网络是图神经网络中的一个重要分支,其将卷积神经网络思想应用到图结构数据处理中,为图中每一个节点聚合其邻居节点特征以提供图结构信息,大多数图神经网络模型是在图卷积神经网络上变化推导而来。
图卷积神经网络的特征聚合过程如下:首先根据图的邻接矩阵将图中每个节点的邻居节点及自身的特征进行聚合;然后使用激活函数对更新后的节点特征进行非线性变换,从而得到所有节点的特征表示,实现节点之间的信息传递。以一层图卷积神经网络为例,第l-1层神经网络每一个节点的特征表示为
异质信息网络;知识图谱;图注意力网络;表示学习
(引入)常用的异质信息网络有知识图谱和具有简单模式层的异质信息网络,它们的表示学习通常遵循不同的方法。
(研究内容)该文总结了知识图谱和具有简单模式层的异质信息网络之间的异同,提出了一个通用的异质信息网络表示学习框架。该文提出的框架可分为三部分:基础向量模型,基于图注意力网络的传播模型以及任务模型。
基础向量模型用于学习基础的网络向量;传播模型通过堆叠注意力层学习网络的高阶邻居特征;可更换的任务模型适用于不同的应用场景。
与基准模型相比,该文所提框架在知识图谱的链接预测任务和异质信息网络的节点分类任务中都取得了相对不错的效果
(总结)本文提出了一种通用的异质信息网络表示学习框架,该框架科分为三部分:基础向量模型,基于图注意力网络的传播模型以及任务模型。对于每个模型,本文针对不同的异质信息网络,采用了不完全相同的设计方法,并解决了不同类型网络中存在的一些问题。该框架可以应用于多个任务并取得良好的效果。
(展望)本框架的问题在于各模块对于不同类型的网络还需要特定的设计,未来计划提出更加具有通用性的表示学习模型。
嵌入传播 图神经网络 推荐 注意力机制
推荐系统
图神经网络,知识图谱,偏好传播,推荐系统,涟漪网络,图卷积网络
推荐算法
在近年中,推荐系统的出现,成为了用户从众多信息中筛选出偏好信息的有效手段。在早期推荐算法研究中,基于协同过滤的推荐算法在生活中得到了广泛应用,随着推荐算法领域研究的深入,很多学者发现,这种方式普遍存在着数据稀疏和冷启动问题。为了解决此问题,很多研究人员将一些辅助信息加入到推荐系统中,这一创新开创了推荐算法的新阶段。知识图谱作为辅助信息的一种,包含着丰富的语义特征,有助于进一步获取实体间的高阶邻域信息,丰富实体表示,从而解决数据稀疏问题来提升推荐准确性。知识图谱中的拓扑结构信息与推荐算法中用户与物品交互矩阵中的信息有着密切的关联,二者的结合带来更深层次的数据关联,弥补了原本数据的稀疏性,通过知识图谱的拓扑结构和有效的推荐算法可以挖掘用户和物品的潜在特征。基于以上原因,将知识图谱引入到推荐系统这一研究方向得到了广泛的应用。目前基于知识图谱嵌入和路径相结合的混合推荐算法效果显著,已经成为基于知识图谱的推荐系统的主流趋势,这类算法通常利用图神经网络(GNN)对用户偏好进行建模。图神经网络通过逐层聚合邻域信息来丰富用户表示和物品表示,传播高阶信息。图神经网络的聚合机制虽然有效地缓解了基于嵌入和基于路径的方法的缺陷,但是仍存在着一些待提升的空间,比如对知识图谱中的信息挖掘不够深入,不能充分利用知识图谱中的实体信息和关系信息,以及无法同时获取高阶用户特征和高阶物品特征,丰富用户表示的同时也丰富物品表示,现有算法仅仅只对一端的信息进行充分的挖掘,即只考虑了用户端或物品端与知识图谱中实体的关联,缺乏对知识图谱信息充
分的利用。因此,对于探索用户端特征和物品端特征与知识图谱中实体的语义关联以及用户-物品历史交互记录中的隐藏性信息的挖掘是一个挑战。所以,基于以上目前存在的问题,本文进行了深入的研究,提出了一种基于知识图谱的波纹传播与图神经网络结合的推荐模型(KGCN-RN,knowledge graph ripple propagation and graph neuralnetwork)。
本文的主要贡献为:
(1)为了可以同时获取高阶用户特征和高阶物品特征,丰富用户表示的同时也丰富物品表示,本文提出的 KGCN-RN 模型通过引入知识图谱信息,自动获取知识图谱中的潜在信息同时丰富用户表示和物品表示,利用水波模型的偏好传播来丰富用户特征表示,对用户特征进行高阶建模,同时在物品端利用图神经网络的消息传递机制聚
合邻域信息来丰富物品特征表示,把知识图谱视作为一个有权图,也就是实体之间的关系通过计算变为一个权重,用来表示该关系对用户偏好程度的影响。弥补了现有推荐方法对用户端或物品端特征提取不充分的问题。
(2)为了可以更精确的聚合相似性较高的邻域信息,该模型在对与实体相关的多个关系之间的权重进行采样时,采用基于重要程度采样来聚合每一层邻域信息,即根据所得的权重值从高到低采样固定数量的邻域信息,得到高阶物品表示。使得推荐结果更加精准,从而更深层次的融入到推荐系统,并且提升推荐系统的准确性。
将本文提出的算法在三个不同类型的公开数据集上进行实验,与一些现有模型的实验结果进行比较,KGCN-RN 模型在点击率预测、Top-K 推荐、数据稀疏性实验中的结果均优于现有算法,证明了本文提出的 KGCN-RN 模型的有效性。
会话推荐;图神经网络;注意力机制;多头注意力;目标注意力
会话推荐
知识图谱;推荐系统;分离式表征;图神经网络
推荐算法
本文提出一种基于分离式表征的知识图谱推荐算法DKAN,该算法细粒度建模用户兴趣和物品特征,能有效挖掘用户的深层兴趣。
首先对用户多种兴趣和交互意图进行细粒度建模,将用户和物品的混合表征解耦成多个层面的分离式表征;
再融合用户-物品交互图和相关知识图谱为协同知识图,利用图神经网络,扩充用户和物品表征的领域信息;
在聚合领域信息时,算法采用注意力机制和门控单元区分不同领域信息的重要性,挖掘用户多种潜在兴趣,最后形成端到端的推荐框架。
后续计划进一步引入更多辅助信息到算法中,例如社交网络,用户行为序列信息等。
- 数据稀疏:数据框中绝大多数数值缺失或者为零的数据
- 用户物品冷启动
对于冷启动问题,一般分为三类:
一)用户冷启动:如何对新用户做个性化推荐。
二)物品冷启动:如何将新加进来的物品推荐给对它感兴趣的用户。
三)系统冷启动:新开发的网站如何设计个性化推荐系统。- 算法的鲁棒性:鲁棒是Robust的音译,也就是健壮和强壮。指控制系统在一定(结构,大小)的参数摄动下,维持其它某些性能的特性。
(引入)基于知识图谱的推荐算法可以挖掘用户的潜在兴趣,有效解决推荐系统中冷启动和数据稀疏性问题,但现有基于知识图谱的推荐算法建模层面单一,很难挖掘到用户的深层兴趣。
为此,提出一种基于分离式表征的知识图谱推荐算法。
(研究内容)首先,利用分离式表征方法,将用户和物品的混合表征解耦成多个层面的分离式表征;然后,采用图神经网络方法,利用用户-物品交互二分图和知识图谱中的领域信息扩充用户和物品的分离式表征;同时,在分离式表征聚合邻域信息时,采用注意力机制和门控单元区分不同信息的重要性,自适应捕捉用户兴趣点。
该算法细粒度刻画用户和物品表征,深度挖掘用户兴趣和物品特征,在三个公开数据集上与基准算法进行了对比实验,实验结果表明本文提出的算法在AUC、F1等指标上有明显提高。
本文提出了一种基于分离式表征的知识图谱推荐算法DKAN,该算法细粒度建模用户兴趣和物品特征,能有效挖掘用户的深层兴趣。
DKAN算法首先对用户多种兴趣和交互意图进行细粒度建模,将用户和物品的混合表征解耦成多个层面的分离式表征;然后,融合用户-物品交互图和相关知识图谱为协同知识图,利用图神经网络,扩充用户和物品表征的邻域信息;在聚合邻域信息时,算法采用注意力机制和门控单元区分不同领域信息的重要性,挖掘用户多种潜在兴趣,最后形成端到端的推荐框架。
通过在三个不同场景下的公开数据集上进行实验,对比结果表明,DKAN算法在点击率预估场景和top-K推荐场景相比于基准算法取得了显著的性能提升,消融实验也进一步验证了本文引入分离式表征、注意力机制和门控单元的有效性。
在未来,计划进一步引入更多辅助信息到算法中,例如社交网络,用户行为序列信息等。
会话推荐;图神经网络;注意力机制;多头注意力;目标注意力
为解决基于循环神经网络会话推荐方法全局偏好表示不准确,以及欠考虑目标项目与所有项目相关性的问题,提出一种基于图神经网络和注意力机制的会话推荐方法。利用图神经网络捕捉会话项目间的依赖关系,得到项目嵌入;通过多头注意力生成全局嵌入准确表示全局偏好,根据目标注意力生成目标嵌入激活目标项目相关性;融合当前嵌入,得到会话嵌入,预测下一次点击。在公共数据集上进行对比实验,实验结果表明,相较最优基准模型,P@20最高达到了71.74%,提高超过0.3个百分点,MRR@20最高达到了35.20%,提高超过3个百分点,验证了该方法的有效性
中矿 博士论文
时间序列预测;时空融合;长短期记忆网络;注意力机制;Transformer模型
人们通过探索历史时刻不同时间序列数据的依赖关系,提取其相关特征,从而对未来时间数据进行预测,其结果可以更好的指导后续时间序列应用场景下的决策与控制任务,使对应系统向着有利方向进行。近年来,得益于传感器、计算机及通信技术的飞速发展,海量的时间序列数据为时间序列预测任务提供了不可多得的机遇,同时也使其面临严峻挑战。丰富的时间序列数据更加全面的展示其内部的深度特性,如长期复杂的时间依赖性、动态变化的空间特性及未知融合的
时空相关性,如何高效精准的提取这类特征已成为时间序列预测的关键科学问题。因此,探索基于深度时空特性的时间序列预测模型具有十分重要的意义。针对上述时间序列预测的关键科学问题,本文分别提出了四种时间序列预测模型,旨在提高时间序列预测精度,并在气象数据集 SML2010、股票数据集Nasdaq100等公开数据集及煤炭地下气化现实应用场景下的时间序列数据集进行验证。本文工作如下:
1)针对多变量时间序列时间特征提取问题,本文提出一种基于时间依赖特征的卷积-长短期记忆模块的多变量时间序列预测模型。该模型引入膨胀因果卷积及残差网络,对多变量时间序列的时间特征进行提取,扩大网络的感知范围,提高多变量时间序列时间特征提取能力;通过时间卷积模块与长短期记忆模块相结合,解决传统循环神经模型梯度消失或者梯度爆炸的问题。实验表明,相较于其他基于时间特性的预测方法,该模型在多变量时间序列预测方面具有优秀的性能。
2)针对多变量时间序列的时间依赖性和空间特性提取问题,提出一种基于时间特征和空间特征的双层注意力多变量时间序列预测模型。该模型引入卷积层来提取时间序列的空间特征;引入一种新的时间序列数据预处理方法,有效解决了多变量时间序列各变量时间依赖特征相互影响的问题;提取多变量时间序列空间特性基础上,将长短期记忆网络与注意力机制相结合,更加精确的提取其时间相关性。实验表明,相较于其他基于时间和空间特性的预测方法,该模型在多变量时间序列预测方面具有优秀的性能。
3)针对多变量时间序列的时间特征和空间特征提取问题,提出基于时间和空间特征的图信息嵌入双阶段 Transformer 模型。该模型构造自适应空间图结构
和时间图结构,更加有效的表征时间序列的时间特性和空间特性;通过空间Transformer 模块、HTC-LSTM 模块与时间 Transformer 模块相结合分别提取多变量时间序列的空间相关性和时间相关性。实验表明,相较于其他基于时间和空间特性的预测方法,该模型在多变量时间序列预测方面具有优秀的性能。
4)针对多变量时间序列时空特征提取问题,提出一种基于融合时空特征自适应图神经网络的多变量时间序列预测模型。该模型构建一个新的融合时空图,根据各时间维度上空间图的相互关系,将整个滑动窗口单个空间图融合成一个大的融合时空图,它保留了隐藏的时间、空间、时空联系;通过节点嵌入方法构造一个自适应邻接矩阵,不需要任何先验知识的指导,在训练过程中以数据驱动的方式动态优化参数,获得最优时空联系。实验表明,对比于其他时间序列预测模型,该模型在多变量时间序列预测方面具有优秀的性能。
上述研究成果可以更好的指导对应系统向着有利方向进行,为后续时间序列应用场景下的决策和控制任务提供技术支持。
本论文有图 44 幅,表 36 个,参考文献 153 篇
深度学习;小目标检测;多尺度特征融合;无锚机制;注意力机制
小目标检测是计算机视觉领域最具挑战性的问题之一。相比大目标,小目标覆盖面积小,空间分辨率低,可用特征少,检测效果通常不理想。近年来,基于深度卷积神经网络的小目标检测算法蓬勃发展,并在卫星遥感、无人驾驶等领域取得了 重大成就。文中对国内外现有的小目标检测算法进行了归类、分析和比较。首先介绍小目标检测的难点和常用的数据集;接着分别从骨干网络、金字塔结构、锚框设计、优化目标、增益组件5个方面系统地梳理了已有检测算法,为进一步改进小目标检测算法的性能提供了思路;然后对现有小目标检测算法进行全面总结,并比较分析了列举算法在常用数据集上的性能;最后介绍了小目标检测的应用前景,并对该领域未来的研究方向做出了展望。
短文本分类; 知识图谱; 注意力机制; TextRCNN; 实体消歧
文本分类任务作为文本挖掘的核心问题, 已成为自然语言处理领域的一个重要课题. 而短文本分类由于稀疏性、实时性和不规范性等特点, 已成为文本分类亟待解决的问题之一. 在某些特定场景, 短文本存在大量隐含语义, 由此给挖掘有限文本内的隐含语义特征等任务带来挑战. 已有的方法对短文本分类主要采用传统机器学习或深度学习算法, 但该类算法的模型构建复杂且工作量大, 效率不高. 此外, 短文本包含有效信息较少且口语化严重, 对模型的特征学习能力要求较高. 针对以上问题, 提出了KAeRCNN模型, 该模型在TextRCNN模型的基础上, 融合了知识感知与双重注意力机制. 知识感知包含了知识图谱实体链接和知识图谱嵌入, 可以引入外部知识以获取语义特征, 同时, 双重注意力机制可以提高模型对短文本中有效信息提取的效率. 实验结果表明, KAeRCNN模型在分类准确度、F1值和实际应用效果等方面显著优于传统的机器学习算法. 对算法的性能和适应性进行了验证, 准确率达到 95.54%, F1 值达到 0.901, 对比 4 种传统机器学习算法, 准确率平均提高了约 14%, F1值提升了约 13%. 与 TextRCNN 相比, KAeRCNN 模型在准确性方面提升了约 3%. 此外, 与深度学习算法的对比实验结果也说明, 该模型在其他领域的短文本分类中也有较好的表现. 理论和实验结果都证明, 所提出的KAeRCNN 模型对短文本分类效果更优.
南邮 硕士论文
图神经网络;注意力机制;门控循环单元;社交信息;推荐系统
推荐算法
随着网上信息量的急剧增加,信息过载问题成为了制约网络发展的一个重要因素。推荐系统作为解决该问题的有效方法,得到了工业界和学术界越来越多地关注和研究。图作为一种重要的数据结构,可以表示一组对象之间的复杂关系。而推荐系统中的大部分数据本质上具有图结构,将图神经网络应用于推荐系统,可以更有效的从各种数据中了解用户的偏好和需求。因此基于图神经网络的推荐系统成为推荐系统领域的一个重要研究方向。
本文提出了两种基于图神经网络的推荐算法:融合多头注意力机制的图神经网络算法 MGRU 和长短期偏好融合的图神经网络算法 GNNLSR。
在图神经网络推荐系统中,用户的兴趣爱好受到自身的历史行为、社交网络等多方面影响,呈现出一种动态变化的趋势。而如何在推荐系统中结合用户的社交网络信息以及时序兴趣提取有效信息,是一个棘手的问题。针对上述问题,MGRU算法利用门控循环单元有选择的记忆与遗忘节点的时序信息,增强图神经网络在节点迭代时的抽象能力。再利用注意力记忆网络获得朋友在不同方面对用户的影响,依靠多头注意力机制来调节朋友影响力的大小。
在 Ciao 与 Epionions 数据集上使用均方根误差和平均绝对误差作为评价指标进行实验,结果证明该算法提升了推荐系统的准确率。
目前基于图神经网络的推荐方法中,很多学者将用户和项目的交互信息构建成图,然后通过聚合和更新图上的节点得到用户和项目的嵌入表示。但目前大部分基于图神经网络的模型通常仅考虑用户生成的短期偏好和长期偏好的某一个方面。用户偏好的本质是由短期偏好和长期偏好共同作用而来的,长期偏好记录了一个用户的长期习惯,而短期偏好则是随着时间的推移产生的新兴趣。因此本文提出了一种融合长短期偏好的图神经网络算法 GNNLSR。
此外,本算法中还融合了项目的特征提取,使得该模型在捕获用户长短期偏好的基础上,结合项目特征产生更好的推荐结果
实体对齐;知识图谱;图神经网络;注意力机制;全局对齐
实体对齐
同质超图;超图神经网络;个性化推荐;圈层内容推荐;推荐算法
推荐系统
针对微信“搜一搜”的圈层推荐内容,采用同质超图简化了模型设计,降低了复杂度,提高了表征的可解释性。
后续探索更有效的注意力机制来进一步提升模型的效果,并对存在时序属性的交互数据的建模进行研究
(引入)图神经网络和超图神经网络已成为协同过滤推荐领域的研究热点。
- 过度平滑(over smooth):多次卷积之后,同一连通分量内的所有特征都趋于一致。当GCN图神经网络中连通图中的节点个性化信息非常丰富时,需要处理该问题。
- 用户的可解释性:一般来说,可解释的推荐分为三大类:以物品为媒介、以用户为媒介和以特征为媒介。上述类别的任何组合都将被归类为多维混合解释。“购买了商品X的顾客也购买了商品Y,Z,…”,这被称为用户类别的解释;“推荐物品Y是因为你对物品X、Z、…的评价很高或已购买”,这被称为关于物品的解释;而关于特征的解释是利用特征描述来确定当前推荐物品与用户兴趣之间的匹配。例如,餐馆可以通过地理位置、菜肴和费用等特征来描述。如果用户已经表现出对中国菜肴的偏好,或者推荐了中国餐厅,那么解释会注意到菜系方面。
(现状:存在的问题+需求)在实际场景中,用户和项目的交互非常复杂,导致用户之间存在高阶的复杂关系,而普通的图结构只能表达简单的成对关系,对网络结构的堆叠容易导致中间层表征的过度平滑,在稀疏场景下的用户建模、用户相似性发现与挖掘方面能力较弱;同时,异质超图神经网络的复杂结构使得模型的训练较低。
在以微信“搜一搜”等内容平台为代表的高度稀疏数据场景中,对于基于用户所属群体画像的圈层内容推荐任务,现有模型推荐效果差、用户表示的可解释性弱。
- 表征学习:把原始数据转化为更容易被机器学习应用的数据的过程。对于输入数据进行学习得到的新数据或者对原始数据进行选择得到的新数据都称为表征学习
- 用户表征序列
JK(jump knowledge)跳跃知识 注意力机制
(研究发现)针对此类任务,提出了一个新的轻量同质超图神经网络模型,该模型包含用户交互数据至超图的转化、卷积生成用户表征序列、用户表征计算过滤。该模型首先把用户-项目交互数据转化为只含用户节点的同质超图并计算得到用户表征解耦序列初始值,再根据超图拉普拉斯过滤矩阵进行信息传播和序列值的迭代生成,通过不使用激活层的卷积方法简化模型结构,并根据提出的均值差JK注意力机制为每个序列生成权重矩阵。最终,通过对解耦序列加权求和、过滤实现对用户表示的编码,并在真实数据集上进行实验验证了模型的相对更优效果。
多模态推荐;多模态融合;注意力机制;图神经网络;推荐系统;门控图神经网络
(现状)已有的GNN推荐算法大多利用用户-项目交互图的节点编号信息进行训练,学习用户-项目节点的高阶联系去丰富节点表示。但是忽略了用户对不同模态信息的偏好,没有利用项目的图片、文本等模态信息,或对于不同模态特征的融合简单相加,没有区分用户对不同模态信息的偏好。
(研究发现和分析)针对这一情况,提出多模态融合的GNN推荐模型。
首先,针对单个模态,结合用户-项目交互二部图构建单模态图网络,在单模态图中学习用户对此模态信息的偏好;利用GAT聚合邻居信息,丰富本结点表示;同时利用GRU决定是否聚合邻居信息,达到去噪效果;最后将各个模态图学习到的用户、项目表示通过注意力机制融合得到最终表示,然后送入预测模块
方面级情感分析;图卷积神经网络;句法依存图;注意力机制
方面级的情感分析
提出一种基于语义增强的图卷积神经网络方面级情感分析模型:
后续:
本文仅利用外部情感词典作为知识库来增强方面词背景知识,考虑到RippleNet网络的特征提取效果与在水上传播的实际涟漪类似,可以自动和迭代地沿着知识图中的链接来扩展文本词的外部常识知识,从而建模知识图谱中的三元组关系。
故下一步将使用RippleNet网络来对知识图谱进行建模,更全面地提取知识图谱的结构信息来丰富方面词语义。
- 方面级情感分析:文本情感分析可以按分析粒度分为篇章级情感分析、句子级情感分析和方面级情感分析。早期阶段,篇章级和句子级情感分析任务是研究的重点。它们假设一段文本只有一种情感,并对给定文本进行分析并判断其整体的情感极性是正面、负面或者中性等。篇章级和句子级情感分析的方法仅仅是处理对象文本的长度的差异。目前,针对文本整体进行情感分析的研究技术已经相对成熟,达到了较好的性能。然而,对文本进行整体情感分析会掩盖其细节,且整体情感并不能反映人们对意见目标的、细粒度的情感表达。如果只关注整体情感而忽略具体细节,可能会在推荐系统、问答系统等现实应用中计算出有误的结果。因此,为了进行更完整的情感分析,系统需要发现文本评论的各个方面对象,并确定文本针对每个方面所表达的情感信息,这就是方面级情感分析技术。
(现状)方面级情感分析是一种细粒度文本情感分析技术,可以判断文本目标方面的感情倾向,被广泛应用于商品评价、教育评价等领域,可以辅助用户更全面地了解实体属性并做出精准决策。but,现有的方面级情感分析技术大多存在文本依存关系特征以及外部知识特征提取不充分的问题。
(研究内容)为此,利用图卷积神经网络可以处理异构数据的特点,构建一种语义增强的方面级文本情感分析模型。
将文本的词嵌入向量 输入双向门控循环神经网络 以提取文本和目标方面词的 上下文语义信息,依据句法依存关系类型构建加权句法依存图,根据文本单词和外部知识库构建知识子图,使用图卷积神经网络处理加权句法依存图和知识子图,从而获取融合文本句法结构信息的文本特征和体现外部知识信息的目标方面特征,在此基础上,拼接两组特征向量完成情感极性分析。
图卷积网络;知识图谱;多级特征融合;边关系注意力;方面级情感分析
情感分析
针对现有图神经网络模型未充分利用句法依赖树的边关系信息、外部知识信息以及知识图谱图结构信息等问题,本文提出一种知识增强的双图卷积网络的方面级情感分析方法。该方法结合了图卷积神经网络、边关系注意力机制和知识图谱,可获得与评论文本有关的语义信息、边关系特征和外部知识。
(现状)深度神经网络特别是图神经网络,在方面级情感分析任务上取得了较大进展,但是仍存在未充分利用外部知识信息、句法依赖树的边关系信息以及知识图谱结构信息的缺陷。
(研究内容)针对上述问题,本文提出了一种知识增强的双图卷积网络。
首先,提出一种融合句法依赖关系与外部知识的子图构造算法,得到节点间语义关系更紧密的知识子图。
其次,提出了双图卷积网络,分别利用两个图卷积网络在句法依赖知识子图中引导评论文本的节点学习邻接节点的外部知识,以及在评论文本的句法依赖图中融合特定方面相关的语义信息,从而增强评论文本的特定方面知识表示和语义表示。
再次,BGCN-KE引入边关系注意力机制,更好地捕获特定方面和上下文词语间的语义关系。
最后,提出了一种多级特征融合机制,充分融合特定方面相关的外部知识、语义信息和边关系特征。
全局信息;图神经网络;会话序列;推荐算法;注意力机制
推荐系统
(引入)随着互联网的飞速发展,各种各样的商品、歌曲、电影和文档资料等信息以指数爆炸的趋势呈现。推荐系统的出现使得用户能够在海量的信息中快速而准确地筛选出自己需要的内容,同时也提升了平台的用户转化率以及经济效益。许多平台中,基于会话序列的推荐的应用更加广泛,因为这使得平台可以从匿名的会话信息中预测用户的行为,从而更加精准的预测结果。
近年来,因为图结构对会话序列问题有着天然的适应性,基于图神经网络的推荐算法越来越多的场景中使用到,并且在匿名推荐场景中也有着出色的表现。然鹅,现在的基于图神经网络的会话序列推荐算法也不可避免地存在一些劣势。尽管现在的推荐算法可以通过图结构的内部信息获得的推荐效果更加精准,但是这些算法都一般只使用当前会话序列中的信息来建模用户的偏好信息,忽略了会话的全局信息,不能很好地挖掘到全局信息;此外,这些算法也没有重视和运用图中比较复杂的结构信息,并且信息传播方式的单一性使图神经网络过早地进入平滑的状态,从而一定程度上影响了推荐的性能。
(研究内容)本文针对已有研究工作的不足,主要从以下方面进行改进优化:
(1)本文在原有模型的基础上对初始特征向量进行了加工处理,利用动态全局邻居注意、多通道图神经网络灵活地创建了会话图、全局图和共识图,并得到对应的会话表示,更加全面地提取了全局信息。
(2)引入了图形位置编码器,对得到的融合了会话图和全局图的共识图进行了位置嵌入,得到有位置嵌入的会话表示,从而得到更加精准的全局信息,对后续操作提取全局信息奠定了基础,优化了原模型的输入数据。
(3)提出一种新的带注意力的游走策略。在惰性随机游走策略的基础上,让传播节点自身拥有足够的注意力权重,则在特征传播的过程中,图节点能够让相邻节点信息和自身信息的比列达到平衡,并避免图中信息过早进入过度平滑状态得到不良推荐效果的情况。
本文结合三个数据集进行实验,实验结果验证了本文提出的方法和模型优于一些现有的方法,对用户下次点击预测更加精准。
复旦大学
知识图谱; 表示学习; 链接预测; 多元关系; 超关系
作为人工智能的重要基石, 知识图谱能够从互联网海量数据中抽取并表达先验知识, 极大程度解决了智能系统认知决策可解释性差的瓶颈问题, 对智能系统的构建与应用起关键作用. 随着知识图谱技术应用的不断深化,旨在解决图谱欠完整性问题的知识图谱补全工作迫在眉睫. 链接预测是针对知识图谱中缺失的实体与关系进行预测的任务, 是知识图谱构建与补全中不可或缺的一环. 要充分挖掘知识图谱中的隐藏关系, 利用海量的实体与关系进行计算, 就需要将符号化表示的信息转换为数值形式, 即进行知识图谱表示学习. 基于此, 面向链接预测的知识图谱表示学习成为知识图谱领域的研究热点. 从链接预测与表示学习的基本概念出发, 系统性地介绍面向链接预测的知识图谱表示学习方法最新研究进展. 具体从知识表示形式、算法建模方式两种维度对研究进展进行详细论述. 以知识表示形式的发展历程为线索, 分别介绍二元关系、多元关系和超关系知识表示形式下链接预测任务的数学建模. 基于表示学习建模方式, 将现有方法细化为 4 类模型: 平移距离模型、张量分解模型、传统神经网络模型和图神经网络模型, 并详细描述每类模型的实现方式与解决不同关系元数链接预测任务的代表模型. 在介绍链接预测的常用的数据集与评判标准基础上, 分别对比分析二元关系、多元关系和超关系 3 类知识表示形式下, 4 类
知识表示学习模型的链接预测效果, 并从模型优化、知识表示形式和问题作用域 3 个方面展望未来发展趋势
知识图谱,实体识别,关系抽取,图神经网络,意图分析,因果推理
医疗诊断
随着信息技术的飞速发展,智能化医疗诊断模型在医疗领域发挥着越来越重要的作用,其通过对海量医疗数据进行分析处理来抽取数据中的医疗知识,帮助医疗人员快速了解病人信息以做出更加准确合理地医疗决策。智能化医疗诊断模型增加了医疗资源的利用率,使有限的医疗资源能够服务更多的人群,在一定程度上缓解了医疗不平衡问题,推动了医疗领域的发展。因此,利用人工智能技术对医疗数据进行分析应用,以实现医疗智能化,具有前瞻性的研究意义和高度的应用价值。知识图谱作为一个表示实体关系的语义网络,能够帮助医疗模型更加准确、快速地获取信息,有效地为医疗模型提供医学知识支撑并为其预测结果提供医学解释。因果推理可以根据知识图谱中的因果关系确定从疾病特征到疾病原因的因果路径,预测患者所患疾病种类并挖掘导致该疾病发生的因素,帮助医疗人员更准确地完成治疗方案的制定,提高医疗质量和效率。
本文研究的主要目的是对医疗领域的数据进行深度挖掘,构建出一个更加有效、快捷、准确且有一定规模的医疗知识图谱。并基于知识图谱进行因果推理,实现疾病预测和病因溯源。本文主要工作内容包括以下三个方面:
1、医疗知识图谱的构建:本文采用爬虫技术对国内流行的医疗知识网站进行数据爬取,对爬取到的文本医疗数据进行预处理,作为医疗知识图谱的数据来源。对于预处理后的非结构化医疗数据,本文使用基于 BiLSTM-CRF 的实体识别模型对其进行医疗命名实体识别,并提出了基于依存关系和图神经网络的关系抽取模型来挖掘医疗实体间的关系,获得结构化的医疗关系三元组数据。利用 py2neo 工具连接 Neo4j 数据库,将结构化的医疗关系三元组数据导入 Neo4j 数据库中,生成可视化的医疗知识图谱。针对本文提出的关系抽取模型,我们在公开数据集上与三类关系抽取模型进行了对比实验,结果表明本文提出的关系抽取模型 F1 得分为 86.2%,优于其他对比模型,验证了本文所提模型的有效性。
2、用户意图分析:本文提出了基于 Bert+TextGAT 的用户意图识别模型,将用户问题视作文本数据,利用文本预训练模型 Bert 捕获文本的上下文信息,获取文本的词嵌入表示,利用词共现矩阵和句法依存分析挖掘文本的结构信息,通过图注意力网络的消息传递机制进行文本信息聚合,识别用户意图,帮助医疗诊断模型更好地理解患者的需求和症状。
3、疾病预测和病因溯源:结合上述两项工作构建医疗诊断模型,首先,构建基于知识图谱和 RCNN 的疾病预测模型,根据用户意图和用户问句中包含的疾病症状信息,诊断出疾病症状对应的疾病,确定知识图谱中从症状实体到疾病实体的路径,然后利用因果关系进一步推理出疾病实体到原因实体的路径,确定“症状-疾病-原因”的因果路径,获取导致患者症状出现的原因,完成疾病预测和病因溯源任务。
兴趣点推荐;注意力机制;时序门控图神经网络;窗口池化;实时偏好
兴趣推荐
现有的大多数兴趣点(point of interest, POI)推荐系统由于忽略了用户签到序列中的顺序行为模式以及用户的个性化偏好对于 POI 推荐的影响,因而导致了 POI 推荐系统性能较低,推荐结果不可靠,进而影响用户体验。为了解决上述问题,提出一种融合时序门控图神经网络的兴趣点推荐方法。首先,运用时序门控图神经网络(temporal gating graph neural network, TGGNN)学习 POI embedding;其次,采用注意力机制捕获用户的长期偏好;然后,通过注意力机制融合用户的最新偏好和实时偏好,进而捕获用户的短期偏好。最后,通过自适应的方式结合用户的长期和短期偏好,计算候选 POIs 的推荐得分,并根据得分为用户进行 POI 推荐。实验结果表明,与现有方法相比,本文方法在召回率和平均倒数排名这两项指标上均有较为明显的提升,因此可以取得很好的推荐效果,具有良好的应用前景。
知识图谱;图神经网络;构建技术
作为知识的一种有效的表征方式,知识图谱网络可以用于表示不同类别之间丰富的事实信息,成为有效的知识管理工具,并在知识工程和人工智能领域的应用和研究取得了较大的成果。知识图谱通常表现为一种复杂的网络结构,其非结构化特点致使将图神经网络应用于知识图谱的分析和研究成为了学术界的研究热点。本研究旨在对基于图神经网络的知识图谱构建技术提供广泛、完整和全面的研究,以解决两类知识图谱构建的任务,包括:知识抽取(实体、关系和属性抽取)和知识合并与加工(链接预测、实体对齐和知识推理等)。在此基础上,我们还研究了基于高级的图神经网络方法用于知识图谱相关的应
用,如推荐系统、问答系统和计算机视觉等。最后提出了基于图神经网络的知识图谱应用的未来研究方向,并对这个快速增长领域中的各方向的研究进展进行展望。
(1)GNN 模型的可扩展性
GNN(图神经网络)模型长期存在可扩展性问题,
在处理大规模图数据时。虽然许多新的技术和算法已被
开发用于提高 GNN 模型的可扩展性,但是仍然存在一
些问题导致 GNN 模型的可扩展性较差。首先是图的规
模,GNN 模型需要处理大规模的节点和边实体,会导
致内存消耗和复杂度等问题,其次是许多 GNN 模型再
设计时考虑了特定类型的图数据,可能不太适合处理其
他类型的数据。(例如:现有的 GNN 模型主要用于处理
自然语言处理数据,但对于医疗数据,地震解释数据,
还未能挖掘到有效的处理方法),为了提高 GNN 的可
扩展性,需要考虑这些因素,并寻找相应的解决方案。
(2)图神经网络的工业应用
现有的图神经网络的研究大多基于理论上公开数
据集上,没有应用于大规模的实际应用领域,例如:地
质构造建模、航空航天、金融领域等,很少使用图神经
网络进行处理,领域知识图谱对数据的准确性要求很高,
需要得到准确的结果,但图神经网络的泛化能力仍有待
提升,最终实现工业落地并发挥图神经网络处理像知识
图谱这样图结构的数据,仍旧需要不断研究。
(3)知识图谱的工业落地
现如今对知识图谱的需求呈现爆炸式增长,但是对
于领域知识图谱的构建仍然存在一些局限性,首先是知
识图谱的用处,通过各个深度学习的方法构建的知识图
谱能否应用于垂直领域,会不会存在花费大量人力物力
构建的知识图谱的问题,因为深度学习的不可解释性和
不确定性,导致无法满足实际工程的需求。以及会不会
存在知识图谱交叉的问题,构建的多个领域知识图谱在
很大程度上是重合的,从而造成了资源浪费。由于图神
经网络仍然是个黑盒子,使用图神经网络构建的知识图
谱仍旧无法在工业上落地。
多模态推荐;多模态融合;注意力机制;图神经网络;推荐系统;门控图神经网络
推荐算法
分别对不同模态建立交互图,在单模态图上聚合高阶邻居信息,同时利用注意力机制去除噪声和区分邻居信息重要性,来进行用户偏好建模。在最后模态特征融合时,设计轻注意力模块去捕获用户对不同模态的偏好,同时模块设计兼顾可扩展性和便利性。
后续引入更多辅助信息带来的影响进行研究,实现进一步提升推荐准确性和验证轻注意力模块有效性的目的。
图神经网络;属性图;注意力机制;显式反馈;电影推荐
电影推荐