Knowledge Graph Convolutional Networks for Recommender Systems

Knowledge Graph Convolutional Networks for Recommender Systems

ABSTRACT

背景

为了减轻基于协作过滤的推荐系统的稀疏性和冷启动问题,研究人员和工程师通常收集用户和项目的属性,并设计精细的算法目的是利用这些额外的属性信息。一般来说,属性不是孤立的,而是相互联系的,形成了一个知识图谱(KG)。

创新点

提出了知识图卷积网络(KGCN),这是一个端到端的框架,通过在KG上挖掘它们的相关属性来有效地捕捉项目间的相关性。
为了自动发现KG的高阶结构信息和语义信息,从知识图谱每个实体的邻居采样作为感受野,然后当计算一个给定实体表示的时候,将邻里信息与偏执值结合起来考虑。感受野可以扩展到多个跳,以模拟高阶邻近信息,并捕获用户潜在的远程兴趣。

INTRODUCTION

基于CF用户和项目交互的缺点

协同过滤(C F)是一种传统的推荐技术,它分配基于用户和项目ID的向量表示,然后通过特定的操作对它们的交互进行建模。例如:内积和神经网络。基于CF的方法通常存在用户-项目交互的稀疏性和冷启动问题。
为了解决这些限制,研究人员通常采用特征丰富的场景,用户和项目的属性被用来补偿稀疏性并提高推荐的性能。

与不含KG的方法相比,将KG纳入推荐的好处

(1)KG项目之间丰富的语义关联有助于探索它们之间的潜在联系,提高推荐结果的准确性
(2)KG中的各种关系有助于合理地扩大用户的兴趣,增加推荐项目的多样性
(3)KG连接用户历史上喜欢的和推荐的项目,从而为推荐系统带来可解释性

KGCN

.设计目标是自动捕捉KG中的高阶结构和语义信息。KGCN的关键思想是在计算KG中给定实体的表示时,聚合和合并带有偏见的邻域信息。
优势:
(1)通过邻域聚合的操作,成功捕获本地邻近结构并存储在每个实体中
(2)邻居对应的权重是由依赖于连接关系和特定用户的分数来加权的,这既表征了KG的语义信息,也表征了用户在关系中的个性化兴趣。
给定实体的邻域定义也可以分层扩展到多跳,以模拟高阶实体依赖关系,并捕获用户潜在的远程兴趣。

Our contribution in this paper are summarized as follows:

(1)提出了知识图卷积网络,一个端到端的框架,探索用户在知识图谱做推荐上的偏好。通过扩展知识图谱中每个实体的每个感受野,KGCN能够捕捉用户的高阶个性化兴趣…
(2)在三个现实世界的推荐场景上进行实验…结果表明KGCN-LS对最先进基线的有效性…
(3)向研究人员发布KGCN的代码和数据集(知识图),以验证报告的结果并进行进一步的研究。代码和数据可在
https://github.com/hwwang55/KGCN. 获得

RELATED WORK

GCN

GCN可分为谱聚类法和非谱聚类法。本文提出一种特殊类型图(即知识图)的非谱聚类方法。

KNOWLEDGE GRAPH CONVOLUTIONAL NETWORKS

知识图感知推荐问题

在许多推荐场景中,一个项目v∈V对应于一个实体e∈ E. 例如,在书籍推荐中,“A Song of Ice and Fire"项目也出现在知识图中(与实体有相同的名字)。

给定用户-项交互矩阵Y以及知识图G,目的是预测用户u是否对他以前没有交互的项目v有潜在的兴趣。目标是学习一个预测函数在这里插入图片描述,其中在这里插入图片描述表示用户u参与项目v的概率,在这里插入图片描述表示函数F的模型参数

KGCN Layer

提出KGCN是为了捕捉知识图中实体间的高阶结构邻近性。
eg.描述单个KGCN层
在这里插入图片描述
使用了一个函数g:通过内积的方式来计算用户和关系之间的分数。ur是用于u和关系r的向量表示。
在这里插入图片描述
描述关系r对用户u的重要性。
例如,一个用户可能有更多潜在的兴趣,在他看过的电影历史记录中,是因为喜欢一个明星而观看电影,而另一个用户可能更关心电影的“类型”。
在这里插入图片描述
在这里插入图片描述
为了表征项目v的拓扑邻近结构,我们计算了v的邻域的线性组合。e是实体e的向量表示。
.当计算实体的邻域表示时,用户关系分数充当个性化过滤器,因为聚集了相对于用户特定分数的偏差邻居。
在现实世界的知识图中,N(e)表示一个实体的邻居集合,它的大小可能在所有实体上都有很大的差异。为了使每个批次的计算模式保持固定和更有效,统一采样固定大小。为每个实体设置一组邻居,而不是使用其完整邻居数据。
Knowledge Graph Convolutional Networks for Recommender Systems_第1张图片
这是一个给定实体的两层感受野的示例。
KGCN层的最后一步是将实体向量表示v及其邻域表示vuS(v)聚合为单个向量。因此这里用到了聚合器。
论文中在KGCN中使用了三种类型的聚合器,比较评估聚合器的性能。
图中蓝色节点和其邻居节点(绿色节点)的向量表示,混合以形成下一次迭代(蓝色节点)的表示形式。

Learning Algorithm

通过一个KGCN层,一个实体的最终向量表示依赖于它本身以及它的近邻节点,我们命名为一阶实体表示。KGCN从一层扩展到多层,以更深入的方式合理地探索用户的潜在兴趣。该技术是直观的:传播每个实体的初始表示(0阶表示)到它的邻居形成一阶实体表示,然后可以重复这个过程,即进一步传播和聚合一阶表示以获得二阶表示.一般来说,一个实体的h阶表示是它自身及其邻居表示的混合。这是KGCN的重要性质。
H表示感受野的最大深度(或等效的聚合迭代次数),由表示向量附加的后缀[h]表示h阶。
Knowledge Graph Convolutional Networks for Recommender Systems_第2张图片
在这里插入图片描述
项目v的向量表示与用户表示u一起输入函数f:Rd×Rd→R,用于预测用户u对项目v概率。

EXPERIMENTS

评估KGCN的三个现实世界的场景:电影,书籍和音乐推荐。

Datasets

MovieLens-20M 是电影推荐中广泛使用的基准数据集,它由MovieLens网站上大约2000万个明确的评级(从1到5)组成。
https://grouplens.org/datasets/movielens/
Book-Crossing包含了Book-Crossing社区100万本书的评分(从0到10)
http://www2.informatik.uni-freiburg.de/~cziegler/BX/
Last.FM包含来自Last.fm在线音乐系统的两千名用户的音乐人收听信息。
https://searchengineland.com/library/bing/bing-satori

CONCLUSIONS

本文为推荐系统提出了知识图卷积网络。KGCN通过选择性地聚合邻域信息,将非谱聚类GCN方法扩展到知识图,能够学习KG的结构信息和语义信息,以及用户的个性化和潜在兴趣。以批处理的方式实现本文的方法,它能够在大型数据集和知识图上操作。通过对真实世界数据集(电影、书籍和音乐推荐)的广泛实验,证明了KGCN的性能始终优于最先进的基线。

你可能感兴趣的:(知识图谱用于推荐,KGCN模型)