基于知识图谱的推荐系统

基于知识图谱的推荐系统

推荐系统: 核心目标是通过分析用户行为、兴趣、需求等信息, 在海量的数据中挖掘用户感兴趣的信息, 如商品、新闻、POI (point of interest) 和试题 等。

个性化推荐算法是推荐系统的核心, 其主要可以被分为3 类, 即

  1. 基于内容的推荐算法
  2. 基于协同过滤的推荐算法
  3. 混合推荐算法

主要问题:

  1. 用户和物品之间的行为关系数据的稀疏问题
  2. 对新用户或者新物品进行推荐时存在的冷启动问题

将协同过滤推荐算法和其他辅助信息相结合(例如, 用户与物品的属性特征、用户社交网络信息等) 搭建混合推荐系统来解决以上问题

  • 知识图谱作为混合推荐系统中一类有效的辅助信息

知识图谱

知识图谱本质:是一个存储知识实体与实体之间关系的结构化网络, 可以帮助形式化描述、理解现实世界的事物及其相互关系。

知识图谱是一种有向信息异构网络。 其包含节点"实体" 与有向边"关系",

  • 因而蕴含了推荐系统中对于物品的大量背景信息, 以及物品之间的关系。
  • 并且它可以与用户行为数据构成的用户-物品网络集成起来,从而扩展了用户与商品之间存在的隐藏的关联关系, 补充了用户与物品交互数据, 因此可以更进一步地提升推荐效果.
  • 另外,基于知识图谱的推荐方法为构建可解释推荐系统提供了一些新的思路(即不同的路径)

基于知识图谱的推荐系统——方法

两类技术方法:基于嵌入的方法 & 基于路径方法

1 基于嵌入的方法

基于嵌入的应用知识图谱在推荐系统的方法:主要是通过图嵌入的方法对实体和关系进行表征, 进而扩充原有物品和用户表征的语义信息

1.1 基于Trans 系列的图谱嵌入方法

这类方法目的是将实体和关系映射到连续的向量空间中, 获得低维稠密表示。主要包括TransE, TransH, TransR 和TransD

在通过Trans 系列的图谱嵌入方法学习得到实体、关系的表征之后, 就可以用来扩充原有推荐系统中物品、用户的表征

[例]

  • Zhang 等[10] 使用TransR 的方法在知识图谱中学习物品相关实体的结构化知识, 得到物品的结构化语义嵌入表征, 从而对推荐系统中原有基于协同过滤中每个物品V_j 的隐向量e_j 进行扩充
  • Wang 等[2].针对新闻推荐中物品的特殊性, 首先利用TransD 对实体进行表征之后, 再通过对新闻文本先进行实体抽取, 结合实体嵌入表征和原有的词级别嵌入表征对每条新闻进行表征, 从而提升了新闻推荐系统中物品语义的关联性——DKN ⭐

1.2 基于异质信息网络的图嵌入方法

知识图谱因其节点和边具有不同的类别, 又可以被称作一种异质信息网络图, 因此可以使用一些异质信息网络图的嵌入的方法对图上的实体和关系进行表征。

2 基于路径方法

基于路径的应用知识图谱在推荐系统的方法:主要是挖掘基于图谱用户、物品之间多种连接关系

  • 由于知识图谱可以和推荐系统中的用户-物品交互数据构成一个异质信息网络(heterogeneous information networks), 因此可以在推荐系统中引入传统的对异质信息网络进行挖掘的元路径(Meta-path) 的方法。

基于知识图谱的推荐系统——应用

1 传统推荐系统

传统推荐系统是指在给定用户-物品的交互数据以及可能包含用户、物品的属性数据下, 对用户推荐其可能感兴趣的商品

  • 电影

  • 图书

  • 新闻 ⭐

    新闻推荐属于一类特殊的推荐场景, 因为新闻更新十分频繁造成其具有冷启动、交互数据稀疏的问题, 并且新闻中的文本是语义高度浓缩的, 充满实体和常识。为此, 在应用知识图谱到新闻的推荐场景中时, 首先会对它做实体链接[93, 94], 从而将新闻文本中的实体提取出来, 并和图谱中的实体关联, 从而进行后续的推荐算法. 这类任务主要应用的是Bing-News [2] 数据集, 可以使用一些通用类知识图谱如Wikidata [42] 和Microsoft Satori 进行实体关联.

  • 电商商品

  • POI

  • 音乐

  • 药物

2 序列化推荐系统

序列化推荐系统的目的在于捕捉用户兴趣的变化模式, 从而基于用户历史的交互信息预测当前的兴趣点。

目前经典的建模方法包括:

  • 基于马尔科夫(Markov) 的模型
  • 循环神经网络recurrent neural network (RNN) 的模型

主流建模序列化推荐系统的方法:基于循环神经网络的方法

3 可解释推荐系统

可解释推荐系统的目的是:在推荐物品给用户的同时给出推荐的原因, 从而提升推荐系统的可靠性

目前研究者设计的知识图谱下的可解释推荐系统主要是基于路径推荐的方法, 如图所示, 通过知识图谱中实体关联的数据将物品进行关联,并通过后续不同建模的方式进行可解释性的分析.

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-GqpO6fSm-1603109174089)(F:\Notebook\Project\基于知识图谱的推荐系统\image-20201018180245052-1603015457816.png)]

参考

[2] Wang H, Zhang F, Xie X, et al. DKN: deep knowledge-aware network for news recommendation. In: Proceedings of the 2018 World Wide Web Conference, 2018. 1835–1844

[10] Zhang F, Yuan N J, Lian D, et al. Collaborative knowledge base embedding for recommender systems. In: Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2016. 353–362

[42] 42 Vrandeˇci´c D, Kr¨otzsch M. Wikidata: a free collaborative knowledge base. Commun ACM, 2014, 57: 78–85

[93] Milne D, Witten I H. Learning to link with wikipedia. In: Proceedings of the 17th ACM Conference on Information and Knowledge Management, 2008. 509–518
[94] Sil A, Yates A. Re-ranking for joint named-entity recognition and linking. In: Proceedings of the 22nd ACM International Conference on Information & Knowledge Management, 2013. 2369–2374

你可能感兴趣的:(推荐)