基于图学习综述

2 图结构

2.1 Tree Graphs

物品按照类别进行层次划分

这种层次图可以关联到同类别或相似类别的两个项目
也可以避免把同一个子类的项目重复推荐

只有物品

2.2 Unipartite Graphs

至少存在两个同类图

一个是用户之间的社会关系
社会影响会在图上传播,产生级联影响

另一个是两个一起出现在购物车或者订单的物品
一起出现的物品可以表示两者互补或竞争的关系,还可以表现一些用户的购物模式

2.3 Bipartite Graphs

用户和物品之间的行为关系(如点击、购买、收藏等)
这可以有同类和异类的图

2.4 Attributed Graphs

用户的属性特征,找到相似用户(朋友以及其他同类人)

物品的属性特征和共现能够表现一些物品的共现模式。

2.5 Complex Heterogeneous Graphs

有一张用户和物品交互的 bipartite 图,即用户历史行为

另一张是用户社会关系图或物品特征图,即用户关系和物品特征

两张图中共同的用户或物品作为连接两张图的桥梁

2.6 Multi-source Heterogeneous Graphs

在解决冷启动和稀疏的问题上,有其他多源的相关信息(用户简介、社会关系、物品特征、物品共现)

也就是三张及其以上的图

结合更多的图意味者更多互补的信息,也意味着更多的矛盾


3 方法

3.1 Random Walk

让一个随机游走者用户和/或项目为节点的图上游走,每一步都有一个预定义的转移概率,用来模拟用户和项目之间的隐含偏好或者交互性传播,然后根据随机游走者经过一定步骤后落在节点上的概率对这些候选节点进行排序推荐。

除了基本的随机游走[Baluja etal. 2008]
还有带有重启的随机游走[Bagci and Karagoz, 2016; Jiang etal. 2018]
它设置了一个在每次转换中跳回起始节点的恒定概率,并且通常用于包含许多节点的图中,以避免从起始节点的特定上下文中移出。

为了更个性化的推荐,有计算每个步骤的用户特定转移概率 [Eksombatchai et al., 2018]

缺点

  1. 需要为每个用户在每一步生成所有候选项的排名分数,因此效率较低,很难应用于大规模图上
  2. 基于随机游走的推荐算法是基于启发式的,缺乏优化推荐目标的模型参数,大大降低了推荐性能

3.2 Graph Representation Learning

将每个节点映射成一个潜在的低维表示,从而将图的结构信息编码到其中

Graph Factorization Machine based RS (GFMRS)

使用因子分解机(例如,矩阵分解)基于图上的元路径对节点间的交换矩阵进行分解,以获得每个节点(例如用户或项目)的潜在表示,这些表示将用作后续推荐任务的输入 [Wang et al., 2019d]

缺点
这种模型很容易受到观测数据稀疏性的影响,推荐可能不太理想

Graph Distributed Representation based RS (GDRRS)

遵循 Skip-gram 模型,学习图中每个用户或项目的分布式表示,将用户或项目的自我信息及其相邻关系编码为低维向量[Shi et al., 2018]

使用随机游走来生成在一个元路径中同时出现的节点序列,然后使用 skipgram 或类似的模型来生成推荐的节点表示。

Graph Neural Embedding based RS (GNERS)

通常使用神经网络来学习用户或项目在图中的嵌入

神经嵌入模型很容易与其他下游的神经推荐模型集成在一起,以构建端到端的 RS,可以将两个模型联合训练在一起以获得更好的优化

有如属性图[Han et al.,2018]、异构图[Hu et al.,2018]、多源异构图[Cen et al.,2019] 等

3.3 Graph Neural Networks (GNN)

Graph Attention network based RS (GATRS)

注意机制强调那些更重要的用户或项目对特点用户或项目的影响

注意的权重用来集中邻居的信息到目标用户或项目的表示中

应用于社会图[Fan et al., 2019]、项目会话图[Xu et al., 2019]和知识图[Wang et al., 2019c]

Gated Graph Neural Network based RS (GGNNRS).

将门控递归单元 (GRU) 引入到 GNN 中,通过迭代吸收图中其他节点的影响来学习优化的节点表示,综合捕捉节点间的关系。

应用于项目之间复杂转换模型的会话图[Wu et al., 2019b],或不同类别时尚产品之间的复杂交互模型[Cui et al.,2019,Wang]

Graph Convolutional Network based RS (GCNRS)

通过图结构和节点特征信息迭代地聚合局部图邻域的特征信息

通过卷积和池化操作,GCN能够有效地汇总来自邻域的信息来学习用户和项目的信息嵌入,也就是信息来源更广

GCN 用于在社交推荐中对社交图进行影响扩散,在用户-项目交互图上挖掘隐藏的用户-项目连接信息,以减轻协作过滤中的数据稀疏性问题,并通过在基于项目属性的知识图上挖掘其相关属性来捕获项目间的相关性

3.4 Knowledge-Graph Approach

基于外部知识(副信息)构建知识图谱,探索用户或项目之间的隐式或高阶连接关系

由于利用了额外的知识,KGRS能够更好地理解用户的行为和物品特征,从而产生了更多可解释的建议[Wang et al., 2018a]

Ontology based KGRS (OKGRS)

OKGRS 构建了一个基于用户或项目本体的层次化 KG,用于表示树形图中的层次化归属关系

在这个图中,根节点表示最粗粒度的类别,如食物;而叶节点表示特定的项目,如面包。这也符号选择物品的顺序

Side information based KGRS (SKGRS)

SKGRS 基于用户或项目的副信息(例如项目的属性)构建 KG,以发现它们之间的隐式联系

KG 被广泛用于协作过滤中,通过加入用于改进推荐的附加信息来丰富项目表示

Common knowledge based KGRS (CKGRS)

CKGRS 主要基于共同知识构建语义库,如从网络文本、领域知识等中提取一般语义。

CKGRS 包含了推荐产品或服务之间的外部隐式关系,这些产品或服务是从共同知识中提取出来的,用于改进推荐。

应用于新闻推荐中,发现新闻和电子商务之间潜在的知识层面的联系 [Luo et al, 2019]

基于图学习综述_第1张图片

4 进一步的研究方向

4.1 动态图学习

在现实生活中,包括用户和项目在内的对象以及它们之间的关系随着时间的推移不断变化,从而产生动态图而不是静态图。

4.2 因果推断

因果推理是发现对象或动作之间因果关系的主要技术。

我们仍然远远没有充分和完全地理解用户选择背后的原因和意图,这对于提出可靠和可解释的建议是非常关键的。

将因果推理引入 GLRS 可以构建更高级和更易于解释的 RS。基于 RS 的多源多模态图学习
实际上,推荐的数据点可以来自多个来源,采用不同的方式,但它们是相互关联的,而且协作有助于落实推荐。
此外,某些类型的数据点可能会给其他数据点带来一些干扰,这些不同的数据点之间甚至可能存在一些矛盾。

4.3 大规模的实时图学习

图结构数据通常需要更多的时间和空间来处理,更不用说在它上面执行复杂的机器学习技术来产生建议。为此,有必要进一步研究更先进的 GLRS,使大规模和实时计算产生建议。

你可能感兴趣的:(【图学习】)