这篇和之前的一篇工作简称是一样的,但是内容完全不同,本文是Robust Graph Collaborative Filtering (RGCF),注意甄别
最近,图神经网络(GNN)作为一种有效的协作过滤(CF)方法已成功地应用于推荐系统。然而,现有的基于GNN的CF模型存在用户-项目交互数据的噪声,这严重影响了实际应用中的有效性和鲁棒性。尽管已有几项关于推荐系统中数据去噪的研究,但它们要么忽略了GNN消息传播中噪声交互的直接干预,要么在去噪时未能保持推荐的多样性
为了解决上述挑战,提出了一种新的基于GNN的协作过滤方法,该方法通过对不可靠交互进行降噪,名为RGCF(鲁棒图协作过滤)。
我们在RGCF中设计了两个主要的技术模块。首先,我们通过识别更可靠的消息传递交互(图去噪模块)来直接改进图结构学习。其次,我们通过将从去噪交互数据和多样性增强数据(多样性保持模块)中学习到的用户偏好进行关联,进一步增强了推荐的多样性。
图1:(a)RGCF采用图去噪模块来构造去噪交互图,并通过从多样性增强图中提取多样性信息来进一步保持推荐的多样性。(b) 图形去噪模块通过减少它们的权重或基于估计的可靠性对它们进行修剪来减轻噪声交互的影响。(c) 多样性保持模块随机引入具有高可靠性的未观测交互,以丰富去噪图。
具有相似特征或结构作用的节点更容易相互作用。由于节点特征在CF中可能不可用,因此基于交互图中用户和项目之间的结构相似性来估计观察到的交互的可靠性程度。
设置为将用户和项目结构特征转换为相同的隐藏空间,生成用户和项目的结构特征矩阵。:
在相互作用图G中测量它们的结构相似性,使用余弦相似性函数进行相似性测量:
因此,将余弦相似度转换为归一化余弦距离作为交互的可靠度:
估计的可靠性程度不同于先前研究中定义的重要性权重,因为可靠性程度是基于同质性理论启发的结构相似性而不是注意力机制来测量的。
基于用户-项目交互的估计可靠度,我们对交互图G应用了软去噪策略和硬去噪策略,这得到了去噪交互图:
图去噪模块通过减少交互图中的权重或修剪它们来减轻GNN中噪声交互的负面影响。
(PS:硬去噪:直接剪掉低 可靠度的边;软去噪:对剩余的交互边进行权重分配)
传播机制与LightGCN一致
层内传递:
多层聚合:
还是老样子, 预测层由内积实现,loss嘛,还是熟悉的BPR
图去噪的一个副作用是它可能会削弱推荐多样性。所以提出了多样性增强图
为了在去噪时平衡推荐的准确性和多样性,关键思想是在去噪交互图中引入多样但可靠的边。
构建过程包括两个步骤:随机抽样和可靠性感知选择。
具体地说,首先,我们统一采样一组非连续用户项对,概率为p:
请注意,候选集C在每个训练循环中随机采样,这确保了要添加的交互的多样性。
然后,我们选择具有高可靠度的用户项对,这可以正式定义为:
注意,与图去噪模块不同,图去噪从固定观测数据中移除不可靠的交互,多样性保持模块从动态候选交互中选择交互。多样性来自随机抽样,可靠性来自可靠性感知选择。
然后在这个多样性增强图中利用公式7方式进行嵌入传播,得到新的嵌入
(2)多样性保持
针对于两个不同的图学到的嵌入,是否会出现偏差,提出基于互信息最大化(MIM)的辅助自监督任务,以拉近两种节点表示,并在两个因素之间进行权衡。
互信息最大化:通过最大化节点表示的互信息,我们可以捕获图的不同视图之间的相关性,并识别原始图的最基本信息。
噪声图和多样性增强图的嵌入
损失为:
BPR+DIV+L2
我们随机地将5%的观察到的用户项交互记录替换为噪声交互记录,以构建合成数据集。我们只将噪声注入训练集和验证集,保持测试集不变,以确保结果的可靠性。
其中,“w/oGD”、“w/oDP”和“w/oboth”分别表示在RGCF中移除图去噪模块、移除多样性保持模块和移除两者。
去除图去噪模块主要影响准确性(Recall),而去除多样性保持模块主要影响多样性(Coverage)
数据集构建过程,我们通过用随机噪声交互替换一定比例的原始交互来污染训练集和验证集,同时保持测试集不变。
增加噪声交互的比率会显著降低所有基线方法的性能。RGCF的性能退化比其他方法小得多。RGCF的性能始终优于基线方法。
选择合适的系数可以在应用RGCF时平衡推荐的纯度和多样性。
将所提出的去噪策略,应用于多个CF模型,实测,有效
为了进一步证明RGCF减少了噪声交互对训练过程的负面影响,
LightGCN受到了噪声交互的严重影响。在RGCF的训练过程中,噪声交互的预测分数逐渐降低,噪声交互和正常交互的分数之间存在明显的差距,这表明RGCF可以有效地区分噪声和正常交互。