Efficient Heterogeneous Collaborative Filtering without Negative Sampling for Recommendation
Chong Chen, Min Zhang, Weizhi Ma, Yongfeng Zhang, Yiqun Liu and Shaoping Ma
Tsinghua University, Rutgers University
http://yongfeng.me/attach/chen-aaai2020.pdf
关于推荐的最近研究主要集中在探索STOA神经网络来提升模型的表达能力,同时利用负采样策略来高效学习。
尽管比较高效,现有方法并没有比较好的考虑两个重要问题,1. 负采样的波动比较剧烈,这就使得在实际应用中基于采样的方法难以达到最优的排序效果;
2. 尽管异质反馈(浏览,点击以及购买)在很多线上系统中广泛存在,大部分现有方法只考虑一种主要的用户反馈,比如购买行为。
这篇文章提出一种新的非采样迁移学习解决方案,即高效异质协同过滤(EHCF),用于Top-N推荐。该方法不仅可以对细粒度用户商品关系进行建模,而且可以从整个异质数据(包含无标签数据)中高效的学习模型参数,同时时间复杂度相对较低。
在三个真实数据集上的大量实验表明,在传统(单行为)和异质场景中,EHCF的效果显著优于STOA推荐方法。此外,EHCF在训练高效方面具有显著提升,进而使其更容易用于真实大规模系统中。
该项研究有利于基于整体数据的高效神经网络方法进一步的发展。
用户行为的多样性图示如下
其中包括了浏览、加购物车以及购买行为等
现有方法的缺陷在于负采样具有随机性因素太多,进而导致难以得到最优解
其二即为没有考虑多种行为之间的转变关系
这篇文章的主要贡献如下
部分现有方法的做法如下
针对只有正样本的数据集,一般有两种做法
这两种做法各有利弊
为了解决上述低效问题,研究人员提出了以下解决方案
本文所提模型的问题描述如下
目标为估计似然度,并且给出top-N推荐列表
模型框架图示如下
用户和商品之间的所有类型的行为都共享同一个嵌入层,似然函数的形式如下
在预测时,多种行为之间的转换过程如下
损失函数定义如下
进一步,损失可以表示为有标签数据和全量数据的组合
借助于内积,可以得到以下表达式
计算复杂度得以缩减。
多任务学习方式如下
数据集信息描述如下
下面是数据集详情
参与对比的基准方法有两大类,其中一类为
另一大类为
评估方法利用击中率和NDCG
参数设置如下
几种方法的效果比较如下
多行为、迁移以及多任务学习的影响如下
下表证明了本文算法的高效性
模型性能随迭代次数的变化趋势如下
本文算法在稀疏数据集依然可以取得较好的效果
不同的控制系数对应的模型效果如下
代码地址
https://github.com/chenchongthu/EHCF
我是分割线
您可能感兴趣
AAAI2020|个性和情绪集成的注意力模型在推荐系统中的应用
ICML2007|深度学习用于协同过滤的开篇作之一(出自深度学习鼻祖之一Hinton)
SIGIR2019|基于BERT的深度学习模型在信息检索中的应用(已开源)
SIGIR2019|基于注意力机制的新型深度学习模型(采莓树模型BIRD,已开源)
SIGIR2019|深度学习如何更好地用于学习排序(LTR)(已开源)
SIGIR2019|利用DeepSHAP来解释神经检索模型(已开源)
SIGIR2019|胶囊网络来解释你喜欢什么不喜欢什么(已开源)
KDD2018|基于GBM的动态定价回归模型
KDD2018|超越deepfm的CTR预估模型深层兴趣网络DIN(已开源)
RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET
SIGIR2018|选择性GBDT(SelGB)用于排序学习(已开源)
AAAI2018|斯坦福大学提出并开源增强生成式模型
ijcai2017|CTR经典模型DeepFM,FNN,PNN,W&D,LR,FM对比(哈工大诺亚方舟提出CTR模型)
ICML2019|一种基于强化学习的推荐系统(GAN用户模型,佐治亚理工学院联合蚂蚁金服提出且已开源)
ICML2018|GBDT中如何寻找影响较大样本(普林斯顿大学联合Yandex提出并开源)
IJCAI2019|基于对抗变分自编码的协同过滤框架VAEGAN
聊聊CatBoost
聊聊XGBoost CatBoost LightGBM RF GBDT
IJCAI2019|新型特征增广GBDT--AugBoost(已开源)
IJCAI2019|清华大学提出并开源新型梯度提升决策树(梯度提升分段线性回归树)
新型梯度提升决策树GBDT-SPARSE(谷歌微软FaceBook加州大学联合提出)
ICML2019|深度学习鼻祖之一Bengio提出并开源图马尔科夫神经网络
GBDT,LR,深度学习如何联合发力(以推荐系统和游戏为例)
大规模GBDT系统应用场景及效果对比(LightGBM,XgBoost,DimBoost等)
新型在线预测模型DeepGBM(基于GBDT扩展的深度学习框架)
顶会中深度学习用于CTR预估的论文及代码集锦 (3)
ICML 2018 深度学习论文及代码集锦(5)
深度学习用于文本摘要的论文及代码集锦
深度学习用于机器翻译的论文及代码集锦
深度学习用于序列标注中的论文及代码集锦
深度学习在推荐系统中的应用及代码集锦(4)
深度学习在OCR中的应用论文及代码集锦 (2)