AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)

Efficient Heterogeneous Collaborative Filtering without Negative Sampling for Recommendation

Chong Chen, Min Zhang, Weizhi Ma, Yongfeng Zhang, Yiqun Liu and Shaoping Ma

Tsinghua University, Rutgers University

http://yongfeng.me/attach/chen-aaai2020.pdf

关于推荐的最近研究主要集中在探索STOA神经网络来提升模型的表达能力,同时利用负采样策略来高效学习。

尽管比较高效,现有方法并没有比较好的考虑两个重要问题,1. 负采样的波动比较剧烈,这就使得在实际应用中基于采样的方法难以达到最优的排序效果;

2. 尽管异质反馈(浏览,点击以及购买)在很多线上系统中广泛存在,大部分现有方法只考虑一种主要的用户反馈,比如购买行为。

这篇文章提出一种新的非采样迁移学习解决方案,即高效异质协同过滤(EHCF),用于Top-N推荐。该方法不仅可以对细粒度用户商品关系进行建模,而且可以从整个异质数据(包含无标签数据)中高效的学习模型参数,同时时间复杂度相对较低。

在三个真实数据集上的大量实验表明,在传统(单行为)和异质场景中,EHCF的效果显著优于STOA推荐方法。此外,EHCF在训练高效方面具有显著提升,进而使其更容易用于真实大规模系统中。

该项研究有利于基于整体数据的高效神经网络方法进一步的发展。

用户行为的多样性图示如下

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第1张图片

其中包括了浏览、加购物车以及购买行为等

现有方法的缺陷在于负采样具有随机性因素太多,进而导致难以得到最优解

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第2张图片

其二即为没有考虑多种行为之间的转变关系

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第3张图片

这篇文章的主要贡献如下

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第4张图片

部分现有方法的做法如下

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第5张图片

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第6张图片

针对只有正样本的数据集,一般有两种做法

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第7张图片

这两种做法各有利弊

为了解决上述低效问题,研究人员提出了以下解决方案

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第8张图片

本文所提模型的问题描述如下

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第9张图片

目标为估计似然度,并且给出top-N推荐列表

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第10张图片

模型框架图示如下

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第11张图片

用户和商品之间的所有类型的行为都共享同一个嵌入层,似然函数的形式如下

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第12张图片

在预测时,多种行为之间的转换过程如下

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第13张图片

损失函数定义如下

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第14张图片

进一步,损失可以表示为有标签数据和全量数据的组合

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第15张图片

借助于内积,可以得到以下表达式

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第16张图片

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第17张图片

计算复杂度得以缩减。

多任务学习方式如下

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第18张图片

数据集信息描述如下

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第19张图片

下面是数据集详情

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第20张图片

参与对比的基准方法有两大类,其中一类为

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第21张图片

另一大类为

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第22张图片

评估方法利用击中率和NDCG

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第23张图片

参数设置如下

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第24张图片

几种方法的效果比较如下

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第25张图片

多行为、迁移以及多任务学习的影响如下

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第26张图片

下表证明了本文算法的高效性

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第27张图片

模型性能随迭代次数的变化趋势如下

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第28张图片

本文算法在稀疏数据集依然可以取得较好的效果

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第29张图片

不同的控制系数对应的模型效果如下

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)_第30张图片

代码地址

https://github.com/chenchongthu/EHCF


              我是分割线


您可能感兴趣

AAAI2020|个性和情绪集成的注意力模型在推荐系统中的应用

ICML2007|深度学习用于协同过滤的开篇作之一(出自深度学习鼻祖之一Hinton)

SIGIR2019|基于BERT的深度学习模型在信息检索中的应用(已开源)

SIGIR2019|基于注意力机制的新型深度学习模型(采莓树模型BIRD,已开源)

SIGIR2019|深度学习如何更好地用于学习排序(LTR)(已开源)

SIGIR2019|利用DeepSHAP来解释神经检索模型(已开源)

SIGIR2019|胶囊网络来解释你喜欢什么不喜欢什么(已开源)

KDD2018|基于GBM的动态定价回归模型

KDD2018|超越deepfm的CTR预估模型深层兴趣网络DIN(已开源)

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

SIGIR2018|选择性GBDT(SelGB)用于排序学习(已开源)

AAAI2018|斯坦福大学提出并开源增强生成式模型

ijcai2017|CTR经典模型DeepFM,FNN,PNN,W&D,LR,FM对比(哈工大诺亚方舟提出CTR模型)

ICML2019|一种基于强化学习的推荐系统(GAN用户模型,佐治亚理工学院联合蚂蚁金服提出且已开源)

ICML2018|GBDT中如何寻找影响较大样本(普林斯顿大学联合Yandex提出并开源)

IJCAI2019|基于对抗变分自编码的协同过滤框架VAEGAN

聊聊CatBoost

聊聊XGBoost CatBoost LightGBM RF GBDT

IJCAI2019|新型特征增广GBDT--AugBoost(已开源)

IJCAI2019|清华大学提出并开源新型梯度提升决策树(梯度提升分段线性回归树)

新型梯度提升决策树GBDT-SPARSE(谷歌微软FaceBook加州大学联合提出)

ICML2019|深度学习鼻祖之一Bengio提出并开源图马尔科夫神经网络

GBDT,LR,深度学习如何联合发力(以推荐系统和游戏为例)

大规模GBDT系统应用场景及效果对比(LightGBM,XgBoost,DimBoost等)

新型在线预测模型DeepGBM(基于GBDT扩展的深度学习框架)

顶会中深度学习用于CTR预估的论文及代码集锦 (3)

ICML 2018 深度学习论文及代码集锦(5)

深度学习用于文本摘要的论文及代码集锦

深度学习用于机器翻译的论文及代码集锦

深度学习用于序列标注中的论文及代码集锦

深度学习在推荐系统中的应用及代码集锦(4)

深度学习在OCR中的应用论文及代码集锦 (2)

你可能感兴趣的:(AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源))