ATM|注意力转移模型在预测下一个商品中的应用

ATM: An Attentive Translation Model for Next-Item Recommendation

Bin Wu, Xiangnan He, Zhongchuan Sun, Liang Chen, and Yangdong Ye

Zhengzhou University, University of Science and Technology of China, Sun Yat-Sen University

http://staff.ustc.edu.cn/~hexn/papers/TII19-Attentive-Trans.pdf

预测用户下次会购买什么商品在推荐系统中非常重要。

基于分解的方法在推荐系统中比较常用,但是,最近的一些研究表明,内积不满足三角不等式,这可能会破坏模型的泛化能力。

TransRec能够克服这种问题,它能够学习距离度量,来预测用户商品交互的强度。但是,这种方法只利用了最近消费的商品对用户的短期偏好进行建模,这有损模型的准确性。

这篇文章提出一种高效方法,ATM,注意力迁移模型,该模型能够明确探索高阶序列信息,进而可以用于下一次购买商品推荐。该模型需要构建基于用户的转移向量,用来解释多个最近购买的商品,这样可以对用户短期偏好的更多信息进行编码,而不是最近购买的商品。

为了将多个商品聚合到一个表示中,作者们设计了一种位置感知的注意力机制,对不同顺序的商品可以学到不同的商品权重。

四个真实数据集上的实验表明,本文方法优于STOA方法。

这篇文章所提模型跟TransRec的对比图示如下

ATM|注意力转移模型在预测下一个商品中的应用_第1张图片

这篇文章的主要贡献有以下三点

ATM|注意力转移模型在预测下一个商品中的应用_第2张图片

问题描述如下

ATM|注意力转移模型在预测下一个商品中的应用_第3张图片

下面是一些符号约定

ATM|注意力转移模型在预测下一个商品中的应用_第4张图片

个性化注意力转移模型定义如下

ATM|注意力转移模型在预测下一个商品中的应用_第5张图片

用户转移嵌入的高阶马尔可夫链图示如下

ATM|注意力转移模型在预测下一个商品中的应用_第6张图片

作者们并不是利用简单的注意力机制,而是融入了位置因素,具体解释如下

ATM|注意力转移模型在预测下一个商品中的应用_第7张图片

ATM结构图示如下

ATM|注意力转移模型在预测下一个商品中的应用_第8张图片

下面是算法伪代码

ATM|注意力转移模型在预测下一个商品中的应用_第9张图片

本文所用数据集有以下四个

ATM|注意力转移模型在预测下一个商品中的应用_第10张图片

统计信息如下

ATM|注意力转移模型在预测下一个商品中的应用_第11张图片

作者们所用衡量指标有以下两个

ATM|注意力转移模型在预测下一个商品中的应用_第12张图片

上述两个指标的公式表示如下

ATM|注意力转移模型在预测下一个商品中的应用_第13张图片

参与对比的几种方法简介如下

ATM|注意力转移模型在预测下一个商品中的应用_第14张图片

ATM|注意力转移模型在预测下一个商品中的应用_第15张图片

ATM|注意力转移模型在预测下一个商品中的应用_第16张图片

主要对比的几个方面有

ATM|注意力转移模型在预测下一个商品中的应用_第17张图片

参数设置以及实验环境如下

ATM|注意力转移模型在预测下一个商品中的应用_第18张图片

实验效果总结如下

ATM|注意力转移模型在预测下一个商品中的应用_第19张图片

对于衡量指标,不同的N的实验结果如下

ATM|注意力转移模型在预测下一个商品中的应用_第20张图片

不同的聚合函数对模型效果影响实验结果如下

ATM|注意力转移模型在预测下一个商品中的应用_第21张图片

马尔可夫链的阶对模型效果影响图示如下

ATM|注意力转移模型在预测下一个商品中的应用_第22张图片

并不是时间越近,权重就越大,示例如下表

ATM|注意力转移模型在预测下一个商品中的应用_第23张图片

代码地址

https://github.com/hexiangnan/neural_collaborative_filtering 

https://github.com/lijingsdu/sessionRec_NARM 

https://github.com/graytowne/caser_pytorch 

https://sites.google.com/view/ruining-he/

https://github.com/voladorlu/MARank


              我是分割线


您可能感兴趣

IJCAI2019|深层自注意力网络在序列推荐中的应用

AAAI2020|深度学习在表格分析中的应用

NIPS论文系列|复数域RNN,深层生成模型,DRL在MDP中的应用(已开源)

AAAI2020|结合时空信息的分层注意力网络在大规模社交网络中的应用

ICDE2020|基于深度学习的关系抽取

只有正样本和无标签样本时如何构建分类器

ICDE2020|图卷积网络在价格感知推荐中的应用

WSDM2020|基于强化学习的多轮对话推荐系统(EAR, 即将开源)

WWW2020|如何利用未来数据协助训练基于会话的推荐(GRec)

ICML2018|基于自注意力的序列推荐模型SASRec(已开源)

IJCAI2018|分层时空LSTM在位置预测中的应用(HST-LSTM)

IJCAI2019|基于会话和注意力机制的CTR预估模型DSIN(已开源)

AISTATS2018|密歇根大学提出新型在线boosting算法用于多标签排序(已开源)

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)

ICML2007|深度学习用于协同过滤的开篇作之一(出自深度学习鼻祖之一Hinton)

SIGIR2019|基于BERT的深度学习模型在信息检索中的应用(已开源)

SIGIR2019|深度学习如何更好地用于学习排序(LTR)(已开源)

SIGIR2019|利用DeepSHAP来解释神经检索模型(已开源)

KDD2018|基于GBM的动态定价回归模型

KDD2018|超越deepfm的CTR预估模型深层兴趣网络DIN(已开源)

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

SIGIR2018|选择性GBDT(SelGB)用于排序学习(已开源)

IJCAI2019|基于对抗变分自编码的协同过滤框架VAEGAN

聊聊CatBoost

聊聊XGBoost CatBoost LightGBM RF GBDT

顶会中深度学习用于CTR预估的论文及代码集锦 (3)

ICML 2018 深度学习论文及代码集锦(5)

深度学习用于文本摘要的论文及代码集锦

深度学习用于机器翻译的论文及代码集锦

深度学习用于序列标注中的论文及代码集锦

深度学习在推荐系统中的应用及代码集锦(4)

深度学习在OCR中的应用论文及代码集锦 (2)

你可能感兴趣的:(ATM|注意力转移模型在预测下一个商品中的应用)