#Paper Reading# Seq2Slate: Re-ranking and Slate Optimization with RNNs

论文题目: Seq2Slate: Re-ranking and Slate Optimization with RNNs
论文地址: https://negative-dependence-in-ml-workshop.lids.mit.edu/wp-content/uploads/sites/29/2019/06/seq2slate_icml_workshop.pdf
论文发表于: ICML 2019(CCF A类会议)

论文大体内容:
本文主要介绍了谷歌团队用一个Seq2Seq的模型来predict下一个观看的视频,以此用于推荐系统的Rerank。

Motivation:
传统的LTR方法更多是序列encoding的方法,就是将各个特征做Embedding,然后根据这些Embedding学习到label的映射。没有其它工作尝试过decoding的方法,这也是本文提出的方法。

Contribution:
本文作者提出使用Seq2Seq的架构来解决item推荐的问题,称为Seq2Slate。这个方法主要是根据用户前面看过的视频序列,来predict下一个观看的视频,应用pointer network框架,进行纯数据驱动学习。

1. 本文使用pointer network[1]如图,左右两边都使用LSTM;
#Paper Reading# Seq2Slate: Re-ranking and Slate Optimization with RNNs_第1张图片

2. 本文使用了每个item是否click的监督信息来做supervised training;
#Paper Reading# Seq2Slate: Re-ranking and Slate Optimization with RNNs_第2张图片

实验
3. Dataset
①Yahoo Learning to Rank Challenge[2];
②Microsoft Web30k[3];
③Real-World Data: 大规模商业推荐系统;

4. Baseline
①AdaRank;
②Coordinate Ascent;
③LambdaMART;
④ListNet;
⑤MART;
⑥Random Forests;
⑦RankBoost;
⑧RankNet;

5. Metric
①MAP;
②NDCG;

6. 实验结果
#Paper Reading# Seq2Slate: Re-ranking and Slate Optimization with RNNs_第3张图片


参考资料: 
[1] https://zhuanlan.zhihu.com/p/48959800
[2] https://webscope.sandbox.yahoo.com/catalog.php?datatype=c&guccounter=1
[3] https://www.microsoft.com/en-us/research/project/mslr

 


以上均为个人见解,因本人水平有限,如发现有所错漏,敬请指出,谢谢!

你可能感兴趣的:(paper,reading,Reinforcement,Learning,Rerank)