Session-based recommendations with recurrent neural networks(阅读理解)

Session-based recommendations with recurrent neural networks(阅读理解)_第1张图片

本文是最大贡献在于第一次将RNN使用到Session-based Recommendation中

作者将用户的行为作为看做是序列问题,有效的将时间信息添加到网络中,在传统的两类推荐方法中——基于内容的推荐算法和协同过滤推荐算法(model-based、memory-based)在刻画序列数据中存在缺陷:每个item相互独立,不能建模item的连续偏好信息,缺失了整个序列的休息。

而本文的方法恰好运用到真个序列的信息,不仅关注最近几次的用户行为,并全面考虑到前面信息对后面信息的影响。同时随着状态的跳转,基于RNN的序列建模克服了马尔科夫决策过程中维度爆炸的问题,总体上来看这是一个属于Seq2Seq的预测问题


模型流程:

输入:

点击序列x=[x1, x2, x3, ... , xr, ... xn],通过one-hot编码,使用embedding将序列转换成向量格式(这也是RNN中常见的输入形式)

输出:

每一个item 被点击的预测概率

Session-based recommendations with recurrent neural networks(阅读理解)_第2张图片

训练策略:

作者为提高训练的效率,提出了两种加速策略

1 Training strategy:

首先,我们为session创建一个顺序,接着,我们使用第一个session的第一个item作为输入,(期望的输出结果是第二个item),输入的第二批数据是第二个item。如果任何一个session结束了,则下一个可用的session填充在那个位置上。我们假设每一个session都是独立的,所以当发生切换的时候我们将重置合适的hidden state

这篇文章传达的思路就是很简单但是有效,为后面相关的研究开辟了新道路,起到了很好的引导作用。

2 Sample on the output

因为item的维度非常高,item的数量将会计算量,所以训练的方式的每次选择当前的正样本,然后随机抽取负样本。即选取了同一个mini-batch 中其他sequence下一个点击的item作为负样本,用这些正负样本来训练整个神经网络。

你可能感兴趣的:(文本序列生成)