【推荐算法论文阅读】Recurrent Neural Networks with Top-k Gains for Session-based Recommendations
本文是一篇很好的讲述进行梯度下降和参数更新时,困难样本、简单样本与梯度消失之间的关系,以及如何设置使简单样本对平均梯度的影响更小。一、samplingtheoutput在每个训练步骤中,GRU4Rec将会话中当前事件的项目(由one-hot向量表示)作为输入。网络的输出是项目的一组分数,对应于它们成为会话中下一个项目的可能性。GRU4Rec引入了基于mini-batch的采样。对于mini-bat