DIN

用户的兴趣是很多样的,基于候选商品只与用户的一部分兴趣有关,使用attention机制,对用户的不同行为的注意力是不一样的。

数据集问题:

review包含reviewerId(评论人的id),asin(商品ID),unixReviewTime(评论时间)

meta包含asin(商品ID),categories(类别,只包含最后一个类目)

meta_df中是按照asin排序,review_df是按照reviewid,unixreviewtime进行排序,cate_list是所有商品的categories构成的列表

Build_dataset:

每个正样例产生相同个数的负样例;

训练集为前i个item产生下一个item,添加一个正例添加一个负例

最后一个Item是目标

test_set中存储的是(reviewerId, history, (pos, neg))

train_set中存储的是(reviewerId, history, pos)

model:

先使用用户访问过的所有的item的embedding加和组合成用户的embedding表示

损失函数时sigmoid_cross_entropy_with_logits

需要训练的参数包含

 

,

  #将用户访问过的item的embedding压缩到一起

 

你可能感兴趣的:(DIN)