2019-07-14

[ACL 2019] Neural News Recommendation with Long- and Short-term User Representations

  • 新闻推荐,学习用户的两个表示:用户的长期兴趣和短期兴趣
  • 其他工作一般都只学习了用户的一种表示
  • 长期兴趣表示就是一个固定的user Embedding
  • 短期用户表示就是用户最近点击的新闻的表示,通过GRU得到
  • 新闻的表示建模如下图,两个级别的Topic Embedding和Title的表示拼接,Title的表示用CNN+Attention得到


    news encoder
  • 然后就是怎么合并两种用户表示了,一种是用长期用户表示初始化短期表示的GRU hidden state,一折是直接拼接两种表示,从实验效果来看,初始化的效果好一点,两个方法具体如下两图


    LSTUR-ini

    LSTUR-con
  • 最后通过用户表示与候选news表示做点积得到预测分数
  • 主要贡献:提出了一种方法同时学习用户的长期和短期表示

[IJCAI 2019] Deep Session Interest Network for Click-Through Rate Prediction

  • 阿里的文章,DIN和DIEN之后的一篇,DSIN
  • 本文考虑到一个现象,就是用一个session里面的item一般都是很相似的,不同session的item差异比较大,如下图:


    session的差异
  • 所以本文提出了一个基于session的CTR预估方法,整体结构如下


    Overview
  • 对于每一个session,用multi-head self-attention建模然后mean pooling得到一个表示
  • 然后用Bi-LSTM对多个session的表示建模
  • 中间用attention(activation unit)得到两个整体的表示
  • 最后与user profile表示、item profile表示拼一起,然后MLP得到最后的预测值
  • 主要贡献:提出了一种基于session的CTR预估模型
  • 缺点:user没有与item做任何交互,只是最后拼一起了

[KDD 2019] Beyond Personalization: Social Content Recommendation for Creator Equality and Consumer Satisfaction

  • 平衡内容创建者平等和内容消费者满意度
  • 就是说对长尾用户的内容增加曝光,而又不损害用户满意度
  • 主要通过对用户的多级社交网络friends做attention,这样得到用户的个性化表示能增加推荐的准确度和多样性
  • 对内容(文档)的建模如下图,通过CNN+attention对word level建模,然后通过BiGRU+attention得到整个文档的表示


    architecture
  • 用户的表示,也就是他的多个多级friends的表示的attention,多个friends通过蒙特卡罗树探索得到,如下图:


    social
  • 用Gini指数来量化不同模型的解决长尾问题的程度,越大的Gini指数说明越少的内容统治了整个市场,实验效果如图:


    实验效果
  • 主要贡献:提出了内容生产者公平的问题,不能使得用户满意度降低,同时提出了一个模型来解决这个问题。

[KDD 2019] Real-time Attention Based Look-alike Model for Recommender System

  • 腾讯的文章,也是解决长尾内容的问题
  • 用Look-alike模型,就是对一个item,得到与其有过交互的一些用户当做seed users,然后从seed users出发得到一些相似的其他用户,给这些用户推荐这个item
  • 这样的话,只要一个item与其交互过的user数量达到一定量,就能把它推荐给很多用户了, 结构如下图


    model structure
  • 然后通过异步更新seed users的方法使得可以快速在线预测
  • 主要贡献:提出了长尾内容问题,并且提出一个解决方法

[WWW 2019] Feature Generation by Convolutional Neural Network for Click-Through Rate Prediction

  • 自动特征增广方法
  • 通过CNN从原始特征中生成一些新的特征,用来模拟特征工程,来得到更好的效果, 如下图


    FGCNN
  • 具体的,原始特征就是多个Field的Embedding表示的一个矩阵, 然后用CNN在这个矩阵上做卷积,得到生成的人造特征,再与原始特征拼一起来做预测,如下图


    overview
  • 主要贡献:一种新的角度做模型,生成人造特征
  • 缺点:特征就还是原来的没有变,相当于多做了一步而已

[KDD 2019] Behavior Sequence Transformer for E-commerce Recommendation in Alibaba

  • 用Transformer对用户行为建模,得到预测结果
  • 整体结构图如下,就是用transformer对历史item表示和target item一起建模,然后去其他特征的表示拼一起,然后MLP得到最后的预测


    overview architecture
  • 主要贡献:用Transformer结构对用户序列建模

[KDD 2019] Hierarchical Gating Networks for Sequential Recommendation

  • 分层门控网络做序列推荐
  • 用户兴趣分为长期和短期兴趣,然后短期兴趣其实是很难通过最近交互的items捕捉到
  • 本文通过两层的gate机制来对用户的短期兴趣建模,模型结果如下


    architecture
  • 第一层gate按维度对表示做gate,第二层按item对item表示做gate,然后通过average或max聚合得到一个表示
  • 最后的预测值通过user与target,gated表示与target以及原始item表示与target的点积求和得到
  • 主要贡献:提出了一个新的方法来预测下一个item推荐

你可能感兴趣的:(2019-07-14)