Wentao et al. Representation Learning-Assisted Click-Through Rate Prediction. arXiv, 2019.
整个模型包括三个部分
Fuyu et al. SDM: Sequential Deep Matching Model for Online Large-scale Recommender System. CIKM, 2019.
用户存在短期偏好与长期偏好,文章认为,一方面,在一个session中可能存在多个兴趣倾向(session可以根据浏览时间划分,若一定时间没有浏览,再次浏览即为一个新的session),另一方面,当前session的兴趣可能会受长期偏好的影响。基于以上考虑,本文提出SDM模型,融合了长期偏好与短期偏好,分别对二者进行向量表示,然后利用long-short term gated fusion将长期兴趣向量与短期兴趣向量融合后,预测用户行为进行推荐。
文章贡献
Wentao et al. MiNet: Mixed Interest Network for Cross-Domain Click-Through Rate Prediction. CIKM, 2020.
现有的工作主要针对单一领域CTR预测,即仅利用ad数据进行CTR预测,并对特征交互、用户行为历史和上下文信息等方面进行建模。然而,广告通常伴随着自然内容显示,这为跨域CTR预测提供了机会。在本文中,我们解决了这个问题,并利用源域的辅助数据来提高目标域的CTR预测性能。我们的研究基于UC今日头条(如下图),源域为自然新闻feed(新闻域),目标域为广告(广告域)。跨域的一个主要优势CTR预测是指通过跨域丰富数据,可以缓解目标域的数据稀疏性和冷启动问题,从而提高预测性能。模型大体分为两个部分:
为了有效地利用跨域数据,在MINet的主要部分建模了三种类型的用户兴趣:
Zhe et al. COLD: Towards the Next Generation of Pre-Ranking System. KDD, 2020.
现有粗排的相关工作仅仅把算力看做系统的一个常量,模型和算力的优化是分离的。论文重新思考了模型和算力的关系,从两者联合设计优化的视角出发,提出了新一代的粗排架构COLD (Computing power cost-aware Online and Lightweight Deep pre-ranking system). 它可以灵活对模型效果和算力进行平衡。COLD没有对模型进行限制,可以支持任意复杂的深度模型。这里论文把GwEN ( group-wise embedding network) 作为我们的初始模型结构。它以拼接好的特征embedding作为输入,后面是多层全连接网络,支持交叉特征。当然,如果特征和模型过于复杂,算力和延时都会难以接受。因此论文一方面设计了一个灵活的网络架构可以进行效果和算力的平衡。另一方面进行了很多工程上的优化以节省算力。
Weinan et al. Deep Interest with Hierarchical Attention Network for Click-Through Rate Prediction. SIGIR, 2020.
直观上,用户的兴趣存在层级关系,这种层级关系使得用户兴趣先从higher-level开始,然后再到lower-level,比如用户会先关注商品的类目,然后到品牌,最后到商品。用attention network对这种层级的兴趣进行建模能提高用户行为的表达。在DIN(Deep Interest Network)基础上,提出Deep Interest with Hierarchical Attention Network (DHAN)来建模用户的层级兴趣。在DHAN里,建模了多种层级结构,第一层attention层用来建模商品,后面的attention层建模更高层级,如品牌、类目。为了建模多种层级关系,使用了expanding mechanism,使得DHAN能够抽取不同层级的重要性,刻画用户的层级兴趣。实验效果显示,AUC比DIN提升12%到21%,比DIEN提升1.0%到1.7%。
DMIN: 《Deep Multi-Interest Network for Click-through Rate Prediction》
不管在电商领域还是短视频领域,用户的兴趣通常是多样的,潜藏在一个隐空间中,同时,用户在一个时间段內的兴趣是会演化的,用户的兴趣演化潜藏在序列item的变化过程中,所以为了建模这种多兴趣跟演化性,阿里提出来DMIN模型。
DMIN模型跟DIN和DIEN的模型如出一辙,特征部分可以说是跟另外两个模型一样,如果你之前对于din和dien比较熟悉的话,那看这篇论文就很容易通透了。
Ze et al. Deep Match to Rank Model for Personalized Click-Through Rate Prediction. AAAI, 2020.
1)在排序模型中引入了匹配思想,并引入辅助训练网络;
2)以一种灵活的、可扩展的方式引入了行为相关的query,从而能够更灵活地评价一个行为的重要性;
3)相比于DIEN,其在行为序列的计算上是可并行的;
DMR模型提出的基于匹配思想的深度排序模型DMR可以看做是另一种对DIN的改进方式。文章提出了两种网络结构,Item-to-Item网络和User-to-Item网络,来描述用户和候选目标item是否匹配。
Shu-Ting et al. Deep Time-Stream Framework for Click-Through Rate Prediction by Tracking Interest Evolution. AAAI, 2020.
Changhua et al. Personalized Re-ranking for Recommendation. RecSys, 2019.
直观上来说,用户的行为信息也应该被加入到重排,因为不同用户的倾向性不同。假如用户更关注价格,重排时价格就需要更多关注。文章提出基于Transformer的个性化重排,
Liyi et al. A Deep Prediction Network for Understanding Advertiser Intent and Satisfaction. CIKM, 2020.
Yu et al. EdgeRec: Recommender System on Edge in Mobile Taobao. CIKM, 2020.
作者在paper里强调的,传统的CS架构存在2个显著问题:
基于此,paper提出了完整的边缘计算框架,用来解决上述问题。以便模型能够更及时的对用户的最新行为进行感知,并产生针对性的预测结果。
Yufei et al. MTBRN: Multiplex Target-Behavior Relation Enhanced Network for Click-Through Rate Prediction. CIKM, 2020.
Wentao et al. Representation Learning-Assisted Click-Through Rate Prediction. arXiv, 2019.
整个模型包括三个部分
Fuyu et al. SDM: Sequential Deep Matching Model for Online Large-scale Recommender System. CIKM, 2019.
用户存在短期偏好与长期偏好,文章认为,一方面,在一个session中可能存在多个兴趣倾向(session可以根据浏览时间划分,若一定时间没有浏览,再次浏览即为一个新的session),另一方面,当前session的兴趣可能会受长期偏好的影响。基于以上考虑,本文提出SDM模型,融合了长期偏好与短期偏好,分别对二者进行向量表示,然后利用long-short term gated fusion将长期兴趣向量与短期兴趣向量融合后,预测用户行为进行推荐。
文章贡献
Wentao et al. MiNet: Mixed Interest Network for Cross-Domain Click-Through Rate Prediction. CIKM, 2020.
现有的工作主要针对单一领域CTR预测,即仅利用ad数据进行CTR预测,并对特征交互、用户行为历史和上下文信息等方面进行建模。然而,广告通常伴随着自然内容显示,这为跨域CTR预测提供了机会。在本文中,我们解决了这个问题,并利用源域的辅助数据来提高目标域的CTR预测性能。我们的研究基于UC今日头条(如下图),源域为自然新闻feed(新闻域),目标域为广告(广告域)。跨域的一个主要优势CTR预测是指通过跨域丰富数据,可以缓解目标域的数据稀疏性和冷启动问题,从而提高预测性能。模型大体分为两个部分:
为了有效地利用跨域数据,在MINet的主要部分建模了三种类型的用户兴趣:
Zhe et al. COLD: Towards the Next Generation of Pre-Ranking System. KDD, 2020.
现有粗排的相关工作仅仅把算力看做系统的一个常量,模型和算力的优化是分离的。论文重新思考了模型和算力的关系,从两者联合设计优化的视角出发,提出了新一代的粗排架构COLD (Computing power cost-aware Online and Lightweight Deep pre-ranking system). 它可以灵活对模型效果和算力进行平衡。COLD没有对模型进行限制,可以支持任意复杂的深度模型。这里论文把GwEN ( group-wise embedding network) 作为我们的初始模型结构。它以拼接好的特征embedding作为输入,后面是多层全连接网络,支持交叉特征。当然,如果特征和模型过于复杂,算力和延时都会难以接受。因此论文一方面设计了一个灵活的网络架构可以进行效果和算力的平衡。另一方面进行了很多工程上的优化以节省算力。
Weinan et al. Deep Interest with Hierarchical Attention Network for Click-Through Rate Prediction. SIGIR, 2020.
直观上,用户的兴趣存在层级关系,这种层级关系使得用户兴趣先从higher-level开始,然后再到lower-level,比如用户会先关注商品的类目,然后到品牌,最后到商品。用attention network对这种层级的兴趣进行建模能提高用户行为的表达。在DIN(Deep Interest Network)基础上,提出Deep Interest with Hierarchical Attention Network (DHAN)来建模用户的层级兴趣。在DHAN里,建模了多种层级结构,第一层attention层用来建模商品,后面的attention层建模更高层级,如品牌、类目。为了建模多种层级关系,使用了expanding mechanism,使得DHAN能够抽取不同层级的重要性,刻画用户的层级兴趣。实验效果显示,AUC比DIN提升12%到21%,比DIEN提升1.0%到1.7%。
DMIN: 《Deep Multi-Interest Network for Click-through Rate Prediction》
不管在电商领域还是短视频领域,用户的兴趣通常是多样的,潜藏在一个隐空间中,同时,用户在一个时间段內的兴趣是会演化的,用户的兴趣演化潜藏在序列item的变化过程中,所以为了建模这种多兴趣跟演化性,阿里提出来DMIN模型。
DMIN模型跟DIN和DIEN的模型如出一辙,特征部分可以说是跟另外两个模型一样,如果你之前对于din和dien比较熟悉的话,那看这篇论文就很容易通透了。
Ze et al. Deep Match to Rank Model for Personalized Click-Through Rate Prediction. AAAI, 2020.
1)在排序模型中引入了匹配思想,并引入辅助训练网络;
2)以一种灵活的、可扩展的方式引入了行为相关的query,从而能够更灵活地评价一个行为的重要性;
3)相比于DIEN,其在行为序列的计算上是可并行的;
DMR模型提出的基于匹配思想的深度排序模型DMR可以看做是另一种对DIN的改进方式。文章提出了两种网络结构,Item-to-Item网络和User-to-Item网络,来描述用户和候选目标item是否匹配。
Shu-Ting et al. Deep Time-Stream Framework for Click-Through Rate Prediction by Tracking Interest Evolution. AAAI, 2020.
Changhua et al. Personalized Re-ranking for Recommendation. RecSys, 2019.
直观上来说,用户的行为信息也应该被加入到重排,因为不同用户的倾向性不同。假如用户更关注价格,重排时价格就需要更多关注。文章提出基于Transformer的个性化重排,
Liyi et al. A Deep Prediction Network for Understanding Advertiser Intent and Satisfaction. CIKM, 2020.
Yu et al. EdgeRec: Recommender System on Edge in Mobile Taobao. CIKM, 2020.
作者在paper里强调的,传统的CS架构存在2个显著问题:
基于此,paper提出了完整的边缘计算框架,用来解决上述问题。以便模型能够更及时的对用户的最新行为进行感知,并产生针对性的预测结果。
Yufei et al. MTBRN: Multiplex Target-Behavior Relation Enhanced Network for Click-Through Rate Prediction. CIKM, 2020.