阿里 - 淘宝 - 精排模型发展趋势

一、DIN网络 2018年7月19日

,提出attention结构用在用户序列特征上,这种attention不是self-attention,而是预估item用来当做query,用户序列中的每个item作为key value

阿里兴趣网络DIN网络中几个关键的点(三)_1066196847的博客-CSDN博客_din网络

二、DIEN网络 2018年

兴趣抽取层

相对于DIN网络有这样改进点,DIN网络只做了用户序列attention这件事,DIEN首先加了一个loss,用gru计算点击序列(长度为T)的T个输出,然后取前T-1个和输出的后T-1个求累积loss,这样这个预测就会包含预测下一个的意义。

兴趣演化层

对这T个输出使用带attention的gru得到最终的输出final_state2,和其他的特征(user的embedding、item的embedding、各种序列、前面两个的点乘)concat在一起,送到后面的mlp层 

dien论文翻译_1066196847的博客-CSDN博客

三、长序列建模 MIMN 2019年7月25日

解决了DIN DIEN不能针对长序列的处理瓶颈,这个模型可以处理长度达到1000的序列建模

阿里妈妈长期用户历史行为建模——MIMN模型详解 - 知乎

推荐系统遇上深度学习(八十五)-[阿里]长用户行为序列建模探索:MIMN_abcdefg90876的博客-CSDN博客

四、sim模型 2020年6月

MIMN求多,没考虑target item;din求准,但是处理不了长序列,sim模型能够处理长度达到10000的序列,这在电商场景(淘宝)或者内容场景(抖音),是很常见的,比如从文章中得知,180 天行为数据中30%的样本的点击序列超过了10000,这个比例可不少了

sim先从序列中搜索出一批合适的item,再利用din思想进行处理

阿里精排sim - 知乎

你可能感兴趣的:(精排模型(单label模型),算法)