推荐系统实现2:经典召回模型

推荐系统召回:

召回的目的是根据用户部分特征,从海量物品库,快速找到小部分用户潜在感兴趣的物品交给精排,重点强调快。

DSSM:

双塔模型在推荐领域中是一个十分经典的模型,无论是在召回还是粗排阶段,都会是首选。这主要是得益于双塔模型结构,使得能够在线预估时满足低延时的要求。

推荐系统实现2:经典召回模型_第1张图片

 DSSM的主要原理是将Q和D1,D2...Dn映射到相同的语义空间,通过最大化向量之间的余弦相似度,从而训练得到多端的语义映射,具体来说,就是先联合训练构建embedding层,再分别应用训练好的共同embedding根据输入给出输入端的embedding,如下图所示:

推荐系统实现2:经典召回模型_第2张图片

主要优势:在海量的候选数据进行召回的场景下,速度很快。

主要缺点:忽视了用户端和物品端之间的关联信息。

SENet双塔模型:

SENet是一种应用于图像处理的新型网络结构,其作用是为了将大量长尾的低频特征抛弃,弱化不靠谱低频特征embedding的负面影响

 推荐系统实现2:经典召回模型_第3张图片

SENET主要分为三个步骤Squeeze, Excitation, Re-weight 

Squeeze阶段:我们对每个特征的Embedding向量进行数据压缩与信息汇总,即在Embedding维度计算均值:

推荐系统实现2:经典召回模型_第4张图片

Excitation阶段:这阶段是根据上一阶段得到的向量进行缩放。这个过程的具体操作就是经过两层DNN。

作用是判断哪些特征重要,哪些特征不重要。

  • Re-weight阶段:是将Excitation阶段得到的每个特征对应的权重 AA 再乘回到特征对应的Embedding里,就完成了对特征重要性的加权操作。

  •  (由于雨水倒灌,抢险救灾,代码分段分析等未完待续)

你可能感兴趣的:(大数据,深度学习,推荐算法)