搜索 (1)---京东

参考:https://mp.weixin.qq.com/s/4UBehc0eikVqcsFP7xL_Zw

1 京东电商语义检索说商品排序

(1) 背景搜索 (1)---京东_第1张图片
主要内容:
1)Query 理解
query纠错, 改写,扩展, 分词
2) 召回阶段
向量检索
3)排序

(2) 向量检索
1)传统倒排索引,只能检错资源意义。
2)向量topk召回。 近似检索方法: KDTree, TDM, LSH, PQ, HNSW.
3)打分计算函数: inner product L2 distance
4) Multi heads 让query 可以生成多个embedding 与sku embedding 计算score
5)attention loss
6)负样本: 随机采样, batch 采样
7)双塔模型: qurey tower , item tower
搜索 (1)---京东_第2张图片
8)训练样本拉去:
搜索 (1)---京东_第3张图片
(3)商品排序

   1) 训练样本“ 同一个session  中 用户购买的商品a和没有购买的商品b配对起来,并将购买和未购买最为最终学习的label. 构造查询商品对训练集
   2)特征:

搜索 (1)---京东_第4张图片
3)个性化升级
1)候选商品和用户历史商品做attention. 将静态的user embedding 升级为随query和当前商品变化的user embedding
2) 使用grap学习方法对id类特征embedding 进行pretrain.
具体方法: 高质量点击行为生成商品graph, 通过随机游走生成训练数据,再利用Skip-gram进行训练,计入id embedding 提高模型离线指标和收敛速度。

(4)时效性优化

搜索 (1)---京东_第5张图片

你可能感兴趣的:(搜索)