7M推荐系统 - S2 内部推荐和排序架构

1 召回算法和业界最佳实践进阶

各种Embedding方法
各种k-means方法kdtree和kball树

2 用户建模(召回、排序都会用到)

预测用户下一个浏览或者购买的类目,性别预测,年龄预测等。

3 用户特征和Item特征的常用方法

Wrappers:一个一个试
Embedded:加入正则
Filters:feature-label相关性

  • 连续型特征离散二值化
    离散化:等宽分桶(按值分),均匀分桶(按样本数分),k-means
    二值化:要么该特征one-hot,或者three-hot
  • 过程
    特征预排序通过信息增益IG,添加特征,细筛选特征
  • 泛化和自解释
    泛化是历史记录没有的
    自解释是有历史记录的
  • 四种类型
    数值
    类别
    时间
    文本

4 主流技术方向思考及相应model的改进方案

讲了一遍冷启动

讲了这三个算法

推荐流程概念 33:40

  • 核心指标
    GMV:一定时间内的商品成交总额
    QPS
    RT:系统响应 < 0.1s
    优化排序:让模型参数减少,层数减少,但是效果会降低,是tradeoff
    推荐和搜索有什么关系?
    1.推荐做的好,搜索的流量下降
    2.搜索这个工具是必要的
    推荐做的好 -> 用户粘性,用户留存 -> DAU GMV
    (短视频/电影)推荐系统和电商推荐系统相比,区别是什么?
    视频推荐多看重时长,电商推荐看是否购买
    量级的不同,存储方式,计算量,算法都不同
  • 核心业务
    首猜:首页猜你喜欢
    详情页(相关推荐,播放页,关灯页)

你可能感兴趣的:(7M推荐系统 - S2 内部推荐和排序架构)