推荐分享

推荐分享

流量变现-广告

推荐核心:
匹配 相似性 : 人和人、物品和物品、用户特征和商品特征
排序

算法

  • 协同过滤:数据要的少,效果可以 使用普遍
  • 广义线性模型: 特征拟合,找用户特征
  • 深度学习: 数据中自动找特征
  • 强化学习: 人工干预很少,封闭系统。类似人主动学习。

趋势:

  • 搜索和推荐融合
  • AI和传统算法
  • 隐私政策强时,数据少,就用小样本和端(实时记录)、云(历史记录)协统技术

协同过滤

矩阵分解
聚类

问题

  • 稀疏,品类太多,用户购买同一个几率小

  • 相似度度量:微信和陌陌对相似度权限贡献相同

  • 可扩展性:计算量随着user item增加而增加O(m*n)

  • 聚类

  • 矩阵分解
    user-item 交互信息中 矩阵分解来挖掘

冷启动、数据热点(流行)

广义线性

p(click|show) = w.x

比如逻辑回归,其实不是绝对线性,但是线性思维,所以叫广义线性

高维稀疏特征-

  • ID型、离散型特征可用one-hot独热编码
  • 特征组合,丰富特征
  • 如果人工找的特征效果不好,就可以用机器方法找特征(GBDT)、特征组合学习-因子分解机(FM)、实时机器学习(流计算)

在线学习

FTRL(Google,2013)
特征学到了就直接丢掉了,不需要迭代学习
不会出现数据量一直增大导致学习计算量持续增长情况
实时推荐系统

基于树的特征挖掘
gbdt

深度学习

设计多个神经元,每个神经元都判断某个特征
比如多个神经元分别判断猫 眼睛 头 尾巴 体长等 ,如果达到某个数值的神经元超出了判断阈值,就认定这个物体是猫

问题:

  • 高维稀疏特征不适用,因为有全连接,导致连接数太多

广度&深度学习模型

宽特征用LR
窄特征用DL

强化学习

样本少时可以用

建立 推荐引擎到环境(用户)的闭环

人特别容易变化,所以强化学习是未来趋势

目前效果还不太好,收敛速度慢,生产环境使用很少

推荐指标

  • 用户满意度 点击率 转化率
  • 多样性 推荐之间差异化 不相似
  • 准确性
  • 新颖性
  • 鲁棒性 反作弊 稳健性
  • 覆盖率 长尾物品和用户
  • 惊奇性
  • 实时性
  • 用户信任度-推荐理由?

除了固定的一些数据指标,还可以加上一些用户问卷,比如给用户交互点击是否喜欢推荐的

你可能感兴趣的:(机器学习)