【机器学习】“冷启动” 问题

【机器学习】“冷启动”问题

  • 1. 什么是“冷启动”问题?
  • 2. “冷启动”问题的分类
  • 3. 如何解决冷启动问题?
  • 参考链接


1. 什么是“冷启动”问题?

在缺乏有价值数据的时候,如何有效地满足业务需求的问题,就是“冷启动问题”。
冷启动在推荐系统中表示该系统积累数据量过少,无法给新用户做个性化推荐的问题,这是产品推荐的一大难题。

冷启动问题是机器学习系统中十分常见、无法回避的问题,因为任何机器学习系统都要经历从无到有的过程。试想,你作为一个新用户,在没有用户数据的情况下,淘宝如何给你个性化推荐商品,抖音如何给你个性化推荐视频呢?


2. “冷启动”问题的分类

具体地讲,根据数据匮乏情况的不同,冷启动问题主要分为 3 类:

  1. 用户冷启动:新用户注册后,没有历史行为数据。
  2. 物品冷启动:新物品上架后,没有用户对该物品的交互数据。主要解决如何将新的物品推荐给可能对它感兴趣的用户这一问题。
  3. 系统冷启动:新系统上线时,缺乏所有历史相关数据。如何在一个新开发的网站上(还没有用户,也没有用户行为,只有一些物品的信息)设计个性化推荐系统,从而在网站刚发布时就让用户体验到个性化推荐服务这一问题。

3. 如何解决冷启动问题?

一般解决方案:

  1. 推送热门排行榜,然后等到用户数据收集到一定的时候,再切换为个性化推荐;
  2. 利用用户注册时提供的年龄、性别等数据做粗粒度的个性化;
  3. 利用用户的社交网络账号登录(需要用户授权),导入用户在社交网站上的好友信息,然后给用户推荐其好友喜欢的物品;
  4. 要求用户在登录时对一些物品进行反馈,收集用户对这些物品的兴趣信息,然后给用户推荐那些和这些物品相似的物品;
  5. 对于新加入的物品,可以利用内容信息,将它们推荐给喜欢过和它们相似的物品的用户;
  6. 在系统冷启动时,可以引入专家的知识,通过一定的高效方式迅速建立起物品的相关度表。

参考链接

  1. https://www.jianshu.com/p/fd0fee2f2044
  2. https://zhuanlan.zhihu.com/p/31202640

你可能感兴趣的:(机器学习,机器学习)