推荐算法——基于内容的推荐CB

推荐系统不仅可以有效地帮助用户发现高质量的适合自己的信息,另一方面也帮助应用和商家增加用户的使用时长,更好的留住用户。推荐系统越精准,用户的体验更好,商家获得的回报越大。所以这也是推荐系统应用越来越广泛的主要原因。

现在我们的生活和学习中处处都可以看到推荐系统的应用,比如我们打开百度首页,就可以看到给我们推荐的新闻热点。

比如我们打开优酷看视频的时候

还有微博,今日头条,抖音,京东,淘宝等等越来越多的地方会看到推荐系统的应用。

什么是CB推荐算法

基于内容的推荐算法是众多算法中最基本的一种,就是根据用户过去喜欢的内容或者物品,通过复杂的数学计算找出与这些内容和物品相似的,然后推荐给用户。算法的核心就是内容的相似度。

CB推荐算法主要有以下几个过程

  1. 提取内容或者物品(我们以后统称为Item)的特征
  2. 根据用户以前的喜欢的和不喜欢的Item的特征进行计算,得出用户喜欢的特征
  3. 根据用户喜欢的特征,去Item候选中,找出相关性最大的n个Item,然后推荐给用户

举个简单的例子:

一个用户在优酷看了一个成龙的一个动作喜剧电影。然后就根据这个电影提取出他的几个特征,”成龙“ ”动作“ ”喜剧“ 然后推断出这个用户可能喜欢的电影就是具有这几个特征的电影,然后就可以推荐一写其他的成龙的电影,其他的动作片,其他的喜剧片给这个用户。

CB算法的优点:

  • 提升推荐结果的相关性
  • 结果可解释
  • 推荐结果容易被用户感知
  • 新的Item也可以马上被推荐

CB算法的缺点:

  • 无个性化
  • 依赖于对Item的深度分析,Item特征抽取有时候比较困难
  • 无法挖掘用户的潜在兴趣
  • 无法为新用户产生推荐

欢迎关注公众号:「努力给自己看」

你可能感兴趣的:(大数据)