推荐算法概述(基于用户的协同过滤算法、基于物品的协同过滤算法、基于内容的推荐算法)

“无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家。教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家。点这里可以跳转到教程。”   

   目前推荐系统研宄的主要趋势是从单一的、独立的推荐系统算法逐渐向组合多种推荐算法形成混合式的综合推荐算法方向发展,越来越多的结合用户标签数据、社交网络数据、上下文信息、地理位置信息。群体推荐也成为一个目前非常热门的主题。并且有些也用到了推荐系统领域之外的算法,如模糊集概念、人工智能领域的遗传算法,贝叶斯网络等。当然也有一些研究还在不断深入挖掘传统、经典的如基于内容过滤、协同过滤等算法可能的改进算法。

     互联网上的很多数据分布都属于长尾分布即大部分数据的使用频率很低,只有少部分的数据被广泛使用,这小部分数据其实就是热门数据,但如果把热门数据和冷门数据的使用量作对比,会发现冷门数据的使用量远远大于热门数据的使用量,这也许和人们想象中相反,但这是经过长时间的统计分析得出的结论。用户的行为数据其实也符合这一规律,无论从物品角度的物品流行度,还是用户角度的用户流行度都符合长尾分布

推荐系统算法概述

      推荐系统的研究大致可以分为三个阶段,第一阶段是基于传统的服务,第二阶段是基于目前的社交网络的服务,第三阶段是即将到来的物联网。这其中产生了很多基础和重要的算法,例如协同过滤(包括基于用户的和基于物品的)、基于内容的推荐算法、混合式的推荐算法、基于统计理论的推荐算法、基于社交网络信息(关注、被关注、信任、知名度、信誉度等)的过滤推荐算法、群体推荐算法、基于位置的推荐算法。其中基于邻域的协同过滤推荐算法是推荐系统中最基础、最核心、最重要的算法,该算法不仅在学术界得到较为深入的研究,而且在业界也得到非常广泛的应用,基于邻域的算法主要分为两大类,一类是基于用户的协同过滤算法,另一类是基于物品的协同过滤算法,除此之外,基于物品的推荐算法应用也非常广泛,所以下文将对这三种基础算法进行详细介绍。

基于用户的协同过滤算法

       基于用户的协同过滤算法简称,其简单应用情景是:当用户需要个性化推荐时,可以先找到与他相似其他用户(通过兴趣、爱好或行为习惯等,然后把那些用户喜欢的并且自己不知道的物品推荐给用户。

注:两个用户对流行物品的有相似兴趣,丝毫不能说明他们有相似的兴趣,此时要增加惩罚力度。

推荐算法概述(基于用户的协同过滤算法、基于物品的协同过滤算法、基于内容的推荐算法)_第1张图片

基于物品的协同过滤算法

      基于物品的协同过滤算法简称,其简单应用情景是:当一个用户需要个性化推荐时,例如由于他之前购买过金庸的《射雕英雄传》这本书,所以会给他推荐《神雕侠侶》,因为其他用户很多都同时购买了这两本书。

注:1、如果是热门物品,很多人都喜欢,就会接近1,就会造成很多物品都和热门物品相似,此时要增加惩罚力度。

        2、活跃用户对物品相似度的贡献小于不活跃的用户。

推荐算法概述(基于用户的协同过滤算法、基于物品的协同过滤算法、基于内容的推荐算法)_第2张图片

 

 基于内容的推荐算法
     虽然协同过滤是目前较为流行的推荐算法,在学术界和工业界都有广泛的研究和使用,但同样作为推荐系统领域的基础算法一一基于内容的推荐也是很重要的,其他它还是最早出现的推荐算法。其基本原理是根据用户之前对物品的历史行为(如用户购买过什么物品、对什么物品收藏过、评分过等等,然后再根据计算与这些物品相似的物品,并把它们推荐给用户。例如用户之前购买过金庸的武侠小说,这可以说明用户可能是一个金庸迷或武侠迷,这时就可以给用户推荐一些金庸的其他武侠小说。基于内容的推荐算法之前也成为基于内容的过滤(搜索)算法,早期主要应用在信息检索和信息过

基于内容的推荐算法一般包括以下三步:

1、为每个物品抽取一些特征用来表示这个物品。

2、使用用户的历史行为数据分析物品的这些特征,从而学习出用户的喜好特征或者说兴趣。

3、通过比较上一步得到的用户兴趣和待推荐物品的特征,确定一组相关性最大的物品作为推荐列表。

 

推荐系统基础算法对比

      UserCF是给用户推荐那些和他有共同兴趣的用户喜欢的物品,ItemCF则是为用户推荐那些和他之前喜欢的物品类似的物品,所以UserCF推荐较为社会化,即推荐的物品是与用户兴趣一致的那个群体中的热门物品,ItemCF的推荐较为个性,因为推荐的物品一般都满足自己的独特兴趣

 

 

 

你可能感兴趣的:(机器学习)