基于大数据的个性化推荐系统

基于大数据的个性化推荐系统

1、概述

推荐系统的主要任务就是联系用户信息,一方面帮助用户发现对自己有价值的信息,另一方面让信息能够展现在对它感兴趣的用户面前,从而实现信息消费者和信息生产者的双赢。基于大数据的推荐系统通过分析用户的历史记录了解用户的喜好,从而主动为用户推荐其感兴趣的信息,满足用户的个性化推荐需求。、

2、工作原理

推荐系统接收的输入是推荐的数据源,一般情况下,推荐引擎所需要的数据源包括以下几点:

  • 要推荐物品或內容的元数据,如关键字、基因描述等。
  • 系统用户的基本信息,如性别、年龄等。
  • 用户对物品或者信息的偏好,根据应用本身的不同,可能包括用户对物品的评分,用户查看物品的记录,用户的购买记录等(用户的偏好信息可以分为显式用户反馈和隐式用户反馈两大类:显式用户反馈是用户在网站上自然浏览或者使用网站以外,显式地提供的反馈信息,如用户对物品的评分,或者对物品的评论等;隐式用户反馈是用户在使用网站时产生的数据,隐式地反映了用户对物品的喜好,如用户购买了某物品,用户查看了某物品的信息等)。

3、推荐机制

大部分推荐引擎的工作原理是基于物品或者用户的相似集进行推荐,所以可以对推荐机制进行以下分类:

  • 基于人口统计学的推荐:根据系统用户的基本信息发现用户的相关程度。
  • 基于内容的推荐:根据推荐物品或内容的元数据,发现物品或者内容的相关性。
  • 基于协同过滤的推荐:根据用户对物品或者信息的偏好,发现物品或者內容本身的相关性,或者是发现用户的相关性。

(1)基于人口统计学的推荐

基于人口统计学的推荐机制可根据用户的基本信息发现用户的相关程度,然后将相似用户喜爱的其他物品推荐给当前用户。

基于人口统计学的推荐机制的主要优势是对于新用户来讲没有“冷启动”的问题,这是因为该机制不使用当前用户对物品的喜好历史数据。该机制的另一个优势是它是领域独立的,不依赖于物品本身的数据,所以可以在不同的物品领域都得到使用。

(2)基于内容的推荐

基于内容的推荐是在推荐引擎出现之初应用最为广泛的推荐机制,它的核心思想是根据推荐物品或内容的元数据,发现物品或内容的相关性,然后基于用户以往的喜好记录,推荐给用户相似的物品。

(3)基于协同过滤的推荐

基于协同过滤的推荐的原理就是根据用户对物品或者信息的偏好,发现物品或者内容本身的相关性,或者发现用户的相关性,然后再基于这些相关性进行推荐。

 

基于协同过滤的推荐可以分为 3 个子类:基于用户的协同过滤推荐,基于项目的协同过滤推荐和基于模型的协同过滤推荐。

1) 基于用户的协同过滤推荐

基于用户的协同过滤推荐的基本原理是根据所有用户对物品或者信息的偏好,发现与当前用户口味和偏好相似的“邻居”用户群。一般的应用是采用计算“k-邻居”的算法,然后基于这 k 个邻居的历史偏好信息,为当前用户进行推荐的。

基于用户的协同过滤推荐机制和基于人口统计学的推荐机制都是计算用户的相似度,并基于“邻居”用户群计算推荐的,它们的不同之处在于如何计算用户的相似度。基于人口统计学的机制只考虑用户本身的特征,而基于用户的协同过滤机制是在用户的历史偏好的数据上计算用户的相似度,它的基本假设是,喜欢类似物品的用户可能有相同或者相似的口味和偏好。

2)基于项目的协同过滤推荐

基于项目的协同过滤推荐的基本原理是使用所有用户对物品或者信息的偏好,发现物品和物品之间的相似度,然后根据用户的历史偏好信息,将类似的物品推荐给用户。

基于项目的协同过滤推荐和基于内容的协同过滤推荐其实都是基于物品相似度的预测推荐,只是相似度计算的方法不一样,前者是从用户历史的偏好进行推断的,而后者是基于物品本身的属性特征信息进行推断的。

3)基于模型的协同过滤推荐

它是目前应用最为广泛的推荐机制。

基于模型的协同过滤推荐就是指基于样本的用户喜好信息,采用机器学习的方法训练一个推荐模型,然后根据实时的用户喜好的信息进行预测,从而计算推荐。
这种方法使用离线的历史数据进行模型训练和评估,需要耗费较长的时间,依赖于实际的数据集规模、机器学习算法计算复杂度。

(4)混合推荐机制

推荐往往不是只采用了某一种推荐机制和策略的,而是将多个方法混合在一起,从而达到更好的推荐效果。

(一)加权的混合:用线性公式将几种不同的推荐按照一定权重组合起来,具体权重的值需要在测试数据集上反复实验,从而达到最好的推荐效果。

(二)切换的混合:对于不同的情况(如数据量,系统运行状况,用户和物品的数目等),选择最为合适的推荐机制计算推荐。

(三)分区的混合:采用多种推荐机制,并将不同的推荐结果分不同的区显示给用户。

(四)分层的混合:采用多种推荐机制,并将一个推荐机制的结果作为另一个的输入,从而综合各个推荐机制的优缺点,得到更加准确的推荐。

你可能感兴趣的:(大数据,推荐系统,大数据,推荐系统)