【推荐系统】【论文阅读笔记】【survey】Hybrid Recommender Systems: Survey and Experiments

一、推荐技术简介:

论文链接:https://www.researchgate.net/publication/263377228_Hybrid_Recommender_Systems_Survey_and_Experiments

CF协同推荐:(用户之间的相关性)对现存的对象的评分或推荐进行汇总,根据用户的评分识别用户之间的共性,并根据用户间的比较生成新的推荐。协作系统中的典型用户配置文件由项目向量及其评级组成,随着用户与系统交互的时间推移,这些项目及其评级不断增加。这些系统可以是基于记忆(memory-based)的,直接使用相关性或其他测量方法将用户相互比较,也可以是基于模型(model-based)的,其中模型来自历史评级数据,用于进行预测。基于模型的推荐者已经使用了多种学习技术,包括神经网络,潜在语义索引和贝叶斯网络

        优点:它们完全独立于被推荐对象的任何机器可读表示,并且对于复杂的对象(如音乐和电影)工作良好,因此它不需要领域知识,并且充满了隐式反馈。适合于在一个小而静态的项目范围内,用户兴趣密度相对较高的问题。与基于内容的方法相比,协作方法的最大优势在于其跨类型或开箱即用的推荐能力。

       缺点:如果项目变化太快,那么对于新用户来说旧的评级信息则价值不大,如果项目集很大,用户兴趣分布很小,那么与其他用户重叠的可能性就很小。并且该方法存在用户以及项目冷启动问题。

 

CN基于内容的推荐:(项目之间的相关性)基于内容的推荐者根据用户所评价的对象中存在的特征来学习用户兴趣的概要。由基于内容的推荐程序导出的用户兴趣概要的类型取决于所采用的学习方法。决策树、神经网络和基于向量的表示都已经使用。与协作案例一样,基于内容的用户配置文件是长期模型,随着观察到更多关于用户偏好的证据而更新。

     优点:不需要领域知识,不存在项目冷启动问题,并且推荐效果随着时间推移而提高,也具有隐式反馈

     缺点:存在新用户冷启动问题,需要大量的历史数据集,并且存在稳定性问题,并且该方法不具有跨类型推荐能力。需要对物品进行分析和建模,推荐的质量依赖于对物品模型的完整和全面程度。在现在的应用中我们可以观察到关键词和标签(Tag)被认为是描述物品元数据的一种简单有效的方法。

DM基于人口统计学的推荐:简单的根据系统用户的基本信息发现用户的相关程度,然后将相似用户喜爱的其他物品推荐给当前用户

      优点:不需要领域知识,可以实现跨领域推荐,因为不使用当前用户对物品的喜好历史数据,所以对于新用户来讲没有“冷启动(Cold Start)”的问题。

      缺点:存在稳定性问题,并且用户的基本信息也难以准确获得。

UT基于效用的推荐:基于用户需求和可用选项集之间匹配的评估。基于效用的推荐者根据用户对每个对象效用的计算提出建议。

      优点:不存在冷启动问题,对偏好变化十分敏感,可以包含非产品功能

      缺点:用户必须要输入效用函数,推荐能力静态,无法进行学习。

二、混合推荐系统的组合方法

1.加权(weighted):根据系统中所有可用推荐技术的结果计算推荐项得分的方法。最初给予协作推荐者和基于内容的推荐者同等的权重,但随着对用户评分的预测得到确认或不确定,它会逐渐调整权重。加权混合的好处是,系统的所有功能都以简单的方式影响推荐过程,并且很容易执行事后权值分配并相应地调整混合。然而,该技术中隐含的假设是,不同技术的相对值在可能项的空间上或多或少是一致的。从上面的讨论中,我们知道情况并非总是如此:对于评分者数量较少的项目,协作推荐者的作用较弱。

2.转换(switching):切换式混合策略建立了项目级对混合策略的敏感性:系统使用一些标准在推荐技术之间切换。可以首先使用基于内容的推荐方法,具有足够可信度的推荐后尝试进行协作推荐。这种切换混合并不能完全避免冷启动问题,因为协作系统和基于内容的系统都存在“新用户”问题。然而,日常学习者的基于内容的技术是最近邻的,这并不需要大量的例子来进行准确的分类。

3.混合的(mixed):如果同时提出大量建议是可行的,则可以使用混合混合方法,将来自多个技术的建议一起提出。该方法避免了新项目的冷启动问题,但是没有绕开新用户的冷启动问题。

4.特征组合(feature combination):实现内容/协作合并的另一种方法是将协作信息简单地视为与每个项目相关联的附加特征数据,并在此增强的数据集上使用基于内容的技术。特征组合混合允许系统考虑协作数据,而不必完全依赖它,因此它降低了系统对已对项目进行评级的用户数的敏感度。但是,它允许系统拥有与项目内在相似性相关的信息,这些信息对于协作系统来说是不透明的。

5.级联 (cascade)级联杂交是一个分阶段的过程。在该技术中,首先使用一种推荐技术来产生候选的粗略排名,然后第二种技术从候选集合中细化推荐,第二个算法只会调整上一个算法的推荐结果的排序或者剔除掉部分结果,而不会新增推荐标的物。级联允许系统避免在已经被第一个项很好地区分的项上使用第二个、较低优先级的技术,或者在评级足够低的项上使用第二个、较低优先级的技术,这些项永远不会被推荐。因为cascade的第二步只关注那些需要额外区别对待的项目,所以它比例如将其所有技术应用于所有项目的加权混合更有效。此外,由于高优先级推荐者给出的评级只能被细化,而不能被推翻,因此级联在低优先级技术的操作中本质上能够容忍噪声。

6.特征增强(feature augmentation):产生物品的等级或分类,然后将该信息并入下一种推荐技术的处理中。虽然级联技术和增强技术通过两个推荐者进行排序,第一个推荐者对第二个有影响,但它们本质上是完全不同的。在增强型混频器中,第二推荐者使用的特征包括第一推荐者的输出。在级联混合中,第二推荐者在产生其排名时不使用第一推荐者的任何输出,但两个推荐者的结果以优先顺序组合。

7.元级(meta-level):两种推荐技术结合的另一种方法是使用一种方法生成的模型作为另一种方法的输入。元级被称为通过内容进行协作过滤,这与特征增强不同:在增强混合体中,我们使用学习的模型生成特征以输入到第二个算法;在元级混合体中,整个模型成为输入。它为每个用户建立了一个基于内容的模型,描述了预测用户喜欢的项目的特征。这些模型,本质上是术语和权重的向量,然后可以在用户之间进行比较以做出预测。元级方法的好处是,学习的模型是用户兴趣的压缩表示,并且随后的协作机制比原始评级数据更容易对这种信息密集表示进行操作。它通过将多个示例的评分压缩到一个模型中来避免稀疏性的问题,使得该模型可以更容易地在用户之间进行比较。

  

【推荐系统】【论文阅读笔记】【survey】Hybrid Recommender Systems: Survey and Experiments_第1张图片

上表是总结了混合推荐系统中一些最突出的研究。其中有四种混合技术是顺序不敏感的:加权、混合、切换和特征组合,在这些混合系统中,其中CN/CF(基于内容的推荐/协同推荐)混合系统与CF/CN(协同推荐/基于内容的推荐)系统没有区别

级联型、增强型和元级混合型具有内在的有序性。

人口学技术在其方法上类似于协作(相互比较用户),只是使用不同的特性(人口学数据与评级)来这样做。因此,基于内容/人口统计学(CN/DM)的元级混合和基于内容/协作(CN/CF)的元级混合是没有区别的。

我们可以区分两种情况:在整个推荐空间内,一个推荐者(算法)比另一个推荐者(算法)具有更好的准确性的统一情况;以及在空间的不同部分,两个推荐者(算法)具有不同强度的非统一情况。如果推荐者在整体空间中不是一致的、相等的,那么可以使用一种混合方法,其中可以包含较弱推荐者的不精确性:例如,一种级联方案是较强的推荐者,具有较高优先级,其中较弱的一种增强型混合体充当贡献少量信息的机器人,或者使用一种元级组合其中较强的技术产生密集的表示,从而增强较弱的技术的性能。在非统一的情况下,系统需要能够在不同的时间雇用两个推荐人。在这里切换混合是一个自然的选择,但它要求系统能够检测何时应该首选一个推荐者。特征组合和混合混合可以用于允许两个推荐者输出,而无需实现切换标准。

三、基于知识的餐厅推荐系统

entree是一个餐厅推荐系统,使用基于案例的推理(Kolodner 1993)(基于案例推理是由目标案例的提示而获得记忆中的源案例,并由源案例来指导目标案例求解)技术来选择和排名餐厅。用户通过提交入口点(已知餐厅或一组标准)与系统交互,并显示类似的餐厅。然后,用户在一个对话框中与系统交互,批评系统的建议,并以交互方式优化搜索,直到获得一个可接受的选项。

   entre推荐技术是一种基于知识的相似性检索技术。有两种基本的检索模式:相似性查找和基于评论的导航。在相似情况下,用户已经从目录中选择了一个给定的项(称为源),并请求了其他与之类似的项。要执行此检索,将从数据库检索一组候选实体,并根据与源的相似性和返回给用户的前几个候选进行排序。导航基本上是相同的,只是在排序之前过滤候选集,只留下那些满足用户评论的候选集。例如,如果用户使用“Nicer”参数响应项X,则系统将确定X“niceness”值,并拒绝除值较大的候选项之外的所有候选项。entre不保留这样的用户配置文件。它是一个无状态应用程序——它的响应完全由用户响应的示例和给出的特定评论决定。

      餐厅之间的相似关系被分解成一组独立的属性,如餐厅的“美好度”,这些属性对应于用户对对象的高级感知或兴趣。对于每个这样的属性,都定义了一个局部相似性度量,该度量度量两个项相对于该属性的相似程度。两个价格相同的餐馆在价格度量上会得到最大的相似性评级,但可能会有所不同。

基于知识/协作的级联混合

     我们希望保持对话互动,这是FindMe系统的特点。这意味着推荐必须被看作是对用户最后一次评论的直接回应,而不是更全面的东西。因此,KB/CF元级混合和KB/CF特征增强都不合适,因为在这两种配置中,实际上推荐的是协作部分。CF/KB特征增强和CF/KB元级混合本来是可能的,但在这两种情况下,系统中基于知识的部分都必须从协作生成的特征中进行推理。这将需要额外的知识工程——正是我们试图避免的。这就留下了加权/级联类型的混合类型。由于entre的相似性评估技术已经使用了一个级联,我们发现简单地添加协作推荐作为最后一个级联步骤是最优雅的。

四、对混合推荐系统的思考

此部分来源于:https://xueqiu.com/7788828530/137338256

     混合推荐算法提出的目的主要是希望通过多个算法的有效配合避免单个算法存在的问题,提升推荐的整体质量,前面提到的几种混合方式是从算法的角度来说明几种可行的混合方案,这7种混合方案是在2002年提出来的,历史比较久远了,虽然现在还很有代表性,但是这几年整个推荐系统在算法、工程实践、应用场景上都有较大发展和变化,有很多情况可能是这7种混合方式没有覆盖到的,另外,这7种混合方式只是从算法的角度来进行介绍的,而从更广义的角度来看,推荐系统的混合不光有算法的混合,还有数据源的混合、多类别标的物的混合、应用场景的混合等等,在本节我根据自己对推荐系统的未来发展的理解,试图对混合推荐系统可能的重点发展方向进行简单介绍,给大家提供一些新的思考问题的视角。

1 整合实时推荐中用户短期和长期兴趣

实时个性化推荐可以快速响应用户请求,让用户实时获得优质推荐服务,帮助用户及时获取信息对用户来说是非常有价值的事情。

怎么整合用户实时兴趣和长期兴趣对提升用户体验是非常关键的,实时

个性化推荐一定是未来的重点方向,特别是随着5G时代的到来,网速有极大的提升,谁能更快更好地服务用户,谁就能拥有用户。

2 利用单个复杂模型建模多源信息

传统的基于内容的推荐、协同过滤等算法一般只利用部分相关数据来构建推荐模型,由于利用的数据有限,模型相对简单,因此单个算法可能存在一些问题,利用我们介绍的混合推荐策略可以避免部分相关问题。那是否可以利用其它的方案来解决这些基础模型存在的问题呢?确实是可以的。现在随着深度学习等复杂模型的流行,有很多学术研究和工业实践利用深度学习、强化学习等技术整合多种信息来获得更好的推荐效果,这种从模型层面整合多种信息的方法,可以更好地学习多数据源之间的内在关系,所以一定是未来的一个重要的研究和实践方向。

目前的数据源按照数据承载的载体不同有文本、图像、视频、音频等数据,从数据的来源,有用户相关数据、标的物相关数据、用户行为数据、上下文数据等,利用深度学习、异构信息网络等复杂算法来整合多源数据提供更优质的推荐服务是很有前途的一个方向。

3 多源的标的物混合

现在很多APP都是朝着提供综合性服务的方向发展,比如美团(吃、住、行、生活等)等APP提供多种不同性质和类别的服务,未来推荐算法可能会提供综合性的推荐服务,在同一个推荐列表中存在多种不同类别差异性极大的标的物。

另外,互联网产品做广告变现是非常重要的一种商业化手段,随着新闻短视频等信息流产品的流行,信息流广告越来越受到互联网公司的重视,信息流广告中将广告和标的物混合在一起推荐,这时广告也可以看成是一种标的物,因而也是一种标的物混合推荐的形态,只不过在信息流广告中,我们除了关注标的物的“消费”外,还会重点关注广告曝光、点击、购买等收益性指标

怎么将不同类别的标的物进行混合推荐给用户,保证不同类别标的物之间的一致性、协调性(对于信息流广告来说,就是所谓的原生广告的概念),满足用户多样性的要求,这也是一个非常有价值的研究与实践方向。

4 家庭场景中多人兴趣的混合推荐

伴随着智能电视业务从萌芽到成熟,互联网服务走进了家庭电视这块大屏。互联网公司如小米、华为等已经布局智能电视业务,传统电视机厂商也进入智能电视行业,家庭互联网成为一个新的重要的流量入口。随着中国城镇化发展与消费升级,越来越多的人开始购买互联网智能电视。智能电视作为家庭中的一块大屏,为家庭成员提供视听相关服务,视频是智能电视上最重要的杀手级服务。智能电视区别于手机的一大特点是家庭中多个成员共享一台设备,这一点不同导致智能电视上的推荐服务需要兼顾多个家庭成员的兴趣。智能电视上的推荐是多个家庭成员兴趣的混合,怎么在一个推荐列表中为多个家庭成员提供推荐,满足家庭成员多样性的兴趣需求是智能电视上的个性化推荐非常棘手的一个问题,也是必须要解决好的一个问题。

5 用户在多APP场景下行为的混合

目前很多提供互联网服务的公司通过打造APP矩阵来提供多种类的服务,试图占领用户日常生活的方方面面,通过多款APP发展更多的用户,增加更多的变现可能。另一方面,在更多领域做尝试和探索,提供多款APP也能抵御存在的风险。这种策略也是未来的公司生存发展的重要趋势和策略之一。

用户在同一家公司的多个APP上的行为,帮助公司从多个渠道来获得用户的兴趣偏好,进而对用户有更全面的了解。怎么融合用户多样的行为,从而为用户在某个APP上提供更加精准的推荐服务,是一个非常值得探索的方向。

6 用户多状态(场景)的融合推荐

很多时候用户的行为之间是有一定的依赖关系的,用户在当前状态的行为可能依赖于前一状态的操作和决策,在数学上有专门的一个学科“随机过程”来研究变量之间随着时间变化的状态转移关系。对于互联网产品来说,用户也有兴趣状态的转移过程,下面我举几个大家耳熟能详的案例:

(1) 用户在淘宝上买了一个手机,后面用户可能会买手机壳等配件产品;

(2) 淘宝上的某女性用户关注孕妇服,未来若干月后她可能会关注婴儿服饰、奶粉、尿不湿等产品;

(3) 用户在携程上订了一张去三亚的机票,几个小时后,用户可能会关注旅游景点、吃饭、住宿等;

总的来说,用户在使用某个互联网APP时,在时间、地理位置、状态等上的变化对用户的后续行为及兴趣变化是有很大影响的,推荐系统怎么整合用户多种状态之间的转换,将这些复杂的信息整合起来为用户提供更好的推荐服务,是非常有必要的,也是一件非常有挑战的事情。

 


 

你可能感兴趣的:(推荐系统,推荐系统,survey,论文笔记)