封面图:
作者:Shoujin Wang,麦考瑞大学博后,研究方向为数据挖掘,机器学习以及推荐系统。
编者按: 基于会话的推荐系统, 作为一种新兴的推荐系统范式,正方兴未艾,大量的新技术和新方法层出不穷。这篇综述给读者在关于这个领域的主要问题,关键挑战,最新进展以及主要方法和应用等方面提供了一个综合而全面的认知。
本文给大家介绍一篇刚被ACM旗舰期刊 ACM Computing Surveys (CSUR) 接收的基于会话推荐系统 (Session-based Recommender Systems (SBRS)) 的综述长文。ACM Computing Surveys 是计算机学科最具影响力的期刊之一,其最新影响因子为7.99,为中科院认定的一区Top期刊,CORE Rank A* 期刊,主要发表计算机科学领域较有代表性的综述论文。
文章题为A Survey on Session-based Recommender Systems。这篇文章是基于会话的推荐系统方向的一篇较为系统全面的综述文章。全文共39页,包含11个sections,4幅插图,11张表格和163篇该领域内有代表性的参考文献。该文基于作者长期的积累和思考,对基于会话推荐系统这一推荐系统子领域进行了全面而深入的梳理和总结。该文对目前文献中存在的各种各样的对问题的定义进行了统一的形式化,系统地定义了基于会话推荐系统的场景,任务和基本问题以及基本方法。作者从数据特征的角度出发,系统分析了session数据所特有的基本特征,以及他们给推荐任务带来的挑战。然后系统而全面地对这一领域当前的进展进行了归纳总结,包括对方法的分类和比较,对每类方法基本思想和特征的阐述。梳理和总结了基于会话推荐系统的主要应用场景,代表性算法和公开的数据集,并提供了开源链接。最后分享了本领域的未来可能的研究方向。该文由浅入深,语言力求通俗易懂,举例丰富,既有深入的理论分析,又有应用,算法和数据集,既适合科研工作者阅读,也适合工程人员阅读。作者希望该文能给相关的研究人员提供一个对该领域研究的主要问题以及涉及的各个方面,主要挑战和进展一个全面而综合的了解,同时给未来的研究提供一些启发。
https://www.researchgate.net/profile/Shoujin-Wang/research
https://arxiv.org/abs/1902.04864
[1] Shoujin Wang, Liang Hu, Yan Wang, Xiangnan He, Quan Z. Sheng, Mehmet A. Orgun, Longbing Cao, Francesco Ricci, Philip S. Yu. Graph Learning based Recommender Systems: A Review. In Proceedings of the 30th International Joint Conference on Artificial Intelligence (IJCAI 2021 Survey Track), 1-9, 2021. Preprint version: https://www.researchgate.net/profile/Shoujin-Wang
[2] Shoujin Wang, Liang Hu, Yan Wang, Longbing Cao, Quan Z. Sheng, Mehmet A. Orgun. Sequential Recommender Systems: Challenges, Progress and Prospects. In Proceedings of the 28th International Joint Conference on Artificial Intelligence (IJCAI 2019 Survey Track), 6332-6338, 2019. Preprint version: https://www.researchgate.net/profile/Shoujin-Wang
在当今的信息过载和数字经济时代,推荐系统在消费,服务和决策制定等方面正发挥着日益重要的作用。近些年来,基于会话的推荐系统(session-based recommender systems (SBRSs)) ,作为推荐系统的一种新的范式,正在兴起。不同于其他传统的推荐系统,如基于内容的推荐系统和协同过滤推荐系统,通常建模用户的长期和静态的偏好,基于会话的推荐系统旨在捕获用户短期和动态的偏好来给用户提供更实时和精准的推荐服务。这些推荐服务能对用户不断发展和变化的会话上下文场景具有较好的敏感性。尽管基于会话的推荐系统已经被广泛研究,目前既没有对基于会话的推荐系统的一个统一的问题定义和陈述,也没有对基于会话的推荐系统的特征和挑战的一个深入阐述。通常,人们并不太清楚基于会话的推荐系统的挑战被解决到什么程度了,以及这一领域的总体研究概况是什么样的。这篇全面综述通过深入探索和讨论基于会话的推荐系统所涉及的主体(比如会话), 行为(比如用户对物品的点击), 以及他们的特性(比如会话的长度)来解决上述问题。我们提出了一个通用的基于会话的推荐系统的问题陈述,概括和总结了这一领域多样化的数据特征和挑战,并且定义了一个分类方法来对该领域内代表性的研究进行分类。我们讨论了基于会话的推荐系统在现实场景中的主要应用领域,整理了典型的算法和常用的数据集。最后我们讨论了在这个充满活力的研究领域内的新的研究机会。
推荐系统已经发展成为人们进行快速有效选择和决策的一个基本工具。它已经渗透到我们日常生活的方方面面,包括生活,工作,学习,娱乐,社交和商业运营。推荐系统的作用在数字经济中和信息日益过载的时代显得尤为重要,因为用户通常需要从大量的和快速增长的内容、产品和服务(统称为物品 (item))中选择他们所需要的。因此,各种各样的推荐系统研究领域兴起了并取得了成功,比如基于内容的推荐系统,协同过滤推荐系统和混合型推荐系统。
然而,这些推荐系统倾向于利用所有的用户与物品之间的交互信息来学习每个用户对物品的长期和静态的偏好。这种做法通常是建立在一个隐含的假设之上的,那就是一个用户的所有的历史交互行为对他当前的偏好是同等重要的。这可能与现实不相符合,主要原因有两点:首先,一个用户对物品的选择不仅依赖于他长期以来形成的偏好,而且依赖于他短期的最近的偏好和跟时间相关的上下文场景(比如他最近浏览或者购买过的物品)。这种短期偏好通常隐含在用户的最近发生的与物品的交互行为之中,而这类最近的交互行为通常仅占用户所有交互行为的很小一部分。其次,一个用户对物品的偏好通常是动态变化而非静止的,它会随着时间的推移而演变。
近些年来,为了弥补上述不足,基于会话的推荐系统(session-based recommender systems (SBRSs))悄然兴起,并引起了越来越多的关注。不同于上述推荐系统,基于会话的推荐系统从用户在交易过程中产生的会话(session)数据来挖掘和学习用户的偏好。每一个会话包含在一段连续的时间段内发生的多个“用户–物品交互行为”,比如某用户在一次交易会话 (比如从登录电商平台的账号到退出账号这段时间)中购买了一篮子物品。通过将每一个会话作为最基本的输入数据单元,一个基于会话的推荐系统能够从一个用户的最近产生的会话中捕获他的短期偏好,以及从一个会话到另一个会话之间的偏好的变化,从而进行更精准和实时的推荐。在本文中,我们用基于会话的推荐系统来指代那些所有以session数据为中心来推荐当前会话里的下一个物品,接下来的所有物品以及下一个会话里的所有物品的推荐系统。这个定义包括了有些文献中的一些狭义的基于会话的推荐系统,它们只推荐当前会话里的下一个物品。
对于基于会话的推荐系统,文献中存在各种各样不同的工作。这些工作通常用不同的词语来描述,建立在不同的场景设置和假设之上,针对不同的应用领域。比如,Hidasi et al. 在匿名会话数据上建立了一个基于会话的推荐系统。他们通过假设会话内部的交互行为之间存在严格的先后顺序来预测用户接下来想要点击的物品或者想看的电影。Hu et al. 则在非匿名会话数据上建立了另一个基于会话的推荐系统来推荐用户下一个可能想购买的物品,他们没有假设会话内部存在严格的顺序。Jing et al. 则基于非匿名会话数据设计了一个基于会话的推荐系统来推荐用户想要听的下一首歌或者想看的下一部电影,他们假设会话内部存在顺序。
虽然基于会话的推荐系统广泛存在于各个领域并且很多相关的研究都已经开展了,但是在这个领域还存在很多的由不同的描述,假设,场景设置和应用领域导致的不一致性。而且,没有一个统一的框架可以对现有的工作进行分类,对于基于会话的推荐系统也还没有统一的问题陈述。更重要的是,没有人对基于会话的推荐系统的特征(包括问题和数据方面的), 挑战和研究进展进行系统的讨论,也没有人对代表性的和最先进的方法进行系统的分类。这些缺陷限制了基于会话的推荐系统的理论发展和实际应用。为了弥补上面提到的不同方面的缺陷,本文对基于会话的推荐系统提供了一个综合而系统性的概览和综述。
本文的主要贡献如下:
• 我们提供了一个统一的框架来对基于会话的推荐系统的相关工作进行分类,从而有效的缓解了这一领域内的不一致性。
• 我们首次为基于会话的推荐系统提出了一个统一的问题陈述,在该陈述中,一个基于会话的推荐系统是建立在以下几个正式的概念之上的:用户,物品,动作,交互和会话。
• 我们对会话数据的基本特征以及它给基于会话的推荐系统带来的挑战提供了一个综合的概览。据我们所知,这是该领域内的第一次这样的描述。
• 我们对基于会话的推荐系统的各类方法进行了系统的分类和比较,从而可以看出该领域的各个挑战被解决到什么程度了,以及该领域当前的进展如何。
• 我们对每一类方法简单介绍了主要的技术细节,从而给读者对基于会话的推荐系统的当前进展提供一个深入的了解。
• 我们分析和讨论了基于会话的推荐系统的主要的实际应用领域和场景, 收集和整理了典型算法的开源代码和常用的公开数据集。
• 最后,我们讨论了和分享了基于会话的推荐系统的一些开放的研究问题和可能的研究方向。
文献中存在各种不同的既关于基于会话的推荐系统,也关于序列推荐系统的研究。序列推荐系统是与基于会话的推荐系统紧密相关但不同的领域。即使在基于会话的推荐系统中也存在很多不同的子领域,比如下一个物品推荐,下一个购物篮推荐等。因此,很多用不同词语描述的不同的工作混杂在一块,导致整个领域内没有一个统一和一致的描述,很容易让人混淆。在这一节,我们首先澄清基于会话的推荐系统和序列推荐系统的概念以及他们之间的差异,然后提出一个整体框架来统一组织基于会话的推荐系统内的各种不同研究,最后我们阐述这篇综述跟已有的相关综述之间的差异。
根据推荐任务的不同,基于会话的推荐系统可以划分为对当前会话内下一个交互行为(通常是下一个物品)的推荐,对当前会话内剩余所有交互行为的推荐和对下一个会话的推荐。
一个推荐系统可以看作一个系统,它包含多个基本主体:用户,物品,他们间的交互行为。这些基本的主体和行为构成会话的基本组成部分,而会话是基于会话的推荐系统的核心主体。因此我们首先介绍这些主体和行为的定义及属性,然后在他们基础之上定义基于会话的推荐系统的研究问题。这些定义和属性将进一步用来对基于会话的推荐系统进行刻画和分类。
基于会话的推荐系统建立在会话数据之上,不同类型的会话数据通常具有不同的特征,这些特征本质上给基于会话的推荐系统带来了不同的挑战。本节我们首先描述根据会话(session)的属性所划分的不同类型的会话数据,然后讨论每一类会话数据的特征和挑战。
根据采用的技术,基于会话推荐系统方法可以分为3大类:传统方法,基于嵌入表征学习的方法,和基于神经网络的方法。这3大类又可以进一步分为8类。
传统方法采用传统的数据挖掘或者机器学习技术来挖掘会话数据内部的相关性,从而进行会话推荐。传统方法主要包含4类:
基于会话推荐系统已经被广泛应用于现实世界的各个领域和场景当中,来使客户和企业获利。下表总结了这些传统的和新兴的应用领域。
在本文中,我们对当前的基于会话的推荐系统的最具代表性的工作进行了系统而广泛的调研。我们提出了一个统一的框架来把这个领域内各种各样的工作归结为3大类,同时我们提出了一个统一的问题陈述来消除该领域内存在的各种不一致性,以减少读者的疑惑。我们透彻地分析了会话数据的独有特征以及他们给基于会话的推荐系统所带来的挑战。我们提出了一个分类机制来对现有的基于会话的推荐系统的方法进行分类,阐述了每一类方法的核心思想和一些关键的技术细节。此外我们讨论了基于会话的推荐系统的实际应用领域和场景,收集和整理了一些典型的算法和数据集。最后我们讨论了该领域一些可能的研究方向。关于基于会话的推荐系统的研究正方兴未艾,大量的新技术和新方法正在不断涌现出来。我们希望这篇综述能给读者在关于这个领域的主要问题,关键挑战,最新进展以及主要方法和应用等方面带来一个综合而全面的了解。