一. 论文简介
本文给大家介绍一篇刚被 ACM 旗舰期刊 ACM Computing Surveys (CSUR) 接收的基于会话
推荐系统 (Session-based Recommender Systems (SBRS)) 的综述长文。ACM Computing Surveys 是计算机学科最具影响力的期刊之一,其最新影响因子为 7.99,为中科院认定的一区 Top 期刊,CORE Rank A* 期刊,主要发表计算机科学领域较有代表性的综述论文。
文章题为《A Survey on Session-based Recommender Systems》,论文一作为麦考瑞大学博后Shoujin Wang,研究方向为数据挖掘,
机器学习以及
推荐系统 。这篇文章是
基于会话的推荐系统方向的一篇较为系统全面的综述文章。全文共 39 页,包含 11 个 sections、4 幅插图、11 张表格和 163 篇该领域内有代表性的参考文献。该文基于作者长期的积累和思考,对基于会话
推荐系统这一
推荐系统子领域进行了全面而深入的梳理和总结。
该文对目前文献中存在的各种各样的对问题的定义进行了统一的形式化,系统地定义了基于会话
推荐系统的场景,任务和基本问题以及基本方法。作者从数据特征的角度出发,系统分析了 session 数据所特有的基本特征,以及他们给推荐任务带来的挑战。然后系统而全面地对这一领域当前的进展进行了归纳总结,包括对方法的分类和比较,对每类方法基本思想和特征的阐述。梳理和总结了基于会话
推荐系统的主要应用场景,代表性算法和公开的数据集,并提供了开源链接。最后分享了本领域的未来可能的研究方向。
该文由浅入深,语言力求通俗易懂,举例丰富,既有深入的理论分析,又有应用,算法和数据集,既适合科研工作者阅读,也适合工程人员阅读。作者希望该文能给相关的研究人员提供一个对该领域研究的主要问题以及涉及的各个方面、主要挑战和进展一个全面而综合的了解,同时给未来的研究提供一些启发。
论文预印版链接: https://www.researchgate.net/profile/Shoujin-Wang/research https://arxiv.org/abs/1902.04864
二. 论文解读
0. 摘要
在当今的信息过载和数字经济时代,
推荐系统在消费、服务和决策制定等方面正发挥着日益重要的作用。近些年来,基于会话的
推荐系统(session-based recommender systems (SBRSs)) ,作为
推荐系统的一种新的范式,正在兴起。不同于其他传统的
推荐系统,如基于内容的
推荐系统和协同过滤
推荐系统,通常建模用户的长期和静态的偏好,基于会话的
推荐系统旨在捕获用户短期和动态的偏好来给用户提供更实时和精准的推荐服务。这些推荐服务能对用户不断发展和变化的会话上下文场景具有较好的敏感性。尽管基于会话的
推荐系统已经被广泛研究,目前既没有对基于会话的
推荐系统的一个统一的问题定义和陈述,也没有对基于会话的
推荐系统的特征和挑战的一个深入阐述。通常,人们并不太清楚基于会话的
推荐系统的挑战被解决到什么程度了,以及这一领域的总体研究概况是什么样的。
这篇全面综述通过深入探索和讨论基于会话的
推荐系统所涉及的主体 (比如会话),行为(比如用户对物品的点击),以及他们的特性(比如会话的长度) 来解决上述问题。研究者提出了一个通用的基于会话的
推荐系统的问题陈述,概括和总结了这一领域多样化的数据特征和挑战,并且定义了一个分类方法来对该领域内代表性的研究进行分类。研究者讨论了基于会话的
推荐系统在现实场景中的主要应用领域,整理了典型的算法和常用的数据集。最后研究者讨论了在这个充满活力的研究领域内的新的研究机会。
1. 引言
推荐系统已经发展成为人们进行快速有效选择和决策的一个基本工具。它已经渗透到我们日常生活的方方面面,包括生活、工作、学习、娱乐、社交和商业运营。
推荐系统的作用在数字经济中和信息日益过载的时代显得尤为重要,因为用户通常需要从大量的和快速增长的内容、产品和服务(统称为物品 (item))中选择他们所需要的。因此,各种各样的
推荐系统研究领域兴起并取得了成功,比如基于内容的
推荐系统,协同过滤
推荐系统和混合型
推荐系统。
然而,这些
推荐系统倾向于利用所有的用户与物品之间的交互信息来学习每个用户对物品的长期和静态的偏好。这种做法通常是建立在一个隐含的假设之上的,那就是一个用户的所有的历史交互行为对他当前的偏好是同等重要的。这可能与现实不相符合,主要原因有两点:
近些年来,为了弥补上述不足,基于会话的
推荐系统 (session-based recommender systems (SBRSs)) 悄然兴起,并引起了越来越多的关注。不同于上述
推荐系统,基于会话的
推荐系统从用户在交易过程中产生的会话 (session) 数据来挖掘和学习用户的偏好。每一个会话包含在一段连续的时间段内发生的多个「用户–物品交互行为」,比如某用户在一次交易会话 (比如从登录电商平台的账号到退出账号这段时间)中购买了一篮子物品。通过将每一个会话作为最基本的输入数据单元,一个基于会话的
推荐系统能够从一个用户的最近产生的会话中捕获他的短期偏好,以及从一个会话到另一个会话之间的偏好的变化,从而进行更精准和实时的推荐。
在本文中,研究者用基于会话的
推荐系统来指代那些所有以 session 数据为中心来推荐当前会话里的下一个物品,接下来的所有物品以及下一个会话里的所有物品的
推荐系统。这个定义包括了有些文献中的一些狭义的基于会话的
推荐系统,它们只推荐当前会话里的下一个物品。
对于基于会话的
推荐系统,文献中存在各种各样不同的工作。这些工作通常用不同的词语来描述,建立在不同的场景设置和假设之上,针对不同的应用领域。比如,Hidasi et al. 在匿名会话数据上建立了一个基于会话的
推荐系统。他们通过假设会话内部的交互行为之间存在严格的先后顺序来预测用户接下来想要点击的物品或者想看的电影。Hu et al. 则在非匿名会话数据上建立了另一个基于会话的
推荐系统来推荐用户下一个可能想购买的物品,他们没有假设会话内部存在严格的顺序。Jing et al. 则基于非匿名会话数据设计了一个基于会话的
推荐系统来推荐用户想要听的下一首歌或者想看的下一部电影,他们假设会话内部存在顺序。
虽然基于会话的
推荐系统广泛存在于各个领域并且很多相关的研究都已经开展了,但是在这个领域还存在很多的由不同的描述,假设,场景设置和应用领域导致的不一致性。而且,没有一个统一的框架可以对现有的工作进行分类,对于基于会话的
推荐系统也还没有统一的问题陈述。更重要的是,没有人对基于会话的
推荐系统的特征(包括问题和数据方面的), 挑战和研究进展进行系统的讨论,也没有人对代表性的和最先进的方法进行系统的分类。这些缺陷限制了基于会话的
推荐系统的理论发展和实际应用。为了弥补上面提到的不同方面的缺陷,本文对基于会话的
推荐系统提供了一个综合而系统性的概览和综述。
本文的主要贡献如下:
研究者提供了一个统一的框架来对基于会话的推荐系统的相关工作进行分类,从而有效的缓解了这一领域内的不一致性。
研究者首次为基于会话的推荐系统提出了一个统一的问题陈述,在该陈述中,一个基于会话的推荐系统是建立在以下几个正式的概念之上的:用户、物品、动作、交互和会话。
研究者对会话数据的基本特征以及它给基于会话的推荐系统带来的挑战提供了一个综合的概览。据了解,这是该领域内的第一次这样的描述。
研究者对基于会话的推荐系统的各类方法进行了系统的分类和比较,从而可以看出该领域的各个挑战被解决到什么程度了,以及该领域当前的进展如何。
研究者对每一类方法简单介绍了主要的技术细节,从而给读者对基于会话的推荐系统的当前进展提供一个深入的了解。
研究者分析和讨论了基于会话的推荐系统的主要的实际应用领域和场景、收集和整理了典型算法的开源代码和常用的公开数据集。
最后,研究者讨论和分享了基于会话的推荐系统的一些开放的研究问题和可能的研究方向。
2. 相关工作
文献中存在各种不同的既关于基于会话的
推荐系统,也关于序列
推荐系统的研究。序列
推荐系统是与基于会话的
推荐系统紧密相关但不同的领域。即使在基于会话的
推荐系统中也存在很多不同的子领域,比如下一个物品推荐、下一个购物篮推荐等。因此,很多用不同词语描述的不同的工作混杂在一块,导致整个领域内没有一个统一和一致的描述,很容易让人混淆。在这一节,研究者首先澄清基于会话的
推荐系统和序列
推荐系统的概念以及他们之间的差异,然后提出一个整体框架来统一组织基于会话的
推荐系统内的各种不同研究,最后阐述这篇综述跟已有的相关综述之间的差异。
2.1 基于会话的
推荐系统 vs. 序列
推荐系统
2.2 统一组织基于会话的
推荐系统相关工作的框架
根据推荐任务的不同,基于会话的
推荐系统可以划分为对当前会话内下一个交互行为(通常是下一个物品)的推荐,对当前会话内剩余所有交互行为的推荐和对下一个会话的推荐。
2.3 相关的综述(详见原文)
3. 基于会话的推荐系统问题陈述
一个
推荐系统可以看作一个系统,它包含多个基本主体:用户、物品、他们间的交互行为。这些基本的主体和行为构成会话的基本组成部分,而会话是基于会话的
推荐系统的核心主体。因此研究者首先介绍这些主体和行为的定义及属性,然后在他们基础之上定义基于会话的
推荐系统的研究问题。这些定义和属性将进一步用来对基于会话的
推荐系统进行刻画和分类。
3.1 用户以及用户的属性
3.2 物品以及物品的属性
3.3 行为以及行为的属性
3.4 会话以及会话的属性
3.5 基于会话的推荐系统的研究问题陈述
4. 特征和挑战
基于会话的
推荐系统建立在会话数据之上,不同类型的会话数据通常具有不同的特征,这些特征本质上给基于会话的
推荐系统带来了不同的挑战。本节首先描述根据会话 (session) 的属性所划分的不同类型的会话数据,然后讨论每一类会话数据的特征和挑战。
4.1 与会话长度相关的特征和挑战
4.2 与会话内部顺序相关的特征和挑战
4.3 与行为类型相关的特征和挑战
4.4 与用户信息相关的特征和挑战
4.5 与会话数据结构相关的特征和挑战
5. 基于会话推荐系统方法的分类和比较
5.1 基于会话推荐系统方法的分类
根据采用的技术,基于会话
推荐系统方法可以分为 3 大类:传统方法,基于嵌入表征学习的方法,基于神经网络的方法。这 3 大类又可以进一步分为 8 类。
5.2 不同类方法之间的比较
6. 传统的基于会话推荐系统方法
传统方法采用传统的数据挖掘或者
机器学习技术来挖掘会话数据内部的相关性,从而进行会话推荐。传统方法主要包含 4 类:
6.1 基于模式 / 规则挖掘的方法
6.2 基于最近邻模型的方法
6.3 基于马尔科夫链的方法
6.4 基于生成式概率模型的方法
6.5 传统方法之间的比较
7. 基于嵌入表征学习 (latent representation) 的方法
8. 基于深度神经网络的方法
8.1 基于基本的深度神经的方法
8.1.1 基于 RNN 的方法
8.1.2 基于 MLP 的方法
8.1.3 基于 CNN 的方法
8.1.4 基于 GNN 的方法
8.2 基于高级模型的方法
8.2.1 基于注意力模型的方法
8.2.2 基于记忆网络的方法
8.2.3 基于混合专家模型的方法
8.2.4 基于生成模型的方法
8.2.5 基于强化学习的方法
8.3 基于深度神经网络的方法间的比较
9. 基于会话推荐系统的应用,算法和数据集
9.1 基于会话
推荐系统的应用
基于会话
推荐系统已经被广泛应用于现实世界的各个领域和场景当中,来使客户和企业获利。下表总结了这些传统的和新兴的应用领域。
9.2 开源算法和公开数据集
9.2.1 开源算法整理
9.2.2 公开数据集整理
10. 展望和未来的研究方向
11. 结论
在本文中,研究者对当前的基于会话的
推荐系统的最具代表性的工作进行了系统而广泛的调研。研究者提出了一个统一的框架来把这个领域内各种各样的工作归结为 3 大类,同时提出了一个统一的问题陈述来消除该领域内存在的各种不一致性,以减少读者的疑惑。研究者透彻地分析了会话数据的独有特征以及他们给基于会话的
推荐系统所带来的挑战。研究者提出了一个分类机制来对现有的基于会话的
推荐系统的方法进行分类,阐述了每一类方法的核心思想和一些关键的技术细节。此外研究者讨论了基于会话的
推荐系统的实际应用领域和场景,收集和整理了一些典型的算法和数据集。最后研究者讨论了该领域一些可能的研究方向。关于基于会话的
推荐系统的研究正方兴未艾,大量的新技术和新方法正在不断涌现出来。研究者希望这篇综述能给读者在关于这个领域的主要问题,关键挑战,最新进展以及主要方法和应用等方面带来一个综合而全面的了解。
相关综述文章:
[1] Shoujin Wang, Liang Hu, Yan Wang, Xiangnan He, Quan Z. Sheng, Mehmet A. Orgun, Longbing Cao, Francesco Ricci, Philip S. Yu. Graph Learning based Recommender Systems: A Review. In Proceedings of the 30th International Joint Conference on Artificial Intelligence (IJCAI 2021 Survey Track), 1-9, 2021. Preprint version: https://www.researchgate.net/profile/Shoujin-Wang [2] Shoujin Wang, Liang Hu, Yan Wang, Longbing Cao, Quan Z. Sheng, Mehmet A. Orgun. Sequential Recommender Systems: Challenges, Progress and Prospects. In Proceedings of the 28th International Joint Conference on Artificial Intelligence (IJCAI 2019 Survey Track), 6332-6338, 2019. Preprint version: https://www.researchgate.net/profile/Shoujin-Wang
部分参考文献:
Shoujin Wang, Longbing Cao, Yan Wang, Quan Z. Sheng, Mehmet A. Orgun, Defu Lian. A Survey on Session-based Recommender Systems. ACM Computing Surveys (CSUR 2021), 1-39, (accepted). Shoujin Wang, Liang Hu, Yan Wang, Xiangnan He, Quan Z. Sheng, Mehmet A. Orgun, Longbing Cao, Francesco Ricci, Philip S. Yu. Graph Learning based Recommender Systems: A Review. In Proceedings of the 30th International Joint Conference on Artificial Intelligence (IJCAI 2021 Survey Track), 1-9, 2021. Shoujin Wang, Liang Hu, Yan Wang, Longbing Cao, Quan Z. Sheng, Mehmet A. Orgun. Sequential Recommender Systems: Challenges, Progress and Prospects. In Proceedings of the 28th International Joint Conference on Artificial Intelligence (IJCAI 2019 Survey Track), 6332-6338, 2019. Shoujin Wang, Liang Hu, Yan Wang, Quan Z. Sheng, Mehmet A. Orgun, Longbing Cao. Modeling Multi-Purpose Sessions for Next-Item Recommendations via Mixture-Channel Purpose Routing Networks. In Proceedings of the 28th International Joint Conference on Artificial Intelligence (IJCAI 2019), 6332-6338, 2019. Shoujin Wang, Liang Hu, Longbing Cao, Xiaoshui Huang, Defu Lian, Wei Liu. Attention-based Transactional Context Embedding for Next-item Recommendation. In Proceedings of the 32nd AAAI Conference on Artificial Intelligence (AAAI 2018), 2532-2539, 2018. Shoujin Wang, Liang Hu, Longbing Cao. Perceiving the Next Choice with Comprehensive Transaction Embeddings for Online Recommendation. In Proceedings of the 28th Joint European Conference on Machine Learning and Knowledge Discovery in Databases (ECML-PKDD 2017), 285-302, 2017. Shoujin Wang, Liang Hu, Yan Wang, Quan Z. Sheng, Mehmet A. Orgun, Longbing Cao. Intention Nets: Psychology-inspired User Choice Behavior Modeling for Next-basket Prediction. In Proceedings of the 34th AAAI Conference on Artificial Intelligence (AAAI 2020),6259–6266, 2020. Liang Hu, Longbing Cao, Shoujin Wang, et al. Diversifying Personalized Recommendation with User-session Context. In Proceedings of the 26th International Joint Conference on Artificial Intelligence (IJCAI 2017), 1858-1864, 2017.