之前把2022年已公布的推荐系统相关顶会梳理一遍 ,历史推荐系统顶会论文梳理系列文章可以参考公众号或知乎,快捷合辑详见《2022推荐系统顶会论文梳理系列》。
WSDM'23已公布录用结果,共收到投稿690篇,录用123篇,录用率为17.8% ,完整录用论文列表见WSDM'23 Accepted Papers。
本文对WSDM'23推荐系统相关论文(41篇)进行梳理,后续选择感兴趣的论文进行单独解读,相关论文可在公众号后台回复WSDM2023-RecSys获取,我也会更新到Github-Currently_Awesome-RecSys-Papers中 (部分未公开的论文后面再补充,欢迎关注/Star)。
整体来看,WSDM'23的论文和之前同质化比较严重,最火的方向依然是图网络和对比学习,部分标题甚至和已有论文完全相同,也有的是在原有基础上稍加修改,比如单意图变多意图,整体看起来并没有特别出彩的文章。不过还是例行梳理学习一下,也许朴实无华的标题下,就有未知的精彩呢。
1. DGRec: Graph Neural Network for Recommendation with Diversified Embedding Generation
本文出自伊利诺伊大学芝加哥分校、字节,主要研究基于 GNN 的多样化推荐系统。
动机:基于图神经网络(GNN)的推荐系统由于其在准确性方面的出色表现,近年来受到越来越多的关注。 GNN 模型将用户-项目交互表示为二部图,通过聚合邻居的嵌入来生成用户和项目表示。 然而,这样的聚合过程往往纯粹基于图结构来积累信息,忽略了聚合邻居的冗余性,导致推荐列表的多样性较差。
方法:在本文中,我们提出通过直接改进嵌入生成过程来使基于 GNN 的推荐系统多样化。 特别是,我们利用以下三个模块:子模块邻居选择来找到不同邻居的子集以聚合每个 GNN 节点,分层注意为每一层分配注意权重,以及损失重加权以专注于长尾类别的项目。 将这三个模块混合到 GNN 中,我们提出了用于多样化推荐的 DGRec(基于 GNN 的多样化推荐系统)。
2. VRKG4Rec: Virtual Relational Knowledge Graph for Recommendation
本文出自华科,主要研究用于推荐系统的虚拟关系知识图谱。
动机:将知识图谱作为辅助信息已经成为推荐系统的新趋势。 最近的研究将项目视为知识图谱的实体,并利用图神经网络来辅助项目编码,但要独立考虑每种关系类型。 然而,关系类型通常太多,有时一种关系类型涉及的实体太少。 我们认为知识图谱中的关系之间可能存在一些潜在的相关性。 考虑项目编码的所有关系类型可能没有必要也没有效果。
方法:在本文中,我们提出了一个 VRKG4Rec 模型(Virtual Relational Knowledge Graphs for Recommendation,用于推荐的虚拟关系知识图谱),该模型将具有潜在相关性的关系聚类以生成虚拟关系。 具体来说,我们首先通过无监督学习方案构建虚拟关系图 (VRKG),并为 VRKG 上的节点编码设计了一种局部加权平滑 (LWS) 机制,该机制仅根据节点本身及其邻居迭代更新节点嵌入,但不涉及额外的训练参数。 LWS 机制也用于用户-项目二部图的用户表示学习,它利用具有虚拟关系知识的项目编码来帮助训练用户表示。
3. Efficiently Leveraging Multi-level User Intent for Session-based Recommendation via Atten-Mixer Network
本文出自港科大、北大、微软亚研等,主要研究基于图网络的会话推荐问题。
动机:基于会话的推荐 (SBR,Session-based recommendation)旨在基于短期和动态的会话来预测用户的下一次行为。 最近,人们越来越关注利用各种精心设计的图神经网络 (GNN) 来捕捉项目之间的成对关系,这似乎表明设计更复杂的模型是提高实证性能的灵丹妙药。 然而,随着模型复杂性的指数增长,这些模型仅实现了相当有限的提升。
方法:在本文中,我们剖析了经典的基于 GNN 的 SBR 模型,并经验性的发现一些复杂的 GNN 传播是冗余的,因为readout模块在基于 GNN 的模型中起着重要作用。 基于这一观察,我们直觉地提出移除GNN的传播部分,而readout模块将在模型推理过程中承担更多责任。 为此,我们提出了多级注意混合网络(Atten-Mixer,Multi-Level Attention Mixture Network),它利用概念视图和实例视图readouts来实现项目变换的多级推理。 由于简单地枚举所有可能的高级概念对于大型现实世界的推荐系统是不可行的,我们进一步结合了 SBR 相关的归纳偏置,即局部不变性和固有优先级来修剪搜索空间。
4. Variational Reasoning over Incomplete Knowledge Graphs for Conversational Recommendation
本文出自山大,暂未公开,引用其官网文章。
对话式推荐任务通过与用户的交互向他们推荐商品,且往往利用外部知识(如知识图谱)来引入更加丰富的语义信息。现有的对话式推荐系统中使用的原始知识图谱往往是稀疏和不完整的,这限制了推理能力和推荐性能;此外,现有的工作没有充分利用对话语料来动态地完善知识图谱和选择相关知识。为了探索如何利用对话式推荐任务中的大规模对话语料来增强不完整的知识图谱, 并根据对话上下文进行动态知识推理,本文提出了一种可以在不完整知识图谱上进行变分推理的对话式推荐模型VRICR(Variational Reasoning over Incomplete KGs Conversational Recommender)。 本文把针对于特定对话语境的目标知识子图作为隐变量,把原始不完整的知识图谱以及对话信息作为可观测变量,通过变分贝叶斯的方法推理逼近目标知识子图, 随后利用推理出的子图进行下游推荐和回复生成子任务。本文在两个基准对话式推荐数据集上进行了充分的实验,实验结果证实了VRICR在推荐和对话子任务上的有效性。
5. Cognition-aware Knowledge Graph Reasoning for Explainable Recommendation
6. Self-Supervised Group Graph Collaborative Filtering for Group Recommendation
7. SGCCL: Siamese Graph Contrastive Consensus Learning for Personalized Recommendation
8. Simplifying Graph-based Collaborative Filtering for Recommendation
9. Heterogeneous Graph Contrastive Learning for Recommendation
1. IDNP: Interest Dynamics Modeling using Generative Neural Processes for Sequential Recommendation
本文出自新南威尔士大学等,主要研究序列推荐问题。
动机:序列推荐模型越来越依赖于连续的短期用户-项目交互序列来建模用户兴趣。 然而,这些方法引起了对短期和长期收益的担忧。 (1) 短期:即使是在很短的时间内,交互序列也可能不是单一兴趣的结果,而是几个相互交织兴趣的结果,导致他们无法建模跳跃行为; (2) 长期:交互序列主要是在离散的时间间隔内稀疏地观察到的,而不是长期连续观察到的,这使得推断长期兴趣变得困难,因为只能推导出离散的兴趣表示,而没有考虑跨序列的兴趣动态。
方法:在这项研究中,我们通过学习(1)短期收益的多尺度表征 (multi-scale representations of short-term interests); (2) 动态感知的长期收益表示 (dynamics-aware representations of long-term interests)来解决这些问题。 我们提出了一个使用生成神经过程的兴趣动态建模框架IDNP (Interest Dynamics modeling framework using generative Neural Processes),从函数的角度对用户兴趣进行建模。 IDNP 学习全局兴趣函数族,将每个用户的长期兴趣定义为函数实例化,通过函数连续性表现兴趣动态。 具体来说,IDNP 首先将每个用户的短期交互编码为多尺度表示,然后将其概括为用户上下文。 通过将潜在的全局兴趣与用户上下文相结合,IDNP重建长期用户兴趣函数并预测即将到来的交互。 此外,即使交互序列有限且不连续,IDNP 也可以对此类兴趣函数进行建模。
2. DisenPOI: Disentangling Sequential and Geographical Influence for Point-of-Interest Recommendation
本文出自北大、美团,主要研究POI解耦问题。
动机:兴趣点(POI)推荐在各种位置感知服务中起着至关重要的作用。 据观察,POI 推荐受顺序和地理影响。 然而,由于没有标签,现有方法往往将这两种影响纠缠在一起,这可能导致推荐性能不佳和可解释性差。
方法:在本文中,我们通过提出 DisenPOI 来解决上述挑战,DisenPOI 是一种用于 POI 推荐的新颖的解耦双图框架 (Disentangled dual-graph framework for POI recommendation),它联合利用两个单独图上的顺序和地理关系,并通过自监督解耦这两种影响。 与现有方法相比,模型的主要创新是使用对比学习提取顺序和地理影响的解耦表示。 具体来说,我们根据用户的行为顺序构建地理图和时序图,定制他们的传播方案以变得具有序列/地理意识,以更好地捕捉相应的影响。 从行为序列中提取偏好代理作为两种影响的伪标签,通过对比损失监督解耦。
3. Multi-Intentions Oriented Contrastive Learning for Sequential Recommendation
4. Exploiting Explicit and Implicit Item relationships for Session-based Recommendation
1. One for All, All for One: Learning and Transferring User Embeddings for Cross-Domain Recommendation
本文出自阿尔伯塔大学和腾讯,主要研究跨域推荐问题。
动机:跨域推荐是提高推荐系统性能的重要方法,尤其是当目标域中的数据稀疏时。 然而,大多数现有技术都侧重于单目标或双目标跨域推荐,很难推广到具有多个目标域的跨域推荐。 此外,负迁移问题在跨域推荐中普遍存在,目标域中的推荐性能可能并不总是通过从源域中学习的知识得到增强,尤其是当源域具有稀疏数据时。
方法:本文提出了CAT-ART,这是一种多目标跨域推荐方法,它通过表示学习和嵌入迁移学习改进所有参与域中的推荐。 CAT-ART由两部分组成:一个自监督的Contrastive AuToencoder (CAT) 框架,用于根据来自所有参与域的信息生成全局用户嵌入,以及一个基于注意力的表示迁移 (ART,Attention-based Representation Transfer) 框架,该框架从其他域转移特定领域的用户嵌入以协助目标域推荐。CAT-ART 除了将原始用户嵌入到目标域中之外,还通过结合使用学习到的全局用户表示和从其他域迁移的知识来提高任何目标域中的推荐性能。 数据集将开源,以促进多领域推荐系统和用户建模领域的未来研究。
2. Towards Universal Cross-Domain Recommendation
1. Knowledge Enhancement for Contrastive Multi-Behavior Recommendation
2. Improving News Recommendation with Channel-Wise Dynamic Representations and Contrastive User Modeling
3. Knowledge-Adaptive Contrastive Learning for Recommendation
1. Meta Policy Learning for Cold-Start Conversational Recommendation
本文出自弗吉尼亚大学和京东,主要通过元强化学习研究冷启动用户的对话推荐策略学习。
动机:对话推荐系统 (Conversational recommender systems) 明确征求用户的偏好以即时改进推荐。 大多数现有的对话推荐解决方案都采用强化学习方法来为一群用户训练单一策略。 然而,对于系统的新用户,这样的全局策略对于生成对话推荐变得无效,即冷启动挑战。
方法:在本文中,我们通过元强化学习研究冷启动用户的对话推荐策略学习。 我们提出学习一种元策略,并通过几次对话推荐试验使其适应新用户。 为了促进策略适应,我们设计了三个协同组件。 首先是元探索策略,致力于通过探索性对话识别用户偏好;其次是基于 Transformer 的状态编码器,用于模拟用户在对话期间的正面和负面反馈;第三个是基于嵌入状态的自适应项目推荐器。
2. Generative Slate Recommendation with Reinforcement Learning
1. CL4CTR: A Contrastive Learning Framework for CTR Prediction
本文出自复旦、微软亚研,主要研究点击率预估中的特征表示问题。
动机:许多点击率预测工作侧重于设计先进的结构来建模复杂的特征交互,但忽略了特征表示学习的重要性,为每个特征采用普通嵌入层,这导致次优特征表示,继而导致较差的CTR 预测性能。 例如,在许多 CTR 任务中占大部分的低频特征在标准监督学习设置中较少被考虑。
方法:在本文中,我们引入自监督学习来直接产生高质量的特征表示,并提出了一种与模型无关的 CTR 对比学习 (CL4CTR) 框架,该框架由三个自监督学习信号组成,以规范特征表示学习:对比损失、特征对齐和域一致性(contrastive loss, feature alignment, and field uniformity)。 对比模块首先通过数据增强构建正特征对,然后通过对比损失最小化每个正特征对的表示之间的距离。 特征对齐约束迫使来自同一领域的特征表示接近,而域一致性约束迫使来自不同领域的特征表示远离。
2. Directed Acyclic Graph Factorization Machines for CTR Prediction via Knowledge Distillation
本文出自人大、北邮、微信,主要研究点击率预估任务中的知识蒸馏问题。
动机:随着推荐系统中高维稀疏数据的增长,在 CTR 预测任务中学习高阶特征交互的计算成本大幅增加,这限制了高阶交互模型在实际工业应用中的使用。 最近一些基于知识蒸馏的方法将知识从复杂的教师模型迁移到浅层学生模型,以加速在线模型推理。 然而,它们在知识蒸馏过程中受到模型准确性下降的影响,平衡浅层学生模型的效率和有效性具有挑战性。
方法:为了解决这个问题,我们提出了一种有向无环图分解机 (KD-DAGFM,Directed Acyclic Graph Factorization Machine),通过知识蒸馏从现有的复杂交互模型中学习高阶特征交互,用于 CTR 预测。 所提出的轻量级学生模型 DAGFM 可以从教师网络中学习任意显式特征交互,实现近似无损的性能,并通过动态规划算法证明。 此外,改进的通用模型 KD-DAGFM+ 被证明可以有效地从任何复杂的教师模型中提取显式和隐式特征交互。
1. Unbiased Knowledge Distillation for Recommendation
本文出自中科大、浙大,主要研究推荐系统知识蒸馏的偏差问题。
动机:推荐系统中标准的蒸馏范式会导致严重的偏差问题——蒸馏后更强地推荐流行的项目。 这种影响会阻止学生模型做出准确和公平的推荐,从而降低推荐系统的有效性。
方法:在这项工作中,我们确定了知识蒸馏中偏差的起源——它源于教师的偏差软标签,并在蒸馏过程中进一步传播和强化。 为了纠正这个问题,我们提出了一种具有分层蒸馏策略的新方法。 它首先根据受欢迎程度将物品分成多个组,然后提取每个组内的排名知识来监督学生的学习。 我们的方法简单且与教师无关——它在蒸馏阶段工作,不会影响教师模型的训练。
2. Separating Examination and Trust Bias from Click Predictions for Unbiased Relevance Ranking
1. Relation Preference oriented High-order Sampling for Recommendation
2. Disentangled Negative Sampling for Collaborative Filtering
1. Feature Missing-aware Routing-and-Fusion Network for Customer Lifetime Value Prediction in Advertising
2. Boosting Advertising Space: On Designing Ad Auctions for Augment Advertising
Disentangled Representation for Diversified Recommendations
Federated Unlearning for On-Device Recommendation
Learning to Distinguish Multi-User Coupling Behaviors for TV Recommendation
Slate-Aware Ranking for Recommendation
Calibrated Recommendations as a Maximum Flow Problem
MUSENET: Multi-Scenario Learning for Repeat-Aware Personalized Recommendation
A Personalized Neighborhood-based Model for Within-basket Recommendation in Grocery Shopping
Range Restricted Route Recommendation Based on Spatial Keyword
AutoGen: An Automated Dynamic Model Generation Framework for Recommender System
A Causal View for Item-level Effect of Recommendation on User Preference
Explicit Counterfactual Data Augmentation for Recommendation
Uncertainty Quantification for Fairness in Two-Stage Recommender Systems
An F-shape Click Model for Information Retrieval on Multi-block Mobile Pages