论文笔记:推荐系统去偏(Debiased Recommendation)研究综述

1 推荐系统的偏差

  • 出现偏差的原因:用户行为数据是观察所得(Observational)而不是实验所得(Experimental),因此会存在各种偏差,如用户对物品的选择偏差、系统对物品的曝光偏差等;
  • 偏差带来的问题:不考虑偏差,直接利用数据来构建模型会导致性能欠佳,在一定程度上也损害了用户对推荐系统的体验和信任,如何去除推荐系统偏差已经成为推荐系统研究领域的一个新方向
  • 解决方案:随着因果推断(Causal Inference)的兴起,倾向分数(Propensity Score)、反事实(Counterfactual)思想以及去除混淆因子(Confounder)等手段在此领域也得到广泛应用,为推荐系统去偏提供了一些思路。

本文主要介绍推荐系统去偏的研究进展情况,包括各种偏差及解决思路概括和对近几年各大会议录用的部分该领域文章的解读。

2 偏差分类

2.1 选择偏差(Selection Bias)

  • 定义: 主要来自用户的显式反馈,如对物品的评分。由于用户倾向于对自己感兴趣的物品打分,很少对自己很少对自己不感兴趣的物品打分,造成了数据非随机缺失(Missing Not At Random, MNAR)问题,观察到的评分并不是所有评分的代表性样本,于是产生了选择偏差。
  • 解决方法: 数据填充(Data Imputation);倾向分数等。

2.2 一致性偏差(Conformity Bias)

  • 定义:用户对物品的评分受用户所在的群体影响,与群体里的其他用户的评分趋于一致,即使这个评分与自己的感受不相符。这导致用户的评分并不总是能反应该用户的真实偏好。
  • 解决方法:对社会群体或流行度效应进行建模等。

2.3 曝光偏差(Exposure Bias)

  • 定义:主要来自用户的隐式反馈,如点击。用户只能看到一部分系统曝光的物品,并作出点击等反应。但是数据中不包含的交互并不一定代表用户不喜欢,还有可能是用户不知道该物品。
  • 解决方法:启发性置信权重;采样(Sampling)等。

2.4 位置偏差(Position Bias)

  • 定义:用户倾向于与推荐列表顶部的物品产生交互(点击、购买等),尽管这些物品可能是不相关的或不是最符合偏好的。这导致交互的物品可能并没有很高的相关性。
  • 解决方法:点击模型(Click models);倾向分数等。

2.5 流行度偏差(Popularity Bias)

  • 定义: 推荐系统数据存在长尾现象,少部分流行度高的物品占据了大多数的交互。推荐模型基于这些数据训练时,通常给流行度高的物品高分,给流行度低的物品低分,这就导致流行度高的物品更频繁地出现在数据中。流行度偏差会降低推荐系统的个性化水平,并导致推荐结果的不公平。
  • 解决方法:正则化(Regularization);对抗学习(Adversarial learning);因果图(Causal graph)等。

2.6 不公平带来的偏差(Unfairness)

  • 定义:不公平是指系统不公平地对待某些个人或群体,而偏袒其他用户。如在有些岗位推荐系统中,相比于男性而言,女性可能会更少地被推荐高薪或职业指导服务等广告,造成了性别不公平。
  • 解决方法:再平衡(Rebalancing);正则化;对抗学习;因果建模(Causal modeling)等。

2.7 反馈回路放大偏差(Feedback Loop Amplifies Biases)

  • 定义:真实的推荐系统通常会形成一个恶性循环,从而扩大各种偏差。以流行度偏差为例,推荐系统的反馈回路会导致流行度高的物品更加流行,而流行度低的物品变得更不受欢迎,这种效应会降低推荐结果的多样性,导致用户的同质化。
  • 解决方法:通过收集随机数据或强化学习等方式打破循环。

2.8 归纳偏差(Inductive Bias)

  • 定义:通过作出一系列假设,使得模型能更好地学习目标函数进而完成推荐任务。很多假设对推荐模型效果提升都是有帮助的,如MF算法将用户和物品的交互估算成二者向量的内积。
  • 这个偏差对模型的训练不但无害还有利。

3 主要论文

3.1 Recommendations as Treatments: Debiasing Learning and Evaluation (ICML2016)

论文笔记:推荐系统去偏(Debiased Recommendation)研究综述_第1张图片

  • 问题:选择性偏差selection biases;
  • 方法:本文提出利用逆倾向分数(Inverse Propensity Score, IPS) 处理选择偏差。倾向分数可以看作是每个数据被观察到的概率。从因果推断的角度看待推荐问题,认为在推荐系统中给用户曝光某个商品类似于在医学中给病人施加某种治疗方式。这两个任务的共同点是,只知道少数病人(用户)对少数治疗方式(物品)的反应,而大多数的病人-治疗(用户-物品)对的结果是观察不到的。本文提出的方法可以在数据有偏的情况下实现无偏的性能估计,并提供了一个矩阵分解方法。

3.2 Doubly robust joint learning for recommendation on data missing not at random (ICML2019)

参考文献

1 Bias and Debias in Recommender System: A Survey and Future Directions
2 推荐系统去偏(Debiased Recommendation)研究进展概述

你可能感兴趣的:(推荐系统,论文阅读)