因果推断推荐系统工具箱 - DCCF(一)

文章名称

【Arxiv-2021】【Rutgers University-Salesforce Research】Deconfounded Causal Collaborative Filtering

核心要点

文章旨在同时解决推荐模型中遇到的各种偏差,作者首先利用具有未观测混淆变量的因果图建模用户行为,并结合前门准则和机器学习模型来消除未观测混淆变量对数据和推荐模型的影响,最终提出Deconfounded Causal Collaborative Filtering(DCCF)模型。

方法细节

问题引入

在为训练推荐模型而收集的数据中,存在各种各样的混淆变量,同时影响treatment(某个物品是否被展示)以及outcome(用户是否喜欢某个物品)。为了消除这些混淆变量的影响(偏差),许多针对特定混淆变量(偏差)的方法被提出。然而,多种混淆变量是共同作用的,很多混淆变量专家们甚至都没与意识到(因为无法被观测),比如与用户听音乐时候的情绪,即影响用户选择什么来听,也影响其给音乐的评分,而这个混淆变量很难观测。混淆变量可以被分为全局混淆变量和个体混淆变量,比如温度整体影响所有用户对冰淇淋的偏好,好天气整体影响大家出去玩的倾向。但是有些人(下图中的Bob)由于个人倾向(不喜欢大太阳,因为可能会晒伤皮肤,喜欢雨天出去),而与整体用户的倾向不同。

global and personal confounders

Causal Graph是研究混淆变量的有效的工具,通常可以采用后门准则和前门准则2种方法,在估计因果效应时控制混淆变量的影响,对因果效应进行(无偏)估计。如上所述,在推荐场景下,有许多未知的混淆变量,作者表示后门准则很难同时对所有混淆变量(偏差)进行校准,因此采用前门准则。

具体做法

back-door adjustment and front-door adjustment

首先,让我们看看后门准则和前门准则,以及为什么作者选择了后者。常见的因果图如下图所示,那么后门在准则是指,如果(注意是一系列随机变量,不一定是单独一个),1)不包含任意的子节点;2)阻断了所有之间包含进入的路径。由于混淆变量的存在,。当混淆变量满足后门准则时,可以通过控制(adjust)混淆变量来识别对的因果效应,。然而,后门准则的问题是,太多了,很难控制所有混淆变量(很多还是未被观测的),同时,在比较多的时候,求和项也很难计算。

back-door adjustment and front-door adjustment

如上图b所示,如果随机变量满足,1)阶段所有到的通路(treatment到outcome的);2)没有任何一条从到的通路没有被截断(即到不存在其他后门路径);3)到的所有后门路径都被阻断。那么满足前门准则,此时,可以利用来估计对的因果效应。

前门准则的中间步骤是,再把看作treatment,看做满足后门准则的随即变量,可以得到上述式子。

Causal Graph of DCCF

作者利用用户特征当做(Mediator),来反映不受全局和个体混淆变量影响的因素,具体因果图,如下图所示。其中,分别表示用户,物品和偏好(outcome),包括全局和个体混淆变量。利用前门准则,可以分析用户-物品元组()的偏好。

DCCF Causal Graph

本节讲述了前门准则和作者构造的描述用户行为的因果图,下一节继续讲解如何利用前门准则估计物品展示对用户偏好的因果效应。

心得体会

前门准则

在具有众多未观测混淆变量的场景下,前门准则(中介分析)越来越流行,也可以缓解多混淆变量计算复杂度较高的问题。然而,个人理解,也需要treatment具有较小的维度,不然,同样也会遇到计算瓶颈,因为需要在两个维度进行求和。如果分别是用户-物品元组的曝光(这个动作)以及物品特征,这个维度和稀疏程度,同样不小,也会影响模型效果。

你可能感兴趣的:(因果推断推荐系统工具箱 - DCCF(一))