因果推断推荐系统工具箱 - CCF(三)

文章名称

【AAAI-2019】【Rutgers University】Causal Collaborative Filtering

核心要点

文章旨在将现有的基于相关性的协同过滤模型,扩展到基于因果的协同过滤模型,使得模型能够打破观测数据的边界,真正的估计那些没有被观测到的反事实结果。作者提出了一个通用的协同过滤框架CCF来建模推荐系统中的因果关系,并且表明原有的基于相关性的协同过滤模型是CCF的特例,是简化CCF因果图之后的结果。作者还提出了一个条件干预方法来模拟do-calculus,以此从观测数据中估计因果关系,并利用新提出的反事实约束学习框架估计用户对物品的偏好。

上一节描述了如何把估计的问题转化为条件期望,并且强调存在其他的交互历史的情况,需要进行反事实推理。本节继续介绍,反事实推理和基于反事实约束的学习方法。

方法细节

问题引入

上一节提到估计等价于估计条件期望。这里的需要是所有可能的交互,而不仅仅是观测到的实际交互,也就是需要生成反事实。作者把子图c的因果图改为子图d中的因果图。这样的改动,把随机变量变为外生变量,其他的随机变量是链式结构。如果是全部的可能结构,那么则是所有可能的被推荐的物品(也就是无偏的,不但推荐的物品的个数可能发生变化,概率也可能发生变化),这样估计的偏好也将是无偏的。

manipulation causal graph

作者把用户偏好的无偏估计公式表示如下,其中表示所有可能的历史交互。此时,我们需要估计在所有可能的历史交互下,物品被推荐的可能以及其对用户偏好的影响。估计所有可能性的期望值,作为用户偏好的估计值。

unbiased user preference estimation

具体做法

如前所述,为了实现在所有交互历史的情况下,通过估计推荐特定物品的期望,来估计干预,需要反事实推理。具体需要经历三个步骤,

  • 生成反事实样本。生成的反事实样本一般被要求是在真实样本上进行最小的改动[30],并改变模型的判断。在文章的场景中,要求经过最小改动,使得用户行为历史变为反事实样本。
  • 筛选反事实样本。因为我们要求被推荐的物品是(因为,所以,得到的必须和目标的一致,需要过滤掉不符合条件的反事实样本。
  • 计算条件期望。此时,需要知道每一个反事实样本出现的条件概率。然而,这个概率是未知的,因此,作者利用均匀分布(因为不知道任何信息,基于最大熵的原理,就选择均匀分布),平均分配反事实的概率。观测事实的概率大于其他均匀分布的反事实。(作者表示其他分布将来会尝试)。

Generate Counterfactual Examples

生成反事实样本时,作者首先采用启发式的方法,包括3种策略,

  • Keep One,K1。在真实的历史行为中,只保留用户的一个交互行为。
  • Delete One,D1。从用户真实的历史行为中,删除一个用户的交互行为。
  • Replace One,R1。从用户真实的历史行为中,替换一个用户的交互行为。

在R1策略中,又可以分为,随机替换和最近邻替换,其中最近邻的度量embedding的欧氏距离。

Select Counterfactual Examples

假设用户历史行为序列为,利用上述任意启发式策略,可以得到个反事实样本。如上所述,由于反事实干预(条件干预)要求生成的反事实样本必须也能够推荐出目标物品,因此,利用推荐模型对反事实样本进行预测,选择个物品。如果目标物品,则把反事实样本纳入候选集,最终得到反事实样本集合

Calculate the Expectation

在真实观测样本和反事实样本上,利用上述公式5,计算。**由于不知道反事实样本可能的出现概率,以及它们与实际观测数据可能出现概率的关系(大小关系),因此采用均匀分布来分配概率,可以表现为下图所示的公式,

  • 观测数据的概率稍大些(因为实际被观测到),记作。
  • 反事实样本的概率稍小些,所有的反事实样本的概率均为。
distribution of examples

由此可以得到,其计算公式如下图所示。其中,表示推荐模型估计的条件概率。

p(y|u,do(v))

心得体会

对用户偏好的影响(文中斜体)

个人感觉,这里虽然改变历史交互行为可能影响用户的喜好,但是历史行为更多的是通过改变推荐模型的决策,进而改变,最终改变用户的反馈。这个反馈可能是对其他物品的,但是都表示这一次(当次推荐请求的)反馈。貌似还不能够估计出,改变用户兴趣的部分。

或者这么说,是固定的,我们需要估计的是在各种展示概率的情况下,我们能看到用户会对该物品表现出多大偏好。

均匀分布

在求期望时,作者利用随机分布给观测数据和反事实样本分配其出现的概率,这种做法在不知道真实分布的情况下是符合最大熵原理的。文章中作者也提到,可以利用其他一些复杂的分布,不过这些将作为未来的工作。此时,其实就是利用一些领域的先验知识。

文章引用

[30] Judea Pearl, Madelyn Glymour, and Nicholas P Jewell. 2016. Causal inference in statistics: A primer. John Wiley & Sons.

(为了保证对应可查,引用将遵循原文的顺序和标号,额外引用将用*代表)
(虽然如下图所示有点多,如果觉得有用,不吝赞一个哇.

你可能感兴趣的:(因果推断推荐系统工具箱 - CCF(三))