因果推断推荐系统工具箱 - Doubly robust joint learning for recommendation on data missing not at random(一)

文章名称

Doubly robust joint learning for recommendation on data missing not at random

核心要点

上一节主要讲了问题MNAR的问题,以及EIB和IPS等方法如何进行纠偏。这一节我们来看作者是如何做DR的。

方法细节

问题引入

具体做法

Error-imputation-based

Error-imputation-based的方法采用启发式的插值方式,构造真实评分估计误差的无偏估计量,来替换直接利用观测数据进行评分估计。其中,是通过超参数和结合模型的估计评分得到的。通过类似因果推断binary treatment下,利用potential outcome构造factual outcome的式子,得到最终的估计误差项。

EIB

imputation MAE

imputation MSE

其中,如下图所示, 被称为误差偏离,用来衡量真实评分误差和插值评分误差的偏离程度。这个误差项在本文中被用来进行联合训练。
error deviation

Inverse-propensity-scoring

IPS的方法是因果推断中比较常见的。利用估计的user-item对被观测到的可能性,对样本进行逆概率调权,最终得到对真实评分估计的无偏估计量。

IPS

为了减小IPS的方差,也可以采用类似offline policy evaluation的self-normalization IPS减小方差。
SNIPS

心得体会

A Causal View

如上边提到,EIB其实是类似binary treamtent下的causal inference问题的某种构造损失。除此之外,其实EIB的有点类似于balancing,只不过这里的是常数。同时,还利用进行了平移。也就是说,无论是EIB还是IPS都是可以从因果角度解释的,可见Debias这件事情无论在哪个场景都有因果的痕迹。其实,直接在观测数据集上估计评分,类似于因果推断的Directly Prediction方法,后边又有了PSM(也就是matching和balancing)以及IPS。

你可能感兴趣的:(因果推断推荐系统工具箱 - Doubly robust joint learning for recommendation on data missing not at random(一))