因果推断推荐系统工具箱 - CPBM(三)

文章名称

【SIGIR-2019】【Cornell University】Intervention Harvesting for Context-Dependent Examination-Bias Estimation

核心要点

上一节讲解了如何利用显示交换物品排序的结果,来构造干预下学习PBM和CPBM模型的数据集,以及他们为什么是有效的。这一节讲解Intervention Harvesting以及针对CPBM的AllPairs模型(不了解AllPairs的同学可以参考因果推断推荐系统工具箱 - AllPairs(一))。

方法细节

问题引入

其实,在之前讲解PBM的时候已经有一篇文章介绍了,Intervention Harvesting以及针对PBM的AllPairs模型。和本文是同一个作者,所以顺理成章的将两者扩展到了CPBM。

如前所述,显示交换排序位置(Swap Interventions)是对排序结果进行了直接干预,可能会影响用户体验。因果推断推荐系统工具箱 - AllPairs(一)中的方法也一样,作者表示可以利用多个排序函数的结果来构造类似显示交换排序位置的数据集,并称这种方法为Intervention Harvesting。把这个方法扩展到CPBM的场景的主要问题在于,可能需要对多个context下的结果进行平均(因为多了context这个维度,同时还有排序位置这个维度需要聚合)。

具体做法

假设我们有个排序函数,利用每一个函数可以得到针对一个查询上线文的排序结果。定义为物品在排序结果中的排序位置。日志记录的数据集用表示,其中每一个排序函数在这个数据集中有个样本(排序函数处理了个查询),并且假设所有的排序函数所对应的查询分布是一致的,可以利用如下图所示的公式表示。

distribution stationary

CPBM下的intervention harvesting实际上就是通过合理选择使得在给定的查询上下文中,的排序满足如下图所示条件,并且称为interventional sets。

interventional sets

通过控制物品在中出现的次数,确保针对查询物品元组,位置的相关性是相同的(因为都是同一个物品)。可以利用如下图所示的公式,计算物品被分配到位置的概率。

assignment probability

因此,我们可以得到构造的点击数据,计算公式如下图所示。构造的点击率标签可以被看做是一种近似随机替换(random swapping)下的IPS加权点击率。

constructed click feedback

到此,如果不考虑上下文环境对审视概率和相关性的影响(也就是PBM),那么直接利用交叉熵和上边构造的label进行优化,求解模型参数就可以了(PBM假设)。然而,如果是CPBM,相关性概率和查询上下文有关系,也就是相关性概率变成了。如果还是用乘积的式子来当目标优化,需要把中的边缘化掉(marginalize,就是求加权平均)。显然,直接这样操作,估计的结果将不在是无偏的了。

因此作者提出了两个模型,分别建模在给定的情况下位置的审视概率和随机交换下的文档与查询相关的概率(两个神经网络,主要还是解决数据稀疏的问题)。基于这两个模型,可以得到在CPBM下的Allpairs模型,目标函数如下图所示。

AllPairs estimator for the CPBM

作者提到采用的的网络结构是简单的MLP(结构如下图所示),可以通过1)调整更复杂的网络结构,2)进行位置向量嵌入表示学习,来提升模型的性能。

$h(x, k)与g(x, k, k\prime)$ architecture

今天的分享就到这里,感觉这篇看的最后有点云里雾里,还要仔细读一下AllPairs Estimator for the CPBM。

心得体会

个人感觉,这两个函数是在利用神经网络的方法共享把对相关性和审视概率的估计泛化到不同的查询条件下。作者在文中提到仍然是一个平均条件概率,我理解是期望,因为神经网络估计的也是期望值。不过,没太理解为什么上面已经说了平均就不是无偏了,这里还要建模平均相关性呢?也许是没有显示边缘化?

你可能感兴趣的:(因果推断推荐系统工具箱 - CPBM(三))