预处理异质性和处理异质性

在社会科学研究当中,我们经常会面临的一个问题是:我们需要去看一个处理变量对于结果变量的影响。而在调查数据当中,我们能获取的一个基本统计量是,接受过处理(也就是发生过某件事情)的人平均值减去没接受过处理(没发生过某件事情)的人平均值。

如果粗略地看,我们很可能以为这是这个处理的影响。但其实,由于接受处理和不接受处理的人之间并不相同,并且不同的人接受处理发生的效应大小也不会相同,因此我们不能简单地把这个平均值之差看作是处理效应。

这个统计量实际上包括了三个部分:预处理异质性、处理异质性以及处理效应本身。

预处理异质性和处理异质性_第1张图片

举个例子,如果我们想要看上大学对于个人收入回报的影响。我们可以得到上大学的人的平均收入和没上过大学的人的平均收入。但其实,不同人能上大学的概率是不一样的。例如,富人的孩子更可能上大学,而穷人的孩子上大学的可能性更低。此外,不同的人上大学能够获取的收入回报也不同。

所以,如果我们要得到上大学真正的处理效应,也即平均而言上大学能够对于个人收入影响的效应,在得到上大学的人平均收入减去没上过大学的人平均收入后,

还需要减去(上大学的人如果没上大学的收入-没上大学的人的收入),也即预处理异质性

以及减去(上大学的人中上了大学减去如果没上大学的收入)-(没上大学的人中如果上了大学-没上大学的人的收入)*p(样本中接受大学教育的人比例),也即样本中的处理异质性

也即是图中的式子。

一般来说,前者往往可以观测,可以对其也就是混淆变量(cofounder)进行控制。而后者往往无法观测,例如那些更聪明的人上了大学比不那么聪明的人上学因为上大学更可能获取更高的回报,但是我们很难在调查数据中获取一个代表聪明值的变量。因此无法对其进行控制。

Xie, Y., Brand, J. E., & Jann, B. (2012). Estimating heterogeneous treatment effects with observational data. Sociological methodology, 42(1), 314-347.

你可能感兴趣的:(学习)