因果推断(二):3个基本假设

文章目录

  • 总结
  • 假设一:稳定单位处理值假设(SUTVA, Stable Unit Treatment Value Assumption)
  • 假设二:正值假设(Positivity)
  • 假设三:条件独立性假设(Conditional Independence Assumption, CIA)
  • Strong Ignorability = 正值假设 + 条件独立性假设
  • 参考资料

总结

因果推断(二):3个基本假设_第1张图片

假设一:稳定单位处理值假设(SUTVA, Stable Unit Treatment Value Assumption)

别名是:一致性假设(Consistency)。

任何单位的潜在结果,不会因为分配给其他单位的处理而变化。并且对于每个单位,每个处理水平的不同形式或版本不会导致不同的潜在结果。

我理解有两层含义:

1. 单位(是指原子研究对象)之间具有独立性,不会产生相互作用:

 例如,T为是否吃药。假设A吃了药,B没有吃药。
 
 A不会受B影响,B也不会受A影响;

2. 一种处理只会导致一种结果:

例如,T为是否养猫。假设小花养了一只加菲猫(T=1),结果Y=开心,小草没有养猫(T=0),结果Y=不开心。

又来了个小明,他也养了猫(T=1),但是是养了一只美短,结果Y=不开心。那就不对了!

说明T定义的不好,此时同一种处理带来了两种完全不同的结果。
 

假设二:正值假设(Positivity)

有的文献里也称为 overlap、common support
确保对于任意背景变量X的unit集合,T=1和T=0的结果均存在。从而避免由于对给定的X,仅包含T=0的结果数据,使得T=1的结果无法估测。

换句话说:对于任意X值,每个对象接受干预或对照的概率都是正值。

例如,T是是否上大学,Y是收入水平。

对于相同背景(X)的人群,我们需要既有上大学的样本,也需要有没有上大学的样本,这样才能估计干预的因果效应。
 

假设三:条件独立性假设(Conditional Independence Assumption, CIA)

注意,它还有两个别的经常出现的名字:“Ignorability”, “无偏性假设”(Unconfoundeness Assumption)

假设内容是,给定背景变量X,处理(或干预)变量和结果变量之间的关系是独立的

第一层意思,如果两个病人有相同的背景变量,那么他们施加相同的处置时,他们的潜在结果应该是一样的。

第二层意思,具备相同变量的两个病人,他们的处置分配概率也应该相同。(Unconfoundeness Assumption)

例如,假设我们正在研究一种新的药物是否对降低高血压的效果有帮助。我们希望通过因果推断来确定这种药物的治疗效果。

在这个情境中,"ignorability" 假设意味着,给定一组特定的控制变量,药物的使用与结果(血压的降低效果)之间没有未建模的共同因素。即任何影响药物使用和结果的潜在因素,都已经通过控制变量的方式被考虑进来了。

再举个反例:考察药物对病人治疗效果的例子。

Y为康复率,W=1代表使用药物,X为年龄。

假设年轻和年老的病人,年轻的病人基本不会选择用药,只有年老的病人更倾向于选择用药。

则相当于W=1的治疗组以年老的病人为主,W=0的对照组以年轻的病人为主。

那么治疗组的治愈率会偏低,甚至低于对照组。从而得出药物对康复率具有副作用的错误结论。

Strong Ignorability = 正值假设 + 条件独立性假设

参考资料

[1] Yao L , Chu Z , Li S ,et al.A Survey on Causal Inference[J]. 2020.DOI:10.48550/arXiv.2002.02770.
[2]因果推断中的Ignorability假设: https://zhuanlan.zhihu.com/p/356635697

你可能感兴趣的:(因果推断,算法,笔记)