倾向性评分匹配 Propensity Score Matching

@[TOC](倾向性得分匹配 Propensity Score Matching)k


前言

提示:本文为基于Youtube视频:An intuitive introduction to Propensity Score Matching的学习笔记

一、倾向性评分匹配是什么?

倾向性评分匹配是一种统计学方法,用于处理观察研究的数据。

二、匹配

首先我们有T变量:干预(0/1),代表政策/措施等是否有实施,即区分实验组与原始控制变量组。变量Y:观察结果,代表需要评估的指标,如新生儿死亡率等。变量X1,X2等:样本属性,代表样本本身的一些性质,如贫困率、地区医生拥有率等。

匹配原理如下,在样本属性X中选择影响政策制定的主要变量进行实验组和对照组的匹配。如现有政策Z,影响政策制定的主要因素为变量X1:贫困率(即贫困率高于某临界值的地区将施性政策Z)。则匹配的主要原理是X1属性相等的样本互相匹配。因此一个实验组样本可能匹配多个控制变量组样本。

三、倾向性评分

在实践中,我们使用LR(PR)模型进行自动匹配。预测匹配的方法如下:Prob(T=1|X1, X2, X3…, Xk)。使用T变量的预测概率(predicted prob of T;)作为倾向性评分,即propensity score.

我们将倾向性评分相近的样本互相匹配(注,此处有多种匹配方法,直接匹配、将倾向性评分取对数、选择阈值等)。

四、政策效果估计

eg,有
样本1(T=1;X1=0.5;X2=0.1;Y=10;PS=0.4166);
样本2(T=1;X1=0.6;X2=0.2;Y=15;PS=0.7359);
样本3(T=1;X1=0.7;X2=0.1;Y=22;PS=0.9285);
样本4(T=0;X1=0.5;X2=0.2;Y=19;PS=0.3952);
样本5(T=0;X1=0.6;X2=0.1;Y=25;PS=0.7527).
则政策Z效果为:(10+15+22)/3-(19+25+25)/3=-7.3,

五、匹配效果检验

方法如下:
1、比较实验组与新的控制变量组(利用PS分数匹配后重新筛选的变量组)的共变性(covariate balance)是否一致;
2、比较实验组与新的控制变量组倾向性评分的分配(distribution)是否一致:直接看数据:最大最小值及变化、倾向测试评分协方差的直方图、非参数的密度图、非参数分布(the distribution non-parametrically)的密度图等;
3、比较实验组与旧的控制变量组倾向性评分的分配(distribution)是否重叠(overlap):如果重叠较少,意味着匹配不成功;如果完美匹配,意味着没有必要挑选制作新的控制变量组,可以直接用原数据进行计算。

六、匹配与回归

匹配(见一)与回归(见二)解决的是极为相似的问题,但这两种方法各有优劣,详情请见Youtube视频。

匹配的优点:
1.not as sensitive to the functional form of the covariates(?);
2.easier to assess whether it’s working;(有许多方法可以达成五3的情况)
3.如果你拥有大量明显无法匹配的原控制组样本,匹配会直接完全忽视这些样本,回归却可能会考虑到这些样本,从而导致结果的偏差;
4.often easier to think abt the key determinants of program placement rather than the determinants of acual outcomes;
5.解释起来更容易。

回归的优点:
1.有时政策不是二元而是连续的,这种情况更适用于回归匹配;
2.可以看到所有变量的影响,而不仅仅是政策本身;
3.可以估计政策与协变量的相互作用(?);
4.倾向性评分还有许多其他用法,你可以任意决定如何使用该评分。

七、倾向性评分匹配不能做到的事

该方法会忽略某些对同时对结果及干预变量有影响的因素,如未观测到的干扰因素(unoberved confounders)。要解决这个问题,需要利用其他不同的方法,如工具变量(instrumental variables)、 断点回归(regresion discountinuity)等。

其他学习资源

1. Mostly harmless econometrics, Section 3.3, Angrist and Pischke(2009) 2. Propensity Score Analysis: Statistical Methods and Applications, Guo and Fraser(2014)

@[TOC](倾向性得分匹配 Propensity Score Matching)

你可能感兴趣的:(公共政策的定量评估方法,统计学,数据分析)