python 双重差分_双重差分的理论与实践

1. 理论

1.1 标准表述(定义)

双重差分模型(difference-in-differences)主要被用于社会学中的政策效果评估。其原理是基于一个反事实的框架来评估政策发生和不发生这两种情况下被观测因素y的变化。如果一个外生的政策冲击将样本分为两组—受政策干预的Treat组和未受政策干预的Control组,且在政策冲击前,Treat组和Control组的y没有显著差异,那么我们就可以将Control组在政策发生前后y的变化看作Treat组未受政策冲击时的状况(反事实的结果)。通过比较Treat组y的变化(D1)以及Control组y的变化(D2),我们就可以得到政策冲击的实际效果(DD=D1-D2)。

具体地,单一冲击时点的双重差分的模型如下:

其中,Ti为政策虚拟变量;Ai为时间虚拟变量; Ti ×At为两者的交互项;b3即为我们需要的双重差分估计量。

政策冲击的实际效果: DD = D1 - D2 = ( β2 + β3 ) - β2 = β3

需要特别指出的是,只有在满足“政策冲击前Treat组和Control组的y没有显著差异”(即平行性假定)的条件下,得到的双重差分估计量才是无偏的。

详细说明

为测度“处理”(或实验)的效果,我们关心被解释变量经“处理”前后的变化,考虑以下两期面板数据:

混合OLS

只加政策变量作为核心解释变量,再加入时间D(t)等作为控制变量,进行的普通混合OLS回归,测度出x(it)的效应β,就是简单地将实验组减去控制组,得到一个有偏的估计(因为x(it)可能与不随时间改变的个体特征u(i)等固定效应相关),故下一步再做一阶差分,第二期减去第一期,将u(i)消掉。即双重差分。

双重差分DID

示意图

只有在满足“政策冲击前Treat组和Control组的y没有显著差异”(即平行性假定)的条件下,得到的双重差分估计量才是无偏的。

1.2 另一种表述(常用)

1.2.1 理解交互项的含义

例子:研究性别和学历对工资的影响,性别是F,学历是E,工资是S。如果没有交叉项,那么回归的方程是:

S = β0 + β1 × F + β2 × E

在这种情况下,性别的影响是β1,学历的影响是β2。而有交叉项,那么回归的方程是

S = β0 + β1 × F + β2 × E + β3 × F × E

在这种情况下,性别对工资的影响是β1+β3*E,学历对工资的影响是β1+β3*F

所以我们很容易发现,交叉项刻画了什么呢?

它刻画了一个人的学历对工资的影响是否受性别的影响(β1+β3*F),刻画了一个人的性别对工资的影响是否受学历的影响(β

你可能感兴趣的:(python,双重差分)