> 天鹰(中南财大——博士研究生)
E-mail: [email protected]
双重差分模型的平行趋势假定如何检验? ——coefplot命令来告诉你(一)
原创: 李子健&周鹏 Stata and Python数据分析 2017-06-02
双重差分模型(difference-in-differences)主要被用于社会学中的政策效果评估。其原理是基于一个反事实的框架来评估政策发生和不发生这两种情况下被观测因素y的变化。如果一个外生的政策冲击将样本分为两组—受政策干预的Treat组和未受政策干预的Control组,且在政策冲击前,Treat组和Control组的y没有显著差异,那么我们就可以将Control组在政策发生前后y的变化看作Treat组未受政策冲击时的状况(反事实的结果)。通过比较Treat组y的变化(D1)以及Control组y的变化(D2),我们就可以得到政策冲击的实际效果(DD=D1-D2)。
具体地,单一冲击时点的双重差分的模型如下:
其中,Ti为政策虚拟变量;Ai为时间虚拟变量; Ti ×At为两者的交互项;b3即为我们需要的双重差分估计量。
需要特别指出的是,只有在满足”政策冲击前Treat组和Control组的y没有显著差异”(即平行性假定)的条件下,得到的双重差分估计量才是无偏的。
下面我们就通过模拟数据来进一步介绍双重差分估计和平行性假定的检验:
一、构造数据
1.首先我们构造观测值并生成随机数种子
clear
set more off
set obs 1000
set seed 123456789
2.构造面板数据,将1000个样本,分为两组:实验组(Treat==1),对照组(Treat==0)
gen Treat=(uniform()<=0.6)
3.根据随机数构造公司-年度数据
bysort Treat: gen int group=uniform()*90+Treat*90+1
bysort group: gen year=2016-_n+1
4.假定2012年,实验组(Treat==1)公司受到一个外生政策冲击
gen Post=(year>=2012)
5.模拟被解释变量y,控制变量x1,x2
gen y=ln(1+uniform()*100)
replace y=y + ln(uniform()*10+rnormal()*3) if Treat==1 & Post==1
gen x1=rnormal()*3
gen x2=rnormal()+uniform()
我们可以看到,公司id(group)、年份(year)、分组标识(Treat)、冲击发生标识(Post)、被解释变量(y)以及控制变量(x1, x2)已经生成。
二、双重差分模型估计
gen Treat_Post=Treat*Post
xi: regress y Treat Post Treat*Post x1 x2 i.year, vce(robust)
est store OLS_DID
xtset group year
xi: xtreg y Post Treat*Post x1 x2 i.year,fe vce(robust)
est store FE_DID
esttab OLS_DID FE_DID, ar2(%9.3f) b(%9.3f) t(%9.3f) nogap compress ///
indicate("Year=_Iyear*") star(* 0.1 ** 0.05 *** 0.01)
结果显示交互项(Treat*Post)的系数显著为正,表明政策实施导致了y显著增加。然而,此时我们还不能确切的说,这一政策效果的评估是准确的,因为只有在对照组和实验组满足平行性假定的时候,Treat和post的交互项才是处理效应。因此平行趋势假定的重要性不言而喻。平行性假定的检验可以通过回归分析或者绘图的方式进行。
三、平行性假定和
动态效果分析
gen Dyear=year-2012
gen Before2=(Dyear==-2 & Treat==1)
lab var Before2 "2 Year Prior"
gen Before1=(Dyear==-1 & Treat==1)
lab var Before1 "1 Year Prior"
gen Current=(Dyear==0 & Treat==1)
lab var Current "Year of Adoption"
gen After1=(Dyear==1 & Treat==1)
lab var After1 "1 Year After"
gen After2=(Dyear==2 & Treat==1)
lab var After2 "2 Year After"
gen After3_=(Dyear>=3 & Treat==1)
lab var After3_ "3 or More Year After"
xtset group year
xi:xtreg y Treat Post Before2 Before1 Current After1 ///
After2 After3_ x1 x2 i.year,fe vce(robust)
est store Dynamic
Before2,Before1均为虚拟变量,如果观测值是受到政策冲击前的第2年和第1年的数据,则该指标分别取1,否则取0;如果观测值是受到政策冲击当年的数据,则Current取值为1,否则取0;当观测值是受到政策冲击后的第1年、第2年、第3年的数据时,After1、After2、After3分别取1,否则取0。
我们看到Before2,Before1的系数均不显著,而Current、After1、After2、After3的系数均正向显著,说明双重差分模型满足平行趋势假定。
在下一期推文中我们将介绍关键部分,即如何使用coefplot命令输出图形,用图形来反映平行趋势假定。预知后事如何,请继续关注我们的公众号哟~祝大家周末愉快!