双重差分模型python包_什么是双重差分模型(difference-in-differences model)?

前面有人说了两个组别两个时间点的DID, 我简单来说一下DDD也可以说是多组别多时间点的DID

假设,推行一项政策,各个地区实行的时间不同

简单来说,让我们来以g代表不同的地区(g>=2),t代表不同的时间点 (t>=2)

所以

D(gt)代表g地区在t时实行政策的状态是一个二分变量(1=是,0=否)

D(gt)=1意味着g地区在t时实行了政策

其余状况 D(gt)=0, 所以我们可以得到

Y(gt) = a(g) + b(t) + δD(gt)+ e(gt)

其中a(g)是group fixed effect, b(t)是time fixed effect。

我们加入fixed effect在我们的model中是为了控制那些没有被测量到的混杂因素,这也是DID或者DDD的设计的重要一环。

既然我们有了多个时间点,我们就需要考虑序列相关性(serial correlation),这又是一大展开感兴趣可以自己搜一下这篇文章

Bertrand, M., Duflo, E., & Mullainathan, S. (2004). How much should we trust differences-in-differences estimates?. The Quarterly journal of economics, 119(1), 249-275.

上面文章中作者提到了4种方法,Block bootstrap, Ignoring time-series information, Empirical variance-covariance matrix, Arbitrary variance-covariance matrix。慎用简单粗暴的忽略法(强烈想用DID方法的同学看一下这篇文章

最后,既然model有了,一切就简单咯~~~good luck

PS:()内是下角标

PSS:感觉学的时候都是英文,再自己翻译回中文怪怪的。。。。。实在不行我就重新用英文写一遍(如果有需求的话

PSSS:希望能有一点帮助吧

Reference

Wing, C., Simon, K., & Bello-Gomez, R. A. (2018). Designing difference in difference studies: best practices for public health policy research. Annual review of public health, 39.

你可能感兴趣的:(双重差分模型python包)