stata里reghdfe函数在不同固定效应设计下的观测值问题

        最近在修改一篇working paper发现,用reghdfe做回归的时,在相同的基准模型中添加不同的交互固定效应,模型的观测值数量不同。由于担心审稿人的质疑,进一步讨论了这一问题。

        后来也与学校内其他老师交流,发现也有类似的问题。但是老师的解决思路是通过if e(sample)的方式强行使得各模型回归观测值数量相同。感觉这一方式有点治标不治本,但是查阅了很多中文材料,咨询过一些国内的大佬,好像都没有给一个很好的解释。后来找到一篇参考文献,大致解释清楚了这一函数观测值数量的问题。参考文献如下:

Correia S. Singletons, cluster-robust standard errors and fixed effects: A bad mix[J]. Technical Note, Duke University, 2015, 7.

 总结起来解决这一问题的思路如下:

1.和审稿人argue。观测值数量主要是singleton(大致可以理解为由于虚拟变量过多所导致被完全解释的观测值,在经过匹配的数据里比较常见)的问题,从理论上来说可能对估计有不好的影响。可以引用这篇文章里的一些解释。

2.手动删除singleton。但是这里有一个迭代,因为你删除Singleton的操作本身也会产生新的singleton,导致需要反复删除,处理起来比较麻烦。此外,由于模型设定不同,singleton的数量也不同,因此即便手动删除也无法保证观测值数量相等,因此更建议方法1。

3.加入keepsingletons 选项。原文里也提到,删除singleton虽然能解决一部分问题,但是同样会创造一些新的问题。也可以加入这一选择保留所有的singleton,使得估计结果与areg,xtreg,reg等完全一致。这一方式相对来说最为简单~

你可能感兴趣的:(stata里reghdfe函数在不同固定效应设计下的观测值问题)