【Stata】reghdfe 含多重虚拟变量 / 固定效应的面板回归方法(行业,地区等)

一、问题

最近有人问我怎么 Eviews 做回归总是奇异矩阵,一般都是变量问题,毕竟 Eviews 处理面板数据很无力,我就推荐他用 stata ,结果 stata 也不行。
我拿到数据之后发现,原来多个虚拟变量,用 regxtreg 怎么调都是 共线性 , R2 太小,系数不显著的问题。

后来发现,问题出在估计方法有问题:

  1. 若个体固定效应模型是采用Within回归(xtreg , fe),它会将不随时点变化的量都减去了,所以,如果模型中不随时点变化的虚拟变量(包括个体固定效应项)的个数如果大于N (无截距项情形;有截距项就是N-1个) ,它只能估计出前N个,其他的都不在模型中
  2. 若是采用LSDV法估计个体固定效应模型(reg i.provi),是设置了N-1个虚拟变量实现的,如果再往模型里加不随时点变化的虚拟变量(如行业、区域等),模型是会将它们排除在模型里面的,即完全多重共线性 (只是Stata将多余的虚拟变量排除在模型之外后,再进行估计。)

P.S. 感谢 张华节 老师的原理讲解。

二、解决

(1)REGHDFE

幸运的是,在 github 有人做了解决这个问题的工具包,2019年还更新过。
【Stata】reghdfe 含多重虚拟变量 / 固定效应的面板回归方法(行业,地区等)_第1张图片
github 地址:点这里

(2)原理

没有细看,主要是基于这篇 2017 年的文献来的:
【Stata】reghdfe 含多重虚拟变量 / 固定效应的面板回归方法(行业,地区等)_第2张图片
看了看后文,之前还有一些先行研究:
【Stata】reghdfe 含多重虚拟变量 / 固定效应的面板回归方法(行业,地区等)_第3张图片

(3)安装

我发现直接 net install 根本不好用 ssc install 也卡死,无奈只能用手动安装了,要依赖一个 ftools 工具箱,可以提高处理效率,github 地址。
ftools 和上面提到的 reghdfe 都拉取下来(或者打包下载下来)。Stata 执行以下命令:

	// 卸载原有命令
	cap ado uninstall ftools
	cap ado uninstall reghdfe
	// 安装新命令包
	net install ftools, from(c:\git\ftools)
	net install reghdfe, from(c:\git\reghdfe)
	// 编译
	ftools, compile
	reghdfe, compile

注意:from 里的填你下载的安装包里的 src 目录,里面有一个 stata.toc 文件,他引导 Stata 安装包。

(4)使用

数据我就不报了,执行:

reghdfe lnf lngdp lnp lndis , absorb(time cu e) vce(r) con

absorb 里填写需要固定效应的变量,con 是报告常数项
【Stata】reghdfe 含多重虚拟变量 / 固定效应的面板回归方法(行业,地区等)_第4张图片
发现 lnp 不显著,而且提示 e 固定效应有点冗余,剔除 e 看看:

reghdfe lnf lngdp lnp lndis , absorb(time cu) vce(r) con

【Stata】reghdfe 含多重虚拟变量 / 固定效应的面板回归方法(行业,地区等)_第5张图片
效果不错,可以用了,当然也不是 e 一定剔除了就好,损失了 R2。

(5)其他

发现怎么没报告固定效应值呢,找了找安装包 docs 下的帮助文档 reghdfe.html ,找到了在 absorb 里添加一个 savefe 就可以了:
【Stata】reghdfe 含多重虚拟变量 / 固定效应的面板回归方法(行业,地区等)_第6张图片
在仔细看看,发现可以直接在固定效应变量前加 = 就可以自定义名字了:
【Stata】reghdfe 含多重虚拟变量 / 固定效应的面板回归方法(行业,地区等)_第7张图片

三、后记

有关 gmm2sls 的我就没细看,这个包还能做动态面板,想必处理内生性能更好点,而且作者还有一个 iv 的包能处理多固定效应,具体可以在作者 github 上看。

理了一下时间线,这个工具在 github 上是大概 2015 年才有的:
【Stata】reghdfe 含多重虚拟变量 / 固定效应的面板回归方法(行业,地区等)_第8张图片
成熟论文是 2017 年才发表的,也就是说几乎 2015 之前出现的多固定效应论文几乎都是错误的估计,2017 之前的真伪也要被质疑。

你可能感兴趣的:(Stata)