互助问答第1期:工具变量回归等四个问题及解答

本期解答人:Figo,匿名专业人士
问:用一个工具变量时,内生性检验显示没有内生性问题;用两个工具变量时,就会检验出内生性,同时回归的R平方缺失。请问怎么理解这些结果?
答:这里涉及两个问题:第一,为什么使用不同工具变量,内生性检验的结果会不同;第二,为什么工具变量回归时,R平方会不显示。
关于第一个问题,首先,内生性检验比较的是OLS系数和工具变量回归系数。在工具变量正确使用的前提下,如果两系数差异明显,则说明OLS系数是有偏差的,也就是说OLS回归中存在内生性问题;如果两系数差异不明显,则说明OLS估计出来的系数也是比较准确的,便不能肯定OLS回归有内生性问题。大家不要过度迷信或依赖这个检验,这个检验本身并不能告诉您工具变量是否有效;如果工具变量选得不对,检验结果就不能说明任何问题。此外,即便工具变量选得正确,不同工具变量的估计结果一般也会不同(因为工具变量回归结果本质上是“局部平均处理效应”(LATE)),进而可能会造成内生性检验的结果不同——这不能说明您的结果是对还是错。我个人的看法(不一定正确):这个检验实际上没什么用,我自己的研究从来不做该检验。

关于第二个问题,首先,R平方在工具变量回归中并不是一个重要指标。工具变量回归的最大目的估计出没有偏差的因果效应,而不是找到尽力拟合数据的模型。其次,如果工具变量回归不显示R平方,最大的可能是R平方算出来是个负数。工具变量回归的第二阶段本质上是因变量对内生变量的预测值和其他外生变量的回归,单独基于这个回归计算出的R平方不会是负数。但是,Stata在计算工具变量回归R平方时,会把内生变量的预测值替换为内生变量本身,这就不能保证R平方一定为正。与上一题同理:显示不显示R平方、R平方是否为正并不能说明您工具变量回归系数是否可信。

问:我读到某篇论文的一段话(如下图所示),文章有几个内生自变量,使用这些自变量的滞后一期变量做它们的工具变量,也就是工具变量个数等于内生解释变量个数了,为什么还能做过度识别检验?

答:如果单从这段话来看,是做不了过度识别检验的。不是作者写错了,就是他做错了。

问:计算赫芬达尔指数时,如果某一行业的公司只有1个或者2个,那是否要把这些行业删掉?另外,行业分类是选择哪一年的行业分类?

答:赫芬达尔指数衡量了一个行业内部企业的集中度,数值越大,集中度越高。指数最大值可以取1,表示行业完全集中在单个企业手里(完全垄断),所以即使某个行业只有一家或两家公司,计算该指数也完全有意义。至于第二个问题,完全取决于您的研究需要:需要计算哪一年的指数,就用哪一年的数据。

问:在使用ivtobit模型时,如何进行识别不足检验和弱识别检验?

答:识别不足检验看的是工具变量与内生变量是否相关,只需要在ivtobit命令后加入first选项汇报第一阶段结果,然后检验第一阶段中工具变量前面的系数是否(联合)统计显著即可。弱识别检验看的是工具变量与内生变量是否足够相关,我个人推荐第三方命令weakiv(运行ssc install weakiv安装)。在运行完ivtobit命令后运行weakiv命令(需要仔细阅读和学习weakiv的帮助文件特别是其中的例子以熟悉其用法)。
互助问答第1期:工具变量回归等四个问题及解答_第1张图片

你可能感兴趣的:(互助问答第1期:工具变量回归等四个问题及解答)