一、异方差
异方差——用人话解释:随机扰动项的方差跟自变量有关系
异方差的后果:
1、OLS的估计仍然是无偏、一致的
2、T检验、F检验失效
3、高斯马克尔科夫定理使用了同方差假设——OLS不再是BLUE(Best Linear Unbiased Estimation)即无偏最小估计量
异方差的检验——不满足球形扰动项
1.White 检验
2. BP 检验
两者的区别:White 检验包含交互项和高次项
BP 检验优势是可以帮助确定异方差的具体形式
stata实现:
先reg
White 检验
estat imtest, white
BP 检验(最开始假设是残差项服从正态分布)
estat hettest, iid (放宽假设,只要是独立同分布就行)
estat hettest, rhs iid(用方程右边的解释变量来检验异方差问题)
estat hettest mvalue(想要检验的变量), iid (BP检验可以指定某些解释变量来做异方差检验)
问题:
如果两者检验结果不一致,BP检验只是证明了残差项的平方和解释变量不存在线性关系,但是可以参在高次或者交互项的关系,因此以White检验为主,他的结果更为稳健
异方差的处理方法:
1. OLS+稳健标注误——仍然用OLS回归,只是标准误选择异方差稳健标准误
虽然能够使得假设检验能够照常进行,但此时OLS仍然不是最有效率的估计
2.广义最小二乘法(GLS)
既然原方程不满足同方差假定,那就通过变量转换,使得方程满足同方差假设
此时GLS是BLUE估计量
3. 加权最小二乘法(WLS)
WLS是GLS的一种特殊情况
假设没有自相关,仅仅存在异方差
STATA实现
OLS+稳健标注误 ——reg var1 var2 , robust (或者只打一个r)
组间异方差:(stata实现)
xtset 个体变量 时间变量 //面板数据的设定
xtreg y x control, fe (先要运行固定效应模型)
xttest3 (检验组间异方差,原假设是同方差,P值小于0.1,说明存在组间异方差)
xtserial y x control (组内自相关检验,原假设是不存在组内自相关的)
xtreg y x control,fe
xttest2 (组间同期相关检验,缺陷是仅适用于长面板,原假设是不存在截面相关)
xtcsd, pes //假设统计量服从标准正态分布
xtcsd, fri //假设统计量服从卡方分布
标准误的选取——robust,cluster
cluster
假设干扰项在group之间不相关,而在group内部存在相关性。
适用于异方差且允许观测值组内相关
如何对标准误进行两次聚类 如何对标准误进行两次聚类_哔哩哔哩_bilibili
二、自相关问题——主要出现在面板数据或者时间序列数据
autocorrelated
人话:A个体随机扰动项第一年的数据可能与第二年或者第三年有一定相关性
组内相关,但组间不相关——A个体有一定相关性,B个体有一定相关性,但是AB之间随机扰动项是不相关的
例如cluster (ind)意思是行业内部允许相关,行业之间是不相关的
注意:在xtreg中两者没有区别
自相关一般指残差 自相关:总体回归模型的随机误差项之间存在相关关系。
而自回归是被解释变量与滞后期
自回归应该是指被解释变量与滞后期存在相关关系。
修正组间异方差、组内自相关以及组间同期相关问题:
pcse: panel-corrected standard error 面板校正标准误差
1. 组间异方差
xtpcse y x control i.industry i.year, hetonly (仅存在组间异方差)
2.组内自相关(假设只存在一阶自相关)
ar1 假设所有个体的个体的相关系数ρ相同
xtpcse y x control i.industry i.year, corr(ar1)
psar1 个体存在不同的ρ
xtpcse y x control i.industry i.year, corr(psar1)
3.存在组间异方差+组间同期相关
xtpcse y x control i.industry i.year
4.存在组间异方差+组内自相关+组间同期相关
xtgls y x control i.industry i.year, panels(cor) cor(ar1)
xtgls y x control i.industry i.year, panels(cor) cor(psar1)
常用的命令