xtpcse depvar indepvars,options
该命令的关键在于选项
A. 自相关的设定(一阶自相关)
a.corr(ar1),使用的估计方法为FGLS【误差项存在自相关时使用该选项;当T不比n大很多时使用该选项,因为此时T可能无法提供足够多的信息去估计每个个体的自相关系数,所以约束了每个个体的自相关系数都相等】
b.corr(psar1) ,使用的估计方法为FGLS【误差项存在自相关时使用该选项;当T比n大很多时使用该选择项,当T比n大很多时每个个体的自相关系数可以不同,就可以使用选项】
c.corr(independent)或corr(ind),使用的估计方法为OLS【误差项不存在自相关】
B.异方差与截面的设定
a.independent【误差项不存在异方差和截面相关问题,使用该选项】
b.hetonly(提供考虑异方差的面板校正标准误)【误差项存在异方差但不存在截面相关问题,则使用该选项】
c.不加选项即可(提供既考虑异方差又考虑截面相关的面板校正标准误)【误差项存在异方差和截面相关问题时,不加任何选项】
选项:corr(ind)+independent等价于LSDV
xtgls depvar indepvars,options
如果对误差项的处理正确,那么xtgls比xtpcse估计效果更好
A.对异方差和截面相关的设定
a.panels(iid)****【误差项不存在异方差和截面相关】
b.panles(heteroskedastic)****【误差项存在异方差+截面不相关】
c.panels(correlated)只适用于长面板数据【误差项存在异方差+截面相关】
选项:corr(ind)+panels(iid)等价于LSDV
B.自相关的设定
a.corr(ar1),使用的估计方法为FGLS
#误差项存在自相关时使用该选项;当T不比n大很多时使用该选项,因为此时T可能无法提供足够多的信息去估计每个个体的自相关系数,所以约束了每个个体的自相关系数都相等
b.corr(psar1),使用的估计方法为FGLS。
#误差项存在自相关时使用该选项;当T比n大很多时使用该选择项,当T比n大很多时每个个体的自相关系数可以不同,就可以使用选项
c.corr(independent)或corr(ind),使用的估计方法为OLS。
#误差项不存在自相关时,使用该选项
以香烟需求估计与三大检验为例,即数据集“mus08cigar.dta”,包括了美国10个州1963-1992年有关香烟消费量的相关变量。
双向固定效应模型——(审稿人一般认为双向固定效应为逻辑起点)
其中,被解释变量 l n c lnc lnc为人均香烟消费量的对数,解释变量: l n p lnp lnp为实际香烟价格的对数, l n p m i n lnpmin lnpmin为相邻州最低香烟价格的对数, l n y lny lny为人均可支配收入的对数。
use"D:\mus08cigar.dta"
des
##结果
Contains data from D:\mus08cigar.dta
obs: 300
vars: 6 26 Nov 2008 17:14
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
storage display value
variable name type format label variable label
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
state float %9.0g U.S. state
year float %9.0g Year 1963 to 1992
lnp float %9.0g Log state real price of pack of cigarettes
lnpmin float %9.0g Log of min real price in adjoining states
lnc float %9.0g Log state cigarette sales in packs per capita
lny float %9.0g Log state per capita disposable income
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
xtset state year
## 结果
panel variable: state (strongly balanced)
time variable: year, 63 to 92
delta: 1 unit
告诉Stata软件,这是一个以截面变量state为州,时间变量为year的面板数据。由“strongly balance”可知,这是一个平衡面板数据。
sum lnc lnp lnpmin lny
## 结果
Variable | Obs Mean Std. Dev. Min Max
-------------+---------------------------------------------------------
lnc | 300 4.792591 .2071792 4.212128 5.690022
lnp | 300 4.518424 .1406979 4.176332 4.96916
lnpmin | 300 4.4308 .1379243 4.0428 4.831303
lny | 300 8.731014 .6942426 7.300023 10.0385
twoway (scatter lnc lnp)(lfit lnc lnp)
xtline lnc
tab state,gen(state)
##结果
U.S. state | Freq. Percent Cum.
------------+-----------------------------------
1 | 30 10.00 10.00
2 | 30 10.00 20.00
3 | 30 10.00 30.00
4 | 30 10.00 40.00
5 | 30 10.00 50.00
6 | 30 10.00 60.00
7 | 30 10.00 70.00
8 | 30 10.00 80.00
9 | 30 10.00 90.00
10 | 30 10.00 100.00
------------+-----------------------------------
Total | 300 100.00
gen t=year-62
reg lnc lnp lnpmin lny state2-state10 t
##结果
Source | SS df MS Number of obs = 300
-------------+---------------------------------- F(13, 286) = 56.65
Model | 9.24427482 13 .711098063 Prob > F = 0.0000
Residual | 3.58977229 286 .012551651 R-squared = 0.7203
-------------+---------------------------------- Adj R-squared = 0.7076
Total | 12.8340471 299 .042923234 Root MSE = .11203
------------------------------------------------------------------------------
lnc | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
lnp | -1.027 0.104 -9.92 0.000 -1.231 -0.823
lnpmin | 0.510 0.102 5.01 0.000 0.309 0.711
lny | 0.498 0.153 3.26 0.001 0.197 0.798
state2 | -0.077 0.038 -2.01 0.045 -0.153 -0.002
state3 | 0.089 0.029 3.01 0.003 0.031 0.146
state4 | -0.181 0.071 -2.54 0.012 -0.321 -0.041
state5 | -0.107 0.089 -1.20 0.231 -0.281 0.068
state6 | 0.218 0.048 4.57 0.000 0.124 0.312
state7 | 0.116 0.075 1.54 0.125 -0.032 0.263
state8 | 0.107 0.049 2.17 0.031 0.010 0.204
state9 | 0.043 0.033 1.32 0.189 -0.021 0.108
state10 | -0.134 0.033 -4.07 0.000 -0.198 -0.069
t | -0.043 0.012 -3.57 0.000 -0.067 -0.019
_cons | 3.489 1.377 2.53 0.012 0.777 6.200
------------------------------------------------------------------------------
est store ols
avplot lnp
检验误差项的自相关问题
xtserial lnc lnp lnpmin lny state2-state10 t
## 结果
Wooldridge test for autocorrelation in panel data
H0: no first order autocorrelation
F( 1, 9) = 89.304
Prob > F = 0.0000
P值为0,所以拒绝一阶自相关不存在的原假设,表明存在自相关问题。
quietly xtreg lnc lnp lnpmin lny t,fe
xttest3
##结果
Modified Wald test for groupwise heteroskedasticity
in fixed effect regression model
H0: sigma(i)^2 = sigma^2 for all i
chi2 (10) = 378.90
Prob>chi2 = 0.0000
P值为0,所以拒绝原假设,认为误差项存在异方差问题。
. quietly xtreg lnc lnp lnpmin lny t,fe
. xttest2
## 结果
Correlation matrix of residuals is singular.
not possible with test
r(131);
我在这里遇到的问题是矩阵是奇异的,不能使用xttest2,但老师实例中得到结果是P值是0,拒绝了原假设,所以存在截面相关。
通过三大检验,我们知道模型的误差项存在自相关、异方差和截面相关的问题,所以,我们需要对误差项的自相关、异方差和截面相关问题进行处理并报告计量结果。
xtpcse lnc lnp lnpmin lny state2-state10 t,corr(psar1)
est store xtpcse
xtgls lnc lnp lnpmin lny state2-state10 t,corr(psar1) panels(correlated)
est store xtgls
xtscc lnc lnp lnpmin lny state2-state10 t
est store xtscc
esttab ols xtpcse xtgls xtscc,b(%9.2f)p mtitle(ols xtpcse xtgls xtscc)obslast star(* 0.1 ** 0.05 *** 0.01)compress nogap k(lnp lnpmin lny t)