更详细的时间序列的自相关放在7.2 单变量均值回归模型
总体回归模型的随机误差项之间存在相关关系,即不同观测点(不同的样本个体或者不同的时间点)上的误差项彼此相关。
如果存在 E ( μ i μ j ) ≠ 0 \mathrm{E}(\mu_i\mu_j)\ne 0 E(μiμj)=0,就说明存在序列相关性;如果仅有 E ( μ i μ i + 1 ) ≠ 0 \mathrm{E}(\mu_i\mu_{i+1})\ne 0 E(μiμi+1)=0,就说明存在一阶序列相关/自相关。
自相关可以写成如下形式:
μ t = ρ μ t − 1 + ϵ t \mu_t=\rho\mu_{t-1}+\epsilon_t μt=ρμt−1+ϵt
ρ \rho ρ被成为一阶自相关系数/自协方差系数, − 1 < ρ < 1 -1<\rho<1 −1<ρ<1;
ϵ t \epsilon_t ϵt是满足标准最小二乘回归假定的随机干扰项(经典误差项),即零均值、同方差、序列不相关
经济变量固有的惯性
例如消费习惯的影响经常被包含在随机误差项中,随机误差项可能出现序列正相关。
模型的设定偏误
遗漏了重要解释变量或函数形式设定偏误
内生性问题也可能来源于重要解释变量的遗漏,内生性是随机误差项与解释变量相关
数据处理造成的相关
例如将月度数据调整为季度数据,由于采用了加合处理,修匀了月度数据的波动, 使季度数据具有平滑性,这种平滑性产生自相关。
本质后果:存在自相关的情况下,OLS低估了参数估计量的方差,随机干扰项的方差也被低估;
在一阶自相关 X t = ρ X t − 1 + μ t X_{t}=\rho X_{t-1}+\mu_t Xt=ρXt−1+μt假定下,参数估计量实际的方差是大于估计结果的:
V a r ( β ^ 1 ) = σ 2 ∑ x t 2 + 2 σ 2 ∑ x t 2 [ ρ ∑ t = 1 T − 1 x t x t + 1 ∑ x t 2 + ρ 2 ∑ t = 2 T − 2 x t x t + 2 ∑ x t 2 + ⋯ + ρ T − 1 x 1 x T ∑ x t 2 ] > σ 2 ∑ x t 2 ( 忽 略 异 方 差 问 题 , 计 算 出 的 参 数 的 方 差 ) . \mathrm{Var}(\hat\beta_1)=\frac{\sigma^2}{\sum x_t^2}+\frac{2\sigma^2}{\sum x_t^2}\left[\rho\frac{\sum\limits_{t=1}^{T-1}x_tx_{t+1}}{\sum x_t^2}+\rho^2\frac{\sum\limits_{t=2}^{T-2}x_tx_{t+2}}{\sum x_t^2}+\cdots+\rho_{T-1}\frac{x_1x_{T}}{\sum x_t^2} \right]>\frac{\sigma^2}{\sum x_t^2}(忽略异方差问题,计算出的参数的方差). Var(β^1)=∑xt2σ2+∑xt22σ2⎣⎢⎢⎡ρ∑xt2t=1∑T−1xtxt+1+ρ2∑xt2t=2∑T−2xtxt+2+⋯+ρT−1∑xt2x1xT⎦⎥⎥⎤>∑xt2σ2(忽略异方差问题,计算出的参数的方差).
参数估计量仍未无偏估计,但非有效估计,因为方差扩大了。而 OLS 在计算参数方差时假设无自相关,即 认为 ρ = 0 \rho=0 ρ=0,此时实际方差被低估。
对模型的检验失去意义。由于 OLS 低估了真实方差,因此,t值被高估(更容易通过显著性检验),t检验、F检验和拟合优度检验都失效。
t = β ^ j − β j S β ^ j t=\frac{\hat\beta_j-\beta_j}{S_{\hat\beta_j}} t=Sβ^jβ^j−βj
预测功能失效。随机扰动项的误差不可靠、随机抽样误差不可靠,故预测区间不可靠。
Y F = Y ^ F ± t α / 2 ( σ ^ 1 n + ( X F − X ˉ ) 2 ∑ x i 2 ) Y_F=\hat Y_F\pm t_{\alpha/2}\Bigg(\hat\sigma\sqrt{\frac{1}{n}+\frac{(X_F-\bar{X})^2}{\sum{x_i^2}}}\Bigg) YF=Y^F±tα/2(σ^n1+∑xi2(XF−Xˉ)2)
作 e t − t e_t-t et−t图或者 e t − e t − 1 e_t-e_{t-1} et−et−1图辅助判断。
对
e t = ρ e t − 1 + ε t e t = ρ 1 e t − 1 + ρ 2 e t − 2 + ε t … e_t=\rho e_{t-1}+\varepsilon_t\\ e_t=\rho_1e_{t-1}+\rho_2e_{t-2}+\varepsilon_t\\ \dots et=ρet−1+εtet=ρ1et−1+ρ2et−2+εt…
等回归方程逐一检验。如果存在某一种形式,方程显著成立(F检验),则说明原模型存在自相关。
DW检验法局限性和缺点:
对 μ t = ρ μ t − 1 + ε \mu_t=\rho\mu_{t-1}+\varepsilon μt=ρμt−1+ε构造假设检验 H 0 : ρ = 0 H_0:\rho=0 H0:ρ=0,并构造DW统计量为
D . W . = ∑ t = 2 n ( e t − e t − 1 ) 2 ∑ t = 1 n e t 2 ∈ [ 0 , 4 ] . \mathrm{D.W.}=\frac{\sum\limits_{t=2}^{n}(e_t-e_{t-1})^2}{\sum\limits_{t=1}^{n}e_t^2}\in[0,4]. D.W.=t=1∑net2t=2∑n(et−et−1)2∈[0,4].
需根据样本容量 T T T和解释变量数目 k k k查 D . W . \mathrm{D.W.} D.W.分布表,得到临界值 d L d_{L} dL和 d U d_{U} dU,看DW统计量落在哪个范围,判断自相关状态:( 0 < d L < d U < 4 − d U < 4 − d L < 4 0
事实上, D . W . ≈ 2 ( 1 − ρ ) \mathrm{D.W.}\approx 2(1-\rho) D.W.≈2(1−ρ)。
Q统计量
原假设为残差序列为白噪声,不存在序列相关性,所有 ρ = 0 \rho=0 ρ=0;拒绝原假设意味着,认为序列不是白噪声,序列存在相关性。
模拟AR(m)模型,m的选择影响检验效果,取 m = ln ( T ) m=\ln(T) m=ln(T)效果较好。
考虑一般的 p p p阶序列相关 μ t = ρ 1 μ t − 1 + ρ 2 μ t − 2 + ⋯ + ρ p μ t − p + ε t \mu_t=\rho_1\mu_{t-1}+\rho_2\mu_{t-2}+\cdots+\rho_p\mu_{t-p}+\varepsilon_t μt=ρ1μt−1+ρ2μt−2+⋯+ρpμt−p+εt,检验受约束回归方程:
Y t = β 0 + β 1 X t 1 + ⋯ + β k X t k + ρ 1 μ t − 1 + ⋯ ρ p μ ~ t − p + ε t , H 0 : ρ 1 = ⋯ = ρ p = 0 , Y_t=\beta_0+\beta_1X_{t1}+\cdots+\beta_kX_{tk}+\rho_1\mu_{t-1}+\cdots\rho_p\tilde \mu_{t-p}+\varepsilon_t,\\ H_0:\rho_1=\cdots=\rho_p=0, Yt=β0+β1Xt1+⋯+βkXtk+ρ1μt−1+⋯ρpμ~t−p+εt,H0:ρ1=⋯=ρp=0,
对此方程常使用拉格朗日乘数检验,但是 μ \mu μ是不可观测的,只能对原模型构造回归,使用残差序列: e ~ t = Y t − Y ^ t \tilde e_t=Y_t-\hat Y_t e~t=Yt−Y^t代替 μ t \mu_t μt,从而对此辅助回归有
Y t = β 0 + β 1 X t 1 + ⋯ + β k X t k + ρ 1 e ~ t − 1 + ⋯ + ρ p e ~ t − p + ε t , Y_t=\beta_0+\beta_1X_{t1}+\cdots+\beta_kX_{tk}+\rho_1\tilde e_{t-1}+\cdots+\rho_p\tilde e_{t-p}+\varepsilon_t, Yt=β0+β1Xt1+⋯+βkXtk+ρ1e~t−1+⋯+ρpe~t−p+εt,
计算其可决系数 R 2 R^2 R2,有 L M = n R 2 ∼ χ 2 ( p ) \mathrm{LM}=nR^2\sim \chi^2(p) LM=nR2∼χ2(p)。临界值: χ α 2 ( p ) \chi_{\alpha}^2(p) χα2(p)
若 ρ \rho ρ已知
若原模型存在
μ t = ρ 1 μ t − 1 + μ 2 ρ t − 2 + ⋯ + ρ p μ t − p + ε t , \mu_t=\rho_1\mu_{t-1}+\mu_2\rho_{t-2}+\cdots+\rho_p\mu_{t-p}+\varepsilon_t, μt=ρ1μt−1+μ2ρt−2+⋯+ρpμt−p+εt,
作广义差分变换
Y t − ρ 1 Y t − 1 − ⋯ − ρ p Y t − p = β 0 ( 1 − ρ 1 − ⋯ − ρ p ) + β 1 ( X t 1 − ρ 1 X t − 1 , 1 − ⋯ − ρ p X t − p , 1 ) + ⋯ + β k ( X t k − ρ 1 X t − 1 , k − ⋯ − ρ p X t − p , k ) + ε t . \begin{aligned} &\quad Y_t-\rho_1Y_{t-1}-\cdots-\rho_pY_{t-p}\\ &=\beta_0(1-\rho_1-\cdots-\rho_p)+\beta_1(X_{t1}-\rho_1X_{t-1,1}-\cdots-\rho_pX_{t-p,1})\\ &\quad +\cdots+\beta_k(X_{tk}-\rho_1X_{t-1,k}-\cdots-\rho_pX_{t-p,k})+\varepsilon_t. \end{aligned} Yt−ρ1Yt−1−⋯−ρpYt−p=β0(1−ρ1−⋯−ρp)+β1(Xt1−ρ1Xt−1,1−⋯−ρpXt−p,1)+⋯+βk(Xtk−ρ1Xt−1,k−⋯−ρpXt−p,k)+εt.
当一阶自相关, p = 1 p=1 p=1:
Y t − ρ Y t − 1 = β 0 ( 1 − ρ ) + β 1 ( X t , 1 − ρ X t − 1 , 1 ) + ⋯ + β k ( X t , k − ρ X t − 1 , k ) + ϵ t Y_t-\rho Y_{t-1}=\beta_0(1-\rho)+\beta_1(X_{t,1}-\rho X_{t-1,1})+\dots+\beta_k(X_{t,k}-\rho X_{t-1,k})+\epsilon_t Yt−ρYt−1=β0(1−ρ)+β1(Xt,1−ρXt−1,1)+⋯+βk(Xt,k−ρXt−1,k)+ϵt
广义差分法损失了一定的样本数,在一阶序列相关情况下,对损失的第一次观测值可进行如下的普莱斯-温斯特变换:
Y 1 ∗ = 1 − ρ 2 Y 1 , X 1 j ∗ = 1 − ρ 2 X 1 j . Y_1^*=\sqrt{1-\rho^2}Y_1,\quad X_{1j}^*=\sqrt{1-\rho^2}X_{1j}. Y1∗=1−ρ2Y1,X1j∗=1−ρ2X1j.
补充到差分序列中。
若 ρ \rho ρ未知,要对其进行估计
DW:
ρ ^ = 1 − D W 2 \hat \rho =1-\frac{DW}{2} ρ^=1−2DW
OLS:
e t = ρ ^ e t − 1 + ϵ t e_t=\hat \rho e_{t-1}+\epsilon_t et=ρ^et−1+ϵt
粗略的估计,精确度不高。
用参数估计量的正确标准差进行替换,即使用
V a r ( β ^ 1 ) = σ 2 ∑ x t 2 + 2 σ 2 ∑ x t 2 [ ρ ∑ t = 1 T − 1 x t x t + 1 ∑ x t 2 + ρ 2 ∑ t = 2 T − 2 x t x t + 2 ∑ x t 2 + ⋯ + ρ T − 1 x 1 x T ∑ x t 2 ] . \mathrm{Var}(\hat\beta_1)=\frac{\sigma^2}{\sum x_t^2}+\frac{2\sigma^2}{\sum x_t^2}\left[\rho\frac{\sum\limits_{t=1}^{T-1}x_tx_{t+1}}{\sum x_t^2}+\rho^2\frac{\sum\limits_{t=2}^{T-2}x_tx_{t+2}}{\sum x_t^2}+\cdots+\rho_{T-1}\frac{x_1x_{T}}{\sum x_t^2} \right]. Var(β^1)=∑xt2σ2+∑xt22σ2⎣⎢⎢⎡ρ∑xt2t=1∑T−1xtxt+1+ρ2∑xt2t=2∑T−2xtxt+2+⋯+ρT−1∑xt2x1xT⎦⎥⎥⎤.
进行计算。