【中级计量经济学】Lecture 5 自相关

文章目录

    • Lecture 5 自相关
      • 5.1 自相关定义
      • 5.2 自相关的产生原因
      • 5.3 自相关的后果
      • 5.4 自相关的检验
        • 图示检验法√
        • 回归检验法
        • 杜宾-瓦森(DW)检验法√
        • Ljung-Box检验法√
        • 拉格朗日乘子检验(BG检验)
      • 5.5 自相关的补救办法
        • 广义最小二乘GLS
        • 广义差分法√
        • DW推算和OLS估计
        • 杜宾两步法√
        • 科克伦-奥克特迭代法√
        • 序列相关稳健标准误法

Lecture 5 自相关

更详细的时间序列的自相关放在7.2 单变量均值回归模型

5.1 自相关定义

总体回归模型的随机误差项之间存在相关关系,即不同观测点(不同的样本个体或者不同的时间点)上的误差项彼此相关。

如果存在 E ( μ i μ j ) ≠ 0 \mathrm{E}(\mu_i\mu_j)\ne 0 E(μiμj)=0,就说明存在序列相关性;如果仅有 E ( μ i μ i + 1 ) ≠ 0 \mathrm{E}(\mu_i\mu_{i+1})\ne 0 E(μiμi+1)=0,就说明存在一阶序列相关/自相关。
自相关可以写成如下形式:
μ t = ρ μ t − 1 + ϵ t \mu_t=\rho\mu_{t-1}+\epsilon_t μt=ρμt1+ϵt
ρ \rho ρ被成为一阶自相关系数/自协方差系数, − 1 < ρ < 1 -1<\rho<1 1<ρ<1;
ϵ t \epsilon_t ϵt是满足标准最小二乘回归假定的随机干扰项(经典误差项),即零均值、同方差、序列不相关

5.2 自相关的产生原因

  1. 经济变量固有的惯性

    例如消费习惯的影响经常被包含在随机误差项中,随机误差项可能出现序列正相关。

  2. 模型的设定偏误

    遗漏了重要解释变量或函数形式设定偏误

    内生性问题也可能来源于重要解释变量的遗漏,内生性是随机误差项与解释变量相关

  3. 数据处理造成的相关

    例如将月度数据调整为季度数据,由于采用了加合处理,修匀了月度数据的波动, 使季度数据具有平滑性,这种平滑性产生自相关。

5.3 自相关的后果

本质后果:存在自相关的情况下,OLS低估了参数估计量的方差,随机干扰项的方差也被低估;

在一阶自相关 X t = ρ X t − 1 + μ t X_{t}=\rho X_{t-1}+\mu_t Xt=ρXt1+μt假定下,参数估计量实际的方差是大于估计结果的:
V a r ( β ^ 1 ) = σ 2 ∑ x t 2 + 2 σ 2 ∑ x t 2 [ ρ ∑ t = 1 T − 1 x t x t + 1 ∑ x t 2 + ρ 2 ∑ t = 2 T − 2 x t x t + 2 ∑ x t 2 + ⋯ + ρ T − 1 x 1 x T ∑ x t 2 ] > σ 2 ∑ x t 2 ( 忽 略 异 方 差 问 题 , 计 算 出 的 参 数 的 方 差 ) . \mathrm{Var}(\hat\beta_1)=\frac{\sigma^2}{\sum x_t^2}+\frac{2\sigma^2}{\sum x_t^2}\left[\rho\frac{\sum\limits_{t=1}^{T-1}x_tx_{t+1}}{\sum x_t^2}+\rho^2\frac{\sum\limits_{t=2}^{T-2}x_tx_{t+2}}{\sum x_t^2}+\cdots+\rho_{T-1}\frac{x_1x_{T}}{\sum x_t^2} \right]>\frac{\sigma^2}{\sum x_t^2}(忽略异方差问题,计算出的参数的方差). Var(β^1)=xt2σ2+xt22σ2ρxt2t=1T1xtxt+1+ρ2xt2t=2T2xtxt+2++ρT1xt2x1xT>xt2σ2.

  • 参数估计量仍未无偏估计,但非有效估计,因为方差扩大了。而 OLS 在计算参数方差时假设无自相关,即 认为 ρ = 0 \rho=0 ρ=0,此时实际方差被低估。

  • 对模型的检验失去意义。由于 OLS 低估了真实方差,因此,t值被高估(更容易通过显著性检验),t检验、F检验和拟合优度检验都失效。
    t = β ^ j − β j S β ^ j t=\frac{\hat\beta_j-\beta_j}{S_{\hat\beta_j}} t=Sβ^jβ^jβj

  • 预测功能失效。随机扰动项的误差不可靠、随机抽样误差不可靠,故预测区间不可靠。
    Y F = Y ^ F ± t α / 2 ( σ ^ 1 n + ( X F − X ˉ ) 2 ∑ x i 2 ) Y_F=\hat Y_F\pm t_{\alpha/2}\Bigg(\hat\sigma\sqrt{\frac{1}{n}+\frac{(X_F-\bar{X})^2}{\sum{x_i^2}}}\Bigg) YF=Y^F±tα/2(σ^n1+xi2(XFXˉ)2 )

5.4 自相关的检验

图示检验法√

e t − t e_t-t ett图或者 e t − e t − 1 e_t-e_{t-1} etet1图辅助判断。

回归检验法


e t = ρ e t − 1 + ε t e t = ρ 1 e t − 1 + ρ 2 e t − 2 + ε t … e_t=\rho e_{t-1}+\varepsilon_t\\ e_t=\rho_1e_{t-1}+\rho_2e_{t-2}+\varepsilon_t\\ \dots et=ρet1+εtet=ρ1et1+ρ2et2+εt
等回归方程逐一检验。如果存在某一种形式,方程显著成立(F检验),则说明原模型存在自相关。

杜宾-瓦森(DW)检验法√

DW检验法局限性和缺点:

  1. 解释变量 X X X非随机
  2. μ t \mu_t μt为一阶自相关形式,不适用于高阶序列相关的检验
  3. 回归模型的解释变量中不能含滞后应变量 Y t − 1 Y_{t-1} Yt1
  4. 回归模型必须含有截距项
  5. DW统计量上下界临界值 d L , d U d_L,d_U dL,dU表,要求样本数 T ≥ 15 T\geq15 T15
  6. 若DW统计量落在 d L < D . W . < d U d_LdL<D.W.<dU 4 − d U < D . W . < 4 − d L 4-d_U4dU<D.W.<4dL,则不能判断相关性

μ t = ρ μ t − 1 + ε \mu_t=\rho\mu_{t-1}+\varepsilon μt=ρμt1+ε构造假设检验 H 0 : ρ = 0 H_0:\rho=0 H0:ρ=0,并构造DW统计量为
D . W . = ∑ t = 2 n ( e t − e t − 1 ) 2 ∑ t = 1 n e t 2 ∈ [ 0 , 4 ] . \mathrm{D.W.}=\frac{\sum\limits_{t=2}^{n}(e_t-e_{t-1})^2}{\sum\limits_{t=1}^{n}e_t^2}\in[0,4]. D.W.=t=1net2t=2n(etet1)2[0,4].
需根据样本容量 T T T和解释变量数目 k k k D . W . \mathrm{D.W.} D.W.分布表,得到临界值 d L d_{L} dL d U d_{U} dU,看DW统计量落在哪个范围,判断自相关状态: 0 < d L < d U < 4 − d U < 4 − d L < 4 00<dL<dU<4dU<4dL<4

  • 0 < D . W . < d L 0<\mathrm{D.W.}0<D.W.<dL,存在正自相关。
  • d U < D . W . < 4 − d U d_{U}<\mathrm{D.W.}<4-d_{U} dU<D.W.<4dU,无自相关。
  • 4 − d L < D . W . < 4 4-d_{L}<\mathrm{D.W.}<4 4dL<D.W.<4,存在负自相关。
  • 其他情况下不能确定。

事实上, D . W . ≈ 2 ( 1 − ρ ) \mathrm{D.W.}\approx 2(1-\rho) D.W.2(1ρ)

Ljung-Box检验法√

Q统计量

原假设为残差序列为白噪声,不存在序列相关性,所有 ρ = 0 \rho=0 ρ=0;拒绝原假设意味着,认为序列不是白噪声,序列存在相关性。

模拟AR(m)模型,m的选择影响检验效果,取 m = ln ⁡ ( T ) m=\ln(T) m=ln(T)效果较好。

拉格朗日乘子检验(BG检验)

考虑一般的 p p p阶序列相关 μ t = ρ 1 μ t − 1 + ρ 2 μ t − 2 + ⋯ + ρ p μ t − p + ε t \mu_t=\rho_1\mu_{t-1}+\rho_2\mu_{t-2}+\cdots+\rho_p\mu_{t-p}+\varepsilon_t μt=ρ1μt1+ρ2μt2++ρpμtp+εt,检验受约束回归方程:
Y t = β 0 + β 1 X t 1 + ⋯ + β k X t k + ρ 1 μ t − 1 + ⋯ ρ p μ ~ t − p + ε t , H 0 : ρ 1 = ⋯ = ρ p = 0 , Y_t=\beta_0+\beta_1X_{t1}+\cdots+\beta_kX_{tk}+\rho_1\mu_{t-1}+\cdots\rho_p\tilde \mu_{t-p}+\varepsilon_t,\\ H_0:\rho_1=\cdots=\rho_p=0, Yt=β0+β1Xt1++βkXtk+ρ1μt1+ρpμ~tp+εt,H0:ρ1==ρp=0,
对此方程常使用拉格朗日乘数检验,但是 μ \mu μ是不可观测的,只能对原模型构造回归,使用残差序列: e ~ t = Y t − Y ^ t \tilde e_t=Y_t-\hat Y_t e~t=YtY^t代替 μ t \mu_t μt,从而对此辅助回归有
Y t = β 0 + β 1 X t 1 + ⋯ + β k X t k + ρ 1 e ~ t − 1 + ⋯ + ρ p e ~ t − p + ε t , Y_t=\beta_0+\beta_1X_{t1}+\cdots+\beta_kX_{tk}+\rho_1\tilde e_{t-1}+\cdots+\rho_p\tilde e_{t-p}+\varepsilon_t, Yt=β0+β1Xt1++βkXtk+ρ1e~t1++ρpe~tp+εt,
计算其可决系数 R 2 R^2 R2,有 L M = n R 2 ∼ χ 2 ( p ) \mathrm{LM}=nR^2\sim \chi^2(p) LM=nR2χ2(p)。临界值: χ α 2 ( p ) \chi_{\alpha}^2(p) χα2(p)

5.5 自相关的补救办法

ρ \rho ρ已知

广义最小二乘GLS

广义差分法√

若原模型存在
μ t = ρ 1 μ t − 1 + μ 2 ρ t − 2 + ⋯ + ρ p μ t − p + ε t , \mu_t=\rho_1\mu_{t-1}+\mu_2\rho_{t-2}+\cdots+\rho_p\mu_{t-p}+\varepsilon_t, μt=ρ1μt1+μ2ρt2++ρpμtp+εt,
作广义差分变换
Y t − ρ 1 Y t − 1 − ⋯ − ρ p Y t − p = β 0 ( 1 − ρ 1 − ⋯ − ρ p ) + β 1 ( X t 1 − ρ 1 X t − 1 , 1 − ⋯ − ρ p X t − p , 1 ) + ⋯ + β k ( X t k − ρ 1 X t − 1 , k − ⋯ − ρ p X t − p , k ) + ε t . \begin{aligned} &\quad Y_t-\rho_1Y_{t-1}-\cdots-\rho_pY_{t-p}\\ &=\beta_0(1-\rho_1-\cdots-\rho_p)+\beta_1(X_{t1}-\rho_1X_{t-1,1}-\cdots-\rho_pX_{t-p,1})\\ &\quad +\cdots+\beta_k(X_{tk}-\rho_1X_{t-1,k}-\cdots-\rho_pX_{t-p,k})+\varepsilon_t. \end{aligned} Ytρ1Yt1ρpYtp=β0(1ρ1ρp)+β1(Xt1ρ1Xt1,1ρpXtp,1)++βk(Xtkρ1Xt1,kρpXtp,k)+εt.
当一阶自相关, p = 1 p=1 p=1
Y t − ρ Y t − 1 = β 0 ( 1 − ρ ) + β 1 ( X t , 1 − ρ X t − 1 , 1 ) + ⋯ + β k ( X t , k − ρ X t − 1 , k ) + ϵ t Y_t-\rho Y_{t-1}=\beta_0(1-\rho)+\beta_1(X_{t,1}-\rho X_{t-1,1})+\dots+\beta_k(X_{t,k}-\rho X_{t-1,k})+\epsilon_t YtρYt1=β0(1ρ)+β1(Xt,1ρXt1,1)++βk(Xt,kρXt1,k)+ϵt

广义差分法损失了一定的样本数,在一阶序列相关情况下,对损失的第一次观测值可进行如下的普莱斯-温斯特变换:
Y 1 ∗ = 1 − ρ 2 Y 1 , X 1 j ∗ = 1 − ρ 2 X 1 j . Y_1^*=\sqrt{1-\rho^2}Y_1,\quad X_{1j}^*=\sqrt{1-\rho^2}X_{1j}. Y1=1ρ2 Y1,X1j=1ρ2 X1j.
补充到差分序列中。

ρ \rho ρ未知,要对其进行估计

DW推算和OLS估计

DW:
ρ ^ = 1 − D W 2 \hat \rho =1-\frac{DW}{2} ρ^=12DW
OLS:
e t = ρ ^ e t − 1 + ϵ t e_t=\hat \rho e_{t-1}+\epsilon_t et=ρ^et1+ϵt
粗略的估计,精确度不高。

杜宾两步法√

科克伦-奥克特迭代法√

序列相关稳健标准误法

用参数估计量的正确标准差进行替换,即使用
V a r ( β ^ 1 ) = σ 2 ∑ x t 2 + 2 σ 2 ∑ x t 2 [ ρ ∑ t = 1 T − 1 x t x t + 1 ∑ x t 2 + ρ 2 ∑ t = 2 T − 2 x t x t + 2 ∑ x t 2 + ⋯ + ρ T − 1 x 1 x T ∑ x t 2 ] . \mathrm{Var}(\hat\beta_1)=\frac{\sigma^2}{\sum x_t^2}+\frac{2\sigma^2}{\sum x_t^2}\left[\rho\frac{\sum\limits_{t=1}^{T-1}x_tx_{t+1}}{\sum x_t^2}+\rho^2\frac{\sum\limits_{t=2}^{T-2}x_tx_{t+2}}{\sum x_t^2}+\cdots+\rho_{T-1}\frac{x_1x_{T}}{\sum x_t^2} \right]. Var(β^1)=xt2σ2+xt22σ2ρxt2t=1T1xtxt+1+ρ2xt2t=2T2xtxt+2++ρT1xt2x1xT.
进行计算。

你可能感兴趣的:(中级计量经济学,金融)