多元线性回归—自相关

文章目录

    • @[toc]
    • 1 什么是自相关
      • 1.1 自相关概念
      • 1.2 自相关产生的原因
      • 1.3 自相关表现形式
    • 2 自相关后果
      • 2.1 对估计参数的影响
      • 2.2 对模型检验的影响
    • 3自相关检验
      • 3.1相关图示法
      • 3.2 DW检验
      • 3.3 DW检验局限
    • 4 自相关补救
      • 4.1 广义差分法
      • 4.2 Cochrane—Orcutt迭代法
      • 4.3 差分法
      • 4.4 德宾两步法

1 什么是自相关

1.1 自相关概念

自相关(auto correlation)又称序列相关(serial correlation),即总体回归模型的随机扰动项 μ i \mu_i μi之间存在相关关系。在经典线性回归模型中,无自相关假定为
Cov ⁡ ( u i , u j ) = E ( u i , u j ) = 0 ( i ≠ j ) \operatorname{Cov}\left(u_{i}, u_{j}\right)=E\left(u_{i}, u_{j}\right)=0 \quad(i \neq j) Cov(ui,uj)=E(ui,uj)=0(i=j)
如果该假定不能满足,就称 μ i \mu_i μi μ j \mu_j μj存在自相关,即不同观测点上的误差项彼此相关。随机误差项 μ t \mu_t μt与滞后一期的 μ t − 1 \mu_{t-1} μt1的自相关系数为
ρ = ∑ t = 2 n u t u t − 1 ∑ t = 2 n u t 2 ∑ t = 2 n u t − 1 2 \rho=\frac{\sum_{t=2}^{n} u_{t} u_{t-1}}{\sqrt{\sum_{t=2}^{n} u_{t}^{2}} \sqrt{\sum_{t=2}^{n} u_{t-1}^{2}}} ρ=t=2nut2 t=2nut12 t=2nutut1
其中 − 1 < ρ < 1 -1<\rho <1 1<ρ<1, ρ \rho ρ称为一阶自相关系数。

  • ρ > 0 \rho >0 ρ>0, μ t \mu_t μt μ t − 1 \mu_{t-1} μt1为正相关;
  • ρ < 0 \rho <0 ρ<0, μ t \mu_t μt μ t − 1 \mu_{t-1} μt1为负相关;
  • ρ = 0 \rho = 0 ρ=0, μ t \mu_t μt μ t − 1 \mu_{t-1} μt1不相关。

1.2 自相关产生的原因

  • 经济系统的惯性,例如通货膨胀不仅受到货币供给的影响,还受到过去通货膨胀的影响
  • 经济活动的滞后效应。例如经济学中蛛网模型
  • 数据处理造成的相关。
  • 模型设定偏误。

1.3 自相关表现形式

样本观测期为 n n n的时间序列数据,总体回归模型的随机误差项为 μ 1 , μ 2 , … μ n \mu_1,\mu_2,\dots \mu_n μ1,μ2,μn,自相关形式为
u t = ρ u t − 1 + v t (1) u_{t}=\rho u_{t-1}+v_{t} \tag{1} ut=ρut1+vt(1)
其中 ρ \rho ρ为自相关系数, v t v_t vt满足古典假设,即 E ( v t ) = 0 E(v_t) = 0 E(vt)=0, V a r ( v t ) = σ 2 Var(v_t) = \sigma^2 Var(vt)=σ2, C o v ( v t , v s ) = 0 ( t ≠ s ) Cov(v_t,v_s) = 0(t\ne s) Cov(vt,vs)=0(t=s)。上述模型包含 μ t \mu_t μt μ t − 1 \mu_{t-1} μt1形式,故称(1)为一阶自回归模型,记作 A R ( 1 ) AR(1) AR(1)。若 v t v_t vt中包含 u t u_t ut的成分,则需要从 v t v_t vt中提取 u t − 2 u_{t-2} ut2,得到
u t = ρ 1 u t − 1 + ρ 2 u t − 2 + v t ′ (2) u_{t}=\rho_{1} u_{t-1}+\rho_{2} u_{t-2}+v_{t}^{\prime}\tag{2} ut=ρ1ut1+ρ2ut2+vt(2)
式中 ρ 1 \rho_1 ρ1为一阶自相关系数, ρ 2 \rho_2 ρ2为二阶自相关系数, v t ′ v_t^{'} vt满足古典假设误差项。并将 ( 2 ) (2) (2)称为误差项的二阶自回归,记作 A R ( 2 ) AR(2) AR(2)。一般地,若 μ 1 , μ 2 , … μ n \mu_1,\mu_2,\dots \mu_n μ1,μ2,μn满足
u t = ρ 1 u t − 1 + ρ 2 u t − 2 + ⋯ + ρ m u t − m + v t u_{t}=\rho_{1} u_{t-1}+\rho_{2} u_{t-2}+\cdots+\rho_{m} u_{t-m}+v_{t} ut=ρ1ut1+ρ2ut2++ρmutm+vt
其中 v t v_t vt为古典假设误差项, ρ i ( i = 1 , 2 , … m ) \rho_i(i = 1,2,\dots m) ρi(i=1,2,m) i i i阶自回归系数。


2 自相关后果

自相关与异方差均不服从球形扰动项假设,故自相关的的后果与异方差相同。以一元回归模型为例
Y t = β 1 + β 2 X t + u t Y_{t}=\beta_{1}+\beta_{2} X_{t}+u_{t} Yt=β1+β2Xt+ut
其中 μ t \mu_t μt存在一阶自相关,即 u t = ρ u t − 1 + v t u_{t}=\rho u_{t-1}+v_{t} ut=ρut1+vt,其中 E ( v t ) = 0 E(v_t) = 0 E(vt)=0, V a r ( v t ) = σ 2 Var(v_t) = \sigma^2 Var(vt)=σ2, C o v ( v t , v s ) = 0 ( t ≠ s ) Cov(v_t,v_s) = 0(t\ne s) Cov(vt,vs)=0(t=s)。在大样本条件下, ρ \rho ρ的估计量为
ρ ^ = ∑ u t u t − 1 ∑ u t − 1 2 \hat{\rho}=\frac{\sum u_{t} u_{t-1}}{\sum u_{t-1}^{2}} ρ^=ut12utut1
在大样本条件下, μ t \mu_t μt μ t − 1 \mu_{t-1} μt1的相关系数为
ρ = ∑ u t u t − 1 ∑ u t 2 ∑ u t − 1 2 ≈ ∑ u t u t − 1 ∑ u t − 1 2 = ρ ^ \rho=\frac{\sum u_{t} u_{t-1}}{\sqrt{\sum u_{t}^{2}} \sqrt{\sum u_{t-1}^{2}}} \approx \frac{\sum u_{t} u_{t-1}}{\sum u_{t-1}^{2}}=\hat{\rho} ρ=ut2 ut12 utut1ut12utut1=ρ^
由(1)式迭代得
u t = v t + ρ v t − 1 + ρ 2 v t − 2 + ⋯ = ∑ r = 0 ∞ ρ r v t − r (3) u_{t}=v_{t}+\rho v_{t-1}+\rho^{2} v_{t-2}+\cdots=\sum_{r=0}^{\infty} \rho^{r} v_{t-r}\tag{3} ut=vt+ρvt1+ρ2vt2+=r=0ρrvtr(3)
式表明,误差项可以由服从独立同分布( i i d iid iid)的随机误差序列 v t − r ( r = 1 , 2 , …   ) v_{t-r}(r=1,2,\dots) vtr(r=1,2,)表示,其中权重为 ρ r ( r = 1 , 2 , …   ) \rho^r(r= 1,2,\dots) ρr(r=1,2,)。当 ρ ∈ ( 0 , 1 ) \rho\in(0,1) ρ(0,1)时表明权数为几何递减,当 ρ ∈ ( − 1 , 0 ) \rho \in(-1,0) ρ(1,0)时表明权数为震荡交错衰减。 μ t \mu_t μt的期望与方差为
E ( u t ) = ∑ r = 0 ∞ ρ r E ( v t − r ) = 0 E\left(u_{t}\right)=\sum_{r=0}^{\infty} \rho^{r} E\left(v_{t-r}\right)=0 E(ut)=r=0ρrE(vtr)=0
Var ⁡ ( u t ) = ∑ r = 0 ∞ ρ 2 n Var ⁡ ( v t − r ) = σ v 2 1 − ρ 2 = σ u 2 \operatorname{Var}\left(u_{t}\right)=\sum_{r=0}^{\infty} \rho^{2 n} \operatorname{Var}\left(v_{t-r}\right)=\frac{\sigma_{v}^{2}}{1-\rho^{2}}=\sigma_{u}^{2} Var(ut)=r=0ρ2nVar(vtr)=1ρ2σv2=σu2
当存在自相关时,扰动项的期望值为0,同方差。但方差协方差矩阵非对角线元素,即扰动项的协方差为
Cov ⁡ ( u t , u t − k ) = ρ k Var ⁡ ( u t − k ) = ρ k σ v 2 1 − ρ 2 ≠ 0 \operatorname{Cov}\left(u_{t}, u_{t-k}\right)=\rho^{k} \operatorname{Var}\left(u_{t-k}\right)=\frac{\rho^{k} \sigma_{v}^{2}}{1-\rho^{2}}\ne 0 Cov(ut,utk)=ρkVar(utk)=1ρ2ρkσv2=0
k = 1 k= 1 k=1时称为扰动项 μ t \mu_t μt一阶协方差, k = n k = n k=n称为扰动项 μ t \mu_t μt n n n阶协方差。


2.1 对估计参数的影响

一元线性回归模型在满足经典假设条件下,斜率估计量为
Var ⁡ ( β ^ 2 ) = σ 2 ∑ x t 2 (4) \operatorname{Var}\left(\hat{\beta}_{2}\right)=\frac{\sigma^{2}}{\sum x_{t}^{2}}\tag{4} Var(β^2)=xt2σ2(4)
存在自相关时,估量的期望 E ( β ^ 2 ) = β 2 E(\hat{\beta}_2) = \beta_2 E(β^2)=β2,即无偏。但估量的方差推导过程利用了无自相关假设,即 E ( u i , u j ) = 0 ( i ≠ j ) E\left(u_{i}, u_{j}\right)=0 \quad(i \neq j) E(ui,uj)=0(i=j),于是
Var ⁡ ( β ^ 2 ) ≠ σ 2 ∑ x t 2 \operatorname{Var}\left(\hat{\beta}_{2}\right)\ne \frac{\sigma^{2}}{\sum x_{t}^{2}} Var(β^2)=xt2σ2
可以证明,当随机扰动项 μ t \mu_t μt存在一阶自相关时,估计量的方差为
Var ⁡ ( β ^ 2 ) = σ u 2 ∑ t = 1 n x t 2 ( 1 + 2 ρ ∑ t = 1 n − 1 x t x t + 1 ∑ t = 1 n x t 2 + 2 ρ 2 ∑ t = 1 n − 2 x t x t + 2 ∑ t = 1 n x t 2 + ⋯ + 2 ρ n − 1 x 1 x n ∑ t = 1 n x t 2 ) (5) \operatorname{Var}\left(\hat{\beta}_{2}\right)=\frac{\sigma_{u}^{2}}{\sum_{t=1}^{n} x_{t}^{2}}\left(1+2 \rho \frac{\sum_{t=1}^{n-1} x_{t} x_{t+1}}{\sum_{t=1}^{n} x_{t}^{2}}+2 \rho^{2} \frac{\sum_{t=1}^{n-2} x_{t} x_{t+2}}{\sum_{t=1}^{n} x_{t}^{2}}+\cdots+2 \rho^{n-1} \frac{x_{1} x_{n}}{\sum_{t=1}^{n} x_{t}^{2}}\right) \tag{5} Var(β^2)=t=1nxt2σu2(1+2ρt=1nxt2t=1n1xtxt+1+2ρ2t=1nxt2t=1n2xtxt+2++2ρn1t=1nxt2x1xn)(5)
ρ = 0 \rho = 0 ρ=0,此时 Var ⁡ ( β ^ 2 ) = σ 2 / ∑ x t 2 \operatorname{Var}\left(\hat{\beta}_{2}\right)=\sigma^2/\sum x_{t}^{2} Var(β^2)=σ2/xt2。不难看出,(5)的方差大于(4)式的方差,故在自相关条件下,估计量 Var ⁡ ( β ^ 2 ) \operatorname{Var}\left(\hat{\beta}_{2}\right) Var(β^2)不再是最小的。方差增大,回归系数的标准误增大。当存在自相关时,容易证明,
E ( ∑ e t 2 ) = σ 2 [ ( n − 2 ) − ( 2 ρ ∑ X t X t + 1 ∑ X t 2 + 2 ρ 2 ∑ X t X t + 2 ∑ X t 2 + ⋯ + 2 ρ n − 1 ∑ X t X n ∑ X t 2 ) ] (6) E\left(\sum e_{t}^{2}\right)=\sigma^{2}\left[(n-2)-\left(2 \rho \frac{\sum X_{t} X_{t+1}}{\sum X_{t}^{2}}+2 \rho^{2} \frac{\sum X_{t} X_{t+2}}{\sum X_{t}^{2}}+\cdots+2 \rho^{n-1} \frac{\sum X_{t} X_{n}}{\sum X_{t}^{2}}\right)\right]\tag{6} E(et2)=σ2[(n2)(2ρXt2XtXt+1+2ρ2Xt2XtXt+2++2ρn1Xt2XtXn)](6)
X t X_t Xt μ t \mu_t μt为正相关时,(6)式 E ( ∑ e t 2 ) E\left(\sum e_{t}^{2}\right) E(et2) σ 2 ^ = ∑ e t 2 / ( n − 2 ) \hat{\sigma^2} = \sum e_{t}^{2}/(n-2) σ2^=et2/(n2)相比降低,进而低估了真实的 σ 2 \sigma^2 σ2,最终低估了(4)式的方差。


2.2 对模型检验的影响

自相关问题将低估参数的方差((5)与(6)表现),根据系数检验统计量 t = ( β ^ 2 − β 2 ) / SE ⁡ ( β ^ 2 ) ∼ t ( n − 2 ) t=\left(\hat{\beta}_{2}-\beta_{2}\right) / \operatorname{SE}\left(\hat{\beta}_{2}\right) \sim t(n-2) t=(β^2β2)/SE(β^2)t(n2) t t t统计量被夸大,显著性夸大。类似的,模型显著性检验以及拟合优度也是不可靠的。模型预测方面,其预测精度降低,预测置信区间扩大。


3自相关检验

3.1相关图示法

  • e t e_t et e t − 1 e_{t-1} et1散点图:根据残差 e t e_t et e t − 1 e_{t-1} et1的走势判断正相关还是负相关

  • e t e_t et t t t散点图:如果 e t e_t et随着时间的变化频繁地变化符号,说明 e t e_t et存在负自相关;几个正的 e t e_t et跟着几个负的 e t e_t et,表明 e t e_t et存在正相关。


3.2 DW检验

DW检验是J.Durbin(杜宾)和G.S.Watson(沃特森)于1951 年提出的一种适用于小样本的检验方法。DW检验的条件为

  • 自变量 X X X非随机

  • 随机误差仅为一阶自相关,即 u t = ρ u t − 1 + v t u_{t}=\rho u_{t-1}+v_{t} ut=ρut1+vt(不能处理高阶自相关情形)

  • 线性模型不包含被解释变量滞后项(不能处理动态模型情形)

  • 模型必须存在截距项

  • 数据无缺失项

定义DW统计量
D W = ∑ t = 2 n ( e t − e t − 1 ) 2 ∑ t = 1 n e t 2 D W=\frac{\sum_{t=2}^{n}\left(e_{t}-e_{t-1}\right)^{2}}{\sum_{t=1}^{n} e_{t}^{2}} DW=t=1net2t=2n(etet1)2
其中 e t = Y t − Y ^ t e_t = Y_t-\hat{Y}_t et=YtY^t ( t = 1 , 2 , … n ) (t=1,2,\dots n) (t=1,2,n),将DW统计量展开,在大样本条件下 ∑ t = 2 n e t 2 ≈ ∑ t = 2 n e t − 1 2 ≈ ∑ t = 1 n e t 2 \sum_{t=2}^{n} e_{t}^{2} \approx \sum_{t=2}^{n} e_{t-1}^{2} \approx \sum_{t=1}^{n} e_{t}^{2} t=2net2t=2net12t=1net2,则
D W ≈ 2 [ 1 − ∑ i = 2 n e t e t − 1 ∑ t = 1 n e t 2 ] D W \approx 2\left[1-\frac{\sum_{i=2}^{n} e_{t} e_{t-1}}{\sum_{t=1}^{n} e_{t}^{2}}\right] DW2[1t=1net2i=2netet1]
同理,在 ∑ t = 2 n e t 2 ≈ ∑ t = 2 n e t − 1 2 ≈ ∑ t = 1 n e t 2 \sum_{t=2}^{n} e_{t}^{2} \approx \sum_{t=2}^{n} e_{t-1}^{2} \approx \sum_{t=1}^{n} e_{t}^{2} t=2net2t=2net12t=1net2条件下,
ρ ^ ≈ ∑ t = 2 n e t e t − 1 ∑ t = 1 n e t 2 \hat{\rho} \approx \frac{\sum_{t=2}^{n} e_{t} e_{t-1}}{\sum_{t=1}^{n} e_{t}^{2}} ρ^t=1net2t=2netet1
从而有
D W ≈ 2 ( 1 − ρ ^ ) DW \approx 2(1-\hat{\rho}) DW2(1ρ^)
由于 − 1 < ρ ^ < 1 -1<\hat{\rho}<1 1<ρ^<1,故 0 ≤ D W ≤ 4 0\le DW\le 4 0DW4。根据样本容量 n n n、解释变量个数 k ′ k' k(不包括常数),查DW分布表可得临界值 d L , d U d_L,d_U dL,dU,然后依据以下规则考察 D W DW DW

  • 0 ≤ D W ≤ d L 0\le DW \le d_L 0DWdL,误差项 μ i \mu_i μi存在正相关

  • d L ≤ D W ≤ d U d_L\le DW \le d_U dLDWdU,无法判断

  • d U ≤ D W ≤ 4 − d U d_U \le DW \le 4-d_U dUDW4dU,无自相关

  • 4 − d U ≤ D W ≤ 4 − d L 4-d_U \le DW \le 4-d_L 4dUDW4dL,无法判断

  • 4 − d L ≤ D W ≤ 4 4-d_L\le DW \le 4 4dLDW4,误差项 μ i \mu_i μi存在负相关

显然,当DW值接近0时,存在正相关,接近4时存在负相关,接近2时,不存在相关。注意:DW存在无法判断区域。


3.3 DW检验局限

  • DW统计量具有前置条件

  • DW检验上下界要求样本容量 n ≥ 15 n\ge 15 n15

  • DW检验不适用于随机误差的高阶相关

  • DW检验存在两个未知区域不能判定


4 自相关补救

4.1 广义差分法

一元线性回归模型
Y t = β 1 + β 2 X t + u t (7) Y_{t}=\beta_{1}+\beta_{2} X_{t}+u_{t}\tag{7} Yt=β1+β2Xt+ut(7)
随机扰动项 u t = ρ u t − 1 + v t u_{t}=\rho u_{t-1}+v_{t} ut=ρut1+vt ∣ ρ ∣ < 1 |\rho|<1 ρ<1, v t v_t vt满足经典假设条件。将(7)滞后一期为
Y t − 1 = β 1 + β 2 X t − 1 + u t − 1 (8) Y_{t-1}=\beta_{1}+\beta_{2} X_{t-1}+u_{t-1}\tag{8} Yt1=β1+β2Xt1+ut1(8)
将(8)乘以相关系数 ρ \rho ρ并用(7)减之,得
Y t − ρ Y t − 1 = β 1 ( 1 − ρ ) + β 2 ( X t − ρ X t − 1 ) + u t − ρ u t − 1 Y_{t}-\rho Y_{t-1}=\beta_{1}(1-\rho)+\beta_{2}\left(X_{t}-\rho X_{t-1}\right)+u_{t}-\rho u_{t-1} YtρYt1=β1(1ρ)+β2(XtρXt1)+utρut1
其中 v t = u t − ρ u t − 1 v_t =u_{t}-\rho u_{t-1} vt=utρut1满足经典假设条件,无自相关。令 Y t ∗ = Y t − ρ Y t − 1 Y_{t}^{*}=Y_{t}-\rho Y_{t-1} Yt=YtρYt1 , X t ∗ = X t − ρ X t − 1 X_{t}^{*}=X_{t}-\rho X_{t-1} Xt=XtρXt1, β 1 ∗ = β 1 ( 1 − ρ ) \beta_{1}^{*}=\beta_{1}(1-\rho) β1=β1(1ρ), β 2 = β 2 ∗ \beta_{2}=\beta_{2}^{*} β2=β2,得到
Y t ∗ = β 1 ∗ + β 2 ∗ X t ∗ + v t (9) Y_{t}^{*}=\beta_{1}^{*}+\beta_{2}^{*} X_{t}^{*}+v_{t}\tag{9} Yt=β1+β2Xt+vt(9)
对(9)使用OLS得到参数最佳线性无偏估计量。由于广义差分失去了第一个观测值,一般使用 Y 1 1 − ρ 2 Y_1\sqrt{1-\rho^2} Y11ρ2 X 1 1 − ρ 2 X_1\sqrt{1-\rho^2} X11ρ2 作为相应得补充。


4.2 Cochrane—Orcutt迭代法

ρ \rho ρ一般未知,最简单得方法时通过DW计算,即
ρ ^ ≈ 1 − D W 2 \hat{\rho}\approx1-\frac{DW}{2} ρ^12DW
但该方法较为粗略。一种精确度较高得方法是Cochrane—Orcutt迭代法。步骤如下

  • 使用OLS估计模型 Y t = β 1 + β 2 X t + u t Y_{t}=\beta_{1}+\beta_{2} X_{t}+u_{t} Yt=β1+β2Xt+ut,并计算残差 e t ( 1 ) e_t^{(1)} et(1)

  • 利用残差 e t ( 1 ) e_t^{(1)} et(1)作如下回归
    e t ( 1 ) = ρ ^ ( 1 ) e t − 1 ( 1 ) + v t e_{t}^{(1)}=\hat{\rho}^{(1)} e_{t-1}^{(1)}+v_{t} et(1)=ρ^(1)et1(1)+vt

  • 利用上步计算的 ρ ^ ( 1 ) \hat{\rho}^{(1)} ρ^(1)对模型 Y t = β 1 + β 2 X t + u t Y_{t}=\beta_{1}+\beta_{2} X_{t}+u_{t} Yt=β1+β2Xt+ut作广义差分,令 Y t ∗ = Y t − ρ ^ ( 1 ) Y t − 1 Y_{t}^{*}=Y_{t}-\hat{\rho}^{(1)} Y_{t-1} Yt=Ytρ^(1)Yt1, X t ∗ = X t − ρ ^ ( 1 ) X t − 1 X_{t}^{*}=X_{t}-\hat{\rho}^{(1)} X_{t-1} Xt=Xtρ^(1)Xt1, β 1 ∗ = β 1 ( 1 − ρ ^ ( 1 ) ) \beta_{1}^{*}=\beta_{1}\left(1-\hat{\rho}^{(1)}\right) β1=β1(1ρ^(1)),从而得到样本回归函数
    Y t ∗ = β 1 ∗ + β 2 ∗ X t ∗ + e t ( 2 ) Y_{t}^{*}=\beta_{1}^{*}+\beta_{2}^{*} X_{t}^{*}+e_t^{(2)} Yt=β1+β2Xt+et(2)

  • 利用 β ^ 1 = β ^ 1 ∗ / ( 1 − ρ ^ ( 1 ) ) \hat{\beta}_{1}=\hat{\beta}_{1}^{*} /\left(1-\hat{\rho}^{(1)}\right) β^1=β^1/(1ρ^(1)) β ^ 2 = β ^ 2 ∗ \hat{\beta}_2=\hat{\beta}_2^{*} β^2=β^2,将 β ^ 1 , β ^ 2 \hat{\beta}_{1},\hat{\beta}_{2} β^1β^2代入原回归模型得新的残差 e t ( 3 ) e_t^{(3)} et(3)
    e t ( 3 ) = Y t − β 1 − β 2 X t e_{t}^{(3)}=Y_{t}-\beta_{1}-\beta_{2} X_{t} et(3)=Ytβ1β2Xt

  • 利用残差 e t ( 3 ) e_t^{(3)} et(3)作回归
    e t ( 3 ) = ρ ( 2 ) e t − 1 ( 3 ) + v t e_{t}^{(3)}=\rho^{(2)} e_{t-1}^{(3)}+v_{t} et(3)=ρ(2)et1(3)+vt
    用 OLS法估计的 ρ ^ ( 2 ) \hat{\rho}^{(2)} ρ^(2)是对 ρ \rho ρ的第二轮估计值。给定误差项 δ \delta δ,当 ∣ ρ ^ k − ρ ^ k − 1 ∣ < δ |\hat{\rho}^{k}-\hat{\rho}^{k-1}|<\delta ρ^kρ^k1<δ时,停止迭代。


4.3 差分法

使用条件:完全正自相关,即 ρ = 1 \rho =1 ρ=1。设一阶线性回归模型 Y t = β 1 + β 2 X t + u t Y_{t}=\beta_{1}+\beta_{2} X_{t}+u_{t} Yt=β1+β2Xt+ut u t = ρ u t − 1 + v t u_{t}=\rho u_{t-1}+v_{t} ut=ρut1+vt。将模型滞后一期并作差分得到
Δ Y t = β 2 Δ X t + u t − u t − 1 \Delta Y_{t}=\beta_{2} \Delta X_{\mathrm{t}}+u_{t}-u_{t-1} ΔYt=β2ΔXt+utut1
此时扰动项 v t = u t − u t − 1 v_t = u_t-u_{t-1} vt=utut1满足经典假设条件。从而消除自相关。但这种方法假定了扰动项存在完全正自相关,不具有推广性。


4.4 德宾两步法

自相关系数 ρ \rho ρ未知,可用德宾两步法消除自相关。将广义差分模型变形得到
Y t = β 1 ( 1 − ρ ) + β 2 X t − ρ β 2 X t − 1 + ρ Y t − 1 + v t Y_{t}=\beta_{1}(1-\rho)+\beta_{2} X_{t}-\rho \beta_{2} X_{t-1}+\rho Y_{t-1}+v_{t} Yt=β1(1ρ)+β2Xtρβ2Xt1+ρYt1+vt

  • 将上式视为多元线性回归模型,利用ols法得到 ρ ^ \hat{\rho} ρ^,视为参数 ρ \rho ρ得估计,但却时有偏但一致得估计。

  • 利用 ρ ^ \hat{\rho} ρ^进行广义差分求出序列 Y t ∗ = Y t − ρ Y t − 1 Y_{t}^{*}=Y_{t}-\rho Y_{t-1} Yt=YtρYt1 , X t ∗ = X t − ρ X t − 1 X_{t}^{*}=X_{t}-\rho X_{t-1} Xt=XtρXt1, 然后使用olsOLS对广义差分进行估计,求得最佳线性无偏估计。


-END-

参考文献

庞皓. 计量经济学[M].科学出版社

你可能感兴趣的:(计量经济学,统计学,数据分析,机器学习)