自相关(auto correlation)又称序列相关(serial correlation),即总体回归模型的随机扰动项 μ i \mu_i μi之间存在相关关系。在经典线性回归模型中,无自相关假定为
Cov ( u i , u j ) = E ( u i , u j ) = 0 ( i ≠ j ) \operatorname{Cov}\left(u_{i}, u_{j}\right)=E\left(u_{i}, u_{j}\right)=0 \quad(i \neq j) Cov(ui,uj)=E(ui,uj)=0(i=j)
如果该假定不能满足,就称 μ i \mu_i μi与 μ j \mu_j μj存在自相关,即不同观测点上的误差项彼此相关。随机误差项 μ t \mu_t μt与滞后一期的 μ t − 1 \mu_{t-1} μt−1的自相关系数为
ρ = ∑ t = 2 n u t u t − 1 ∑ t = 2 n u t 2 ∑ t = 2 n u t − 1 2 \rho=\frac{\sum_{t=2}^{n} u_{t} u_{t-1}}{\sqrt{\sum_{t=2}^{n} u_{t}^{2}} \sqrt{\sum_{t=2}^{n} u_{t-1}^{2}}} ρ=∑t=2nut2∑t=2nut−12∑t=2nutut−1
其中 − 1 < ρ < 1 -1<\rho <1 −1<ρ<1, ρ \rho ρ称为一阶自相关系数。
样本观测期为 n n n的时间序列数据,总体回归模型的随机误差项为 μ 1 , μ 2 , … μ n \mu_1,\mu_2,\dots \mu_n μ1,μ2,…μn,自相关形式为
u t = ρ u t − 1 + v t (1) u_{t}=\rho u_{t-1}+v_{t} \tag{1} ut=ρut−1+vt(1)
其中 ρ \rho ρ为自相关系数, v t v_t vt满足古典假设,即 E ( v t ) = 0 E(v_t) = 0 E(vt)=0, V a r ( v t ) = σ 2 Var(v_t) = \sigma^2 Var(vt)=σ2, C o v ( v t , v s ) = 0 ( t ≠ s ) Cov(v_t,v_s) = 0(t\ne s) Cov(vt,vs)=0(t=s)。上述模型包含 μ t \mu_t μt与 μ t − 1 \mu_{t-1} μt−1形式,故称(1)为一阶自回归模型,记作 A R ( 1 ) AR(1) AR(1)。若 v t v_t vt中包含 u t u_t ut的成分,则需要从 v t v_t vt中提取 u t − 2 u_{t-2} ut−2,得到
u t = ρ 1 u t − 1 + ρ 2 u t − 2 + v t ′ (2) u_{t}=\rho_{1} u_{t-1}+\rho_{2} u_{t-2}+v_{t}^{\prime}\tag{2} ut=ρ1ut−1+ρ2ut−2+vt′(2)
式中 ρ 1 \rho_1 ρ1为一阶自相关系数, ρ 2 \rho_2 ρ2为二阶自相关系数, v t ′ v_t^{'} vt′满足古典假设误差项。并将 ( 2 ) (2) (2)称为误差项的二阶自回归,记作 A R ( 2 ) AR(2) AR(2)。一般地,若 μ 1 , μ 2 , … μ n \mu_1,\mu_2,\dots \mu_n μ1,μ2,…μn满足
u t = ρ 1 u t − 1 + ρ 2 u t − 2 + ⋯ + ρ m u t − m + v t u_{t}=\rho_{1} u_{t-1}+\rho_{2} u_{t-2}+\cdots+\rho_{m} u_{t-m}+v_{t} ut=ρ1ut−1+ρ2ut−2+⋯+ρmut−m+vt
其中 v t v_t vt为古典假设误差项, ρ i ( i = 1 , 2 , … m ) \rho_i(i = 1,2,\dots m) ρi(i=1,2,…m)为 i i i阶自回归系数。
自相关与异方差均不服从球形扰动项假设,故自相关的的后果与异方差相同。以一元回归模型为例
Y t = β 1 + β 2 X t + u t Y_{t}=\beta_{1}+\beta_{2} X_{t}+u_{t} Yt=β1+β2Xt+ut
其中 μ t \mu_t μt存在一阶自相关,即 u t = ρ u t − 1 + v t u_{t}=\rho u_{t-1}+v_{t} ut=ρut−1+vt,其中 E ( v t ) = 0 E(v_t) = 0 E(vt)=0, V a r ( v t ) = σ 2 Var(v_t) = \sigma^2 Var(vt)=σ2, C o v ( v t , v s ) = 0 ( t ≠ s ) Cov(v_t,v_s) = 0(t\ne s) Cov(vt,vs)=0(t=s)。在大样本条件下, ρ \rho ρ的估计量为
ρ ^ = ∑ u t u t − 1 ∑ u t − 1 2 \hat{\rho}=\frac{\sum u_{t} u_{t-1}}{\sum u_{t-1}^{2}} ρ^=∑ut−12∑utut−1
在大样本条件下, μ t \mu_t μt与 μ t − 1 \mu_{t-1} μt−1的相关系数为
ρ = ∑ u t u t − 1 ∑ u t 2 ∑ u t − 1 2 ≈ ∑ u t u t − 1 ∑ u t − 1 2 = ρ ^ \rho=\frac{\sum u_{t} u_{t-1}}{\sqrt{\sum u_{t}^{2}} \sqrt{\sum u_{t-1}^{2}}} \approx \frac{\sum u_{t} u_{t-1}}{\sum u_{t-1}^{2}}=\hat{\rho} ρ=∑ut2∑ut−12∑utut−1≈∑ut−12∑utut−1=ρ^
由(1)式迭代得
u t = v t + ρ v t − 1 + ρ 2 v t − 2 + ⋯ = ∑ r = 0 ∞ ρ r v t − r (3) u_{t}=v_{t}+\rho v_{t-1}+\rho^{2} v_{t-2}+\cdots=\sum_{r=0}^{\infty} \rho^{r} v_{t-r}\tag{3} ut=vt+ρvt−1+ρ2vt−2+⋯=r=0∑∞ρrvt−r(3)
式表明,误差项可以由服从独立同分布( i i d iid iid)的随机误差序列 v t − r ( r = 1 , 2 , … ) v_{t-r}(r=1,2,\dots) vt−r(r=1,2,…)表示,其中权重为 ρ r ( r = 1 , 2 , … ) \rho^r(r= 1,2,\dots) ρr(r=1,2,…)。当 ρ ∈ ( 0 , 1 ) \rho\in(0,1) ρ∈(0,1)时表明权数为几何递减,当 ρ ∈ ( − 1 , 0 ) \rho \in(-1,0) ρ∈(−1,0)时表明权数为震荡交错衰减。 μ t \mu_t μt的期望与方差为
E ( u t ) = ∑ r = 0 ∞ ρ r E ( v t − r ) = 0 E\left(u_{t}\right)=\sum_{r=0}^{\infty} \rho^{r} E\left(v_{t-r}\right)=0 E(ut)=r=0∑∞ρrE(vt−r)=0
Var ( u t ) = ∑ r = 0 ∞ ρ 2 n Var ( v t − r ) = σ v 2 1 − ρ 2 = σ u 2 \operatorname{Var}\left(u_{t}\right)=\sum_{r=0}^{\infty} \rho^{2 n} \operatorname{Var}\left(v_{t-r}\right)=\frac{\sigma_{v}^{2}}{1-\rho^{2}}=\sigma_{u}^{2} Var(ut)=r=0∑∞ρ2nVar(vt−r)=1−ρ2σv2=σu2
当存在自相关时,扰动项的期望值为0,同方差。但方差协方差矩阵非对角线元素,即扰动项的协方差为
Cov ( u t , u t − k ) = ρ k Var ( u t − k ) = ρ k σ v 2 1 − ρ 2 ≠ 0 \operatorname{Cov}\left(u_{t}, u_{t-k}\right)=\rho^{k} \operatorname{Var}\left(u_{t-k}\right)=\frac{\rho^{k} \sigma_{v}^{2}}{1-\rho^{2}}\ne 0 Cov(ut,ut−k)=ρkVar(ut−k)=1−ρ2ρkσv2=0
当 k = 1 k= 1 k=1时称为扰动项 μ t \mu_t μt一阶协方差, k = n k = n k=n称为扰动项 μ t \mu_t μt的 n n n阶协方差。
一元线性回归模型在满足经典假设条件下,斜率估计量为
Var ( β ^ 2 ) = σ 2 ∑ x t 2 (4) \operatorname{Var}\left(\hat{\beta}_{2}\right)=\frac{\sigma^{2}}{\sum x_{t}^{2}}\tag{4} Var(β^2)=∑xt2σ2(4)
存在自相关时,估量的期望 E ( β ^ 2 ) = β 2 E(\hat{\beta}_2) = \beta_2 E(β^2)=β2,即无偏。但估量的方差推导过程利用了无自相关假设,即 E ( u i , u j ) = 0 ( i ≠ j ) E\left(u_{i}, u_{j}\right)=0 \quad(i \neq j) E(ui,uj)=0(i=j),于是
Var ( β ^ 2 ) ≠ σ 2 ∑ x t 2 \operatorname{Var}\left(\hat{\beta}_{2}\right)\ne \frac{\sigma^{2}}{\sum x_{t}^{2}} Var(β^2)=∑xt2σ2
可以证明,当随机扰动项 μ t \mu_t μt存在一阶自相关时,估计量的方差为
Var ( β ^ 2 ) = σ u 2 ∑ t = 1 n x t 2 ( 1 + 2 ρ ∑ t = 1 n − 1 x t x t + 1 ∑ t = 1 n x t 2 + 2 ρ 2 ∑ t = 1 n − 2 x t x t + 2 ∑ t = 1 n x t 2 + ⋯ + 2 ρ n − 1 x 1 x n ∑ t = 1 n x t 2 ) (5) \operatorname{Var}\left(\hat{\beta}_{2}\right)=\frac{\sigma_{u}^{2}}{\sum_{t=1}^{n} x_{t}^{2}}\left(1+2 \rho \frac{\sum_{t=1}^{n-1} x_{t} x_{t+1}}{\sum_{t=1}^{n} x_{t}^{2}}+2 \rho^{2} \frac{\sum_{t=1}^{n-2} x_{t} x_{t+2}}{\sum_{t=1}^{n} x_{t}^{2}}+\cdots+2 \rho^{n-1} \frac{x_{1} x_{n}}{\sum_{t=1}^{n} x_{t}^{2}}\right) \tag{5} Var(β^2)=∑t=1nxt2σu2(1+2ρ∑t=1nxt2∑t=1n−1xtxt+1+2ρ2∑t=1nxt2∑t=1n−2xtxt+2+⋯+2ρn−1∑t=1nxt2x1xn)(5)
当 ρ = 0 \rho = 0 ρ=0,此时 Var ( β ^ 2 ) = σ 2 / ∑ x t 2 \operatorname{Var}\left(\hat{\beta}_{2}\right)=\sigma^2/\sum x_{t}^{2} Var(β^2)=σ2/∑xt2。不难看出,(5)的方差大于(4)式的方差,故在自相关条件下,估计量 Var ( β ^ 2 ) \operatorname{Var}\left(\hat{\beta}_{2}\right) Var(β^2)不再是最小的。方差增大,回归系数的标准误增大。当存在自相关时,容易证明,
E ( ∑ e t 2 ) = σ 2 [ ( n − 2 ) − ( 2 ρ ∑ X t X t + 1 ∑ X t 2 + 2 ρ 2 ∑ X t X t + 2 ∑ X t 2 + ⋯ + 2 ρ n − 1 ∑ X t X n ∑ X t 2 ) ] (6) E\left(\sum e_{t}^{2}\right)=\sigma^{2}\left[(n-2)-\left(2 \rho \frac{\sum X_{t} X_{t+1}}{\sum X_{t}^{2}}+2 \rho^{2} \frac{\sum X_{t} X_{t+2}}{\sum X_{t}^{2}}+\cdots+2 \rho^{n-1} \frac{\sum X_{t} X_{n}}{\sum X_{t}^{2}}\right)\right]\tag{6} E(∑et2)=σ2[(n−2)−(2ρ∑Xt2∑XtXt+1+2ρ2∑Xt2∑XtXt+2+⋯+2ρn−1∑Xt2∑XtXn)](6)
当 X t X_t Xt与 μ t \mu_t μt为正相关时,(6)式 E ( ∑ e t 2 ) E\left(\sum e_{t}^{2}\right) E(∑et2)与 σ 2 ^ = ∑ e t 2 / ( n − 2 ) \hat{\sigma^2} = \sum e_{t}^{2}/(n-2) σ2^=∑et2/(n−2)相比降低,进而低估了真实的 σ 2 \sigma^2 σ2,最终低估了(4)式的方差。
自相关问题将低估参数的方差((5)与(6)表现),根据系数检验统计量 t = ( β ^ 2 − β 2 ) / SE ( β ^ 2 ) ∼ t ( n − 2 ) t=\left(\hat{\beta}_{2}-\beta_{2}\right) / \operatorname{SE}\left(\hat{\beta}_{2}\right) \sim t(n-2) t=(β^2−β2)/SE(β^2)∼t(n−2), t t t统计量被夸大,显著性夸大。类似的,模型显著性检验以及拟合优度也是不可靠的。模型预测方面,其预测精度降低,预测置信区间扩大。
e t e_t et与 e t − 1 e_{t-1} et−1散点图:根据残差 e t e_t et与 e t − 1 e_{t-1} et−1的走势判断正相关还是负相关
e t e_t et与 t t t散点图:如果 e t e_t et随着时间的变化频繁地变化符号,说明 e t e_t et存在负自相关;几个正的 e t e_t et跟着几个负的 e t e_t et,表明 e t e_t et存在正相关。
DW检验是J.Durbin(杜宾)和G.S.Watson(沃特森)于1951 年提出的一种适用于小样本的检验方法。DW检验的条件为
自变量 X X X非随机
随机误差仅为一阶自相关,即 u t = ρ u t − 1 + v t u_{t}=\rho u_{t-1}+v_{t} ut=ρut−1+vt(不能处理高阶自相关情形)
线性模型不包含被解释变量滞后项(不能处理动态模型情形)
模型必须存在截距项
数据无缺失项
定义DW统计量
D W = ∑ t = 2 n ( e t − e t − 1 ) 2 ∑ t = 1 n e t 2 D W=\frac{\sum_{t=2}^{n}\left(e_{t}-e_{t-1}\right)^{2}}{\sum_{t=1}^{n} e_{t}^{2}} DW=∑t=1net2∑t=2n(et−et−1)2
其中 e t = Y t − Y ^ t e_t = Y_t-\hat{Y}_t et=Yt−Y^t ( t = 1 , 2 , … n ) (t=1,2,\dots n) (t=1,2,…n),将DW统计量展开,在大样本条件下 ∑ t = 2 n e t 2 ≈ ∑ t = 2 n e t − 1 2 ≈ ∑ t = 1 n e t 2 \sum_{t=2}^{n} e_{t}^{2} \approx \sum_{t=2}^{n} e_{t-1}^{2} \approx \sum_{t=1}^{n} e_{t}^{2} ∑t=2net2≈∑t=2net−12≈∑t=1net2,则
D W ≈ 2 [ 1 − ∑ i = 2 n e t e t − 1 ∑ t = 1 n e t 2 ] D W \approx 2\left[1-\frac{\sum_{i=2}^{n} e_{t} e_{t-1}}{\sum_{t=1}^{n} e_{t}^{2}}\right] DW≈2[1−∑t=1net2∑i=2netet−1]
同理,在 ∑ t = 2 n e t 2 ≈ ∑ t = 2 n e t − 1 2 ≈ ∑ t = 1 n e t 2 \sum_{t=2}^{n} e_{t}^{2} \approx \sum_{t=2}^{n} e_{t-1}^{2} \approx \sum_{t=1}^{n} e_{t}^{2} ∑t=2net2≈∑t=2net−12≈∑t=1net2条件下,
ρ ^ ≈ ∑ t = 2 n e t e t − 1 ∑ t = 1 n e t 2 \hat{\rho} \approx \frac{\sum_{t=2}^{n} e_{t} e_{t-1}}{\sum_{t=1}^{n} e_{t}^{2}} ρ^≈∑t=1net2∑t=2netet−1
从而有
D W ≈ 2 ( 1 − ρ ^ ) DW \approx 2(1-\hat{\rho}) DW≈2(1−ρ^)
由于 − 1 < ρ ^ < 1 -1<\hat{\rho}<1 −1<ρ^<1,故 0 ≤ D W ≤ 4 0\le DW\le 4 0≤DW≤4。根据样本容量 n n n、解释变量个数 k ′ k' k′(不包括常数),查DW分布表可得临界值 d L , d U d_L,d_U dL,dU,然后依据以下规则考察 D W DW DW值
0 ≤ D W ≤ d L 0\le DW \le d_L 0≤DW≤dL,误差项 μ i \mu_i μi存在正相关
d L ≤ D W ≤ d U d_L\le DW \le d_U dL≤DW≤dU,无法判断
d U ≤ D W ≤ 4 − d U d_U \le DW \le 4-d_U dU≤DW≤4−dU,无自相关
4 − d U ≤ D W ≤ 4 − d L 4-d_U \le DW \le 4-d_L 4−dU≤DW≤4−dL,无法判断
4 − d L ≤ D W ≤ 4 4-d_L\le DW \le 4 4−dL≤DW≤4,误差项 μ i \mu_i μi存在负相关
显然,当DW值接近0时,存在正相关,接近4时存在负相关,接近2时,不存在相关。注意:DW存在无法判断区域。
DW统计量具有前置条件
DW检验上下界要求样本容量 n ≥ 15 n\ge 15 n≥15
DW检验不适用于随机误差的高阶相关
DW检验存在两个未知区域不能判定
一元线性回归模型
Y t = β 1 + β 2 X t + u t (7) Y_{t}=\beta_{1}+\beta_{2} X_{t}+u_{t}\tag{7} Yt=β1+β2Xt+ut(7)
随机扰动项 u t = ρ u t − 1 + v t u_{t}=\rho u_{t-1}+v_{t} ut=ρut−1+vt, ∣ ρ ∣ < 1 |\rho|<1 ∣ρ∣<1, v t v_t vt满足经典假设条件。将(7)滞后一期为
Y t − 1 = β 1 + β 2 X t − 1 + u t − 1 (8) Y_{t-1}=\beta_{1}+\beta_{2} X_{t-1}+u_{t-1}\tag{8} Yt−1=β1+β2Xt−1+ut−1(8)
将(8)乘以相关系数 ρ \rho ρ并用(7)减之,得
Y t − ρ Y t − 1 = β 1 ( 1 − ρ ) + β 2 ( X t − ρ X t − 1 ) + u t − ρ u t − 1 Y_{t}-\rho Y_{t-1}=\beta_{1}(1-\rho)+\beta_{2}\left(X_{t}-\rho X_{t-1}\right)+u_{t}-\rho u_{t-1} Yt−ρYt−1=β1(1−ρ)+β2(Xt−ρXt−1)+ut−ρut−1
其中 v t = u t − ρ u t − 1 v_t =u_{t}-\rho u_{t-1} vt=ut−ρut−1满足经典假设条件,无自相关。令 Y t ∗ = Y t − ρ Y t − 1 Y_{t}^{*}=Y_{t}-\rho Y_{t-1} Yt∗=Yt−ρYt−1 , X t ∗ = X t − ρ X t − 1 X_{t}^{*}=X_{t}-\rho X_{t-1} Xt∗=Xt−ρXt−1, β 1 ∗ = β 1 ( 1 − ρ ) \beta_{1}^{*}=\beta_{1}(1-\rho) β1∗=β1(1−ρ), β 2 = β 2 ∗ \beta_{2}=\beta_{2}^{*} β2=β2∗,得到
Y t ∗ = β 1 ∗ + β 2 ∗ X t ∗ + v t (9) Y_{t}^{*}=\beta_{1}^{*}+\beta_{2}^{*} X_{t}^{*}+v_{t}\tag{9} Yt∗=β1∗+β2∗Xt∗+vt(9)
对(9)使用OLS得到参数最佳线性无偏估计量。由于广义差分失去了第一个观测值,一般使用 Y 1 1 − ρ 2 Y_1\sqrt{1-\rho^2} Y11−ρ2与 X 1 1 − ρ 2 X_1\sqrt{1-\rho^2} X11−ρ2作为相应得补充。
ρ \rho ρ一般未知,最简单得方法时通过DW计算,即
ρ ^ ≈ 1 − D W 2 \hat{\rho}\approx1-\frac{DW}{2} ρ^≈1−2DW
但该方法较为粗略。一种精确度较高得方法是Cochrane—Orcutt迭代法。步骤如下
使用OLS估计模型 Y t = β 1 + β 2 X t + u t Y_{t}=\beta_{1}+\beta_{2} X_{t}+u_{t} Yt=β1+β2Xt+ut,并计算残差 e t ( 1 ) e_t^{(1)} et(1)
利用残差 e t ( 1 ) e_t^{(1)} et(1)作如下回归
e t ( 1 ) = ρ ^ ( 1 ) e t − 1 ( 1 ) + v t e_{t}^{(1)}=\hat{\rho}^{(1)} e_{t-1}^{(1)}+v_{t} et(1)=ρ^(1)et−1(1)+vt
利用上步计算的 ρ ^ ( 1 ) \hat{\rho}^{(1)} ρ^(1)对模型 Y t = β 1 + β 2 X t + u t Y_{t}=\beta_{1}+\beta_{2} X_{t}+u_{t} Yt=β1+β2Xt+ut作广义差分,令 Y t ∗ = Y t − ρ ^ ( 1 ) Y t − 1 Y_{t}^{*}=Y_{t}-\hat{\rho}^{(1)} Y_{t-1} Yt∗=Yt−ρ^(1)Yt−1, X t ∗ = X t − ρ ^ ( 1 ) X t − 1 X_{t}^{*}=X_{t}-\hat{\rho}^{(1)} X_{t-1} Xt∗=Xt−ρ^(1)Xt−1, β 1 ∗ = β 1 ( 1 − ρ ^ ( 1 ) ) \beta_{1}^{*}=\beta_{1}\left(1-\hat{\rho}^{(1)}\right) β1∗=β1(1−ρ^(1)),从而得到样本回归函数
Y t ∗ = β 1 ∗ + β 2 ∗ X t ∗ + e t ( 2 ) Y_{t}^{*}=\beta_{1}^{*}+\beta_{2}^{*} X_{t}^{*}+e_t^{(2)} Yt∗=β1∗+β2∗Xt∗+et(2)
利用 β ^ 1 = β ^ 1 ∗ / ( 1 − ρ ^ ( 1 ) ) \hat{\beta}_{1}=\hat{\beta}_{1}^{*} /\left(1-\hat{\rho}^{(1)}\right) β^1=β^1∗/(1−ρ^(1))与 β ^ 2 = β ^ 2 ∗ \hat{\beta}_2=\hat{\beta}_2^{*} β^2=β^2∗,将 β ^ 1 , β ^ 2 \hat{\beta}_{1},\hat{\beta}_{2} β^1,β^2代入原回归模型得新的残差 e t ( 3 ) e_t^{(3)} et(3)
e t ( 3 ) = Y t − β 1 − β 2 X t e_{t}^{(3)}=Y_{t}-\beta_{1}-\beta_{2} X_{t} et(3)=Yt−β1−β2Xt
利用残差 e t ( 3 ) e_t^{(3)} et(3)作回归
e t ( 3 ) = ρ ( 2 ) e t − 1 ( 3 ) + v t e_{t}^{(3)}=\rho^{(2)} e_{t-1}^{(3)}+v_{t} et(3)=ρ(2)et−1(3)+vt
用 OLS法估计的 ρ ^ ( 2 ) \hat{\rho}^{(2)} ρ^(2)是对 ρ \rho ρ的第二轮估计值。给定误差项 δ \delta δ,当 ∣ ρ ^ k − ρ ^ k − 1 ∣ < δ |\hat{\rho}^{k}-\hat{\rho}^{k-1}|<\delta ∣ρ^k−ρ^k−1∣<δ时,停止迭代。
使用条件:完全正自相关,即 ρ = 1 \rho =1 ρ=1。设一阶线性回归模型 Y t = β 1 + β 2 X t + u t Y_{t}=\beta_{1}+\beta_{2} X_{t}+u_{t} Yt=β1+β2Xt+ut, u t = ρ u t − 1 + v t u_{t}=\rho u_{t-1}+v_{t} ut=ρut−1+vt。将模型滞后一期并作差分得到
Δ Y t = β 2 Δ X t + u t − u t − 1 \Delta Y_{t}=\beta_{2} \Delta X_{\mathrm{t}}+u_{t}-u_{t-1} ΔYt=β2ΔXt+ut−ut−1
此时扰动项 v t = u t − u t − 1 v_t = u_t-u_{t-1} vt=ut−ut−1满足经典假设条件。从而消除自相关。但这种方法假定了扰动项存在完全正自相关,不具有推广性。
自相关系数 ρ \rho ρ未知,可用德宾两步法消除自相关。将广义差分模型变形得到
Y t = β 1 ( 1 − ρ ) + β 2 X t − ρ β 2 X t − 1 + ρ Y t − 1 + v t Y_{t}=\beta_{1}(1-\rho)+\beta_{2} X_{t}-\rho \beta_{2} X_{t-1}+\rho Y_{t-1}+v_{t} Yt=β1(1−ρ)+β2Xt−ρβ2Xt−1+ρYt−1+vt
将上式视为多元线性回归模型,利用ols法得到 ρ ^ \hat{\rho} ρ^,视为参数 ρ \rho ρ得估计,但却时有偏但一致得估计。
利用 ρ ^ \hat{\rho} ρ^进行广义差分求出序列 Y t ∗ = Y t − ρ Y t − 1 Y_{t}^{*}=Y_{t}-\rho Y_{t-1} Yt∗=Yt−ρYt−1 , X t ∗ = X t − ρ X t − 1 X_{t}^{*}=X_{t}-\rho X_{t-1} Xt∗=Xt−ρXt−1, 然后使用olsOLS对广义差分进行估计,求得最佳线性无偏估计。
参考文献
庞皓. 计量经济学[M].科学出版社