经典回归模型是建立在平稳数据变量基础上的。许多经济变量是非平稳的,使用经典回归模型会出现伪回归等诸多问题。但是如果变量之间有着长期的稳定关系,即它们之间是协整的,则可以使用经典回归模型。
长期均衡意味着经济系统不存在破坏均衡的内在机制,如果变量在某时期受到干扰后偏离其长期均衡点,则均衡机制将会在下一期进行调整以使其重新回到均衡状态。
假设 X X X 与 Y Y Y 之间的长期均衡关系由下式描述
Y t = α 0 + α 1 X t + μ t Y_t=\alpha_0+\alpha_1X_t+\mu_t Yt=α0+α1Xt+μt
这个式子对均衡关系的解释为:给定 X X X 的一个值, Y Y Y 相应的均衡值也随之确定为 α 0 + α 1 X \alpha_0+\alpha_1X α0+α1X 。
这个式子隐含了一个重要的假设: μ t \mu_t μt 必须是平稳序列。
如果假设不成立,即 μ t \mu_t μt 有上升或下降的随机性趋势。会导致 Y Y Y 对其均衡点的任何偏离被长期累积下来而不能被消除。
在这个假设的基础上,我们称 μ t \mu_t μt 为非均衡误差,它是变量 X X X 和 Y Y Y 的一个线性组合
μ t = Y t − α 0 − α 1 X t \mu_t=Y_t-\alpha_0-\alpha_1X_t μt=Yt−α0−α1Xt
如果 X X X 与 Y Y Y 之间具有长期均衡关系,则 μ t \mu_t μt 应是一零均值平稳时间序列,即零均值 I ( 0 ) {\rm I}(0) I(0) 序列。
另一方面,非平稳的时间序列 X X X 和 Y Y Y 的线性组合可能成为平稳时间序列,我们称 X X X 和 Y Y Y 是协整的。由此便引出了协整的定义。
如果时间序列 Y t 1 , Y t 2 , . . . , Y t k Y_{t1},Y_{t2},...,Y_{tk} Yt1,Yt2,...,Ytk 都是 d d d 阶单整的,存在向量 α = ( α 1 , α 2 , . . . , α k ) \boldsymbol\alpha=(\alpha_1,\alpha_2,...,\alpha_k) α=(α1,α2,...,αk),使得
Z t = α Y T = α 1 Y t 1 + α 2 Y t 2 + . . . + α k Y t k ∼ I ( d − b ) , d ≥ b ≥ 0 Z_t=\boldsymbol{\alpha}\boldsymbol{Y}^{\rm T}=\alpha_1Y_{t1}+\alpha_2Y_{t2}+...+\alpha_kY_{tk}\sim {\rm I}(d-b) \ , \ \ \ \ d\geq b\geq 0 Zt=αYT=α1Yt1+α2Yt2+...+αkYtk∼I(d−b) , d≥b≥0
则称序列 Y t 1 , Y t 2 , . . . , Y t k Y_{t1},Y_{t2},...,Y_{tk} Yt1,Yt2,...,Ytk 是 ( d , b ) (d,\,b) (d,b) 阶协整,记为 C I ( d , b ) {\rm CI}(d,\,b) CI(d,b) 。
如果两个变量都是单整变量,只有当它们的单整阶数相同时,才可能协整;如果它们的单整阶数不相同,就不可能协整。
如果存在三个以上的单整变量且具有不同的单整阶数,有可能经过线性组合构成低阶单整变量。
例如: W t ∼ I ( 1 ) W_t\sim{\rm I}(1) Wt∼I(1) , V t ∼ I ( 2 ) V_t\sim{\rm I}(2) Vt∼I(2) , U t ∼ I ( 2 ) U_t\sim{\rm I}(2) Ut∼I(2)
若进行以下的线性变换并满足以下条件
P t = a V t + b U t ∼ I ( 1 ) P_t=aV_t+bU_t\sim{\rm I}(1) Pt=aVt+bUt∼I(1)Q t = c W t + d P t ∼ I ( 0 ) Q_t=cW_t+dP_t\sim{\rm I}(0) Qt=cWt+dPt∼I(0)
则有结论
V t , U t ∼ C I ( 2 , 1 ) V_t,U_t\sim{\rm CI}(2,\,1) Vt,Ut∼CI(2,1)W t , P t ∼ C I ( 1 , 1 ) W_t,P_t\sim{\rm CI}(1,\,1) Wt,Pt∼CI(1,1)
C I ( d , d ) {\rm CI}(d,\,d) CI(d,d) 的经济意义:两个变量虽然它们具有各自的长期波动规律,但是如果它们是 ( d , d ) (d,d) (d,d) 阶协整的,则它们之间存在着一个长期稳定的比例关系。即使两个时间序列是非平稳的,也可以用经典的回归分析方法建立回归模型。
检验两个呈现 I ( 1 ) {\rm I}(1) I(1) 的变量 y t , x t y_t,\,x_t yt,xt 是否为协整。
step 1. 用 OLS 估计如下方程并计算非均衡误差(该回归又被称为协整回归、静态回归)
y t = α 0 + α 1 x t + μ t y_t=\alpha_0+\alpha_1x_t+\mu_t yt=α0+α1xt+μt
得到
e t = y t − y ^ t = y t − α ^ 0 + α ^ 1 x t e_t=y_t-\hat{y}_t=y_t-\hat{\alpha}_0+\hat{\alpha}_1x_t et=yt−y^t=yt−α^0+α^1xt
step 2. 检验 e t e_t et 的平稳性。
如果 e t e_t et 是平稳序列 I ( 0 ) {\rm I}(0) I(0) ,则 y t , x t ∼ C I ( 1 , 1 ) y_t,x_t\sim {\rm CI}(1,1) yt,xt∼CI(1,1), x t x_t xt 与 y t y_t yt 之间存在协整关系;
如果 e t e_t et 是非平稳的,则 x t x_t xt 与 y t y_t yt 之间不存在协整关系。
检验方法:DF 检验或 ADF 检验
Δ e t = δ e t − 1 + ∑ i = 1 p θ i Δ e t − i + ϵ t \Delta e_t=\delta e_{t-1}+\sum_{i=1}^p\theta_i\Delta e_{t-i}+\epsilon_t Δet=δet−1+i=1∑pθiΔet−i+ϵt
注意:这里的检验对象是协整回归计算出的误差项,并非真正的非均衡误差。而 OLS 法采用了最小残差平方和的原理,因此估计量 δ \delta δ 是向下偏倚的,这将导致拒绝零假设的机会比实际情形大。因此对于 e t e_t et 的平稳性检验的 DF 与 ADF 临界值比正常的 DF 与 ADF 检验的临界值小。
扩展的 EG 检验
为什么多变量协整关系的检验比双变量复杂?——协整变量间可能存在多种稳定的线性组合。
例如:假设有4个 I ( 1 ) {\rm I}(1) I(1) 的变量 Z , X , Y , W Z,X,Y,W Z,X,Y,W ,它们有如下的长期均衡关系:
Z t = α 0 + α 1 W t + α 2 X t + α 3 Y t + μ t Z_t=\alpha_0+\alpha_1W_t+\alpha_2X_t+\alpha_3Y_t+\mu_t Zt=α0+α1Wt+α2Xt+α3Yt+μt
得到非均衡误差 μ t \mu_t μt 是 I ( 0 ) {\rm I}(0) I(0) 序列
μ t = Z t − α 0 − α 1 W t − α 2 X t − α 3 Y t ∼ I ( 0 ) \mu_t=Z_t-\alpha_0-\alpha_1W_t-\alpha_2X_t-\alpha_3Y_t\sim{\rm I}(0) μt=Zt−α0−α1Wt−α2Xt−α3Yt∼I(0)
但存在另一种情况,假设 Z Z Z 与 W W W , X X X 与 Y Y Y 之间分别存在长期均衡关系
Z t = β 0 + β 1 W t + u t Z_t=\beta_0+\beta_1W_t+u_t Zt=β0+β1Wt+utX t = γ 0 + γ 1 Y t + v t X_t=\gamma_0+\gamma_1Y_t+v_t Xt=γ0+γ1Yt+vt
则非均衡误差项 u t u_t ut 和 v t v_t vt 一定是平稳序列 I ( 0 ) {\rm I}(0) I(0) 。于是它们的线性组合也一定是平稳序列,如:
w t = u t + v t = Z t − β 0 − γ 0 − β 1 W t + X t − γ 1 Y t ∼ I ( 0 ) w_t=u_t+v_t=Z_t-\beta_0-\gamma_0-\beta_1W_t+X_t-\gamma_1Y_t\sim{\rm I}(0) wt=ut+vt=Zt−β0−γ0−β1Wt+Xt−γ1Yt∼I(0)
因此存在多组协整向量。
多变量的协整检验步骤
对于非平稳时间序列,可以通过差分的方法将其化为稳定序列。
Y t = α 0 + α 1 X t + μ t Y_t=\alpha_0+\alpha_1X_t+\mu_t Yt=α0+α1Xt+μt
Δ Y t = α 1 Δ X t + v t \Delta Y_t=\alpha_1\Delta X_t+v_t ΔYt=α1ΔXt+vt
v t = μ t − μ t − 1 v_t=\mu_t-\mu_{t-1} vt=μt−μt−1
但是这种做法会引起两个问题
例如,当我们使用 Δ Y t = α 1 Δ X t + v t \Delta Y_t=\alpha_1\Delta X_t+v_t ΔYt=α1ΔXt+vt 进行回归分析时,容易出现截距项显著不为 0 0 0 的情况,即我们得到的估计方程是
Δ Y t = α ^ 0 + α ^ 1 Δ X t + v ^ t , α ^ 0 ≠ 0 \Delta Y_t=\hat\alpha_0+\hat\alpha_1\Delta X_t+\hat{v}_t\ , \ \ \ \ \hat\alpha_0\neq0 ΔYt=α^0+α^1ΔXt+v^t , α^0=0
此时即使保持 X X X 不变, Y Y Y 也会出于长期的上升或下降的过程中,这意味着 X X X 与 Y Y Y 之间不存在静态均衡,与大多数具有长期均衡的经济理论假说不相符。
假设 X t X_t Xt 与 Y t Y_t Yt 的长期均衡关系为
Y t = α 0 + α 1 X t + u t Y_t=\alpha_0+\alpha_1X_t+u_t Yt=α0+α1Xt+ut
由于现实经济中 X X X 与 Y Y Y 很少处在均衡点上,因此实际观测到的只是 X X X 与 Y Y Y 之间的短期或非均衡的关系。假设 X X X 与 Y Y Y 之间的非均衡关系体现为如下 ( 1 , 1 ) (1,\,1) (1,1) 阶分布滞后模型的形式:
Y t = β 0 + β 1 X t + β 2 X t − 1 + δ Y t − 1 + u t Y_t=\beta_0+\beta_1X_t+\beta_2X_{t-1}+\delta Y_{t-1}+u_t Yt=β0+β1Xt+β2Xt−1+δYt−1+ut
该模型显示出 t t t 期的 Y Y Y 不仅与 X X X 的变化有关,而且与 t − 1 t-1 t−1 期的 X X X 与 Y Y Y 的状态值有关。但由于变量可能具有非平稳性,因此不能直接进行 OLS 估计。
差分变形得
Δ Y t = β 0 + β 1 Δ X t + ( β 1 + β 2 ) X t − 1 − ( 1 − δ ) Y t − 1 + u t = β 1 Δ X t − ( 1 − δ ) ( Y t − 1 − β 0 1 − δ − β 1 + β 2 1 − δ X t − 1 ) + u t ≜ β 1 Δ X t − λ ( Y t − 1 − α 0 − α 1 X t − 1 ) + u t \begin{aligned} \Delta Y_t & = \beta_0+\beta_1\Delta X_t+(\beta_1+\beta_2)X_{t-1}-(1-\delta)Y_{t-1}+u_t \\ \\ &=\beta_1\Delta X_t-(1-\delta)\left(Y_{t-1}-\dfrac{\beta_0}{1-\delta}-\dfrac{\beta_1+\beta_2}{1-\delta}X_{t-1}\right)+u_t \\ \\ &\triangleq \beta_1\Delta X_t-\lambda(Y_{t-1}-\alpha_0-\alpha_1X_{t-1})+u_t \end{aligned} ΔYt=β0+β1ΔXt+(β1+β2)Xt−1−(1−δ)Yt−1+ut=β1ΔXt−(1−δ)(Yt−1−1−δβ0−1−δβ1+β2Xt−1)+ut≜β1ΔXt−λ(Yt−1−α0−α1Xt−1)+ut
将上式中的参数与 Y t = α 0 + α 1 X t + u t Y_t=\alpha_0+\alpha_1X_t+u_t Yt=α0+α1Xt+ut 中的相应参数视为相等,则上式中参数 λ \lambda λ 之后的项为 t − 1 t-1 t−1 期的非均衡误差项。这表明 Y Y Y 的短期变化 Δ Y t \Delta Y_t ΔYt 不仅受 X X X 的短期变化 Δ X t \Delta X_t ΔXt 影响,而且根据前一时期的非均衡程度 e c m t − 1 {\rm ecm}_{t-1} ecmt−1 进行相应的修正调整。
误差修正项 e c m {\rm ecm} ecm
e c m t − 1 = Y t − 1 − ( α 0 + α 1 X t − 1 ) {\rm ecm}_{t-1}=Y_{t-1}-(\alpha_0+\alpha_1X_{t-1}) ecmt−1=Yt−1−(α0+α1Xt−1)
一阶误差修正模型
Δ Y t = β 1 Δ X t − λ ⋅ e c m t − 1 + u t \Delta Y_t=\beta_1\Delta X_t-\lambda \cdot {\rm ecm}_{t-1}+u_t ΔYt=β1ΔXt−λ⋅ecmt−1+ut
一般情况下 ∣ δ ∣ < 1 |\delta|<1 ∣δ∣<1,有 0 < λ < 1 0<\lambda<1 0<λ<1。
据此分析 ECM 模型的修正作用
参数的经济意义
问题:是否变量间的关系都可以通过 ECM 来表述?
Granger 表述定理:如果变量 X X X 与 Y Y Y 是协整的,则它们间的短期非均衡关系总能由一个误差修正模型表述。
Δ Y t = l a g g e d ( Δ Y , Δ X ) − λ ⋅ e c m t − 1 + u t \Delta Y_t={\rm lagged}(\Delta Y,\,\Delta X)-\lambda\cdot{\rm ecm}_{t-1}+u_t ΔYt=lagged(ΔY,ΔX)−λ⋅ecmt−1+ut
其中, e c m {\rm ecm} ecm 是非均衡误差项(长期均衡偏差项), λ \lambda λ 是短期调整参数。该模型没有明确指出 Y Y Y 和 X X X 的滞后阶数,可以包含多阶滞后项。由于一阶差分项是 I ( 0 ) {\rm I}(0) I(0) 变量,因此模型中允许采用 X X X 的非滞后差分项 Δ X t \Delta X_t ΔXt 。
首先,对经济系统进行观察和分析,提出长期均衡关系假设。
然后,对变量进行协整分析,以发现变量之间的协整关系,即检验长期均衡关系假设,并以这种关系构成误差修正项。
最后,建立短期模型,将误差修正项看作一个解释变量,连同其他反映短期波动的解释变量一起,建立短期模型,即误差修正模型。
step 1. 利用 OLS 进行协整回归,检验变量间的协整关系,估计协整向量(长期均衡关系参数)
Y t = α 0 + α 1 X t + u t Y_t=\alpha_0+\alpha_1X_t+u_t Yt=α0+α1Xt+ut
step 2. 若协整性存在,则以第一步求得的残差作为非均衡误差项 e c m {\rm ecm} ecm 加入到误差修正模型中,并用 OLS 估计相应参数
Δ Y t = l a g g e d ( Δ Y , Δ X ) − λ ⋅ e c m t − 1 + u t \Delta Y_t={\rm lagged}(\Delta Y,\,\Delta X)-\lambda\cdot{\rm ecm}_{t-1}+u_t ΔYt=lagged(ΔY,ΔX)−λ⋅ecmt−1+ut
注意:在进行变量间的协整检验时,如有必要可在协整回归式中加入趋势项,这时对残差项的稳定性检验就无须设置趋势项。另外,第二步中变量的差分滞后期数,可以通过残差项序列是否存在自相关性来判断,如果存在自相关,则应加入变量差分后的滞后项。
注意:在实际应用研究中,如果 ECM 中误差修正项参数估计值为正,模型设定肯定是错误的。在实际分析的模型设定中,变量常以对数的形式出现,原因在于变量对数的差分近似地等于该变量的变化率,而经济变量的变化率常常是平稳序列。
打开误差修正模型中非均衡误差项的括号,直接用 OLS 估计模型,以双变量为例
Δ Y t = β 1 Δ X t − λ ( Y t − 1 − α 0 − α 1 X t − 1 ) + u t \Delta Y_t=\beta_1\Delta X_t-\lambda(Y_{t-1}-\alpha_0-\alpha_1X_{t-1})+u_t ΔYt=β1ΔXt−λ(Yt−1−α0−α1Xt−1)+ut
Δ Y t = λ α 0 + β 1 Δ X t − λ Y t − 1 + λ α 1 X t − 1 + u t \Delta Y_t=\lambda\alpha_0+\beta_1\Delta X_t-\lambda Y_{t-1}+\lambda\alpha_1X_{t-1}+u_t ΔYt=λα0+β1ΔXt−λYt−1+λα1Xt−1+ut
这时可以一并获得短期弹性和长期弹性的参数估计值,但仍然需要事先对变量间的协整关系进行检验。