时间序列数据被广泛地运用于计量经济研究。经典时间序列和回归分析有很多假定前提,如序列的平稳性、正态性等。如果直接将经济变量的时间序列数据用于建模分析,实际上隐含了这些假定。在这些假定成立的条件下,进行的t、F、卡方检验等才具有较高的可靠度。但是,越来越多的经验证据表明,经济分析中所涉及的大多数时间序列是非平稳的,如果直接将非平稳时间序列当作平稳时间序列来进行分析,会造成伪回归。
本文主要介绍如何判断一个时间序列是否为平稳序列,当我们在计量经济分析中涉及非平稳时间序列时,应如何处理以及如何建模。
所谓“伪回归”,是指变量间本来不存在有意义的关系,但回归结果却得出存在意义关系的错误结论。造成伪回归的根本原因在于时间序列变量的非平稳性。如果用传统回归分析方法对彼此不想关联的非平稳变量进行回归,t检验值和F检验值往往会倾向于显著,从而得出“变量相依”的“伪回归”结果。
因此,当经济变量数据为时间序列数据时,在利用回归分析方法讨论经济变量有意义的经济关系之前,必须对经济变量时间序列的平稳性与非平稳性进行判断。如果经济变量时间序列是非平稳的,则需要寻找新的处理方法。20世纪80年代发展起来的协整理论就是处理非平稳经济变量关系的行之有效的方法。
有些随机现象,要认识它必须研究其发展变化过程,这一类随机现象不能只用一个或多个随机变量来描述,而必须考察其动态变化过程,随机现象的这种动态变化过程就是随机过程。如某国某年的GDP是一个随机变量,但若考察它随时间变化的情形,则{GDPt}就是一个随机过程。
一般地,若对于每一个特定的t,Yt为一随机变量,则称这一簇随机变量{Yt}为一个随机过程。若指标集T为一连续区间,则{Yt}为连续型随机过程。若T为离散集合,则{Yt}为离散型随机过程。随机过程的统计特征通常用其分布及数字特征来刻画。
离散型时间指标集的随机过程通常称为随机型时间序列,简称时间序列。经济分析中常用的时间序列数据都是经济变量随机序列的一个实现。
所谓时间序列的平稳性,是指时间序列的统计规律不会随着时间得推移而发生变化。也就是说,生成变量时间序列数据的随机过程的特征不随时间变化而变化。
直观上,一个平稳的时间序列可以看作一条围绕其均值上下波动的曲线。从理论上,有两种意义的平稳性,一种是严格平稳,另一种是弱平稳。严格平稳是指随机过程{Yt}的联合分布函数与时间的位移无关。设{Yt}为一随机过程,若其联合分布函数为
则称{Yt}为严格平稳随机过程,它的分布结构不随时间推移而变化。
弱平稳是指随机过程{Yt}的期望、方差和协方差不随时间推移而变化。若{Yt}满足:
则称{Yt}为弱平稳随机过程。关于平稳性的概念通常是指弱平稳。
所谓时间序列的非平稳性,是指时间序列的统计规律随着时间的位移而发生变化,即生成变量时间序列数据的随机过程的特征随时间而变化。当生成序列的随机过程是非平稳时,其均值函数、方差函数不再是常熟,自协方差函数也不仅仅是时间间隔t-s的函数,前面介绍的高斯-马尔可夫定理不再成立,一个变量对其他变量的回归可能会导致伪回归结果,计量经济技术也将遇到困难。
实际中遇到的时间序列数据通常是非平稳的,而平稳性在计量经济建模中又具有重要地位,因此有必要对观测值的时间序列数据进行平稳性检验。
时间序列平稳性的检验方法主要有传统方法和现代方法,前者以自相关函数检验为代表,后者以单位根检验为代表。本文主要介绍目前最常用的单位根检验法。
假定{Yt}为一个时间序列,最简单的一种前后依存关系就是变量当前的取值主要与前一时期的取值状况有关,而与前一时期以前的取值状况无直接关系,可用如下一阶自回归模型来描述这种关系:
常记作AR(1)。其中,随机扰动项为独立同分布且均值为零、方差恒定为o2的白噪声。可依据类推到p阶自相关模型的一般形式,记作AR§。
对于一阶自相关模型,根据平稳时间序列分析的理论可知,r的绝对值小于1时,该序列{Yt}是平稳的,如果r=1时,该序列的生成过程变为随机游走过程。
随机游走过程的方差为
当t趋于无穷时,序列的方差趋于无穷大,这说明随机游走过程是非平稳的。
如果一个序列是随机游走过程,则称这个序列是一个的单位根过程。较随机游走更一般的是一般的单位根过程。若随机过程{Yt}遵从
式中r=1,{ut}为一平稳过程,且E(ut)=0,Cov(ut,ut-s)=us<无穷,s=0,1,2,…,则称序列{Yt}为(不带漂移的)单位根过程。带漂移和时间趋势的单位根过程服从如下模型:
显然,随机游走过程是一般单位根过程的一个特例。
从单位根过程的定义可以看出,含一个单位根的过程{Yt},其一阶差分
是一平稳过程,如果像这种经过一阶差分比变为平稳的序列称为一阶单整序列,记作{Yt}~I(1),如果经过2阶差分变为平稳序列称为二阶单整序列,记作{Yt}-I(2)。以此类推,如果序列经过d阶差分后平稳,而d-1次差分不平稳,那么称{Yt}为d阶单整序列,记作{Yt}-I(d),d称为整形阶数。
假定数据序列是由下列自回归模型生成的
其中,随机扰动项独立同分布,期望为零,方差恒定,我们检验是否含有单位根。检验的原假设为H0:r=1。对于无截距项的自回归方程的回归,回归系数r的OLS估计为
检验所用的统计量为
在原假设r=1成立的条件下,t统计量为
注意,在原假设成立的情况下,该统计量不服从t分布。可以证明,上述统计量的极限分布存在,一般称为Dickey-Fuller分布。通过查询DF检验临界值表,与计算出的t统计量值比较。如果t统计量值小于DF检验临界值,则拒绝原假设,说明序列不存在单位根,若t统计量值大于或等于DF检验临界值,则接受原假设,说明序列存在单位根。
此外,Dickey和Fuller研究发现,DF检验的临界值同序列的数据生成过程及回归模型的类型有关,因此它们针对如下三类模型编制了临界值表,这三类模型为:
上述DF检验存在的问题是,在检验所设定的模型时,随机扰动项不存在自相关。但大多数的经济数据序列是不能满足此项假设的,当随机扰动项存在自相关时,直接使用DF检验法会出现偏误。为了保证单位根检验的有效性,人们对DF检验进行拓展,从而形成扩展的DF检验,简称为ADF检验。
ADF检验中的基本模型为如下三种类型:
式中,ut为随机扰动项,它可以是一个一般的平稳过程。当ut存在自相关时,ADF检验将模型变为如下形式:
与DF检验中的模型设定相比较,ADF检验中的模型设定,引入了▲Yt-i(i=1,2,…p)项,其目的是消除自相关性。可以证明,在上述模型中检验原假设H0:r=1的t统计量的极限分布,同DF检验的极限分布相同,从而可以使用相同的临界表,这种检验成为ADF检验。
所谓协整,是指多个非平稳经济变量的某种线性组合是平稳的。例如收入与消费、工资与价格、出口与进口等,这些经济时间序列一般是非平稳序列,但它们之间却往往存在长期均衡关系。下面给出协整的严格定义:
对于两个序列{Xt}与{Yt},如果Yt-I(1),Xt~I(1)(注意这两个序列是同阶单整的),且存在一组非零常数a1、a2,使得a1Xt+a2Yt-I(0),变为0阶单整,则称Xt和Yt之间是协整的。这可以推广到一般情况,具体可见庞皓计量经济学第三版P242。
协整关系也称为长期关系或均衡关系或长期均衡关系。协整概念的提出对于用非平稳变量建立计量经济模型,以及检验这些变量之间的长期均衡关系非常重要。
(1)如果多个非平稳变量具有协整性,则这些变量可以合成一个平稳序列。这个平稳序列就可以用来描述原变量之间的均衡关系。
(2)当且仅当多个非平稳变量之间具有协整性时,有这些变量建立的回归方程才有意义。所以协整性检验也是区别真实回归与伪回归的有效方法。
(3)具有协整关系的非平稳变量可以用来建立误差修正模型。由于误差修正模型把长期关系和短期动态特征结合在一个模型中,因此既可以克服传统计量经济模型忽视伪回归的问题,又可以克服建立差分模型忽视水平变量信息的弱点。
协整性的检验有两种方法:一种是基于回归残差的协整检验,这种检验也成为单一方程的协整检验;另一种是基于回归系数完全信息的Johansen协整检验。这里我们仅介绍单一方程的EG两步法协整检验。
假设只有两个变量序列,要求这两个变量的单整次数应该相同。
第一步,用OLS法作协整回归。用OLS法对回归方程(也称为协整回归方程)
进行估计,得到残差序列et
第二步,检验et的平稳性。若et为平稳的,则{Xt},{Yt}是协整的,反之,则不是协整的。因为若{Xt}、{Yt}不是协整的,则它们的任意线性组合都是非平稳的,因此残差et将是非平稳的。换言之,对残差序列et是否具有平稳性的检验,也就是对{Xt}、{Yt}是否存在协整的检验。
检验et为非平稳的假设可用两种方法。一种方法是对残差序列进行ADF检验,即对et进行单位根检验,但要注意的是,用于检验协整的ADF检验应该使用专用临界值。
还需注意的是,协整检验的临界值不仅与协整回归模型中是否含有漂移项、趋势项有关,而且与所含非平稳变量个数有关。
当多个非平稳变量进行协整检验时,其临界值可以从MacKinnon提供的协整检验临界值表查到。MacKinnon协整检验临界值C(a)的计算公式为
式中,a为显著性水平,T为样本容量。其余参数可通过查表获取。
另一种检验方法是协整回归DW检验。具体做法为,用协整回归所得的残差构造DW统计量:
若et是随机游走的,可以证明DW也应接近于0。因此,只需检验H0:DW=0是否成立,若原假设成立,et为随机游走,Xt与Yt之间不存在协整,反之则存在协整。
误差修正模型(error correction model,ECM)是一种具有特定形式的计量经济模型。其基本思路是,若变量间存在协整关系,则表明这些变量间存在着长期稳定的关系,而这种长期稳定的关系在短期动态过程的不断调整下得以维持。大多数经济时间序列是一阶差分后平稳,同时存在某种联系方式把相互协整过程和长期均衡状态结合起来。这时相互协整隐含的意义是:即使所研究的水平变量各自都是一阶差分后平稳,受支配于长期分量,但这些变量的某些线性组合也可以是平稳的,即所研究变量中的长期分量相互抵消,产生了一个平稳的时间序列。之所以能够这样,是因为一种调节过程(误差修正机制)在起作用,防止了长期关系的偏差在规模或数量上的扩大。因此,任何一组相互协整的时间序列变量都存在误差修正机制,反映短期调节行为。
建立误差修正模型一般采用两步,分别建立区分数据长期特征和短期特征的计量经济学模型。从理论上讲,第一步,建立长期关系模型,即通过水平变量和OLS法估计出时间序列变量间的关系。若估计结果形成平稳的残差序列,那么这些变量间就存在相互协整的关系,长期关系模型的变量选择是合理的,回归系数具有经济意义。
第二步,建立短期动态关系,即误差修正方程。将长期关系模型中各变量以一阶差分形式重新加以构造,并将长期关系模型中所产生的残差序列作为解释变量引入,在一个从一般到特殊的检验过程中,对短期动态关系进行逐项检验,不显著的项逐渐被剔除,到最适当的表示方法被找到为止。值得注意的是,作为解释变量引入的长期关系模型的残差,代表着在取得长期均衡的过程中各时点出现”偏误“的程度,使得第二步可以对这种偏误的短期调整或误差修正机制加以估计。
下面以建立我国货币需求函数为例,说明误差修正模型的建模过程。
货币需求函数通常在局部调整的结构下加以设定。在这种模型中,当前实际货币需求余额是关于实际货币需求余额滞后值、实际国民收入和机会成本等变量的回归。那么,这种依据交易方程设定的模型可作为长期关系模型,其一般形式为:
式中,M为响应的名义货币余额,P为物价指数(通常用GDP的平减指数表示);Y为实际的国内生产总值(GDP);Π为季度通货膨胀率。
第二阶段误差修正方程的一般形式是
式中,EC为长期关系模型中的残差。
在具体建模中,首先,要对长期关系模型的设定是否合理进行单位根检验,以保证EC为平稳序列。其次,对短期动态关系中各变量的滞后项,进行从一般到特殊的检验,在这个检验过程中,不显著的滞后项逐渐被剔除,到找到最佳形式为止。通常滞后期在l=0,1,2,3中进行实验。
在经济学分析中,常常要对经济变量之间的因果关系作出判断。2003年诺贝尔经济学奖获得者格兰杰(Granger)1969年从计量经济学的观点提出了著名的因果关系检验,用于分析时间序列经济变量之间的因果关系。
格兰杰因果关系检验的思想:对于时间序列变量X和Y,如果X是Y变化的原因,则X的变化应该发生在Y变化之前,而且X的过去值应该有助于预测Y的未来值,但Y的过去值不应该能预测X的未来值。具体说,作下式所示的Y关于Y的滞后变量的回归,这是有约束回归:
(10.16)
在式中添加X的滞后变量作为解释变量,所得的式子为无约束回归:
(10.17)
如果X是Y变化的原因,两式子相比,应该显著增加回归模型的解释能力。如果存在这样一种关系,称X是Y的格兰杰原因。反之,如果添加X的滞后变量作为解释变量后,没有显著增加回归模型的解释能力,称X不是Y的格兰杰原因。
根据格兰杰因果关系的意义,X对Y的是否存在格兰杰因果的检验,可通过检验以Y为被解释变量的方程中是否可以把X的全部滞后变量剔除掉而完成。
对于两个平稳时间序列Xt、Yt,分别作(10.16)(10.17)的回归。若有必要,常数项、趋势项、季节虚拟变量等都可以包含在式中。检验X对Y存在格兰杰因果关系的零假设为H0:B1=B2=…=Bm=0,即变量X不是变量Y的格兰杰原因。显然,如果式(10.17)中X的滞后变量的回归系数的估计值全部不存在显著性,则上述假设不能被拒绝。换句话说,如果X的任何一个滞后变量的回归参数的估计值存在显著性,则结论应是X对Y存在格兰杰因果关系。分别计算有约束模型式(10.16)和无约束模型式(10.17)回归的残差平方和RSSR与RSSU,上述检验可用F统计量完成:
式中,m为约束条件的个数,s+m是无约束回归式(10.17)的回归系数个数;n为样本容量。
在原假设成立的条件下,检验统计量F~F[m,n-(s+m)]。在显著性水平a下,如果F>临界值Fa[m,n-(s+m)],则拒绝原假设,即变量X是变量Y的格兰杰原因。
本文主要参考庞皓计量经济学第三版