全文链接:http://tecdat.cn/?p=32188
原文出处:拓端数据部落公众号
单位根的随机性趋势与协整关系对实证分析中时间序列的影响是不容小觑的。检验的目的在于更好的分辨数据特性、甄选模型,以达到或能预测或能证实因果关系或否定以上两者的结果。
单位根检验
基本思路
在进行时间序列分析时,传统上要求所用的时间序列必须是平稳的,否则将会产生伪回归。但是,在现实经济中的时间序列通常是非平稳的,因为各类经济变量一般都随经济增长而产生周期性变化。如果直接采用最小二乘法进行回归分析,即使两个变量之间不存在相关性,也有可能得到一个很高的拟和优度,这就是所谓的谬误回归现象。
为了帮助客户使回归得到的方程更有意义,可以通过差分得到平稳化的序列,然后再进行回归。为了判断时间序列是否平稳,可以使用单位根检验。对于时间序列yt可用如下自回归模型检验单位根。
协整检验
基本思路:
20世纪80年代,Engle和Granger等人提出了协整(Co-integration)的概念,指出两个或多个非平稳(non-stationary)的时间序列的线性组合可能是平稳的或是较低阶单整的。有些时间序列,虽然它们自身非平稳,但其线性组合却是平稳的。非平稳时间序列的线性组合如果平稳,则这种组合反映了变量之间长期稳定的比例关系,称为协整关系。协整关系表达的是两个线性增长量的稳定的动态均衡关系,更是多个线性增长的经济量相互影响及自身演化的动态均衡关系。协整分析是在时间序列的向量自回归分析的基础上发展起来的空间结构与时间动态相结合的建模方法与理论分析方法。
实证模型
本文选取了BLOOMBERG系统报价的一个月期和一年期的人民币离岸NDF汇率收盘价、以及国家外汇管理局公布的人民币对美元即期汇率中间价,分别作为人民币离岸NDF汇率与境内人民币汇率的代理变量。考虑到NDF监管政策与我国新的《外汇管理条例》可能对人民币离岸NDF与境内人民币即期汇率的影响,本文样本人民币离岸NDF汇率数据来源于BLOOMBERG系统,即期汇率数据来源于国家外汇管理局网站。由于境内外节假日的不同,当境内外人民币汇率日期不匹配时,将对应日期的数据删除。由于境内外节假日的不同,当境内外人民币汇率日期不匹配时,将对应日期的数据删除。
数据:USDCNH在岸与USDCNH离岸月度同比数据
读取数据
library(openxlsx)
setwd("E:/USDCNH离岸")
#在岸
data1=read.csv("历史在岸人民币美元.csv")
#离岸
data2=read.csv("USDCNH离岸.csv")
1、单位根检验
需要进行季节调整,给出输出结果
(1)若存在单位根,用差分后序列进行2、3、4 步;
(2)若不存在单位根,就用原序列。
USDCNH在岸数据
首先,对USDCNH在岸数据和离岸数据时间序列进行线性拟合,看数据随时间变化的趋势。对在岸数据的线性拟合模型结果如下。从下面的结果可以看到时间对在岸数据有较大影响,因此该数据不是平稳的序列。
## Residuals:
## Min 1Q Median 3Q Max
## -0.15097 -0.06398 0.01261 0.06016 0.12913
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 6.040e+00 9.331e-03 647.33 <2e-16 ***
## t 1.565e-03 6.685e-05 23.41 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.0722 on 239 degrees of freedom
## Multiple R-squared: 0.6963, Adjusted R-squared: 0.695
## F-statistic: 547.9 on 1 and 239 DF, p-value: < 2.2e-16
对USDCNH在岸数据和离岸数据时间序列进行ADF单位根检验,选择水平值,包含趋势项和漂移项,最大滞后期数按照SIC(Schwarz Info Criterinon)准则,单位根检验结果如下:
## Augmented Dickey-Fuller Test
##
## data: x
## Dickey-Fuller = -1.3371, Lag order = 0, p-value = 0.1453
## alternative hypothesis: explosive
## Residuals:
## Min 1Q Median 3Q Max
## -0.036883 -0.004066 -0.001072 0.002078 0.109471
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 8.724e-02 6.561e-02 1.330 0.1849
## z.lag.1 -1.452e-02 1.086e-02 -1.337 0.1825
## tt 3.925e-05 2.032e-05 1.932 0.0545 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.01209 on 237 degrees of freedom
## Multiple R-squared: 0.01648, Adjusted R-squared: 0.008183
## F-statistic: 1.986 on 2 and 237 DF, p-value: 0.1395
##
##
## Value of test-statistic is: -1.3371 2.6159 1.9859
##
## Critical values for test statistics:
## 1pct 5pct 10pct
## tau3 -3.99 -3.43 -3.13
## phi2 6.22 4.75 4.07
## phi3 8.43 6.49 5.47
接受原假设H 0 :序列x t 非平稳
数据差分
本文用 ADF (Augmented Dick-ey-Fuller Test) 单位根检验来检验时间序列的平稳性。上面列出了人民币在岸汇率水平变量的单位根检验结果。从结果中 可以看到人民币 在岸汇率的 ADF 统计量均大于临界值, 且 P值都较大, 表明它们是非平稳变量, 而它们的一阶差分值的 ADF 统计量均小于临界值, 且 P 值都是 0,表明它们的一阶差分变量是平稳的, 因此可知在岸汇率均为一阶单整过程, 即 I (1) 过程。
USDCNH离岸数据
首先,对USDCNH离岸数据时间序列进行线性拟合,看数据随时间变化的趋势。对在岸数据的线性拟合模型结果如下。从下面的结果可以看到时间对离岸数据有较大影响,因此该数据不是平稳的序列。
## Residuals:
## Min 1Q Median 3Q Max
## -0.122283 -0.059687 -0.008484 0.067933 0.158961
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 6.153e+00 9.250e-03 665.22 <2e-16 ***
## t 1.269e-03 6.627e-05 19.14 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.07157 on 239 degrees of freedom
## Multiple R-squared: 0.6053, Adjusted R-squared: 0.6037
## F-statistic: 366.5 on 1 and 239 DF, p-value: < 2.2e-16
首先,对USDCNH离岸数据时间序列进行ADF单位根检验,选择水平值,包含趋势项和漂移项,最大滞后期数按照SIC(Schwarz Info Criterinon)准则,单位根检验结果如下:
## Augmented Dickey-Fuller Test
##
## data: x
## Dickey-Fuller = -1.8566, Lag order = 0, p-value = 0.3638
## alternative hypothesis: explosive
##
## ###############################################
## # Augmented Dickey-Fuller Test Unit Root Test #
## ###############################################
##
## Test regression trend
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.078389 -0.007280 -0.002134 0.006500 0.182221
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.910e-01 1.034e-01 1.847 0.0659 .
## z.lag.1 -3.119e-02 1.680e-02 -1.857 0.0646 .
## tt 5.848e-05 2.726e-05 2.145 0.0330 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.0185 on 237 degrees of freedom
## Multiple R-squared: 0.01943, Adjusted R-squared: 0.01115
## F-statistic: 2.348 on 2 and 237 DF, p-value: 0.09778
##
##
## Value of test-statistic is: -1.8566 2.0347 2.348
##
## Critical values for test statistics:
## 1pct 5pct 10pct
## tau3 -3.99 -3.43 -3.13
## phi2 6.22 4.75 4.07
## phi3 8.43 6.49 5.47
因此,采用ADF检验分别对在岸与离岸汇率收益率序列进行单位根检验,结果表明各序列都是非平稳序列,一阶差分数据为平稳序列。
由于,原来两个时间序列都是非平稳的,但经过二次差分后变为平稳序列,也就是说它们都是二阶单整的,满足协整检验的前提。因此,下面进行Granger因果检验。
这里我们采用Granger因果检验对上述在岸数据和离岸数据之间的因果关系进行检验。
2.检验协整关系——EG两步法
给出输出结果
(1)若存在长期协整,用VECM法线性过滤,利用利用过滤后的“残差成分”再进行3,4 步;
(2)若不存在长期协整,就不用过滤,直接进行3、4步。
由于在岸数据与离岸数据之间可能存在相互影响,以致采用简单的双变量协整检验,结果可能出现一定的偏差。为此,分别估计以在岸数据为被解释变量的双变量VECM模型和以离岸数据为被解释变量双变量VECM模型,得到基于VECM模型中在岸数据的回归残差和基于VECM模型中离岸数据的回归残差,进一步采用RESET检验等检验方法,对经VECM模型线性过滤后的残差进行检验。表的检验结果表明,所有检验均显著拒绝线性关系的原假设,这说明在岸数据与离岸数据并不是呈现线性的变化趋势,而可能是存在着显著的动态变化趋势。因此,有必要采用Granger因果关系检验,进一步考察在岸数据与离岸数据之间可能存在的关系。
## Residuals:
## Min 1Q Median 3Q Max
## -0.090676 -0.005832 -0.000346 0.007055 0.097828
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.0002001 0.0010342 0.194 0.847
## USDCNH在岸 0.7911232 0.0848505 9.324 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.01593 on 239 degrees of freedom
## Multiple R-squared: 0.9667, Adjusted R-squared: 0.2637
## F-statistic: 86.93 on 1 and 239 DF, p-value: < 2.2e-16
从上面的结果可以看到长期均衡方程的拟合优度高达0.9667,说明该方程有很强的可靠性。通过该方程我们可以看到,USDCNH在岸与USDCNH离岸之间有显著的影响。USDCNH在岸每增加一个单位,USDCNH离岸增长0.7911232亿元。
绘制长期残差
基于VECM模型回归残差的检验结果表明在岸数据与离岸数据呈现的动态变化趋势,为了揭示在岸数据与离岸数据之间的关系,文章分别格兰杰因果检验方法,对经VECM模型线性过滤后的残差进行Granger因果关系检验,基于共同滞后阶数Lx=Ly,并将检验窗宽设置为e=1.5σ的检验结果如表所示
3、 检验——RESET 检验方法
## RESET test
##
## data: data$USDCNH离岸 ~ data$USDCNH在岸
## RESET = 35.913, df1 = 1, df2 = 238, p-value = 7.585e-09
用RESET检验等检验方法,对经VECM模型线性过滤后的残差进行检验。的检验结果表明,所有检验均显著拒绝线性关系的原假设,这说明在岸数据与离岸数据并不是呈现线性的变化趋势,而可能是存在着显著的动态变化趋势。
4、 格兰杰因果检验
## 日期 USDCNH在岸 USDCNH离岸
## 1 2015-01-05 0.0000 0.0000
## 2 2015-01-06 0.0008 -0.0012
## 3 2015-01-07 0.0013 -0.0150
## 4 2015-01-08 0.0033 0.0041
## 5 2015-01-09 -0.0006 0.0018
## 6 2015-01-12 -0.0063 -0.0128
。。。
## 228 2015-12-14 0.0137 0.0178
## 229 2015-12-15 0.0064 -0.0155
## 230 2015-12-16 0.0067 -0.0162
## 231 2015-12-17 0.0131 0.0446
## 232 2015-12-18 0.0057 -0.0108
## 233 2015-12-21 -0.0061 -0.0055
## 234 2015-12-22 -0.0007 -0.0255
## 235 2015-12-23 -0.0015 0.0182
## 236 2015-12-24 0.0024 -0.0009
## 237 2015-12-25 -0.0042 -0.0014
## 238 2015-12-28 0.0037 0.0182
## 239 2015-12-29 0.0114 0.0154
## 240 2015-12-30 0.0031 -0.0085
## 241 2015-12-31 0.0041 0.0013
以进行格兰杰因果检验。对在岸和离岸汇率收益率序列进行Granger因果检验,最优滞后期数是根据AIC信息准则和SC信息准则确定的。在岸人民币汇率、离岸市场汇率的Granger因果关系检验结果见表。该结果显示:在岸人民币汇率和离岸市场人民币汇率具有双向溢出效应,两个市场可以相互引导汇率的变动,并且该变动信息在滞后七期以后可以在1%的显著性水平下影响对方市场当期的汇率。综合各市场之间的报酬溢出关系,认为人民币离岸市场位于价格主导地位,而且人民币离岸市场对在岸人民币汇率的引导滞后期较短。
## Granger causality H0: USDCNH在岸 do not Granger-cause USDCNH离岸
##
## data: VAR object var.2c
## F-Test = 0.6178, df1 = 2, df2 = 468, p-value = 0.5396
##
##
## $Instant
##
## H0: No instantaneous causality between: USDCNH在岸 and USDCNH离岸
##
## data: VAR object var.2c
## Chi-squared = 64.173, df = 1, p-value = 1.11e-15
## $Granger
##
## Granger causality H0: USDCNH离岸 do not Granger-cause USDCNH在岸
##
## data: VAR object var.2c
## F-Test = 9.2651, df1 = 2, df2 = 468, p-value = 0.0001132
##
##
## $Instant
##
## H0: No instantaneous causality between: USDCNH离岸 and USDCNH在岸
##
## data: VAR object var.2c
## Chi-squared = 64.173, df = 1, p-value = 1.11e-15
从检验统计量来看,拒绝“在岸数据不是离岸数据的Granger因果原因”的原假设,而都显著拒绝了“离岸数据不是在岸数据的Granger因果原因”的原假设,表明存在着由离岸数据到在岸数据的双向Granger因果关系。这说明离岸数据是引起在岸数据变化的Granger因果原因。意味着价格上升,可能通过生产链向下游的消费商品价格传导,从而加大物价上涨的压力,也增大了“成本推动型通货膨胀”引发的风险。即两个市场的人民币汇率存在双向的聚集度和持久度的波动溢出,该结果印证了人民币离岸市场由于自由化程度较高,没有政府外汇管制,在这两个市场间信息传递程度最高。
最受欢迎的见解
1.在python中使用lstm和pytorch进行时间序列预测
2.python中利用长短期记忆模型lstm进行时间序列预测分析
3.Python用RNN循环神经网络:LSTM长期记忆、GRU门循环单元、回归和ARIMA对COVID-19新冠疫情新增人数时间序列
4.Python TensorFlow循环神经网络RNN-LSTM神经网络预测股票市场价格时间序列和MSE评估准确性
6.R 语言用RNN循环神经网络 、LSTM长短期记忆网络实现时间序列长期利率预测
7.Matlab创建向量自回归(VAR)模型分析消费者价格指数 (CPI) 和失业率时间序列