时间序列:预测与模型的选择

本文是Quantitative Methods and Analysis: Pairs Trading此书的读书笔记。

预测问题的经典问法:我们有截至当前时间的历史时间序列数据,需要尽可能准确地预测下一个时刻的时间序列值。

如果预测随机时间序列的话,就是使用ARMA模型去描述这些历史数据,估计出ARMA模型的参数,然后可以预测下一个时刻的值。

解决预测问题的步骤:1.预处理;2.分析建模;3.预测。

一、预处理

对数据进行预处理,清洗、变换、除重啥的,把时间序列准备好以供分析。在ARMA建模的情形下,一般要对时间序列做的预处理工作就是差分(differencing)。差分的过程就是通过取给定序列中两个连续值之间的差来构造新序列。为什么要做差分预处理?因为ARMA建模的前提是时间序列是平稳的。如果一个时间序列是不平稳的,差分有助于把非平稳的时间序列转换为平稳的时间序列。也就是我们分析的对象不是时间序列本身,而是差分之后的值形成的时间序列。又因为差分可看作当前值的增量,分析差分序列就是分析值变化的序列。

二、分析建模

用ARMA去拟合我们的数据去建模,估计ARMA的参数。为什么我们要用ARMA去拟合我们的数据呢?答案很简单,ARMA模型为数据提供了一种经验解释,而不涉及理论依据。

三、预测

一旦得到ARMA模型,及估计好参数之后,我们就可以用这个模型去预测。

当我们拟合历史数据得到一个模型之后,这个模型有可能只在见过的历史数据上有一个好的预测结果(准确率高,比如可以用预测值与真实值的均方误差表示准确率),但是在它没见过的数据上,预测结果不好,这就是过拟合(bias)了。但是,如果对历史数据的预测效果不好的话,那就是欠拟合了。如何平衡?

选择合适的模型,即平衡拟合与过拟合的一种方法:Akaike information criterion(AIC)

一个有k个参数的模型,可以计算它的AIC

时间序列:预测与模型的选择_第1张图片

 e_{i}是时刻i的预测误差。式子中第一项衡量拟合度(goodness of fit),第二项衡量过拟合(bias)。注意,每增加一个参数,第二项增加2。我们希望每增加一个参数,拟合度增加,预测误差减小,如果这种减少超过了2,那么AIC就会减少,这样我们就可以增加这个参数。如果AIC变得更大了,那么就不要增加这个参数。

你可能感兴趣的:(配对交易Pairs,Trading,金融)