参考了许多文章,先放到前边。
https://zhuanlan.zhihu.com/p/54799648
https://zhuanlan.zhihu.com/p/38320827
https://zhuanlan.zhihu.com/p/38322638
https://zhuanlan.zhihu.com/p/38322333
https://zhuanlan.zhihu.com/p/38321845
https://yifdu.github.io/2019/04/18/%E6%97%B6%E9%97%B4%E5%BA%8F%E5%88%97%E7%9B%B8%E5%85%B3%E7%AE%97%E6%B3%95%E4%B8%8E%E5%88%86%E6%9E%90%E6%AD%A5%E9%AA%A4/
https://zhuanlan.zhihu.com/p/50170152
http://xtf615.com/2017/03/08/Python%E5%AE%9E%E7%8E%B0%E6%97%B6%E9%97%B4%E5%BA%8F%E5%88%97%E5%88%86%E6%9E%90/
https://zhuanlan.zhihu.com/p/35128342
除此之外还有好多文章,引用到在添加吧。
看了两天的资料,终于对时间序列分析有了微小的认识。在我看来,时间序列分析就是对一段时间的数据进行预测的一种方法,其中对在金融方面应用较多,我查的许多文章都以GDP、股票为例。
在模型求解之前要先记录一些在模型中涉及到的重要概念,之后举例构建模型。
主要参考:
https://zhuanlan.zhihu.com/p/50170152
https://zhuanlan.zhihu.com/p/38320827
平稳性主要分为两种,分别为严平稳和弱平稳,在研究时间序列时我们更加专注弱平稳,他要求两个条件:
如果一个时间序列 { r t r_{t} rt} 满足一下条件,则称为弱平稳:
讲上面两个条件翻译下就是,首先对于时间序列中的元素都是以某一个值为中心变化的,后一句分为两部分,不同间隔的协方差不是时间的函数,意味着变化的拥挤程度不随时间变化(也就是拥挤聚类),对于方差为常数意思是要求序列变化的幅度和时间无关。
主要参考:
https://zhuanlan.zhihu.com/p/38320827
自相关性是用来观察某一时刻数据 r t r_{t} rt 和一定时间间隔 k k k 的时刻数据 r t − k r_{t-k} rt−k 之间的线性依赖关系。
在弱平稳的假设下,由于协方差与时间无关,而仅仅与间隔有关,之后我们会通过观察相关图来判断我们的模型使用,因为通过相关图我们可以观察该序列在任何间隔有无统计上的显著自相关性。
主要参考
https://zhuanlan.zhihu.com/p/38321845
白噪声有一个重要的特性 - - - 序列不相关。满足平稳性要求,那么当我们的模型构建好之后,可以获得残差的时间序列,如果残差序列接近一个白噪声,也就是说残差序列没有自相关性,那么我们的模型拟合效果很好,如果残差序列还存在显著的自相关性,说明在拟合过程中我们还有因素没有考虑。
因此在构建完模型之后需要利用白噪声进行残差检验。
主要参考:
https://zhuanlan.zhihu.com/p/38322333
自回归模型预测是通过参考预测点之前的元素来获得预测值的,也就是说在模型中的变量使时间序列本身,以下是一个 p p p 阶自回归模型。
r t = α 1 r t − 1 + α 2 r t − 2 + . . . + α p r t − p + w t r_{t}=\alpha_{1}r_{t-1}+\alpha_{2}r_{t-2}+...+\alpha_{p}r_{t-p}+w_{t} rt=α1rt−1+α2rt−2+...+αprt−p+wt
p p p 阶的意思使模型使用当前时刻 t t t 之前的 p p p 个观测值作为自变量对 r t r_{t} rt 进行预测,因此该模型可以理解为使用 t t t 时刻前 p p p 个元素的线性组合以及一个随机误差 w t w_{t} wt 来预测下一个元素的值。
滑动平均(moving average)模型是另一个常见的线性时间序列模型。在自回归模型中,我们将收益率 r t r_{t} rt 看作是给定阶数 q q q 下历史收益率序列的线性组合。与自回归模型不同,滑动平均模型将收益率 r t r_{t} rt 看作是历史白噪声的线性组合。
数学上,满足如下关系的时间序列 r t r_{t} rt 被称为一个 q q q 阶的滑动平均模型(为了简化表达式,我们假设漂移率项为 0,即该模型不考虑截距项),记为 M A ( q ) MA(q) MA(q) 模型:
r t = w t + β 1 w t − 1 + β 2 w t − 2 + . . . + β q w t − q r_{t}=w_{t}+\beta_{1}w_{t-1}+\beta_{2}w_{t-2}+...+\beta_{q}w_{t-q} rt=wt+β1wt−1+β2wt−2+...+βqwt−q
该模型就是将一个 p p p 阶的AR模型和一个 q q q 阶的MA模型结合起来,所得到的一个新的线性表达。更为复杂,参数更多。
r t = w t + β 1 w t − 1 + β 2 w t − 2 + . . . + β q w t − q + α 1 r t − 1 + α 2 r t − 2 + . . . + α p r t − p + w t r_{t}=w_{t}+\beta_{1}w_{t-1}+\beta_{2}w_{t-2}+...+\beta_{q}w_{t-q}+\alpha_{1}r_{t-1}+\alpha_{2}r_{t-2}+...+\alpha_{p}r_{t-p}+w_{t} rt=wt+β1wt−1+β2wt−2+...+βqwt−q+α1rt−1+α2rt−2+...+αprt−p+wt
以上三个模型均需要确定阶数,有AIC和BIC两种方法,这里不再讲解原理,之后编码会有体现。