时间序列模型-一般流程(听课笔记)

1 平稳性:

解释:平稳性就是要求由样本时间序列所拟合得到的曲线,在未来一段时间仍顺着现有的形态惯性地延续下去。
体现:平稳性要求序列的统计指标(均值、方差)不发生明显变化
严平稳:严平稳表示数据分布不随时间的改变而改变(如正态分布)
弱平稳:期望与相关系数(依赖性)不变
一个弱平稳过程不一定是严平稳过程,一个严平稳过程也不一定宽平稳过程。

2 差分法

时间序列在不同时刻的差值(t, t-1时刻的差),差分法可以使数据变得平稳,相当于求导操作。

3 AR自回归模型

  • 描述当前值与历史值之间的关系,用变量自身的历史数据预测未来
  • 自回归必须满足平稳性要求
  • p阶AR过程定义:

    是自相关系数,是误差项
自回归模型的限制:
  • 只能用自身的数据来预测与自身前期数据相关的现象
  • 必须平稳
  • 必须自相关,如果自相关系数小于0.5,则不建议采用

4 MA 移动平均模型

  • MA 关注的是自回归模型中误差项的累加
  • q阶自回归过程的定义:
  • 移动平均法能够有效消除预测中的随机波动

5 ARMA 自回归移动平均

定义:
求解参数:,

6 ARIMA(p, d, q) 差分自回归移动平均模型

  • p 自回归项
  • q 移动平均项
  • d 差分阶数
  • 原理:将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值、以及随机误差项的现值和滞后值进行回归所建立的模型。

7 自相关函数ACF(Autocorrelation function)

  • 有序的随机变量序列与自身作比较
    自相关函数反映了同一序列在不同时序的取值之间的相关性
  • 公式:

    的值域为

8 偏自相关函数(PACF)

  • 对于一个平稳AP(p)模型,求之后k自相关系数p(k)时,实际上得到的并不是x(t)与x(t-k)之间单纯的相关关系,中间还掺杂了x(t-1),x(t-2)...的影响,而这k-1个随机变量又都和x(t-k)有相关关系,所以自相关系数掺杂了其他变量的影响
  • 剔除了中间k-1个随机变量的干扰后,得到的相关系数是PACF,是严格的两个变量之间的相关性.
    python 库 statsmodel

9 ARIMA建模流程

  • 将序列平稳(差分法确定d)
  • p,q阶数确定:ACF与PACF
  • 建模ARIMA(p, d, q)

你可能感兴趣的:(时间序列模型-一般流程(听课笔记))