关于时间序列

如果画图之后,时间序列不是平稳的,那么用拆分法将其处理成平稳的时间序列。

数据平稳:
平稳性要求序列的均值和方差不发生明显变化,在拟合曲线之后,在未来的一段时间内仍能顺着现有的形态”惯性”的延续下去。

严平稳:表示分布不随时间的改变而改变。
弱平稳:期望与相关系数不变,未来某时刻的t的值xt就要依赖于它的过去信息,需要依赖性。

差分法:时间序列数据在t与t-1时刻的差值,依次类推:
在这里插入图片描述
自回归模型:(AR)
p阶的自回归过程,表示为AR§
描述当前值与历史值之间的关系,用自身变量的历史时间数据对自身进行预测。
自回归模型必须满足平稳性的要求,n阶自回归过程的公式定义:
在这里插入图片描述
其中,p是阶数(几阶拆分), 是常数项系数, 是误差项系数, 是自相关系数,i是拆分项。
自回归模型的限制:
自回归模型是用自身的数据进行预测的;
必须具有平稳性;
必须具有自相关性,如果自相关系数小于0.5,则不宜采用;
自回归只适用于预测与自身前期相关的现象。

移动平均模型(MA):
q阶移动平均过程,表示为MA(q)
移动平均模型关注的是自回归模型中的误差项的累加;
Q阶自回归过程的公式定义:
在这里插入图片描述
其中,q是移动平均项数。
移动平均法能有效地消除预测中地随机波动;

自回归移动平均模型(ARMA):
ARMA(p, q)。p是自回归阶数,q是移动平均阶数。【其实ARIMA和它差不多,只是多了个d,当然ARMA也可以是ARMA(p,d,q),亲测可行】
公式定义:
在这里插入图片描述
i是将时间序列处理成平稳时所做地拆分次数。

将非平稳地时间序列转化为平稳时间序列,然后对因变量的知否值以及随机误差项的现值和滞后值进行回归所建立模型。

一、参数选择:

自相关函数(ACF):
有序的随机变量序列与自身相比较,自相关函数反映了同一时序在不同时序的取值之间的相关性。
公式:
在这里插入图片描述
Cov是相关函数。

偏自相关函数: (PACF)
对于一个平稳AR(p阶)模型,求出滞后k的自相关系数 时,实际上得到的并不是 与 之间的单纯的相关关系。
同时还会受到中间k-1个随机变量 的影响,而这k-1个随机变量又都和 具有相关关系,故而自相关系数里实际上掺杂了其他变量对 与 的影响。所以,引进偏自相关系数PACF严格了 与 两个变量之间的相关性,其剔除了中间k-1个随机变量的干扰。

对于模型中如何选择p值和q值:【画图!!!】
基于ACF和PACF来确定p和q。
关于时间序列_第1张图片

截尾:落在置信区间内(95%的点都符合该规则,就是<0.95)
第几阶落在置信区间上就取值多少。

你可能感兴趣的:(机器学习与数据挖掘)