时间序列分析ARMA模型原理及Python statsmodels实践(上)

目录

  • 1. 时间序列及相关基本概念
    • 1.1. 时间序列分解
    • 1.2. 时间平稳序列
    • 1.3. 自相关与自相关函数(ACF)
    • 1.4. 白噪声及Ljung-Box检验
      • 1.4.1. 白噪声
      • 1.4.2. Ljung-Box检验
    • 1.5. 时间序列分析的平稳性
      • 1.5.1. 时间序列的平稳性检验
      • 1.5.2. 纯随机性检验
    • 1.6. 差分法
  • 2. 自回归模型与滑动平均模型
    • 2.1. 自回归模型
    • 2.2. 滑动平均模型
    • 2.3. 偏自相关函数(PACF)
  • 3. ARIMA模型
    • 3.1. 一般ARMA模型
    • 3.2. 差分自回归移动平均模型ARIMA
    • 3.3. ARIMA的建模过程
    • 3.4. 单位根过程ADF
      • 3.4.1. 单位根
      • 3.4.2. 单位根过程
      • 3.4.3. 单位根检验ADF
    • 3.5. ARMA模型定阶——AIC、BIC准则( 信息量准则)
    • 3.6. 模型选择
    • 3.7. 残差
      • 3.7.1. 残差QQ图

时序数据是指时间序列数据。时间序列数据是同一统一指标按时间顺序记录的数据列。在同一数据列中的各个数据必须是同口径的,要求具有可比性。时序数据可以是时期数,也可以时点数。时间序列分析的目的是通过找出样本内时间序列的统计特性和发展规律性,构建时间序列模型,进行样本外预测。[百度]

时序分析是以分析时间序列的发展过程、方向和趋势,预测将来时域可能达到的目标的方法。此方法运用概率统计中时间序列分析原理和技术,利用时序系统的数据相关性,建立相应的数学模型,描述系统的时序状态,以预测未来。[百度]

1. 时间序列及相关基本概念

常用按时间序列排序的一组随机变量 X 1 , X 2 , . . . , X t X_1,X_2,...,X_t X1,X2,...,Xt来表示一个随机时间的时间序列,简记为 X t {X_t} Xt;用 x 1 , x 2 , . . . , x n x_1,x_2,...,x_n x1,x2,...,xn x t , t = 1 , 2 , . . . , n {x_t,t=1,2,...,n} xtt=1,2,...,n表示该随机序列的 n n n个有序观察值,称之为序列长度为n的观察值序列。时间序列分析的目的就是给定一个已经被观测的时间序列,观测该序列的未来值。

1.1. 时间序列分解

X t = T t + S t + R t + C t , t = 1 , 2 , 3 , . . . X_t=T_t + S_t + R_t + C_t, t = 1,2,3,... Xt=Tt+St+Rt+Ct,t=1,2,3,...

  • T T T—趋势项
  • S S S—季节项
  • R R R—随机项
  • C C C—有时还有随机周期项(Cycle)

季节项模型有: * 固定的周期季节项: S ( t + s ) = S ( t ) , ∀ t . S_{(t+s)}=S_{(t)},\forall_{t}. S(t+s)=S(t),t. 只需要 S 1 , S 2 , . . . , S s S_1,S_2,...,S_s S1,S2,...,Ss且可设 ∑ j = 1 s S j = 0 \sum_{j=1}^{s}S_j = 0 j=1sSj=0
关于随机项,可设 E R t = 0 , ∀ t ER_t=0,\forall_t ERt=0,t

1.2. 时间平稳序列

一个时间序列,如果均值没有系统的变化(无趋势)、方差没有系统变化,且严格消除了周期性变化,就称之是平稳的。

从统计学的角度来看,平稳性是指数据的分布在时间上平移时不发生变化。因此,非平稳数据显示了由于趋势而产生的波动,必须对其进行转换才能进行分析。例如,季节性会导致数据的波动,并可以通过“季节性差异”过程消除。

因此,时间序列去除趋势项和季节项后的随机部分经常具有平稳性。

序列分解中趋势和季节部分可以用非随机函数描述,但也可以用随机模型。 随机项通常是平稳的。 表现:

  • 水平没有明显变化;
  • 方差没有明显变化;
  • 相关性结构不随时间变化。

1.3. 自相关与自相关函数(ACF)

自相关是指时间序列(信号)在1个时刻的瞬时值与另1个时刻的瞬时值之间的依赖关系,是对1个随机时间序列(信号)的时域描述。

自相关系数度量的是同一事件在两个不同时期之间的相关程度,形象的讲就是度量自己过去的行为对自己现在的影响。

{ X t } \{X_t\} {Xt}为弱平稳序列, { γ k } \{\gamma_k\} {γk} 为自协方差函数。 则

ρ ( X t − k , X t ) = C o v ( X t − k , X t ) V a r ( X t − k ) V a r ( X t ) = γ k γ 0 , k = 0 , 1 , . . . , ∀ t \rho(X_{t-k},X_t)=\frac{Cov(X_{t-k},X_t)}{\sqrt{Var(X_{t-k})Var(X_t)}} = \frac{\gamma _k}{\gamma_0},k=0,1,...,\forall_t ρ(Xtk,Xt)=Var(Xtk)Var(Xt) Cov(Xtk,Xt)=γ0γk,k=0,1,...,t

ρ k = γ k γ 0 \rho_k = \frac{\gamma_k}{\gamma_0} ρk=γ0γk, 这是 X t − k X_{t-k} Xtk X t X_t Xt的相关系数且与 t t t无关, 称 { ρ k , k = 0 , 1 , . . . } \{\rho_k,k=0,1,...\} {ρk,k=0,1,...}为时间序列 { X t } \{X_t\} {Xt}的自相关函数 (Autocorrelation function, ACF)。 ρ 0 = 1 \rho_0 =1 ρ0=1

这是自相关系数的定义,表示间隔为 k k k的时间序列之间的相关系数值。

1.4. 白噪声及Ljung-Box检验

1.4.1. 白噪声

白噪声是由一组0均值,不变方差,相互独立的元素构成,当然可以对该元素的分布进行假设(如高斯分布)。白噪声如同他的名字听起来一样是杂乱无章的,各元素之间没有任何联系。由白噪声组成的序列是随机游走,随机游走序列的自相关特点是其自相关函数几乎为1并且衰减很慢,这种特征我们称为长记忆性。

白噪声表示数据之间没有相关性,如果时间序列都是由白噪声数据构成的,那么时间序列的数据就不能是自相关的。

{ ε t } \{ \varepsilon_t \} {εt} 是一个平稳序列,如果对任何 s , t ∈ N s,t \in \mathbb N s,tN

  • E ε t = μ E \varepsilon_t = \mu Eεt=μ
  • V a r ( ε t ) = σ 2 Var(\varepsilon_t) = \sigma^2 Var(εt)=σ2
  • 当 k ≠ 0 时 , C o v ( ε t , ε t + k ) = 0 当k \ne 0时,Cov(\varepsilon_t, \varepsilon_{t+k}) = 0 k=0,Cov(εt,εt+k)=0

则称 { ε t } \{ \varepsilon_t \} {εt} 是一个白噪声。

μ = 0 \mu = 0 μ=0 时, 称 { ε t } \{ \varepsilon_t \} {εt} 为零均值白噪声。 白噪声的另一种定义要求零均值, 本文中用到的白噪声一般都是零均值的。

μ = 0 , σ 2 = 1 \mu = 0, \sigma^2=1 μ=0,σ2=1 时, 称 { ε t } \{ \varepsilon_t \} {εt}为标准白噪声。

ε t \varepsilon_t εt 服从正态分布时, 称 { ε t } \{ \varepsilon_t \} {εt}是正态白噪声或高斯白噪声。 正态白噪声总是独立白噪声。

1.4.2. Ljung-Box检验

经常采用的检验方式叫Ljung-Box检验(LB检验),这是一种用来检验是否为白噪声的检验方式。这种方法基于自相关系数以及样本数构建了一个服从卡方分布的统计量用于检验。

Q = n ( n + 2 ) ∑ k = 1 m ρ ^ k 2 n − k Q=n(n+2)\sum_{k=1}^m\frac{\hat{\rho}_k^2}{n-k} Q=n(n+2)k=1mnkρ^k2

其中,其中 n n n是样本数量, ρ ^ k 2 \hat{\rho}_k^2 ρ^k2是样本 k k k阶滞后的相关系数,该统计量服从自由度为 m m m的卡方分布。

1.5. 时间序列分析的平稳性

1.5.1. 时间序列的平稳性检验

平稳性就是要求经由样本时间序列所得到的拟合曲线 ,在未来的一段期间内仍能顺着现有的形态“惯性”地延续下去或者说一个时间序列,如果均值没有系统的变化(无趋势)、方差没有系统变化,且严格消除了周期性变化,就称之是平稳的。

对序列的平稳性的检验有以下几种方法:

(1)时序图检验
根据平稳时间序列的均值和方差都为常数的性质,平稳序列的时序图显示该序列值始终在一个常数附近随机波动,而且波动的范围有界;如果有明显的趋势性或者周期性那它通常不是平稳序列。

(2)自相关图检验
平稳序列具有短期相关性,这个性质表明对平稳序列而言通常只有近期的序列值对现时值得影响比较明显,间隔越远的过去值对现时值得影响越小。

随着延迟期数 k k k的增加,平稳序列的自相关系数会比较快的衰减趋向于零,并在零附近随机波动,而非平稳序列的自相关系数衰减的速度比较慢,这就是利用自相关图进行平稳性检验的标准。

(3)单位根检验
单位根检验是指检验序列中是否存在单位根,因为存在单位根就是非平稳时间序列了。

1.5.2. 纯随机性检验

对于白噪声序列,序列是完全随机的,过去的行为对未来的发展没有丝毫影响,故而没有必要再进行深入分析。

纯随机性检验也称白噪声检验,一般是构造检验统计量来检验序列的纯随机性,常用的白噪声检验方法有以下3种方法:

  • 自相关图
  • Box-Pierce检验-
  • Ljung-Box检验

其中,Ljung-Box检验相对用的多一些。

1.6. 差分法

通常情况下,非平稳序列可通过差分变换转化为平稳序列。

p p p阶差分——相距一期的两个序 列值之间的减法运算称为 1 阶差分运算;

Δ x t = X t − X t − 1 \Delta x_t = X_t -X_{t-1} Δxt=XtXt1

k k k步差分—— 相距 k k k期的两个序列值之间的减法运算称为 k k k步差分运算

Δ k x t = X t − X t − k \Delta_k x_t = X_t -X_{t-k} Δkxt=XtXtk

2. 自回归模型与滑动平均模型

2.1. 自回归模型

自回归模型(英语:Autoregressive model,简称AR模型),是统计上一种处理时间序列的方法,用同一变数例如 x x x的之前各期,亦即 x 1 x_1 x1 x t − 1 x_{t-1} xt1来预测本期 x t x_t xt的表现,并假设它们为一线性关系。因为这是从回归分析中的线性回归发展而来,只是不用 x x x预测 y y y,而是用 x x x预测 x x x(自己);所以叫做自回归。

A R ( p ) AR(p) AR(p)模型:
X t = ϕ 0 + ϕ 1 X t − 1 + ϕ 2 X t − 2 + . . . + ϕ p X t − p + ε t X_t = \phi_0 +\phi_1X_{t-1}+\phi_2X_{t-2}+...+\phi_pX_{t-p}+ \varepsilon_t Xt=ϕ0+ϕ1Xt1+ϕ2Xt2+...+ϕpXtp+εt

也可表达为:
X t = μ + ∑ i = 1 p γ i X t − i + ε t X_t = \mu +\sum_{i=1}^p\gamma _iX_{t-i}+ \varepsilon_t Xt=μ+i=1pγiXti+εt
其中:

  • μ \mu μ为常数
  • p p p阶自回归,指当前值与前 p p p个值有关,既历史数据中,输入时序数据周期
  • γ i \gamma _i γi是自相关系数
  • ε t \varepsilon_t εt一般的定义中仅要求是零均值白噪声, 不要求独立同分布。

A R ( 1 ) AR(1) AR(1)模型也是马尔可夫(Markov)过程: X t X_t Xt X 1 , X 2 , . . . X_1,X_2,... X1,X2,...条件下的条件分布, 只与 X t − 1 X_{t-1} Xt1有关。理论上,AR模型也可以是无穷阶的, p p p ∞ \infty 替代。

p p p阶自回归模型的自相关系数拖尾,偏自相关系数 p p p阶截尾。

2.2. 滑动平均模型

MA模型(moving average model)滑动平均模型,模型参量法谱分析方法之一,也是现代谱估中常用的模型。移动平均法能有效地消除预测中的随机波动。

M A ( q ) MA(q) MA(q)序列的模型为:
X t = θ 0 + ε t + θ 1 ε t − 1 + . . . + θ q ε t − q X_t = \theta_0 + \varepsilon_t +\theta_1\varepsilon_{t-1}+...+\theta_q \varepsilon_{t-q} Xt=θ0+εt+θ1εt1+...+θqεtq

也可表达为:
X t = μ + ε t + ∑ i = 1 q θ i ε t − i X_t = \mu + \varepsilon_t + \sum_{i=1}^q\theta_i \varepsilon_{t-i} Xt=μ+εt+i=1qθiεti
其中:
q q q为移动平均项数, q q q阶与前 q q q个误差有关

2.3. 偏自相关函数(PACF)

PAC(Partical Autocorrelation Coefficient 偏自相关系数):同自相关系数大同小异,在计算相关性时移除了中间变量的间接影响。

对于一个平稳 A R ( p ) AR(p) AR(p)模型,求出滞后 k k k自相关系数 p k p_k pk时,实际上得到并不是 X t X_t Xt X t − k X_{t-k} Xtk之间单纯的相关关系。

X t X_t Xt同时还会受到中间 k − 1 k-1 k1个随机变量 X t − 1 X_{t-1} Xt1 X t − 2 X_{t-2} Xt2、……、 X t − k + 1 X_{t-k+1} Xtk+1的影响,而这 k − 1 k-1 k1个随机变量又都和 X t − k X_{t-k} Xtk具有相关关系。

所以,自相关系数 p k p_k pk里实际掺杂了其他变量对 X t X_{t} Xt X t − k X_{t-k} Xtk的影响。

偏自相关函数,是剔除了中间 k − 1 k-1 k1个随机变量 X t − 1 X_{t-1} Xt1 X t − 2 X_{t-2} Xt2、……、 X t − k + 1 X_{t-k+1} Xtk+1的干扰之后, X t − k X_{t-k} Xtk X t X_{t} Xt影响的相关程度。

3. ARIMA模型

ARIMA(Autoregressive Integrated Moving Average model )模型是一种流行且广泛使用的时间序列预测统计方法。

ARIMA 是代表差分整合移动平均自回归模型,又称整合移动平均自回归模型(移动也可称作滑动),ARIMA 模型对时间序列的要求是平稳型。因此,当你得到一个非平稳的时间序列时,首先要做的即是做时间序列的差分,直到得到一个平稳时间序列。 A R I M A ( p , d , q ) ARIMA(p,d,q) ARIMA(pdq)中, A R AR AR是“自回归”, p p p为自回归项数; M A MA MA为“滑动平均”, q q q为滑动平均项数, d d d为使之成为平稳序列所做的差分次数(阶数)。

3.1. 一般ARMA模型

一般ARAM模型为

X t = ϕ 0 + ϕ 1 X t − 1 + ϕ 2 X t − 2 + . . . + ϕ p X t − p + ε t + θ 0 + ε t + θ 1 ε t − 1 + . . . + θ q ε t − q X_t = \phi_0 +\phi_1X_{t-1}+\phi_2X_{t-2}+...+\phi_pX_{t-p}+ \varepsilon_t + \theta_0 + \varepsilon_t +\theta_1\varepsilon_{t-1}+...+\theta_q \varepsilon_{t-q} Xt=ϕ0+ϕ1Xt1+ϕ2Xt2+...+ϕpXtp+εt+θ0+εt+θ1εt1+...+θqεtq

也表示为
X t = μ + ∑ i = 1 p γ i X t − i + ε t + ∑ i = 1 q θ i ε t − i X_t = \mu +\sum_{i=1}^p\gamma _iX_{t-i}+ \varepsilon_t + \sum_{i=1}^q\theta_i \varepsilon_{t-i} Xt=μ+i=1pγiXti+εt+i=1qθiεti

其中 { ε } \{\varepsilon\} {ε}为独立同分布零均值白噪声列, ε t \varepsilon_t εt X t − 1 , X t − 2 , … X_{t-1},X_{t-2},… Xt1,Xt2,独立。 1 − ϕ 1 z − . . . − ϕ p z p 1-\phi_1z-...-\phi_pz^p 1ϕ1z...ϕpzp 称为特征多项式, 特征多项式的根都在单位园外,这是平稳性条件。 一般要求 1 + θ 1 z + . . . + θ q z q 1+\theta_1z+...+\theta_qz^q 1+θ1z+...+θqzq的根也都在单位圆外, 这个条件称为可逆性条件。 两个多项式没有公共根, 否则同一模型可能会有不同的表示。

平稳解的均值为

E ( X t ) = ϕ 0 1 − ϕ 1 − . . . − ϕ p E(X_t)=\frac{\phi_0}{1-\phi_1-...-\phi_p} E(Xt)=1ϕ1...ϕpϕ0

3.2. 差分自回归移动平均模型ARIMA

将自回归模型、移动平均模型和差分法结合,我们就得到了差分自回归移动平均模型 A R I M A ( p , d , q ) ARIMA(p,d,q) ARIMA(p,d,q),其中d是需要对数据进行差分的阶数。

3.3. ARIMA的建模过程

1,对时间序列数据绘图,观察是否为平稳时间序列。
2,若时间序列数据是平稳时间序列,则直接进行下一步,若不是平稳时间序列,则对数据进行差分,转化为平稳时间序列数据。
3,对平稳时间学列数据绘制自相关系数ACF和偏自相关系数PACF图,通过对自相关图和偏自相关图分析,获得AM参数和AR参数。
时间序列分析ARMA模型原理及Python statsmodels实践(上)_第1张图片

3.4. 单位根过程ADF

3.4.1. 单位根

数学上,n次单位根是n次幂为1的复数。它们位于复平面的单位圆上,构成正n边形的顶点,其中一个顶点是1。

z n = 1 , ( n = 1 , 2 , 3 , . . . ) z^n = 1 ,(n=1,2,3,...) zn=1,(n=1,2,3,...)

这个方程的复数根 z z z n n n次单位根。单位的 n次根有n个 。

确切的说,单位根指模为1的根,一般的x的n个单位根可以表示为: x = c o s 2 k π n + s i n 2 k π n i x=cos\frac{2k\pi}{n} + sin\frac{2k\pi}{n}i x=cosn2+sinn2i ,其中: k = 0 , 1 , 2 , . . , n − 1 k=0,1,2,..,n-1 k=0,1,2,..,n1 i i i是虚数的单位。

3.4.2. 单位根过程

A R I M A ( p , 1 , q ) ARIMA(p,1,q) ARIMA(p,1,q)模型称为单位根过程,相应的时间序列被称为单位根序列。

单位根过程与有一个 A R AR AR部分特征根 ∣ z j ∣ > 1 |z_j|>1 zj>1 ∣ z j ∣ |z_j| zj十分接近于1的平稳ARMA序列很难区分。

单位根过程与带有线性趋势的模型不同。 单位根过程数据没有固定走势,可以称为随机趋势。 带有线性趋势的模型减去线性趋势后就平稳了, 单位根过程减去任何线性趋势都不平稳。

3.4.3. 单位根检验ADF

单位根检验ADF检验全称是 Augmented Dickey-Fuller test,ADF是 Dickey-Fuller检验的增广形式。DF检验只能应用于一阶情况,当序列存在高阶的滞后相关时,可以使用ADF检验,所以说ADF是对DF检验的扩展。

ADF检验的原理,就是判断序列是否存在单位根:如果序列平稳,就不存在单位根;否则,就会存在单位根。

ADF检验的假设:

H0 假设就是存在单位根,如果得到的显著性检验统计量P值小于三个置信度(10%,5%,1%),则对应有(90%,95,99%)的把握来拒绝原假设。

3.5. ARMA模型定阶——AIC、BIC准则( 信息量准则)

如果要用ARMA模型对时间序列进行建模,那么首先得确定模型的AR和MA两部分的阶数 ( p , q ) ( p , q ) (p,q) ;确定好阶数后,我们就可以通过回归或者简单的最小二乘法来进一步确定模型的参数。

所以,首先我们得确定模型的阶数。

确定阶数其实可以直接从前面介绍的相关图中通过“截尾”及“拖尾”获得(这个方法不详述了)。不过看图形判断毕竟有点主观,下面介绍基于信息量准则的方法。

当ARMA模型的阶数越高,其描述对象样本的能力就越强。但是阶数越高,参数也就越多,容易造成过拟合的现象。因此我们需要找一个度量工具,来确定最佳的阶数。

用的较为广泛的工具为赤池信息量准则(Akaike information criterion,简称AIC)以及贝叶斯信息量准则(Bayesian information criterion,简称BIC)。

L L L是模型参数的似然函数,它是一个概率函数,读者们可以这样理解:给定模型的一组参数,似然函数描述的是在这组参数下得到样本数据的概率。

在数理统计学中,似然函数是一种关于统计模型中的参数的函数,表示模型参数中的似然性。
给定输出 x x x时,关于参数 θ θ θ的似然函数 L ( θ ∣ x ) L(θ|x) L(θx)(在数值上)等于给定参数 θ θ θ后变量 X X X的概率:
L ( θ ∣ x ) = P ( X = x ∣ θ ) L(\theta|x)=P(X=x|\theta) L(θx)=P(X=xθ)
参考:如何理解似然函数?. 知乎

很显然,当似然函数越大,给定参数对模型的描述越准确。那么,对于较大的阶数,似然函数肯定也较大。

AIC准则与BIC准则就是对似然函数与参数个数的权衡。我们既希望似然函数越大,又希望参数个数越少。

k k k为参数个数,下面就是AIC和BIC的定义:

A I C = − 2 ln ⁡ ( L ) + 2 k A I C = -2\ln(L)+2k AIC=2ln(L)+2k

B I C = − 2 ln ⁡ ( L ) + k ln ⁡ ( n ) B I C = -2\ln(L)+k\ln(n) BIC=2ln(L)+kln(n)

上述 k k k是模型参数的个数, n n n是序列宽度。当阶数 p , q p , q p,q增加, 2 ln ⁡ ( L ) 2\ln(L) 2ln(L)会变大,但同时 2 k 2k 2k也会变大。所以AIC和BIC存在一个最优值。

3.6. 模型选择

模型 ACF PACF
AR (p ) 衰减趋于零(几何型或震荡型) p阶后截尾
MA(q) q阶后截尾 衰减趋于零(几何型或震荡型)
ARMA(p,q) q阶衰减趋于零(几何型或震荡型) p阶衰减趋于零(几何型或震荡型)

模型估计与建立方法:

  • 判断 p p p q q q的值。当我们建立好自回归模型时,为了得到最优的模型结构,我们需要定下 p p p q q q值。这里的定阶一是可以通过自相关系数ACF和偏自相关系数PACF大致决定。由上面的理论分析,我们知道AR§将会出现 p p p阶拖尾,MA(q)将会出现 q q q阶截尾,

  • 在定阶过程中,如果序列的ACF和PACF不是很明确的情况,我们可以用其他模型来定阶。其中就包括AIC和BIC信息准备判别。AIC是一种用于模型选择的指标,同时考虑模型的拟合程度以及简单性,BIC是对AIC的改进,一般来说较小的AIC或者BIC表示在保持模型简单的同时,能够更好的对时间序列进行拟合。

3.7. 残差

残差在数理统计中是指实际观察值与估计值(拟合值)之间的差。“残差”蕴含了有关模型基本假设的重要信息。如果回归模型正确的话, 我们可以将残差看作误差的观测值。

对于时间序列 X t X_t Xt,自回归移动平均拟合值为 X ^ t \hat{X}_t X^t,则残差为:

ϵ ^ t = X t − X ^ t \hat{\epsilon}_t = X_t - \hat{X}_t ϵ^t=XtX^t

3.7.1. 残差QQ图

残差QQ图是指,任意两个数据集都可以通过比较来判断是否服从同一分布。计算每个分布的分位数。一个数据集对应x轴,另一个对应y轴。做一条45度参考线,如果两个数据集数据来自同一分布,则这些点会落在参照线附近。

后续导读 “时间序列分析ARMA模型原理及Python statsmodels实践(下)”:
4. ARMA模型预测销量实践
4.1. 统计分析包statsmodels
4.2. 常用函数概述
4.2.1. 绘制自相关、偏自相关图
4.2.2. 白噪声检验
4.2.3. 单位根检验
4.2.4. 选定模型参数
4.2.5. ARIMA模型函数
4.2.5.1. 常用方法
4.2.5.2. 常用属性/参数
4.3. Python实践过程
4.3.1. 时序数据平稳性检验
4.3.2. 差分及相关检验
4.3.3. 白噪声检验
4.3.3.1. 单位根ADF检验
4.3.3.2. Ljung-Box检验
4.3.4. 模型定阶
4.3.5. 模型训练及拟合分析
4.3.6. 残差分析
4.3.7. 模型报告与预测
5. 总结
5.1. 适用场景
5.2. 应用效果

参考:

[1]. 阿丢是丢心心. 【Python数据分析】时间序列分析——AR/MA/ARMA/ARIMA. CSDN博客. 2022.02
[2]. Autoregressive Moving Average (ARMA): Sunspots data
[3]. 数据分析-中志. 一文搞懂时间序列预测模型(2):ARIMA模型的理论与实践. CSDN博客. 2022.03
[4]. geek精神. Python时间序列数据分析–以示例说明. 博客园. 2017.05
[5]. 李东风. 金融时间序列分析讲义. 北京大学数学科学学院. 2022
[6]. 酒酿小圆子~. 利用ARIMA模型进行时间序列分析(Python_Statsmodels包). CSDN博客. 2020.06
[7]. 灯下鼠. 理解 AR 和 MA 模型. 简书. 2022.05
[8]. TUJC. Arima相关概念. CSDN博客. 2019.03
[9]. 大象咖啡. 时间序列学习(5):ARMA模型定阶(AIC、BIC准则、Ljung-Box检验). CSDN博客. 2021.09
[10]. Avasla. 模型评估方法【附python代码】(信息准则:赤池信息量准则AIC、贝叶斯信息准则BIC). CSDN博客. 2022.05
[11]. 心诣. Python ARMA模型. 知乎. 2022.09
[12]. 爱雅. ARMA模型时间序列分析全流程(附python代码). 知乎. 2022.07
[13]. CCC考研. 《利用Python进行数据分析》13.3statsmodels介绍. 简书. 2018.12​
[14]. 天海一直在. 机器学习——时间序列ARIMA模型(四):自相关函数ACF和偏自相关函数PACF用于判断ARIMA模型中p、q参数取值.CSDN博客. 2022.05
[15]. 李东风. 应用时间序列分析备课笔记. 北京大学数学科学学院…2021.11
[16]. 米米吉吉. 时间序列之单位根检验(1). CSDN博客. 2020.11
[17]. pingzishinee. 白噪声检验. CSDN博客. 2020.09
[18]. KaneBurger. python数据分析之时间序列分析详情. 脚本之家. 2022.08
[19]. 时光之笛. ARIMA模型的定阶原理与建模分析. 知乎. 2022.08.
[20]. lbship. 数据分析之利用ARMA算法对销售进行预测. CSDN博客. 2019.03

你可能感兴趣的:(Python,人工智能及Python,数据分析,python,机器学习,人工智能,ARMA,时间序列)