结构时间序列模型

状态空间模型为时间序列分析提供了一种灵活的方法,尤其是在简化最大似然估计和处理缺失值方面。

结构时间序列模型(structural time series model)

最基本的一元不可观测项模型,具有形式


其中,μt,γt和ωt分别表示不可观测的趋势项、季节项、循环项。et表示不可观测的不规则项。在文献中,通常用非平稳(可能带二重单位根)模型来描述趋势项:


如果σζ=0,则μt服从带漂移β1的随机游走。如果ση=σζ=0,则μt表示确定性的线性趋势。
以下内容2016.5.8更新

·关于季节效应(seasonal effect)
在时间序列分析中,重复出现的模式被称为季节效应。当时间序列由每小时、每天、每月或每季度的观测值构成,则其重复周期为24(小时)、7(天)、12(月)或者4(季度),这就需要注意时间序列所存在的季节效应。
在状态空间框架下,季节效应可应用在局部水平模型或者局部线性趋势模型中增加季节成分来建模。

·关于诊断检验
线性高斯模型的所有显著性检验都基于对三个残差假设的分析。这些残差应当满足如下三个特性,按重要性依次列出:
(1)独立性(independence)
(2)同方差(homoscedasticity)
(3)正态分布(normality)

先从第一个也是最重要的假设开始:独立性。残差的独立性假设可以被Ljung-Box Q统计量查证。

摘录一段解释:

什么是LBQ统计量?

Ljung-Box q 统计量用于检验某个时间段内的一系列观测值是不是随机的独立观测值。如果观测值并非彼此独立,一个观测值可能会在 k 个时间单位后与另一个观测值相关,形成一种称为自相关的关系。自相关会削减基于时间的预测模型(例如时间序列图)的准确性,并导致数据的错误解释。

例如,一家电子公司对电池的月销售量跟踪记录五年。他们想使用这些数据来设计一个时间序列模型,以帮助预测未来的销售额。但是,月销售额可能会受季节趋势影响。例如,当人们为圣诞玩具购买电池时,每年这个时候的销售额都会提升。因此某一年的月销售额观测值可能会与 12 个月后(滞后为 12)的月销售额观测值相关。

在选择时间序列模型之前,他们可以评估月销售额差异的自相关。Ljung-Box Q (LBQ) 统计量将检验最多滞后 k 的自相关等于零的原假设(即,数据值在某一滞后数 — 在本例中为 12 — 之前是随机和独立的)。如果 LBQ 大于特定临界值,则一个或多个滞后的自相关可能显著不同于零,说明在这段时间内各个值并不是独立和随机的。

LBQ 还用于在拟合时间序列模型(例如 ARIMA)后评估假设,以确保残差彼此独立。

Ljung-Box 是一种 Portmanteau 检验,同时也是 Box-Pierce 卡方统计量的修订版。

Q统计量是一般性总括检验,自相关分析图中,用来检查K阶联合自相关系数是否偏离零值。临界值为K阶的卡方分布临界值χ2(K;0.05)。若 Q统计量值大于临界值,则整个前K阶自相关系数估计值偏离于零,意味着独立性的零假设被拒绝。若观测值的Q统计量小于临界值,则独立性的零假设未被拒绝,即没有理由假设残差存在序列相关。

独立性还可以用残差的滞后1阶自相关系数r(1)的值来检验。其临界值为95%的置信区间±2/sqrt(n)。当r(1)值在这个区间内时,则假设成立,反之被拒绝。

第二个重要的假设是残差的同方差假设。

在STAMP中,该假设是由H统计量来检验的。我找了好久资料也没有找到这个所谓的H统计量的来源,可能是自己定义的。姑且先不追根溯源,这个H统计量检验残差的两个相同部分的连续方差是否相等。H(h)的值与F(h,h;0.025)进行比较,若H(h)>1,则当其小于F值时,假设成立,反之被拒绝;若H(h)<1,则利用1/H(h)与F值进行比较。

P.S. F分布临界值可以用EXCEL函数FINV(probability, deg_freedom1, deg_freedom2)计算。

第三个重要的假设是残差为正态分布。

在STAMP中,N统计量检验残差分布的偏度和峰度是否符合正态分布。使用自由度为2的卡方分布来检验。χ2(2;0.05)=5.99,若N小于这个值,则零假设没有被拒绝,反之被拒绝。

你可能感兴趣的:(结构时间序列模型)