淡然之枫

fbprophet论文翻译：Forecasting at Scale

prophet论文翻译

prophet论文翻译：Forecasting at Scale
1 Introduction
2 Features of Business Time Series
3 The Prophet Forecasting Model
- 3.1 The Trend Model
- - 3.1.1 Nonlinear, Saturating Growth
  - 3.1.2 Linear Trend with Changepoints
  - 3.1.3 Automatic Changepoint Selection
  - 3.1.4 Trend Forecast Uncertainty
- 3.2 Seasonality
- 3.3 Holidays and Events
- 3.4 Model Fitting
- 3.5 Analyst-in-the-Loop Modeling
4 Automating Evaluation of Forecasts
- 4.1 Use of Baseline Forecasts
- 4.2 Modeling Forecast Accuracy
- 4.3 Simulated Historical Forecasts
- 4.4 Identifying Large Forecast Errors
5 Conclusion
References
- 附录1 $\ Origin$

prophet论文翻译：Forecasting at Scale

为啥要做这一篇翻译，因为在实际工作中用到了fbprophet，其次，prophet模型与我之间接触到的X13建模框架非常相似，差异在于具体的各成分的估计方法，比较好奇它如何估计出各个成分的；最后，prophet模型与我之前写过的一篇预测文章中都用到了皮尔增长曲线，且都对增长率进行了扩展，想看下他们的拓展方法。
论文下载地址： https://pan.baidu.com/s/11l0I0nTZWZSQX2usWCtDDg,提取码：ubo7

1 Introduction

提供了如下图所示的建立预测模型的架构：

上图是prophet的整体框架，整个过程分为四部分：Modeling、Forecast Evaluation、Surface Problems以及Visually Inspect Forecasts。从整体上看，这是一个循环结构，而这个结构又可以根据虚线分为分析师操纵部分与自动化部分，因此，整个过程就是分析师与自动化过程相结合的循环体系，也是一种将问题背景知识与统计分析融合起来的过程，这种结合大大的增加了模型的适用范围，提高了模型的准确性。按照上述的四个部分，prophet的预测过程为：

Modeling：建立时间序列模型。分析师根据预测问题的背景选择一个合适的模型。
Forecast Evaluation：模型评估。根据模型对历史数据进行仿真，在模型的参数不确定的情况下，我们可以进行多种尝试，并根据对应的仿真效果评估哪种模型更适合。
Surface Problems：呈现问题。如果尝试了多种参数后，模型的整体表现依然不理想，这个时候可以将误差较大的潜在原因呈现给分析师。
Visually Inspect Forecasts：以可视化的方式反馈整个预测结果。当问题反馈给分析师后，分析师考虑是否进一步调整和构建模型。

2 Features of Business Time Series

受节假日的影响；
具有一定的周期性，比如周末效应和季节效应；
时间序列的趋势增长率非固定。

3 The Prophet Forecasting Model

本段不想详细翻译了，简单概况一下：根据上述分析的时间序列特征，作者采用（Harvey & Peters 1990）中对时间序列的处理，即假设时间序列可以分解为趋势、循环和节假日以及随机干扰，其中趋势、循环成分和节假日都假设为时间的函数：
$y(t)=g(t)+s(t)+h(t)+\epsilon_t$
其中： $g (t)$ 表示趋势成分， $s (t)$ 表示季节/周末等循环成分， $h (t)$ 表示节假日等事件成分，这部分类似于周期成分但又不同，比如春节，春节的话虽然一年一次，但是出现的阳历日期每一年是不一样的，所以其周期并不固定；
译者注：时间序列的这种分解方法比较古老了，估计各成分的方法也有很多种，比如X13中用线性滤波器以及迭代法来估计趋势循环成分，再比如可以用卡尔曼滤波来估计时间序列的各个成分，还有一种时间序列的分解方法是经验模态分解法(EMD)，EMD分解出来的时间序列与上述的模型假设不同，其分解出来的各个成分没有物理意义，且分解几部分也是不确定的。

3.1 The Trend Model

提供了两种趋势建模：一种是假设趋势与时间是非线性关系，这里假设趋势皮尔生长曲线，另一种是假设趋势与时间是线性关系。

3.1.1 Nonlinear, Saturating Growth

假设趋势与时间是非线性关系，具体方程如下：
$y(t)=\frac{C(t)}{1+exp(-k(t-m))}$
其中，C是承载力，表示 $y (t)$ 能达到最大或最小的值， $k$ 是增长率， $m$ 是其他参数，用于曲线的左右平移。但是真实的数据往往是 $k$ 不是一个确定性的常数，而是一个随着时间变化的量，这里作者把 $k$ 扩展成了一个分段阶梯函数；后面的内容都是按文章翻译的：
通过定义允许增长率变化的变化点，我们将趋势变化纳入了增长模型；假设增长率在时刻 $s_j,j=1,...,S$ ，有 $S$ 个变化点，定义一个增长率调整向量 $\vec{\delta} \in R^S$ ，其中 $\delta_j$ 是时刻 $s_j$ 的增长率变化量，将所有时期的变化量加上期初的增量量，就得到 $t$ 时刻的增长率： $k+\displaystyle {\sum_{j:t>s_j}{\delta_j}}$ （译者注： $\displaystyle {\sum_{j:t>s_j}}$ 表示遍历 $j$ 的取值范围，然后找出满足条件: $t>S_j$ 的 $j$ ,然后再按照这个index取出 $\delta_j$ 做加法汇总，所以这么理解的话，这里文章应该有误，即选取 $j$ 的条件： $t>S_j$ 应该包含等号，才能跟下文向量的表述结果一致，因此，这里将 $k$ 修正的表达式更改为： $k+\displaystyle {\sum_{j:t \ge s_j}{\delta_j}}$ ）.这可以通过定义一个向量 $\vec{a}(t)\in\{0,1\}^S$ ，其中：

$a_j(t)=\begin{cases} 1\qquad & t \ge S_j \\ 0 \qquad & t \lt S_j \end{cases}$
则第 $t$ 期调整后的增长率计算公式如下（ 注意：文章中的向量均是指列向量）：
$k_t=k+\overrightarrow {a_t}'·\overrightarrow{\delta}$

举例说明：假设给定的时间序列长度为10，其中在第5( $S_1=5$ )和第7( $S_2=7$ )时刻出现增长率的结构突变，那么每一时刻的增长率计算如下：

t	$t\ge S_1$	$a_1(t)$	$\ge S_2$	$a_2(t)$
1	False	0	False	0
2	False	0	False	0
3	False	0	False	0
4	False	0	False	0
5	True	1	False	0
6	True	1	False	0
7	True	1	True	1
8	True	1	True	1
9	True	1	True	1
10	True	1	True	1

当 $t = i$ 时，增长率 $r_i$ 为：
$r_i=k+a_1(i)·\delta_1+a_2·\delta_2=\vec{ {a(i)}}'·\vec{\delta}$
其中：
$\vec{ {a(i)}}= \begin{pmatrix} a_1(i) \\ a_2(i) \end{pmatrix},\vec{\delta}=\begin{pmatrix} \delta_1 \\ \delta_2 \end{pmatrix}$
当 $i = 5$ 时：
$r_5=k+a_1(5)*\delta_1+a_2(5)*\delta_5=k+1·\delta_1+0·\delta_2=k+\delta_1$

因为对曲线修正了增长率，可能破坏了曲线的连续可微性，由于改变增长率，可微性被破坏了，因此，这里需要调整下曲线，使得曲线仍然保持可微的性质，为什么要这么做呢，因为作者最后解决参数的方法是利用数值法，即对似然函数进行求导，所以，这里无论怎么变形，都要得到一个连续可导的函数，下面是文章中给出的修正因子：
$\gamma_j=(s_j-m-\sum_{lγj=(sj−m−l<j∑γl)(1−k+∑l≤jδlk+∑l<jδl)$

3.1.2 Linear Trend with Changepoints

为了预测不会出现饱和增长的问题，分段的恒定增长率模型提供了一个简化且常用的模型。这里的趋势模型可以写为：
$g(t)=(k+\overrightarrow {a_t}'·\overrightarrow{\delta})·t+(m+\overrightarrow {a_t}'·\overrightarrow{\gamma}) \tag{4}$
其中 $k$ 是增长率， $\overrightarrow{\delta}$ 是增长率调整量， $\gamma_j=-S_j·\delta_j$ ， $\overrightarrow{\gamma}$ 的作用也是为了曲线更平滑；
下面给出一个例子：已知时间序列长度为10，其中在 $t = 5$ 和 $t = 7$ 处产生了结构突变，增长率分别增加了0.3和0.45，即 $S_1=5,S_2=7,\overrightarrow {\delta}=[0.3,0.45]'$ ，增长率 $k$ 的初始值为0.5，截距 $m$ 的初始值为0.02，求 $\overrightarrow {\gamma}$ 、未修正的 $g (t)$ 和修正后的 $g (t)$ .
$\overrightarrow{\gamma}=[-S_1,-S_2].*\overrightarrow {\delta}=-[5,7]'.*[0.3,0.45]'=[-1.5,-3.15]'$ ;
$not\_adjust\_g(t)=(k+ \overrightarrow {a_t}'·\overrightarrow{\delta})·t+m$
$adjust\_g(t)$ 按(4)式计算，则计算结果如下表所示：

t	$a_1(t)$	$a_2(t)$	$\overrightarrow {a_t}'·\overrightarrow{\delta}$	$\overrightarrow {a_t}'·\overrightarrow{\gamma}$	$not\_adjust\_g(t)$	$adjust\_g(t)$
1	0	0	0	0	0.52	0.52
2	0	0	0	0	1.02	1.02
3	0	0	0	0	1.52	1.52
4	0	0	0	0	2.02	2.02
5	1	0	0.3	-1.5	4.02	2.52
6	1	0	0.3	-1.5	4.82	3.32
7	1	1	0.75	-4.65	8.77	4.12
8	1	1	0.75	-4.65	10.02	5.37
9	1	1	0.75	-4.65	11.27	6.62
10	1	1	0.75	-4.65	12.52	7.87

fbprophet论文翻译：Forecasting at Scale_第2张图片

3.1.3 Automatic Changepoint Selection

自动的选择突变点
突变点 $S_j$ 可以由分析师指定，或者可以根据一组可能的点进行自动选择。通过指定 $\delta$ 的先验分布，可以很自然的根据公式（3）和（4）选出突变点；
我们通常会指定大量的突变点（例如，若干年的每一个月设置一个突变点），并使用先验分布： $δ_j〜Laplace(0;\tau)$ 。参数 $\tau$ 直接灵活的控制模型增长率的变化。重要的是，稀疏的 $δ$ 对初始增长率 $k$ 没有影响，所以当 $\tau$ 为0时，模型退化为标准的皮尔曲线或线性增长曲线。

3.1.4 Trend Forecast Uncertainty

趋势预测的不确定性
（译者：文章中用到了一个缩写符号w. p. = with probability）
当用模型从历史数据外推预测时，模型将采用固定增长率。那么未来的预测就是一个确定性的点预测，怎么才能获取一个未来预测的概率分布呢，我们通过扩展趋势的一般化模型估计预测趋势中的不确定性。对时间序列中的趋势建模，通用模型如本文中所给的两个模型，都是假设长度为 $T$ 的时间序列历史数据中有S个突变点，每个突变点增长率的变化量都是一个服从Laplace分布的随机变量，即 $δ_j〜Laplace（0;\tau）$ 。我们通过将 $τ$ 替换为从（现有）数据推断出的方差应用到过去的数据中来模拟变化率，从而得到将来的变化率。（We simulate future rate changes that emulate those of the past by replacing τ with a variance inferred from data. ），要做这个事情，完全可以在贝叶斯框架中，给定 $\tau$ 的先验分布，得到其后验分布，从而完成对 $\delta$ 的采样；否则话，我们可以用 $\lambda$ 的极大似然估计值：
$\lambda= \frac{1}{S}\sum_{j=1}^{S}|\delta_j|$
未来的拐点随机出现，且分布与历史上拐点出现的频率一致，具体拐点的采样分布函数如下：
$\forall j>T,\begin{cases} \delta_j=0 w.p. \frac{T-S}{S},\\ \delta_j\sim Laplace(0,λ) w.p. \frac{T}{S}. \end{cases}$

因此，我们通过假设未来将看到与历史上出现次数同频率和大小的增速变化值。一旦获取到 $\lambda$ 的估计值，就可以利用上述对趋势的建模来模拟可能的未来趋势并且可以得到趋势的预测区间。
趋势增速的变化假设和历史同分布是一个比较强的假设，因此我们不期望预测区间有较高的精度。但是预测区间起码能说明预测的不确定性程度，尤其是可以从中看出是否过拟合。因为随着 $\tau$ 越大，拟合误差越小，然而，当做样本外预测时，这种增加变量的方法将导致更大的预测不确定性；

3.2 Seasonality

季节效应
构造一个周期函数，这个周期函数的自变量是时间 $t$ ，假设循环成分为 $s (t)$ ,P = 365:25 for yearly data or P = 7 for weekly data,其傅里叶变换为：
$s(t)=\sum_{n=1}^{N}{(a_ncos(\frac{2\pi nt}{P})+b_nsin(\frac{2\pi bt}{P}))}$
估计循环成分，需要 $2 N$ 个参数： $\beta=[a_1,b_1,...,a_N,b_N]^T$ ,把傅里叶变换的基函数写作一个向量，那么傅里叶变换可以写作两个向量的点乘，这里给个例子，假设给定20个基函数（10个 $c o s$ ,10个 $s i n$ ），假设时间序列的周期为1年（即365天），则基函数向量可以写成如下行向量：
$\overrightarrow{X(t)}=[cos(\frac{2\pi(1)t}{365}),...,sin(\frac{2\pi(10)t}{365})]$
则季节循环成分可以写为：
$s(t)=\overrightarrow{X(t)}·\overrightarrow{\beta}$
文章中假设 $β ∼ Normal(0, σ^2)$ ,目的是给出季节性成分一个平滑的先验分布；

3.3 Holidays and Events

节假日和事件
假期和一些事件会给许多业务的时间序列预测带来了巨大的，可预测的冲击，并且通常不遵循周期性模式，即这些节假日出现的日期并不是间隔相同的日期，不是标准的周期性运动，因此，其效果不能通过平稳的周期很好地建模。例如，美国的感恩节发生在11月的第四个星期四。超级碗是美国最大的电视转播赛事之一，发生在1月或2月的星期日，因此很难通过编程方式宣布。世界上许多国家/地区都有农历假期。特定假期对时间序列的影响通常年复一年，因此将其纳入预测很重要。
我们允许分析员提供过去和未来事件的自定义列表，由事件或假日的唯一名称标识，如表1所示。我们为country列了一个列，以便在全球假日之外保留一个针对特定国家的假日列表。对于给定的预测问题，我们结合了全球假日集和特定国家假日集。
通过假设假日的影响是独立的，将上述列表中的节假日并入到模型中是很简单的。对于每个假期 $i$ ，设 $D_i$ 作为该假期的过去和未来日期的集合，即 ${D_i}$ 包含了节假日 $i$ 的所有日期或受影响日期；对于具体某个时刻 $t$ ，用一个指数函数来表示该时刻是否属于某个节假日，并且给定一个参数 $k_i$ 来表示第 $i$ 个节假日的影响效应，就好季节效应一样，这里构造一个回归矩阵来实现这种来估计这些参数：
$\in D_1)... 1(t \in D_L)]$
构造的回归矩阵：
$Z(t)\overrightarrow{κ} \tag{7}$
跟季节效应类似, 假设 $k$ 的先验分布： $\sim Normal(0, ν^2)$ .
译者注：其实就是引入了虚拟变量来估计节假日和事件型的影响；这里举一个例子说明模型如何引入节假日的，作者把每一时刻按是否是节假日进行分类，然后以一个one_hot编码的形式把节假日表示出来，以国内的节假日为例，假设只研究春节和国庆，如果给定一年的日度数据，那么每一天是否是节假日，是哪个节假日，可以用一个数字来表示，比如，不是节假日标注为0，是春节，标准为1，是国庆，标注为2，然后对这个时间序列做一个one hot编码，就得到了没个时刻的节假日表示；

日期	节假日类型
2020-02-22	0
2020-02-23	0
2020-02-24	1
2020-02-25	1
2020-10-01	2
2020-10-02	2

one hot编码为：

日期	非节假日	春节	国庆节
2020-02-22	1	0	0
2020-02-23	1	0	0
2020-02-24	0	1	0
2020-02-25	0	1	0
2020-10-01	0	0	1
2020-10-02	0	0	1

节假日的影响往往不仅仅就是节假日的那几天，可能节假日的前后一段事件都会受到影响。为了说明这一点，因此设置了一个参数，用于表示节假日影响范围的。
译者总结：

将时间序列采取加法模型分解为趋势+周期+事件影响+随机干扰，时间序列的分解方法，最常规的就是加法模型和乘法模型，prophet仅支持加法模型，在有些场景是必须对数据做变换，才可以利用加法分解模型；这里要说道说道加法模型和乘法模型的区别：
加法模型： $y_t=T_t+C_t+Holiday_t$
乘法模型： $y_t=T_t*C_t*Holiday_t$
对于乘法模型，所代表的物理意义是表示增长率可以分解为加法模型，为了说明，这里假设所涉及的数据都是非负，且只考虑趋势和循环成分：
$y_t=T_t*C_t\\ y_{t-1}=T_{t-1}*C_{t-1}\\ \Rightarrow logy_t=logT_t+logC_t\\ \Rightarrow logy_{t-1}=logT_{t-1}+logC_{t-1}\\ \Rightarrow logy_t- logy_{t-1}=logT_t-logT_{t-1}+logC_t-logC_{t-1} \Rightarrow log \frac{y_t}{y_{t-1}}=log\frac{T_t}{T_{t-1}}+log\frac{C_t}{C_{t-1}}$
即对数增长率可以分解为各成分的对数增长率之和，这个就是乘法模型的物理意义。
趋势构造了两个趋势表示方式，一个是皮尔生长曲线（logistic），一个是时间 $t$ 线性函数，并允许加入结构突变，目前结构突变只允许发生在增长率变量上，即logistic的增长率，和线性回归的斜率项，结构突变其实也可以发生在其他变量上，但要有对应的物理意义；
节假日效应作者用了一个虚拟变量来表示，且假设节假日的影响是一个常量，这个往往不符合现实，比如，国庆假，那10月1日的客流量和10月3日以及10月7日的效应其实是不一样的，即相同的节假日，对每一天的影响其实效应都有可能不同，这里作者直接假设为常数，合理性有待商榷；
文中的季节效应作者假设了是固定周期的效应，其实在现实中很对场景都是变频的，比如生产活动，在淡季时，可能是两周调休一次，而在旺季中，有可能是一周调休一次，如果预测生产或者与生产有关的变量时，固定频率就不合适；
在估计趋势成分时，作者对模型做了调整，以使得模型continue，这里不知道有没有必要，如果作者的求参算法是迭代法，用到了微分，那么要求函数平滑是合理的，但如果用的是随机抽样法，就对连续性和可微性没有要求；

3.4 Model Fitting

模型拟合
用矩阵 $A$ 表示趋势成分的增长率突变量，利用 Stan code 可以将模型简单的写出，并且利用 Stan’s L-BFGS 算法，可以求出最大后验估计，也可以估计出参数的后验分布后，预测时考虑这些参数的后验分布，从而获取预测值的分布；如下代码是求参时的模型设置：
$model\{\\ // Priors: \\ k ∼ normal(0, 5) ; \\ m ∼ normal(0, 5) ; \\ epsilon ∼ normal(0, 0.5) ;\\ delta ∼ double\_exponential(0, tau); \\ beta ∼ normal(0, sigma);\\ //Logistic \ likelihood:\\ \ y ∼ normal(C ./ (1 + exp(-(k + A * delta) .* (t - (m + A * gamma)))) + X * beta, epsilon);\\ // Linear \ likelihood:\\ y ∼ normal((k + A * delta) .* t + (m + A * gamma) + X * beta, sigma); \}$
我们利用正则化来控制列表1中的参数 $\tau$ 和 $\sigma$ ，用于防止过拟合，但是可能没有足够的历史数据来通过交叉验证选择最佳正则化参数。正则化参数给出了默认值，这组默认值适用于大部分场景，同时，也允许模型开发者参与到参数优化中来。

3.5 Analyst-in-the-Loop Modeling

分析师如何建模
做预测的分析师通常对他们所预测的数量有广泛的领域知识，但统计知识有限。在Prophet模型规范中，有几个地方分析师可以更改模型以应用他们的专业知识和外部知识，而不需要了解任何底层统计数据。

承载力：分析师拥有相关领域的知识，知道要预测的标的的极大值/极小值。
突变点：可以直接指定变更点的日期，如产品变更日期。
节假日和季节性：分析师根据经验，指定哪些节假日有影响，他们可以直接输入相关的节假日所在的日期和周期长度。
平滑参数：通过调整 $τ$ ，分析员可以从一系列不同趋势增长模型中进行选择，比如是否包含突变点，突变点的个数等。季节性和假日平滑参数 $(σ, ν)$ 允许分析人员告诉模型未来的历史季节变化。

有了良好的可视化工具，分析师可以使用这些参数来改进模型。当在历史数据上绘制模型模型的预测和真实值对比时，很快就可以看出是否遗漏了结构突变点。 $τ$ 参数是一个参数，可以用来增加或减少趋势灵活性，而 $σ$ 是另一个参数，用来增加或减少季节性成分的强度。可视化为高效的人为调整模型提供了许多其他机会：是线性趋势或逻辑增长，识别季节性的周期长度，以及是否应该异常一些异常点。所有这些干预措施都可以在没有统计专业知识的情况下进行，是分析师应用其个人见解或其专业知识的重要方法。
预测文献通常将数据挖掘而做出来的模型与人类专家使用其所学的任何过程产生的判断预测（也称为管理预测）区分开来，后者往往适用于特定的时间序列。每种方法都有其优点。统计预测（数据挖掘）需要较少的领域知识和来自人类预测者的努力，而且它们可以很容易地扩展到许多预测。判断性预测可以包含更多信息，并对不断变化的条件作出更大的反应，但可能需要分析师的密集工作（Sanders 2005）。
我们提供的分析师循环建模法(analyst-in-the-loop) ，提供了一种建模的替代方法，它试图通过在必要时集中分析员的精力改进模型，而不是关注统计模型上，用于融合统计模型和分析师的经验判断。我们发现我们的方法与循环的"transform-visualize model" (Wickham&Grolemund（2016）提出)非常相似，其中人类的知识在经过多次模型的迭代改进后，融合到了模型之中。

大规模的预测依赖于自动化，但判断性预测在许多应用中显示出很高的准确性（Lawrence et al。2006年）。我们提出的方法允许分析师通过一小部分直观的模型参数和选项对预测进行判断，同时保留在必要时依靠全自动统计预测的能力。在撰写本文时，我们只有一些经验性的证据可以证明准确度可能有所提高，但我们期待着未来的研究能够评估出分析师在提升模型精度的作用。
大规模的“anylyst-in-the-loop”能力在很大程度上取决于对预测质量的自动评估和良好的可视化工具。现在，我们将介绍如何自动的进行预测评估，以识别与分析师输入最相关的预测。

4 Automating Evaluation of Forecasts

自动评估预测精度

4.1 Use of Baseline Forecasts

使用基准模型预测作为对照
评价预测方法时，与一组基准模型做比较是一个重要的方法。我们更喜欢使用简单的预测方法，这些模型可以对数据做出比较强的假设，但在对未来的预测时会更加合理。我们发现了最简单的模型往往比较有用（例如最后时刻的值和样本平均值作为预测）和第2节所述的其他预测方法。

4.2 Modeling Forecast Accuracy

模型的预测精度
预测是在一定的时间范围内进行的，我们称之为 $H$ 。我们关注的是对未来一段时间的预测，我们的预测场景往往是对未来30天，90天、180天或者365天做预测。因此，对于任何有每日观测的预报，我们可以得到日度预测值，与之而来的是每个预测点的误差。我们需要定义一个衡量预测误差的指标。另外，清楚模型在预测过程中精确度，则在实际业务中，就知道是否可以相信模型的预测值。
设 $\hat{y}(t|T)$ 表示基于截止到T时刻的信息，对 $t$ 时刻做出的预测，预测值和真实值的差距用 $d (y, y^{'})$ 表示，其中， $y$ 表示真实值， $y^{'}$ 表示预测值，常用的评价指标有mae,mse,mape等，假设未来预测的最大长度为H，历史样本的最大时间为T，则定义预测精度：

$d(\hat{y}(T + h|T),y(T + h))\\ h \in [1,H]$
为了研究预测精度随着对未来预测日期长度 $h$ 的变化，需要对误差项进行建模，这里对误差建立ARMA模型，ARIMA的参数采取1阶自回归模型，即：
$y(t)=\alpha+\beta(t-1)+v(t)\\ v(t)\sim Normal(0,\sigma_v^2)$
参数 $\sigma_v^2$ 可以通过历史数据估计出来。然而这种方法必须把模型的形式设置正确，否则误差估计是不对的，但是在实践中往往很难保证模型的设置是正确的。
我们倾向于采取非参数发估计期望的预测误差，这适用于各种模型。这种方法类似于采取交叉验证对独立的样本进行样本外的预测，然后估计样本外的误差分布，每一个预测步长 $h$ 都对应一系列的预测误差，因此，可以取误差期望作为该预测步长的预测精度：
$\xi(h) = E[φ(T, h)] \tag{8}$
这个模型很灵活，但是可以强加一些简单的假设。首先，假设误差函数关于 $h$ 连续，因为我们期望在日期相近的时间里，预测误差也尽量的相似；其次，假设误差函数随着预步长 $h$ 的增加而增加（但不是严格递增），在实践操作中，我们选择了如下非线性回归来拟合误差曲线：局部线性回归？(a local regression (Cleveland & Devlin 1988)) 或者保序回归isotonic regression (Dykstra 1981) as flexible non-parametric models of error curves。
为了产生历史预测误差来估计这个模型，我们使用了一个我们称之为仿真历史预测（simulated historical forecasts）的程序。

4.3 Simulated Historical Forecasts

仿真的历史预测
我们希望拟合公式（8）中的预期误差模型，以便做模型选择和评估。不幸的是，很难使用交叉验证，因为时间序列的时序特性，决定了观测值是不可交换的，我们不能简单地随机划分数据。
我们使用模拟历史预测（SHFs），在历史的不同截止时间点生成 $K$ 个预测，预测的时间点是在历史数据内，因此可以评估总误差。该思路来源于经典的“滚动原点”（rolling origin，请参见附件1的说明）预测评估法（Tashman 2000），但仅使用一小截日期序列（一部分历史数据），而不是对每个历史日期都做预测。使用较少模拟日期的主要优点（rolling origin法每个日期都会产生一个预测）是因为它可以节省计算时间，同时，给出的精度相关性较低。
如果我们在过去的这些时间点使用这种预测方法，SHF会模拟我们在预测时会犯的错误。如图3和图4中SHF的示例。这种方法的优点是简单，易于向分析师和决策者解释，并且对于生成对预测误差的洞察力而言也相对没有争议。使用SHF方法评估和比较不同的预测模型时，要注意两个主要问题。
首先，我们做出的模拟预测越多，他们的误差估计就越相关。这里考虑一种极端情况，即每天都做模拟预测，鉴于每天增加的信息量，预测不太可能发生太大变化，而且从一天到第二天的误差几乎相同。另一方面，如果我们进行的模拟预测很少，那么对历史预测误差的观察就更少了，根据我们的模型选择作为一种启发式方法，对于预测范围H，我们通常每 $H / 2$ 个周期进行一次模拟预测。尽管误差测相关性不会对我们对模型准确性的估计带来偏差，但这样做也没什么益处，并且还需浪费时间来计算。
译者注：作者根据时间序列的历史数据构造了一个移动时间窗，这个移动时间窗包含两部分内容，前部分是train集，后部分是test集，train集用于训练模型，test集用于测试模型，那么这个时间窗的移动步长也是一个参数（cutoff的间隔），所以这段内容作者在讲述如何设置这个时间窗的移动步长，如果移动步长太小，假设极端情况下，每一个时间点，移动一次，那么这两次做出来的样本外误差是高度相关的，作者认为尽管相关性不会造成预测精度的估计偏差，但是会浪费计算时间，因此，作者建议时间窗的移动步长要大一点，但是过大了，会导致时间窗的个数减少，可用于分析的样本外误差数据就少了，因此，这里他们建议时间窗的移动步长应该是样本外预测长度的一半，假设未来做100天的预测，那么时间窗的移动步长应该设置为50
其次，有了更多的数据，预测方法就可以做得更好或更差。当模型设定不正确或过拟合时，历史样本越多，误差越大，例如使用样本均值来预测含有趋势增长的时间序列。图7显示了我们对函数 $ξ (h)$ 的估计，即用局部回归法，给出的图3和图4中的时间序列，在整个预测期间的预期平均绝对百分比误差(mape)；误差估计是使用9个模拟的预测日期进行的，从第一年开始每季度做一次。prophet在所有预测范围内的预测误差都较低。prophet模型参数用的是默认值，调参可能会进一步提高预测精度。

fbprophet论文翻译：Forecasting at Scale_第3张图片

Figure 7: Smoothed mean absolute percentage errors for the forecasting methods and time series of Figs. 3 and 4. Prophet forecasts had substantially lower prediction error than the other automated forecast methods.

在可视化预测时，我们更喜欢使用点而不是直线来表示历史数据，因为这些数据代表了非插值的预测误差。然后，我们用线把每个预测误差连接起来。对于SHF，可视化可以帮助找出哪些模型在哪些长度的预测误差比较大，既可以是时间序列（如图3所示），也可以在SHF上汇总（如图7所示）。

4.4 Identifying Large Forecast Errors

识别较大的预测误差
当分析师的预测太多而无法手动检查每个预测时，重要的是能够自动识别可能有问题的预测。自动识别不良预测可以使分析师最有效地利用有限的时间，并利用他们的专业知识来纠正问题。 SHF可以通过多种方式用于找出预测中可能存在的问题。

当预测相对于基线有较大误差时，可能是因为模型设置错误。分析师可以需要调整趋势模型或季节性模型。
当所有的预测值对特定日期预测误差都很大时，表示这一天可能是离群值。分析师可以识别异常值并将其删除。
当某方法的SHF误差从一个水平急剧增加到另一个水平时，可能表明数据的生成过程已发生改变。添加结构突变点或分别为不同的阶段建模。
有些病态的预测问题无法轻易纠正，但是我们遇到的大多数问题都是可以通过指定结构突变点以及除去异常值来纠正的。一旦该预测值被标记，就可以用于审核和可视化展示，那么这些问题就很容易识别和纠正。

5 Conclusion

结论
大规模预测的一个主要问题是，不同知识背景的分析师要做的预测场景可能远远超过其手动可以做的范围。我们预测系统的第一部分是我们通过对Facebook上的各种数据进行多次迭代开发而形成的建模框架。我们使用了一个简单的模块化回归模型，该模型通常可以在给定默认参数情况下表现很好，并且允许分析师选择与其预测问题相关的组件，并根据需要轻松的进行调整。第二个部分是计算预测误差与跟踪系统，让分析师可以找出那些应该手动检查的预测值，帮助提升模型预测预测精度。这很关键，该组件使分析人员能够确定何时需要对模型进行调整，或者什么时候应该使用完全不同的模型。并且，一个操作简单、可调整的模型和可扩展的精度监控体系相结合，使大量分析人员能够预测大量不同的时间序列（也即我们定义的大规模预测）。

References

Byrd, R. H., Lu, P. & Nocedal, J. (1995), ‘A limited memory algorithm for bound constrained optimization’, SIAM Journal on Scientific and Statistical Computing 16(5), 1190–1208.
Carpenter, B., Gelman, A., Hoffman, M., Lee, D., Goodrich, B., Betancourt, M., Brubaker, M. A., Guo, J., Li, P. & Riddell, A. (2017), ‘Stan: A probabilistic programming language’, Journal of Statistical Software 76(1).
Chang, W., Cheng, J., Allaire, J., Xie, Y. & McPherson, J. (2015), shiny: Web Application
Framework for R. R package version 0.11.
URL: http://CRAN. R-project. org/package= shiny
Cleveland, W. S. & Devlin, S. J. (1988), ‘Locally weighted regression: an approach to regression analysis by local fitting’, Journal of the American Statistical Association 83(403), 596–610.
De Gooijer, J. G. & Hyndman, R. J. (2006), ‘25 years of time series forecasting’, International Journal of Forecasting 22(3), 443–473.
De Livera, A. M., Hyndman, R. J. & Snyder, R. D. (2011), ‘A state space framework for automatic forecasting using exponential smoothing methods’, Journal of the American Statistical Association 106(496), 1513–1527.
Dykstra, R. L. (1981), ‘An isotonic regression algorithm’, Journal of Statistical Planning and Inference 5(4), 355–363.
Gardner, E. S. (1985), ‘Exponential smoothing: the state of the art’, Journal of Forecasting
4, 1–28.
Harvey, A. C. & Shephard, N. (1993), Structural time series models, in G. Maddala, C. Rao & H. Vinod, eds, ‘Handbook of Statistics’, Vol. 11, Elsevier, chapter 10, pp. 261–302.
Harvey, A. & Peters, S. (1990), ‘Estimation procedures for structural time series models’, Journal of Forecasting 9, 89–108.
Hastie, T. & Tibshirani, R. (1987), ‘Generalized additive models: some applications’, Journal of the American Statistical Association 82(398), 371–386.
Hutchinson, G. E. (1978), ‘An introduction to population ecology’.
Hyndman, R. J., Khandakar, Y. et al. (2007), Automatic time series for forecasting: the forecast package for R, number 6/07, Monash University, Department of Econometrics
and Business Statistics.
Hyndman, R. J., Koehler, A. B., Snyder, R. D. & Grose, S. (2002), ‘A state space framework for automatic forecasting using exponential smoothing methods’, International Journal of Forecasting 18(3), 439–454.
Lawrence, M., Goodwin, P., O’Connor, M. & Onkal,¨ D. (2006), ‘Judgmental forecasting: a review of progress over the last 25 years’, International Journal of Forecasting 22(3), 493 – 518.
Sanders, N. (2005), ‘When and how should statistical forecasts be judgementally adjusted?’, Foresight 1(1), 5 – 7.
Tashman, L. J. (2000), ‘Out-of-sample tests of forecasting accuracy: an analysis and review’, International journal of forecasting 16(4), 437–450.
Tashman, L. J. & Leach, M. L. (1991), ‘Automatic forecasting software: a survey and
evaluation’, International Journal of Forecasting 7, 209–230.
Wickham, H. & Grolemund, G. (2016), ‘R for data science’.

附录1 $\ Origin$

当需要为数据选择最合适的预测模型或方法时，预测人员通常将可用样本分为两部分：样本内（也称为“训练集”）和保留样本（或样本外，或“测试集”）。然后用样本内数据对模型进行估计，并使用样本外的数据计算预测误差，从而达到评估模型预测性能的目的。
如果这样的程序仅执行一次，则称为“固定原点”评估。但是，时间序列可能包含异常值或水平移位，并且仅由于此原因，较差的模型可能会比更合适的模型表现更好。为了加强对模型的评估，使用了一种称为“滚动原点”的方法。
滚动原点是一种评估技术，根据该技术可以连续更新预测原点，并根据每个原点生成预测（Tashman 2000）。该技术可以获取时间序列的几个预测误差，从而更好地了解模型的性能。如何执行此操作有不同的选择。
$\ can \ this \ be \ done?$
假设时间序列长度为25，初始样本内长度为15，即Origin=15，样本外预测长度为3，则Origin可以从15取到22，共形成8组样本内-样本外预测数据集，如下图，白色表示样本内，灰色表示样本外预测，可以理解对预测区间按一个时间窗进行滑动，滑动步长为1，其实滑动步长也可以作为一个参数；这样我们可以求8组样本的平均预测误差，来比较不同模型的平均预测误差，从而可以进行模型选择。

从8个子样本生成成预测的另一个选择是从第17个历史样本开始预测，而不是从原来第15个开始（见下图）。在这种情况下，该过程一直持续到时间点22，即生成前面最后三个步骤的预测，然后随着预测范围的减小而继续。因此，提前两步预测是从原点23产生的，而只有一步预测是从原点24产生的。结果得到8个一步预测、7个二步预测和6个三步预测。这可以被视为具有非恒定持留率样本大小的Rolling Origin。这在小样本的情况下非常有用，因为我们没有多余的观测数据。

最后，在上述两种情况下，我们都增加了样本内的数据量。然而，出于某些研究目的，我们可能需要保持样本内数据长度不变，比如就是需要用过去100个历史数据，预测未来10步。下图显示了这种情况。在这种情况下，在每次迭代中，我们在序列的末尾添加一个观测值，并从序列的开头删除一个观测值（深灰色单元格）。

你可能感兴趣的:(时间序列模型)

【ICML2024】TimesFM：无需训练！时间序列预测迎来新纪元！ ThePPP_FTS 人工智能深度学习时间序列
论文地址：https://arxiv.org/pdf/2310.10688代码地址：https://github.com/google-research/timesfm/为了更好地理解时间序列模型的理论与实现，推荐参考UP“ThePPP时间序列”的教学视频。该系列内容系统介绍了时间序列相关知识，并提供配套的论文资料与代码示例，有助于理论与实践相结合。https://space.bilibili.c
Python 机器学习：预测国庆黄金周的消费趋势 @技术无疆 Python python 机器学习开发语言人工智能小程序深度学习神经网络
摘要：国庆黄金周作为中国一年中重要的消费高峰期，吸引了众多商家、政府和分析师关注。利用Python和机器学习技术，可以通过历史数据和多维因素构建模型，预测这一期间的消费趋势。本文介绍了数据获取、特征工程、模型选择和优化的完整流程，并提供了完整的Python示例代码。⭕️宇宙起点引言数据获取与处理数据示例特征工程特征工程示例模型选择1时间序列模型（ARIMA）2回归模型（随机森林）3深度学习模型（L
基于Python和PyTorch的实现示例，结合YOLOv8进行人体检测、HRNet进行姿态估计，以及LSTM进行时间序列分析。人工智能专属驿站计算机视觉
视频输入：从摄像头或视频文件中读取视频流。人体检测与跟踪：使用目标检测模型（如YOLOv8、EfficientDet）检测视频帧中的人体。使用目标跟踪算法（如DeepSORT）跟踪人体，确保连续帧中的人体ID一致。姿态估计：使用姿态估计模型（如HRNet、OpenPose）提取人体的关键点（如头、肩、肘、膝、踝等）。关键点信息用于分析人体的姿态和运动。时间序列分析：使用时间序列模型（如LSTM、G
第37讲｜AI+农业气象建模：预测极端天气对农业的影响 Chh0715 人工智能
目录✨导语：天气不可控，但影响可以预测一、数据准备：融合农业与气象⚡二、极端天气如何“定义”？三、模型选择与结构设计时间序列模型：LSTM非时序模型：XGBoost/LightGBM四、案例实战：用LSTM预测小麦产量下降风险（受极端天气影响）五、模型解释与风险感知六、拓展：极端气象早期预警系统总结推荐阅读本节关键词：农业气象、极端天气、LSTM、XGBoost、气象预测、作物产量模拟、AI建模✨
第36讲：作物生长预测中的时间序列建模（LSTM等） Chh0715 lstm 人工智能 rnn r语言 python
目录为什么用时间序列模型来预测作物生长？⛓️什么是LSTM？示例案例：预测小麦NDVI变化趋势1️⃣模拟数据构建（或使用真实遥感数据）2️⃣构建LSTM所需数据格式3️⃣构建并训练LSTM模型4️⃣模型预测与效果可视化除了LSTM，还有哪些方法？农学中的潜在应用场景✅小结在精准农业快速发展的今天，如何准确预测作物的生长状态，已成为提升农业决策效率的重要课题。特别是面对多变的气候、不同地块的管理方式
使用 Python 的 LSTM 进行股市预测无水先生数据分析深度学习人工智能综合 python lstm 开发语言
目录一、说明二、为什么需要时间序列模型？三、下载数据3.1从Alphavantage获取数据3.1从Kaggle获取数据3.3数据探索3.4数据可视化四、将数据拆分为训练集和测试集五、数据标准化六、通过平均进行一步预测6.1标准平均值6.2指数移动平均线6.3如果指数移动平均线这么好，为什么还需要更好的模型？6.4预测未来不止一步七、LSTM简介：预测未来的股票走势7.1数据生成器7.2数据增强7
平滑法时间序列模型原理及Python实践 AI智博信息数据分析与挖掘 python 人工智能
平滑法时间序列模型原理主要涉及通过一定的算法对时间序列数据进行平滑处理，以消除或减弱数据中的随机波动和噪声，从而揭示出数据中的长期趋势和季节性变化，进而对未来数据进行预测。以下是平滑法时间序列模型的详细原理：一、基本原理平滑法时间序列模型基于对历史数据的平滑处理，通过对数据的平均或加权平均，去除数据中的随机波动，使得时间序列数据更加平滑，便于分析和预测。这种方法能够帮助我们更好地理解数据的长期趋势
用Python实现时间序列模型实战——00.学习内容及计划写代码的M教授时间序列模型 python 学习开发语言
学习目标理解时间序列数据的基本概念和特性。掌握常用的时间序列分析方法和模型，包括移动平均模型(MA)、自回归模型(AR)、自回归滑动平均模型(ARMA)、自回归积分滑动平均模型(ARIMA)、季节性自回归积分滑动平均模型(SARIMA)、指数平滑法、状态空间模型等。学习如何进行时间序列的模型评估和预测。实践时间序列分析和预测的典型案例。学习时长共计6周，每周5天学习时间（周末休息或复习）。第1周：
informer+TCN+通道注意力机制+SSA时间序列模型预测成为深度学习高手算法机器学习深度学习 transformer
1.informerInformer是一种用于时间序列预测的深度学习模型，特别适用于长序列的时间序列数据。它是基于Transformer结构的一种改进，主要解决了传统Transformer在处理长序列时计算复杂度高的问题。1.1Informer的关键机制稀疏自注意力机制（ProbSparseAttention）：传统的Transformer使用全局自注意力机制，即对于输入的每个时间步，它都计算与其
时间序列预测之ARMA、ARIMA序列及季节性序列matlab实现 Icy Hunter 数学建模 matlab 数学建模时间序列预测 ARIMA
ARMA是一种平稳时间序列模型，即均值和协方差不随时间的平移而改变。ARMA有三种类型AR序列MA序列ARMA序列但是由于ARMA只能处理平稳序列，而现实中的问题往往有趋势性或周期性等。为了得到平稳序列，我们对数据进行差分运算，使得新序列成为平稳序列，就能够进行ARMA分析，因此ARIMA模型，是在ARMA的基础上多了差分运算，使得其能够处理的序列范围增加了。ARIMA序列例题1：clc,clea
在Python和R语言中使用Auto ARIMA构建高性能时间序列模型公子曼步
想象一下，你的任务是预测下一部iPhone的价格，并提供了历史数据。这包括季度销售、月度支出，以及苹果资产负债表上的一大堆东西。作为一个数据科学家，你会把这个问题归类为什么？当然是时间序列建模。从预测产品的销售到估计家庭的用电量，时间序列预测是任何数据科学家都应该知道的核心技能之一，如果不是精通的话。有很多不同的技术可供您使用，在本文中，我们将介绍一种最有效的技术，称为AutoARIMA。我们将首
时间序列模型的应用及探究零物购人工智能
时间序列模型的应用及探究时间序列：将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。时间序列模型也成为回归模型，一方面承认事物发展的延续性，运用过去时间序列的数据进行统计就可以推测事物的发展趋势；另一方面，充分考虑到偶然因素影响的随机性，使用历史数据，进行统计分析对数据进行适当处理来消除随机波动的影响。简单易行，便于掌握并充分运用时间序列的各项数据，计算速度较快，能够比较精确的确定模型的动
2023美赛C题王牌思路，ARIMA + BertNLP 进阶版，助美赛一臂之力！ CS数模 r语言人工智能数据挖掘
问题一：报告结果的数量每天都在变化。建立一个模型来解释这种变化使用您的模型为3月份报告的结果数量创建一个预测区间用数学建模进行建模：建立一个时间序列模型来解释每天报告结果的数量变化。该模型可以包括以下因素：季节性因素（例如周末和工作日之间的变化）、假期因素（例如国定假日）、推广因素（例如Wordle在社交媒体上的推广）、单词选择因素（一些单词可能更具挑战性，导致玩家减少）等。为了预测3月1日的报告
时间序列大模型：TimeGPT AI知识图谱大本营大模型自然语言处理
论文：https://arxiv.org/pdf/2310.03589.pdfTimeGPT，这是第一个用于时间序列的基础模型，能够为训练期间未见过的多样化数据集生成准确的预测。大规模时间序列模型通过利用当代深度学习进步的能力，使精确预测和减少不确定性成为可能！通过对预训练模型进行了评估，并与既定的统计、机器学习和深度学习方法进行了比较，证明了TimeGPT在性能、效率和简单性方面表现出色。1介绍
时间序列模型学习笔记 Che_Che_ 学习笔记时间序列预测模型 ARIMA
建议配合这个博主的博客食用时间序列模型（ARIMA和ARMA）完整步骤详述_arma模型建模步骤-CSDN博客ARIMA已经老了，但是学习一下有一个了解也是挺好的
【2024华数杯国际数学建模竞赛】问题A 光伏发电完整代码+结果分析+论文框架（一） Better Rose 数学建模数学建模 matplotlib python
问题A数据搜集一、问题分析问题一问题二二、模型假设四、符号说明五、模型的建立与求解5.1问题一模型的建立与求解5.1.1基于箱线图的数据预处理5.1.2描述性统计分析5.1.3基于斯皮尔曼系数的相关性分析5.1.4基于LSTM的时间序列预测模型5.1.5LSTM的时间序列预测结果5.1.6多元回归模型的预测结果5.1.7LSTM时间序列模型的性能评价5.2问题二模型的建立与求解5.2.1基于皮尔逊
基于时间序列模型和神经网络模型预测新能源汽车销量 Wiggins6 python lstm 神经网络能源汽车
数据来源本文数据来源于中国汽车工业协会网的2015年1月~2023年4月的中国新能源汽车销量数据。另外，包括从2015年1月~2023年4月的中国汽车销量数据以及新能源汽车数据的市场渗透率。描述性分析如表1，本文对新能源汽车销量、市场渗透率和汽车销售量进行了描述性统计分析。从表中可以看出，本研究共有100个样本值，新能源汽车销量和市场渗透率的变异系数分别为1.2002和1.1319，远高于汽车销售
2024年华数杯国际赛文心一言解题思路B题光伏电 BZD数模社文心一言人工智能
问题一：中国电力供应发展趋势预测概要回答：中国的电力供应发展趋势将受到经济增长、能源政策、技术进步和市场需求等多重因素的影响。为了实现碳峰值和碳中和目标，预计可再生能源（包括光伏发电）在电力结构中的比重将显著增加。解决方案框架：收集历史电力供应数据、经济增长数据、能源政策文件等。建立多元回归模型或时间序列模型，分析各因素对电力供应的影响。利用模型预测2024-2060年的电力供应趋势。考虑政策变动
PMP工具之回归分析众易
什么是回归分析？回归分析是一种预测性的建模技术，它研究的是因变量（目标）和自变量（预测器）之间的关系。这种技术通常用于预测分析，时间序列模型以及发现变量之间的因果关系。例如，司机的鲁莽驾驶与道路交通事故数量之间的关系，最好的研究方法就是回归。回归分析是建模和分析数据的重要工具。在这里，我们使用曲线/线来拟合这些数据点，在这种方式下，从曲线或线到数据点的距离差异最小。我会在接下来的部分详细解释这一点
第三十八周周报：文献阅读 +BILSTM+GRU+Seq2seq m0_66015895 lstm 人工智能 rnn
目录摘要Abstract文献阅读：耦合时间和非时间序列模型模拟城市洪涝区洪水深度现有问题提出方法创新点XGBoost和LSTM耦合模型XGBoost算法编辑LSTM（长短期记忆网络）耦合模型研究实验数据集评估指标研究目的洪水深度预测实验结果LSTM变体BidirectionalLSTM（双向LSTM）GRU（门循环控制单元）Seq2seq模型编码器-解码器（encoder-decoder）架构Se
目标跟踪算法中的卡尔曼滤波学习 AAI机器之心目标跟踪算法学习人工智能深度学习计算机视觉 pytorch
在使用多目标跟踪算法时，接触到卡尔曼滤波，一直没时间总结下，现在来填坑。1.背景知识在理解卡尔曼滤波前，有几个概念值得考虑下：时序序列模型，滤波，线性动态系统1.时间序列模型时间序列模型都可以用如下示意图表示：这个模型包含两个序列，一个是黄色部分的状态序列，用X表示，一个是绿色部分的观测序列（又叫测量序列、证据序列、观察序列，不同的书籍有不同的叫法，在这里统一叫观测序列。）用Y表示。状态序列反应了
时间序列模型初步学习1 兔兔爱学习兔兔爱学习学习
时间序列预测问题分为两类：（1）单变量时间序列预测问题，数据只有一个通道，预测值仅由目标通道向量序列组成；（2）多变量时间序列预测问题，其中预测器由向量对序列（x，y）组成，但任务是仅预测单个目标通道。ARIMA模型（AutoregressiveIntegratedMovingAveragemodel），差分整合移动平均自回归模型，又称整合移动平均自回归模型（移动也可称作滑动），为时间序列预测分析
2024美赛数学建模常用数学建模时间序列模型之——指数平滑法建模忠哥小师妹数学建模数学建模
一次移动平均实际上认为最近N期数据对未来值影响相同，都加权1/N；而N期以前的数据对未来值没有影响，加权为0。但是，二次及更高次移动平均数的权数却不是1/N，且次数越高，权数的结构越复杂，但永远保持对称的权数，即两端项权数小，中间项权数大，不符合一般系统的动态性。一般说来历史数据对未来值的影响是随时间间隔的增长而递减的。所以，更切合实际的方法应是对各期观测值依时间顺序进行加权平均作为预测值。指数平
2024美赛数学建模常用数学建模时间序列模型之——移动平均法建模忠哥小师妹数学建模数学建模
一、时间序列简介时间序列是按时间顺序排列的、随时间变化且相互关联的数据序列。分析时间列的方法构成数据分析的一个重要领域，即时间序列分析。时间序列根据所研究的依据不同，可有不同的分类。1．按所研究的对象的多少分，有一元时间序列和多元时间序列。2．按时间的连续性可将时间序列分为离散时间序列和连续时间序列两种。3．按序列的统计特性分，有平稳时间序列和非平稳时间序列。如果一个时间序列的概率分布与时间t无关
时序预测：LSTM、ARIMA、Holt-Winters、SARIMA模型的分析与比较建模先锋数据分析专题案例时间序列预测 lstm 人工智能 rnn
基于Python的入门级时间序列预测分析目录引言1数据描述2理论模型简述2.1Holt-Winters三参数指数平滑模型表2.2ARIMA模型2.3SARIMA模型2.4LSTM模型3数据检验与分解3.1单位根检验3.2序列分解4建立时间序列模型4.1模型识别4.2ARIAM模型4.2.1ARIMA(3,1,3)模型拟合4.2.2参数估计和模型检验5模型比较与预测5.1三参数指数平滑模型拟合5.2
2020-03-30 线性时间序列案例学习—汽油价格程凉皮儿
学习资料：http://www.math.pku.edu.cn/teachers/lidf/course/fts/ftsnotes/html/_ftsnotes/fts-ltscases-gas.html这一章用三个实例来详细讲解如何用R语言和线性时间序列模型分析实际数据，并展现线性时间序列模型的适用性与局限性。数据为：1997-01-06到2010-09-27的美国普通汽油价格周数据；1880年
计量经济学|学习笔记以及学习感悟封印师请假去地球钓鱼统计与数据分析素养max 学习笔记计量经济学时间序列
初级计量经济学着重于介绍基本的统计工具和经济模型，以帮助理解经济数据和经济现象之间的关系。它包括回归分析、假设检验和预测方法等内容。中级计量经济学则深入研究这些方法的理论基础和实际应用，包括更复杂的模型和技术，如面板数据分析、时间序列分析和因果推断等。中级课程还探讨了更多的计量经济学理论，如内生性问题、工具变量和因果推断的困难等。一、回归模型二、时间序列模型（一）时间序列基本定义与概念1.时间序列
时间序列预测实战(二十六)PyTorch实现Seq2Seq(LSTM)（结果可视化+自动保存结果） Snu77 时间序列预测专栏 pytorch lstm 人工智能深度学习 python 时间序列预测
一、本文介绍本文给大家带来的时间序列模型是Seq2Seq，这个概念相信大家都不陌生了，网上的讲解已经满天飞了，但是本文给大家带来的是我在Seq2Seq思想上开发的一个模型和新的架构，其是专门为新手开发的，而且为了方便大家使用只定义了一个文件方便大家复制粘贴，架构功能包括：结果可视化、支持单元预测、多元预测、模型拟合效果检测、预测未知数据、以及滚动长期预测功能。Seq2Seq模型是一种处理序列数据的
【数学建模】《实战数学建模：例题与讲解》第九讲-时间序列分析（含Matlab代码） zhushatong 数学建模数学建模 matlab 开发语言
【数学建模】《实战数学建模：例题与讲解》第九讲-时间序列分析（含Matlab代码）基本概念确定性时间序列分析方法平稳时间序列模型ARIMA模型季节性序列习题8.11.题目要求2.解题过程3.程序4.结果习题8.21.题目要求2.解题过程3.程序4.结果习题8.31.题目要求2.解题过程3.程序4.结果本系列侧重于例题实战与讲解，希望能够在例题中理解相应技巧。文章开头相关基础知识只是进行简单回顾，读
时间序列预测实战(二十五)PyTorch实现Seq2Seq进行多元和单元预测（附代码+数据集+完整解析） Snu77 时间序列预测专栏 pytorch 人工智能 python 深度学习时序数据库数据分析
一、本文介绍本文给大家带来的时间序列模型是Seq2Seq，这个概念相信大家都不陌生了，网上的讲解已经满天飞了，但是本文给大家带来的是我在Seq2Seq思想上开发的一个模型和新的架构，架构前面的文章已经说过很多次了，其是专门为新手开发的，而且为了方便大家使用只定义了一个文件方便大家复制粘贴，架构功能包括：结果可视化、支持单元预测、多元预测、模型拟合效果检测、预测未知数据、以及滚动长期预测功能。Seq
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs