GOOMHOOM

使用条件分布模态流进行多变量概率时序预测

译者的话
时序预测是一个古老的话题。有许多基于数理统计的经典算法曾经大放异彩。但随着大数据时代的到来，数据量的急剧增长以使得传统的分析方式在可行性上已初现窘迫，在预测精度及预测步长上也难以满足当代社会的需求，在时序数据表征的随机性太强的情形下，各种假设更是失去了效力。因此这种end-to-end的深度学习时序预测方法应运而生，2018年至今短短数年，便是红火如斯。

从ARIMA、faceBook的Prophet、再到LSTM、DeepAR多个技术选型的更改皆是因为预测准确性到达瓶颈后的为求突破的艰难抉择。因此对DeepAR的易用性和预测准确性及模型通用性印象深刻。因此更是对Kashif Rasul等人提出的方案充满期待。

笔者翻译此文的主要原因是Kashif Rasul等人提出的本套方案在大多数实际生产环境中训练效率较DeepAR更高，预测范围更紧凑，笔者希望国内同仁也能更早的使用这套方法，到时候互相学习，一起改进岂不是妙哉。

关于Normalizing Flows的中文译名，现在大多数的文献及网络文章中译为‘标准化流’，但译者在本文中，统一将Normalizing Flows翻译为‘分布模态流’，而Conditioned Normalizing Flows译为‘条件分布模态流’，译名可能不甚准确，若各位同仁有其他的想法，欢迎沟通交流。

由于笔者水平有限，译文中难免会有疏漏，若有同仁发现了不妥之处，还望及时指出，原文地址为：Multi-variate Probabilistic Time Series Forecasting via Conditioned Normalizing Flows。另外文中包含许多的深度学习方面的术语，笔者并未在文中给出解释，请诸位自行查阅相关资料。

概要

时间序列预测通常是科学和工程问题，可以辅助决策。在大数据量情形下，假设具有相关性的时序是相互独立的，是进行大规模时序预测的一个简单解决办法。但是，考虑相关性的统计学方法不仅可以提高准确度，还可以进行交互式分析，因此上面这种简单的解决方式似乎不够完美。深度学习方法非常适合此问题，但是多变量模型通常只将分布假设为一些基础的分布并且无法扩展到高维。因此，我们建立了一种动态的多变量时序模型，一种用条件分布模态流代替诸如正态分布、T分布、F分布的数据分布的自回归深度神经网络模型。这种结合使得RNN获得了AR（自回归）的诸多优点，比如在具备高维分布模型、获得更好的预测效果同时，具有流的灵活性和高效的计算效率。我们已经证实，这种算法模型在数千个真实的时间序列上的表现（基于目前标准的评价方式）是目前最先进的。

1.引言

经典的时序预测方法，比如Hyndman & Athanasopoulos (2018)给出的单变量预测方法，需要手动调整季节性等其他的参数。基于RNN的时序预测模型，比如LSTM，变得越来越流行，因为这是一种end-to-end的训练方式，不需要进行复杂特征处理，这也是是深度学习的特点。输出的预测结果既可以是一组值，也可以是一个范围（根据数据分布给出的置信区间）。时序置信区间预测的主要难点在于下游业务如何确定什么样的置信区间是可信的，例如异常检测或（商业）决策。不使用概率建模，就无法区分低噪音和高噪音的场景，然而这对预测来说很重要。值预测模型，忽视了噪声带来的风险，但是对噪声的处理在一些场景下十分重要，比如商业决策。

最后，在许多情况下，各个时间序列在统计上是相互依赖的，并且模型需要具有处理这种情况的能力，以提高预测的准确性（Tsay，2014）。例如，为了建立零售商品需求模型，不仅要考虑商品自身历史销售数据，还要考虑其他竞品市场份额的影响。再比如，用传感器测量交通网中的车流量，一条特定街道的阻塞也会影响附近街道–单变量模型可能无法解释上述影响。

因此我们尝试去设计一种基于概率预测的、end-to-end训练模式的、自回归深度学习时序模型算法，这种模型算法支持多变量时间序列，并且实现分布模态流的动态插拔，就像the Masked Autoregressive Flow (Papamakarios等人,2017) or Real NVP (Dinh 等人,2017)。

这篇论文的主要亮点在于：

我们设计了一套针对多变量时间序列的概率方法，这套方法支持受数千个‘因素时间序列’影响的‘目标时间序列’的建模。
我们证实，这套模型在小体量的实验集情形下依然能获得不错的效果。
这套模型在许多真实数据集上的表现是目前最新进的。

该模型还具有以下优点：

基础分布（正态分布、T分布、F分布、贝塔分布等）建模采用条件分布模态流，这种方式支持多种基础分布。
由于采用了注意力机制的并行计算因此训练效率很高，不像典型的基于RNN的时序模型。根据经验，我们观察到基于Transformer的模型的训练时间缩短了一个数量级。

整个论文大体结构如下：第2章介绍了一些背景，第3章介绍了本文中涉及相关技术，第4章介绍了我们的算法，第5章展示了我们实验的详细细节，第6章给出了结论。

2.背景

我们简要介绍时间序列预测的现状，并在本节中介绍了我们方法的基本组成部分。

2.1. 时序预测

经典的时序预测方法基本都是基于ARMA和它的变体比如ARIMA。这些方法与特征工程密不可分，他们还遭受维度的诅咒，需要频繁的重新训练，并且专注于模型的可解释性，而不是测试集的准确性。

过去几年中，深度学习模型在许多领域都比传统方法有更好的表现，比如图像处理、语音识别、自然语言处理，当然也包括时序预测，这与NLP中的序列建模相似。现代单变量值预测方法，例如Oreshkin（2020）等，在许多目标领域具有解释力，并且可以进行快速训练。

在控制理论中对经典方法的区间估计已经进行了数十年，例如 Dietz 等人
(1997)。大多数经典的预测文献都集中于值预测，例如未来某个时间点的分布平均值或中位数。在深度学习中，这两种方法要么是对数据分布进行显式建模，要么是如Zhu＆Laptev（2018）所述使用贝叶斯神经网络。为了估计潜在的分布，我们可以学习某些目标分布的参数，比如DeepAR（Salinas等，2019b），或者使用混合密度网络（MDN）（Bishop，2006年），例如在用于模拟笔迹的MD-RNN方法（Graves，2013年）。最近，Rangapuram等人（2018）将每个单独时间序列的线性状态空间模型与深度概率模型结合在一起，以获得解释性的时间序列预测。

为了进行完整时序建模，即将‘因素时间序列’考虑进来，可以使用多元高斯过程来获取数据的本源结构（Vandenberg-Rodes＆Shahbaba，2015）或者通过RNN习得低阶高斯Copula过程（Salinas等，2019a）。时态正则化矩阵分解框架（Yu等人，2016）建议学习数据依赖关系，从而通过矩阵分解方法预测未来值。LSTNet（Lai等人，2018）使用卷积神经网络（CNN）和RNN构建blocks为值预测的多元时间序列建模。还提出了使用分层的先验贝叶斯模型，以在各个时间序列之间共享statistical strength，同时保持推理的可行性（Chapados，2014年）。Li等人（2019）最近也探索了将多点注意力机制用于时间序列预测，这种方式可以保存更长的历史信息以解决RNN系列（比如LSTM）面临的记忆不够长的问题。

2.2. 通过分布模态流进行概率密度估计

分布模态流（Tabak和Turner，2013）是从 $R^{D}$ 到 $R^{D}$ 的映射，从而将输入空间上的概率密度 $p\mathcal X$ 变换为空间 $\mathcal Z=R^{D}$ 上的一些简单分布（例如，各向同性的高斯分布）。该映射 $f:\mathcal X\mapsto \mathcal Z$ 由一系列双射或可逆函数构成。因此这个转换公式可表述为:
$p\mathcal X(x)=p\mathcal Z(z)\biggl|det(\frac {\partial f(x)} {\partial x})\biggl|$
其中 $\frac {\partial f(x)} {\partial x}$ 是函数 $f$ 在 $x$ 处的雅可比矩阵。分布模态流的特点是逆函数 $x=f^{-1}(z)$ 容易求出并且在计算雅可比行列式的时候时间复杂度为O(D)。

Real NVP（Dinh等人，2017）引入的双射-耦合层满足上述两个特性。它保留部分输入不变，另一部分通过一系列变量恒定函数（上标表示坐标索引）
$\begin{cases} y^{1:d}=x^{1:d} \\ y^{d+1:D}=x^{d+1:D} \bullet exp(s(x^{1:d}))+t(x^{1:d}), \end{cases}$
其中 $\bullet$ 是元素级别乘积, $s ()$ 为缩放函数， $t ()$ 为转换函数，这种算法是由神经网络实现的。非线性的概率密度函数模型 $f (x)$ 是由一系列耦合层通过这种流的形式组成的，这种流将同时改变保留的部分和转换的部分的纬度。通过上述变量的转化方式，可以将流中给定数据点的概率密度函数（PDF）写为：
$\begin{aligned} logp\mathcal X(x)=logp\mathcal Z(z)+log|det (\partial z /\partial x)\\ =logp\mathcal Z(z)+\sum_{i=1}^K log|det(\partial y_i/\partial y_{i-1})| \\ (1) \end{aligned}$
由于the Real NVP的雅可比矩阵是一个分块的三角矩阵（三角矩阵的行列式是对角线元素的乘积），因此可得出下式：
$\begin{aligned} log|det(\partial y_i/\partial y_{i-1})|=sum(log|diag(exp(s(y_{i-1})))|)\\ (2) \end{aligned}$

缩放和转换神经网络的权重参数 $\theta$ 的求解方式是取每个批次训练数据D极大似然估计的解的均值，优化器采用梯度下降，公式如下：
$\mathcal L= \frac 1{ |\mathcal D|} \sum_{x\in \mathcal D}logp\mathcal X(x;\theta)$
在实践中，批归一化（Ioffe和Szegedy，2015）作为双射用来处理所有连续耦合层的输出，使得分布模态流的训练更平稳。双射使用所有层的均值和标准偏差的加权移动平均值来执行此归一化过程，这个双射必须是可训练或可模拟的。

可以对Real NVP方法进行一般化，从而产生Masked Autoregressive Flows（Papamakarios等人，2017）（MAF），其中将转换层构建为自回归神经网络，这也就意味着，输入 $x\in R$ 和输出 $y=(y^1,y^2...,y^D)$ ，需要转换层的变换是可逆的，并且任何输出 $y^i$ 都不要求输入的维度索引≥i（即）（笔者：就是说不能在训练的时候将预测结果给出）。由于该变换的雅可比行列式是三角的，因此这个雅可比行列式是易于求解的。除了使RNN在 $x$ 的 $D$ 维上共享参数外，还可以通过使用掩码来避免这种有序计算，并为其指定名称。然而，生成样本所需的逆是有序的。(笔者：当计算是强顺序时，是无法进行并行计算的，从而使得算法耗时增加)

既然缩放和变换函数的逼近函数不需要可逆，那么直接计算条件概率密度函数PDF $p\mathcal X(x|h)$ 其中 $\in R^H$ ：我们将串起来的缩放函数和转换函数作为耦合层的一个近似，比如将 $s(concat(x^{1:d},h))$ 和 $t(concat(x^{1:d},h))$ 变为映射 $R^{d+H}\mapsto R^{D-d}$ 。另外一种近似求解方式是Korshunova等人(2018)提出的在每层中的 $s ()$ 和 $t ()$ 中增加一个与h相关的偏置项，这种方式不会改变耦合层的对数行列式的值。对我们来讲更重要的是，针对有序数据，使用流行的自回归RNN系列能让不同的学习器共享同一组参数。

对于离散数据，分布具有负无穷大的微分熵，这在训练归一化流量模型时甚至在测试数据上也会导致高到怀疑人生的对数似然。为避免这种情况可以反量化数据，通常通过添加Uniform[0,1）噪声方式来实现。连续模型的对数似然的下界是离散模型的对数似然，如Theis等人所述（2016）。

2.3. 自注意力

基于转换层的自注意力在序列建模方面已经取得了巨大的成功。多点自注意力机制可以让神经网络针对时间序列同时具备长短记忆的能力。重点是，这个转换器接收一个序列 $X=[x_1,x_2,...,x_t]^T \in \Bbb R^{t \times D}$ ,然后多点自注意力转换这个序列为 $H$ 个不同的查询矩阵 $Q_h=XW_h^Q$ 、键矩阵 $K_h=XW_h^K$ 、值矩阵 $V_h=XW_h^V$ ，权重 $XW_h^Q、XW_h^K、XW_h^V$ 都是可学习的参数。在这些线性变换之后，the scaled dot-product attention计算一系列矢量输出，计算方式如下：
$O_h=Attention(Q_h,K_h,V_h)\\=softmax(\frac {Q_hK_h^T \cdot M} {\sqrt {d_K}})V_h$
其中应用掩码M通过将其上三角元素设置为 $\infty$ 来滤出right-ward attention（或者叫future information leakage），并用 $d_K$ (与 $W_h^K$ 有相同维度的矩阵)归一化。之后，所有的 $\space O_h$ 输出被连接起来并再次线性投影。

人们通常在encoder-decoder中使用这种变换，其中编码器用于对时间序列预热，解码器用于学习和自回归生成输出。

3.相关成果

这些模型与这项工作相关的是以某种方式将分布模态流与序列建模结合起来。Transformation Autoregressive Networks（Oliva等人，2018）（TAN），将多元变量 $\in R$ 的概率密度建模为D个条件分布 $\prod_{i=1}^D p \mathcal X(x_i|x_{i-1},x_{i-2},...,x_1)$ ，其中条件来自混合模型中的RNN的状态，然后通过双射进行转换。Pixel SNAIL（Chen等人，2018）方法将核心节点作为条件分布的产物进行建模（可选地，通过一些全局条件进行建模），并通过因果卷积和自注意力（Vaswani等人，2017）方法获取获取长期时间依赖。这些方法对图片等高维数据建模有很好的效果，但对于时间形态的数据才刚开始探索，比如VideoFlow(Kumaret等人,2019)，它由分布模态流组成，该分布模态流认为自回归模型每个时间点的隐变量服从高斯分布，高斯分布的参数是流前一时间步的输出。

使用RNN进行多元或时间属性的序列建模不适合并行化。但是，RNN已经显示出在动态序列建模中非常有效，因此我们仍然认为研究具备时间属性的RNN对多变量时间序列预测非常重要。在此方向上的最新工作（Hwang等人，2019）将带有GRU的二分流用于时间属性以研究多元序列数据的条件生成模型。作者使用双向训练程序来学习生成的观测模型，并将其与时态一起通过RNN进行调节，也可以根据（观察到的）协变量进行调节，它们被建模为潜在空间中的附加条件变量，增加分布模态流的维度。另一些相关研究是能够进行高维数据建模的多变量概率时间序列方法。高斯Copula过程方法（Salinas等，2019a）是用高斯copula过程处理输出的基于RNN的时间序列的法，该方法使用低秩协方差结构建模，以减少计算量复杂性并且也可以处理非高斯边际分布。通过使用协方差矩阵的低秩近似解他们获得了一种易于计算的方法，并且能够可以扩展到成千上万的多元维度。接下来我们将把我们的模型与此模型进行比较。

4.时态条件分布模态流

$x_t^i \in R \space for \space i \in \{1,...,D\}$ 表示时间序列，其中t表示时间索引。因此时刻t处的多元向量可表示为 $x_t \in R^D$ 。时间序列 $\in [1,T]$ 由完整的时间序列数据采样而来， $1,t_0)$ 为训练数据， $t_0,T]$ 为测试数据。

在DeepAR(Salinas等人，2019b)模型中，最大化时间序列 $x_{t}^i$ 在时间步 $t$ 上的对数似然以得到该时间序列在该窗口的预测值。也就是寻找使对似然最大的分布模型（例如计数数据服从负二项分布）的参数，这是通过从其前一时间步 $x_{i-1}^i$ 及其对应的协变量 $c_{t-1}^i$ 得出的RNN的状态完成的。分布模型（对于实数数据通常选择高斯模型，对于计数数据通常选择负二项分布模型）应该能最拟合时序数据的统计属性并且存在满足这些分布参数约束条件的（神经网络的）激活函数，比如高斯分布的比例参数可以用softplus()。

多变量实值数据的简单模型可以在emissions中使用因子分解分布。然后，共享参数可以通过时间组件学习各个时间序列的模式，但是没有捕捉到模型的emissions中的依赖关系。为此，必须对每个时间步的完整联合分布进行建模，例如使用多变量高斯模型。然而，全协方差矩阵的建模不仅增加了 $O(D^2)$ 的神经网络参数个数，增加了学习难度，而且当D较大时，计算网络的损失也变得昂贵。此外，emissions的统计依赖性将仅限于二级效应。Salinas等人将这些模型称为Vec LSTM（2019a年）。

图1.RNN条件下的Real NVP模型在时间t时的示意图，由K个coupling层和batch Norm层组成，在每个coupling层中，我们将 $x_t$ 及RNN转换后的输出作为条件，而RNN输入为上一时间步 $x_{t-1}$ 及其协变量 $c_{t-1}$ ，其中前者是时间相关的特征后者是时间无关的特征。

针对有 $D$ 相互作用时间序列我们希望建立一个可扩展的模型，并使得该模型可以灵活挑选的分布模型，以便捕捉和表示高阶矩。为此，我们使用流式算法（例如Real NVP）为所有时间序列 $\mathcal X(x_t |h_t;θ)$ 在时间t建立了条件联合分布模型，该流式算法条件是时间t处RNN的隐藏状态，或是从注意模块嵌入到t的时间序列。当前使用的自回归RNN（LSTM或者GRU）隐藏层状态 $h_t$ 通过上个时间步中可以观察到的 $x_{t-1}$ 和 $x_{t-1}$ 的协变量 $c_{t-1}$ （如图1所示）：
$\begin{aligned} h_t=RNN(concat(x_{t-1},c_{t-1},h_{t-1})) \\ (3) \end{aligned}$
这个模型是自回归的模型，因为使用到了上一个时间步的观察值 $x_{t-1}$ 和循环网络的状态 $h_{t-1}$ ，以此计算出当前的观察值 $h_t$ 。

为了得到一个功能强大的生成分布模型，我们将K层流模型（Real NVP或者MAF）堆叠起来。结合RNN，通过给出的历史观察值 $\in [1,t_0)$ 和全量的协变量 $\in [1,T]$ 我们得到了所有时间序列未来的条件分布模型。既然这个模型是自回归的，那么密度函数可以重写为：
$\begin{aligned} p \mathcal X(x_{t_0:T}:x_{t_1:t_0},c_{t_1:T})=\prod_{i=1}^D p \mathcal X(x_t:h_t;\theta) \\ （4） \end{aligned}$
$\theta$ 表示所有参数的集合，包括RNN的参数和流的参数

为了模拟时间演化，我们还使用注意力模块进行了研究（Vaswani等人，2017）。这用于计算 $t_0$ 之前的时间序列的embedding。如上所述，训练时间序列被分成预热或编码部分 $x_{1:t_0-1}$ 和输出部分 $x_{t_0:T}$ 。在本例中，有关整个模型的示意图，请参见图2。在训练时，必须注意防止使用来自未来时间点的信息，并通过使用一个反映进展时间因果方向的掩模（即遮住未来时间点）来保持自回归特性。

图2. Transformer Conditioned Real NVP模型示意图，包括一个编码器-解码器堆栈，其中编码器获取时间序列中数个上下文长度的子序列，然后通过因果屏蔽解码器栈生成符合条件长度的时间序列预测值。译码器的输出被用作训练流的输入。注意，位置编码是协变量的一部分，与RNN模型不同，这里所有的时间点 $x_{1:T}$ 都是并行训练的。

在现实世界的数据中，不同时间序列的值的大小可能会有很大的变化。为了将时间序列归一化，我们在将数据送入模型前会将时间序列除以它的期望。而输出乘上期望还原为未缩放的值，这种简化的缩放方法，在实际操作中有很好的表现（Salinas等人 (2019b)）。

4.1 训练

给定数据集 $D$ （一个批次的时间序列），对于每个时间序列和时间步，有 $\in R^D$ 以及协变量 $c _t$ ，在考虑条件化流和RNN或转化器的参数集合的条件下，通过Adam(Kingma & Ba, 2015)给出的SGD（梯度下降）求解（1）式和（3）式的极大似然方程组
$\mathcal L = \frac 1 {|D|T} \sum_{X_{1:t} \in D} \sum_{t=1}^Tlogp \mathcal X(x_t:h_t;\theta)$
实际上，批次D中的时间序列是从我们训练数据中大小为T的时间窗口中随机选择的，并且相对时间步长保持恒定。这允许模型仅在给定协变量的情况下进行冷启动学习。当用于训练的历史数据较少时，这会增大训练数据集，并允许我们在计算时间和内存消耗之间进行权衡，尤其是在D或T较大时。请注意，有关绝对时间的信息仅可通过协变量提供给RNN或转换器，而不能通过训练数据获得的相对位置。与RNN为相比 $O(TD^2)$ ，转换器的计算复杂度为 $O(T^2D)$ ，其中T为时间序列长度，并假设隐藏状态的维数与建模的协时间序列的数量成比例地增长。这意味着对于较大的多元时间序列，即 $D > T$ ，Transformer流模型的计算复杂度较小。此外，与RNN不同，所有用于训练的计算都是并行进行的。转换器允许模型访问历史时间序列的任何部分，而与时间跨度无关，从而能够为规范化流生成更好的条件。

4.2 协变量

我们提供了分类特征的embeddings，在训练模型的时候可以识别一个分类内部的关系或者分类的上下文关系。将这些embedding作为时间序列预测的特征进行组合，可以产生强大的模型，比如Kaggle第一届出租车轨迹预测挑战赛的冠军（DeBrébisson
等人，2015）。我们使用的协变量由时间相关的（例如，星期几，一天中的小时）和时间无关的embedding（如果适用）以及滞后特征组成，后者取决于用于训练的数据集的时间频率。
在我们希望预测的时间段内，必须知道所有协变量。

4.3 推断

为了进行推断，我们要么通过RNN传递一个“热身”时间序列 $x_{1:t-1}$ 来获得隐藏状态 $\hat h_{t_1}$ ，要么使用冷启动即 $\hat h_{t1}=h_1=\vec 0$ 设置的隐藏状态，然后对噪声向量进行采样（各向同性高斯分布），基于起始状态，通过回流计算，获取下一个时间步的时间序列样本。然后，我们使用该样本及其协变量通过RNN获得下一个条件状态 $\hat h_{t_1+1}$ ，重复此步骤，直到达到需要我们推断的时间窗口。从某个初始状态进行采样的过程可能重复很多次，从而获得任意长时间预测范围内我们的预测区间经验分位数。

注意力模型类似地使用预热时间序列 $x_{1:{t_1-1}}$ 及相应协变量并用编码器编码，然后使用解码器输出条件以从流中进行采样。然后，此样本再次在解码器中使用，以迭代方式采样下一个条件状态，类似于seq-to-seq模型中的推理过程。

5.实验

在这里，我们用实验数据集和6个现实中的生产数据对模型及结果进行了检验分析。

5.1 管道系统中的仿真流

在此实验中，我们通过模拟带有阀门的管道系统中的液体流动来检查模型的一些基本属性。
有关系统的描述，请参见图3。

图3 带有传感器（S）和阀门（V）的液体从左向右流动的管道系统

水流从左到右，这个系统中第一个传感器的压力为 $S_0= X + 3,X \sim Gamma(1,0.2)$
。阀门 $V_1,V_2 \sim _{iid} Beta(0.5,0.5)$ ，因此有
$S_i=\frac {V_i} {V_1+V_2}S_0+S_1$
其中 $\in {1,2} \quad S_3=S_1+S_2+\varepsilon_3 \quad \varepsilon \sim N(0,0.1)$ 。通过此模拟，我们检查我们的模型是否能捕获时间上的相关性和空间上的相关性。 $S_1$ 和 $S_2$ 之间的相关性是由于两者具有相同的来源（由 $S_0$ 测得）。这由 $Cov(S1，S2)\gt 0$ 反映出来，该值由我们的模型捕获。

图4.某个时间点捕获到的S1和S2的相关系数的协方差矩阵。颜色越深代表正相关程度越高。

实际情况下连续时间点之间的互协方差结构，以及我们训练模型捕获的交叉协方差结构，如图5所示。它反映了系统中液体的真实流量， $t$ 时刻到达 $S_0$ ， $t + 1$ 到达的 $S_1$ 和 $S_2$ 。 $t + 2$ 时刻到达 $S_3$ 。

图5. 管道系统中的真实液体流量连续时间点之间的互协方差矩阵。颜色越深代表正相关程度越高。

5.2 生产数据

为了评价模型效果我们在每个单独的时间序列上计算连续分级概率评分（ $C R P S$ ），针对合计值也进行相同操作（稍后会标记为 $CRPS_{sum}$ ）。 $C R P S$ 度量累积分布函数 $F$ 与观测值 $x$ 的相容性
$\begin{aligned} CRPS(F,x)=\inf_R(F(z)-\Bbb I\{x \le z\}) \\ (5) \end{aligned}$

其中： $\Bbb II\{x \le z\}$ 是指示函数（当 $\le z$ 时值为1，否则取0）。 $C R P S$ 是一个合适的评分函数，因此，当预测分布F和数据分布相同时， $C R P S$ 达到最小值。利用 $F$ 的经验函数 $C D F$ ，例如将
$\hat F(z)=\frac 1 n \sum_{i=1}^n \Bbb I(X_i \le z) \quad 其中n个样本X_i \sim F$
作为预测CDF的自然近似，在每个时间点可以从条件分布的模拟样本中直接计算出CRPS（Jordan等人，2019）（4）。在实践中，我们以100个样本来估算经验CDF。 $CRPS_sum$ 是D个时间序列的和，真实数据和样本数据均如此（就是生成每个时间点的 $\hat F_{sum}(t)$ ）。在预测时间窗口中结果取均值，一般地
$CRPS_{sum}=E_t[CRPS(\hat F_{sum}(t),{\sum}_ix_t^i)]$
模型使用每个数据集的训练数据片训练，对于测试，从训练数据集中最后一个点开始的滚动窗口预测，并将其与测试集进行比较。

表-1.来自alinas等人的模型（2019a）和我们的模型GRU-Real-NVP，GRU-MAF和Transformer-MAF测试集中的比较（越低越好）。两种最佳方式以粗体显示，其中的值均是相应方式运行3次的平均值和标准误差。

表-2. 实验数据集属性

我们在Exchange（Lai等人，2018），Solar（Laiet等人，2018），Electricity2，Traffic3，Taxi4和Wikipedia5开放数据集上进行训练，完全按照Salinas等人的方法进行处理。
（2019a），其属性在表2中列出。Taxi和Wikipedia都由计数数据组成，因此在被馈送到流之前已被量化（并按均值缩放）。

训练参数如下：

batch_size=32

batch_count_per_epoch=100

max_epoch=40

learning_rate=1e-3

这些LSTM/GRU的超参数来自Salinas等人（2019a），nomalizing flow双射的栈数K=3或K=5。验证评估采样次数为100。转换器采用如下参数

H=8

encoding_layer_num=3

decoding_layer_num=3

dropout_rate=0.1

没有对其他的超参数进行调参。所有的实验均是使用单个节点的Nvidia V-100GPU进行的，在审查通过之后，将提供用于重现结果的代码。

我们比较了使用GRU和两种不同规范化流的方法（分别基于Real NVP和MAF的GRU-Real-NVP和GRU-MAF）以及具有MAF的Transformer模型（Transformer-MAF），以及基于RNN的不同方法和Salinas等人（2019a）的变换方案并在表1中报告了结果。Vec-LSTM-ind-scaling通过均值换算输出独立正态分布的参数，Vec-LSTM-lowrank-Copula通过Copula过程参数化了低秩对角协方差矩阵。GP缩放在重建联合分布之前先对每个时间序列进行缩放，然后再对LSTM进行展开，同样，GP-Copula在每个时间序列上对LSTM进行展开，然后通过低秩加对角协方差高斯copula给出联合发散分布。

在表1中，我们观察到具有RNN或时态条件注意机制的MAF在所有数据集上的 $CRPS_{sum}$ 都达到了目前最先进的水平（据我们所知）。此外，与表1的前四列中列出的最新技术水平相比具有RNN的双向流也表现更好。在补充材料中进一步给出了其他评价指标（例如MSE）的分析。

图-6.模型的依赖结构预测分析。左：根据Traffic测试数据集数据片真实值计算的互协方差矩阵。中间：互协方差矩阵是根据Transformer-MAF模型预测值的100个样本轨迹的平均值计算出来的。右图：两个矩阵的绝对差主要显示了真实值和预测值之间的小偏差。

为了评估我们模型的预测性能，我们在图6中绘制了观测值的互协方差矩阵（左图）以及绘制的100个在Traffic测试数据集数据片上Transformer-MAF模型预测值样本轨迹的平均值（中间图）。图中最右边的图说明了两个互协方差矩阵之间的绝对差。可以看出，大多数协方差结构，尤其是高度相关传感器的左上角区域，从模型中提取的样本中都很好地反映了。

6. 结论

我们提出了一种针对高维的基于概率的多变量时间序列的通用建模方法。这种方法核心是将自回归模型（比如RNN或者注意力机制模型）和条件正则化流相结合。自回归的模型在时间序列预测方面一直有很好的声誉。另一方面，流模型不事先假定先验分布的类型，而是可以适应各种高维数据分布。该组合将自回归类模型的预测能力与流模型的概率密度估计的灵活性相结合。由于不需要进行近似值（协方差结构的低秩近似）重排序，因此效率更高。在没有进行很多超参数调参的情况下，本模型在6个基准数据集上拥有目前国际上最好的表现。

容易想到的一个改进我们这个模型的方法是找到一个更好的潜在流模型。例如，表1显示将Real NVP流与MAF交换可以改善性能，与MAF相比，Real NVP序列模型概率密度建模性能不佳。同样，我们希望其他人设计可供选择的流模型来改善当前方法的性能，例如更改反量化方法，特定仿射耦合层或其他更有效的方法，例如通过另一种Transformer。流模型最新的进展（例如Flow ++（Ho等人2019）所述，以获得表达性二分流模型或处理离散分类数据的模型（Tran等人2019）），我们以后再做可用性的研究。据我们所知，如何通过流对离散的序列数据建模仍然是一个悬而未决的问题-这将最好地体现某些数据集（例如销售数据）的性质。

另外，我们希望改进时间演化模块以改善预测。例如，最近对Transform的改进Reformer（Kitaev等，2020）可以提高存储效率。我们将这些改进留给以后的研究。

最后，现实世界中的应用可能需要训练大量交互时间序列D，例如在电子商务的销售建模中，其中D可以达到数百万或更多。流模型已成功应用于图像建模，这可与这种设置中面临的瞬时维数相提并论，但是对于大时间序列而言，内存需求变得不可行。在以后的工作中，我们将研究可扩展的时间序列模型训练的机制，例如通过对时间序列进行二次采样。

你可能感兴趣的:(深度学习,时序预测,深度学习,机器学习)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
(179)时序收敛---＞(29)时序收敛二九 FPGA系统设计指南针 FPGA系统设计(内训)fpga开发时序收敛
1目录（a）FPGA简介（b）Verilog简介（c）时钟简介（d）时序收敛二九（e）结束1FPGA简介（a）FPGA（FieldProgrammableGateArray）是在PAL（可编程阵列逻辑）、GAL（通用阵列逻辑）等可编程器件的基础上进一步发展的产物。它是作为专用集成电路（ASIC）领域中的一种半定制电路而出现的，既解决了定制电路的不足，又克服了原有可编程器件门电路数有限的缺点。（b）
(180)时序收敛---＞(30)时序收敛三十 FPGA系统设计指南针 FPGA系统设计(内训)fpga开发时序收敛
1目录（a）FPGA简介（b）Verilog简介（c）时钟简介（d）时序收敛三十（e）结束1FPGA简介（a）FPGA（FieldProgrammableGateArray）是在PAL（可编程阵列逻辑）、GAL（通用阵列逻辑）等可编程器件的基础上进一步发展的产物。它是作为专用集成电路（ASIC）领域中的一种半定制电路而出现的，既解决了定制电路的不足，又克服了原有可编程器件门电路数有限的缺点。（b）
(158)时序收敛---＞(08)时序收敛八 FPGA系统设计指南针 FPGA系统设计(内训)fpga开发时序收敛
1目录（a）FPGA简介（b）Verilog简介（c）时钟简介（d）时序收敛八（e）结束1FPGA简介（a）FPGA（FieldProgrammableGateArray）是在PAL（可编程阵列逻辑）、GAL（通用阵列逻辑）等可编程器件的基础上进一步发展的产物。它是作为专用集成电路（ASIC）领域中的一种半定制电路而出现的，既解决了定制电路的不足，又克服了原有可编程器件门电路数有限的缺点。（b）F
(159)时序收敛---＞(09)时序收敛九 FPGA系统设计指南针 FPGA系统设计(内训)fpga开发时序收敛
1目录（a）FPGA简介（b）Verilog简介（c）时钟简介（d）时序收敛九（e）结束1FPGA简介（a）FPGA（FieldProgrammableGateArray）是在PAL（可编程阵列逻辑）、GAL（通用阵列逻辑）等可编程器件的基础上进一步发展的产物。它是作为专用集成电路（ASIC）领域中的一种半定制电路而出现的，既解决了定制电路的不足，又克服了原有可编程器件门电路数有限的缺点。（b）F
(160)时序收敛---＞(10)时序收敛十 FPGA系统设计指南针 FPGA系统设计(内训)fpga开发时序收敛
1目录（a）FPGA简介（b）Verilog简介（c）时钟简介（d）时序收敛十（e）结束1FPGA简介（a）FPGA（FieldProgrammableGateArray）是在PAL（可编程阵列逻辑）、GAL（通用阵列逻辑）等可编程器件的基础上进一步发展的产物。它是作为专用集成电路（ASIC）领域中的一种半定制电路而出现的，既解决了定制电路的不足，又克服了原有可编程器件门电路数有限的缺点。（b）F
(153)时序收敛---＞(03)时序收敛三 FPGA系统设计指南针 FPGA系统设计(内训)fpga开发时序收敛
1目录（a）FPGA简介（b）Verilog简介（c）时钟简介（d）时序收敛三（e）结束1FPGA简介（a）FPGA（FieldProgrammableGateArray）是在PAL（可编程阵列逻辑）、GAL（通用阵列逻辑）等可编程器件的基础上进一步发展的产物。它是作为专用集成电路（ASIC）领域中的一种半定制电路而出现的，既解决了定制电路的不足，又克服了原有可编程器件门电路数有限的缺点。（b）F
(182)时序收敛---＞(32)时序收敛三二 FPGA系统设计指南针 FPGA系统设计(内训)fpga开发时序收敛
1目录（a）FPGA简介（b）Verilog简介（c）时钟简介（d）时序收敛三二（e）结束1FPGA简介（a）FPGA（FieldProgrammableGateArray）是在PAL（可编程阵列逻辑）、GAL（通用阵列逻辑）等可编程器件的基础上进一步发展的产物。它是作为专用集成电路（ASIC）领域中的一种半定制电路而出现的，既解决了定制电路的不足，又克服了原有可编程器件门电路数有限的缺点。（b）
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
Python实现关联规则推荐这孩子谁懂哈 Python Machine Learning python 关联规则机器学习
1.什么关联规则关联规则（AssociationRules）是反映一个事物与其他事物之间的相互依存性和关联性，如果两个或多个事物之间存在一定的关联关系，那么，其中一个事物就能通过其他事物预测到。关联规则是数据挖掘的一个重要技术，用于从大量数据中挖掘出有价值的数据项之间的相关关系。关联规则挖掘的最经典的例子就是沃尔玛的啤酒与尿布的故事，通过对超市购物篮数据进行分析，即顾客放入购物篮中不同商品之间的关
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
从门氏元素周期表看三皇五帝在关中论霜叶红似二月花y
世间所有物质，都是由不同元素组成的，科学家们”认识物质初期，所有元素也是多年逐一认识的。著名的俄罗斯化学家门捷列耶夫(DmitriMendeleev1834－1907)，在1869年首创的元素周期表，想必大家都很熟悉。他是怎么发现元素周期规律并制成表的？最权威的说法是他自己笔记中所记载的，是他做梦所得。门氏元素周期表这个表开始并不完善，但已经有个雏形了。当时只有已知的63种元素。但门氏预测应该有1
3.1 损失函数和优化：损失函数做只小考拉
用一个函数把W当做输入，然后看一下得分，定量地估计W的好坏，这个函数被称为“损失函数”。损失函数用于度量W的好坏。有了损失函数的概念后，就可以定量的衡量W到底是好还是坏，要找到一种有效的方法来从W的可行域里，找到W取何值时情况最不坏，，这个过程将会是一个优化过程。损失函数L_i定义：通过函数f给出预测的分数和真实的目标（或者说是标签y），可以定量的描述训练样本预测的好不好，最终的损失函数是在整个数
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l