Doooo19

【时间序列论文】使用深度学习进行时间序列预测：一项调查

使用深度学习进行时间序列预测：一项调查

已经开发了许多深度学习架构来适应跨不同领域的时间序列数据集的多样性。在本文中，我们调查了单步和多水平时间序列预测中使用的常见编码器和解码器设计——描述了每个模型如何将时间信息纳入预测。接下来，我们重点介绍混合深度学习模型的最新发展，该模型将经过充分研究的统计模型与神经网络组件相结合，以改进任一类别的纯方法。最后，我们概述了深度学习还可以通过时间序列数据促进决策支持的一些方式。

1.简介

时间序列建模历来是学术研究的一个关键领域——形成了气候建模 [1]、生物科学 [2] 和医学 [3] 等主题应用的一个组成部分，以及商业决策制定零售 [4] 和金融 [5] 等等。虽然传统方法侧重于由领域专业知识提供信息的参数模型，例如自回归 (AR) [6]、指数平滑 [7、8] 或结构时间序列模型 [9]，但现代机器学习方法提供了一种学习时间动态的方法以纯粹的数据驱动方式 [10]。随着近年来数据可用性和计算能力的提高，机器学习已成为下一代时间序列预测模型的重要组成部分。受图像分类 [11]、自然语言处理 [12] 和强化学习 [13] 方面的显着成就的启发，深度学习近年来尤其受到欢迎。通过结合反映底层数据集细微差别的定制架构假设（或归纳偏差 [14]），深度神经网络能够学习复杂的数据表示 [15]，从而减轻了对手动特征工程和模型设计的需求。开源反向传播框架 [16、17] 的可用性也简化了网络训练，允许对网络组件和损失函数进行自定义。

鉴于跨各个领域的时间序列问题的多样性，出现了许多神经网络设计选择。在本文中，我们总结了使用深度神经网络进行时间序列预测的常用方法。首先，我们描述了可用于常见预测问题的最先进技术——例如多水平预测和不确定性估计。其次，我们分析了混合模型新趋势的出现，它将特定领域的定量模型与深度学习组件相结合，以提高预测性能。接下来，我们概述了神经网络可用于促进决策支持的两种关键方法，特别是通过可解释性和反事实预测中的方法。最后，我们总结了深度学习在时间序列预测方面的一些有前途的未来研究方向——特别是连续时间和层次模型的形式。虽然我们努力全面概述深度学习中的现代方法，但我们注意到我们的调查绝不是包罗万象的。事实上，关于时间序列预测的自动化方法存在丰富的文献——包括自动参数模型选择 [18]，以及传统的机器学习方法，如内核回归 [19] 和支持向量回归 [20]。此外，高斯过程 [21] 已广泛用于时间序列预测——最近的扩展包括深度高斯过程 [22]，以及通过神经过程进行深度学习的并行处理 [23]。此外，如 [24] 和 [25] 中所示，历史上曾在时间序列应用程序中使用过旧的神经网络模型。

2. 时间序列预测的深度学习架构

时间序列预测模型预测给定实体 i 在时间 t 的目标 $y_{i,t}$ 的未来值。每个实体代表时间信息的逻辑分组——例如气候学中各个气象站的测量值，或医学中不同患者的生命体征——并且可以同时观察。在最简单的情况下，超前一步预测模型采用以下形式：
$\hat y_{i,t+1}=f(y_{i,t-k:t},x_{i,t-k:t},s_i)\\ 其中 \hat y_{i,t+1}是模型预测，\\ y_{i,t-k:t}=\{y_{i,t-k},...,u_{i,t}\},x_{i,t-k:t}=\{x_{i,t-k},...,x_{i,t}\} \\分别是在回溯窗口 k 上对目标和外源输入的观察，\\ s_i 是与实体相关联的静态元数据（例如传感器位置），\\ f(:) 是模型学习的预测函数。\\虽然我们在本次调查中关注单变量预测（即一维目标），\\但我们注意到相同的组件可以扩展到多变量模型而不失一般性 [26、27、28、29、30]。\\为了符号简单起见，除非明确要求，否则我们在后续部分中省略了实体索引 i。$

(a) 基本构建块

深度神经网络通过使用一系列非线性层来构建中间特征表示来学习预测关系 [15]。在时间序列设置中，这可以看作是将相关历史信息编码到潜在变量 $z_t$ 中，最终预测仅使用 $z_t$ 产生：

$f(y_{t-kLt},x_{t-k:t},s)=g_{dec}(z_t) \\ z_t=g_{enc}(y_{t-kLt},x_{t-k:t},s) \\ 其中 genc(:)、gdec(:) 分别是编码器和解码器函数，\\ 并且回想一下方程式 (2.1) 中的下标 i 已被删除以简化符号（例如 y_{i,t} 替换为 y_t）。\\ 因此，这些编码器和解码器构成了深度学习架构的基本构建块，网络的选择决定了我们的模型可以学习的关系类型。\\ 在本节中，我们将研究编码器的现代设计选择（如图 1 所示），以及它们与传统时间模型的关系。\\ 此外，我们探索了时间序列预测应用程序中使用的常见网络输出和损失函数。$

(i) 卷积神经网络

传统上为图像数据集设计的卷积神经网络 (CNN) 提取在空间维度上不变的局部关系 [11, 31]。为了使 CNN 适应时间序列数据集，研究人员利用多层因果卷积 [32、33、34]——即旨在确保仅将过去的信息用于预测的卷积滤波器。对于隐藏层 l 的中间特征，每个因果卷积滤波器采用以下形式：
$h_t^{l+1}=A((W*h)(l,t))\\ (W*h)(l,t)=\sum_{τ=0}^kW(l,τ)h_{t-τ}^l\\ 其中h_t^{l}\in R^{H_in} 为t时刻l层的中间状态，为卷积算子，W(l,τ)\in R^{H_{out}*H_{in}}为l层的固定滤波器权重\\ ，A(:)为激活函数，如一个 sigmoid 函数，表示任何特定于体系结构的非线性处理。\\ 对于总共使用 L 个卷积层的 CNN，我们注意到编码器输出为 z_t =h^L_t。\\$
考虑到一维情况，我们可以看出等式 (2.5) 与数字信号处理中的有限脉冲响应 (FIR) 滤波器非常相似 [35]。\
这对 CNN 学习的时间关系产生了两个关键影响。首先，根据标准 CNN 的空间不变性假设，时态 CNN 假设关系是时不变的——在每个时间步和所有时间使用相同的滤波器权重集。此外，CNN 只能使用其定义的回溯窗口或感受野内的输入来进行预测。因此，需要仔细调整感受野大小 k 以确保模型可以利用所有相关的历史信息。值得注意的是，具有线性激活函数的单个因果 CNN 层相当于一个自回归 (AR) 模型。

扩张卷积

使用标准卷积层在长期依赖性显着的情况下在计算上可能具有挑战性，因为参数的数量直接与感受野的大小成比例。为了缓解这种情况，现代架构经常使用扩张的卷积层 [32, 33]，它扩展了等式 (2.5) 如下：
$(W*h)(l,t,d_l) = \sum_{τ=0}^{[k/d_l]}W(l,τ)h_{t-d_{lτ}}^l \\ 其中 [·] 是 floor 算子，d_l 是特定于层的扩张率。\\ 因此，空洞卷积可以解释为下层特征的下采样版本的卷积——降低分辨率以合并来自遥远过去的信息。\\ 因此，通过增加每一层的扩张率，扩张卷积可以逐渐聚合不同时间块的信息，从而允许以有效的方式使用更多历史。\\ 例如，使用 [32] 的 WaveNet 架构，扩张率以 2 的幂增加，\\ 相邻时间块聚集在每一层中——允许在第 l 层使用 2^l 个时间步长，如图 1a 所示。$

(ii) 递归神经网络

递归神经网络 (RNN) 历来被用于序列建模 [31]，在各种自然语言处理任务中取得了很好的效果 [36]。考虑到时间序列数据作为输入和目标序列的自然解释，许多基于 RNN 的架构已被开发用于时间预测应用程序 [37、38、39、40]。在其核心，RNN 单元包含一个内部记忆状态，它充当过去信息的紧凑摘要。如图 1b 所示，在每个时间步用新观察值递归更新内存状态，即：
$z_t = v(z_{t-1},y_t,x_t,s)\\ 其中z_t\in R^H这里是RNN的隐藏内部状态，v(·)是学习到的记忆更新函数。\\ 例如，Elman RNN [41]，最简单的 RNN 变体之一，将采用以下形式：$

$y_{t+1}=γ_y(W_yz_t+b_y)\\ z_t = γ_z(W_{z_1}z_{t-1}+W_{z_2}y_t+W_{z_3}x_t+W_{z_4}s+b_z)\\ 其中 W; b分别是网络的线性权重和偏置，γ_y(·)； γ_z(·) 是网络激活函数。\\ 请注意，RNN 不需要像 CNN 案例那样明确指定回溯窗口。\\ 从信号处理的角度来看，主要的循环层——即方程 (2.9)——因此类似于无限脉冲响应 (IIR) 滤波器的非线性版本$

长期短期记忆

由于无限的回溯窗口，RNN 的旧变体在学习数据中的长期依赖性方面可能会受到限制 [42、43] – 由于梯度爆炸和消失的问题 [31]。直观上，这可以看作是记忆状态中的一种共振形式。因此开发了长短期记忆网络 (LSTM) [44] 来解决这些限制，方法是改进网络内的梯度流。这是通过使用存储长期信息的单元状态 ct 实现的，通过以下一系列门进行调制：
$\ gate: i_t = \sigma(W_{i_1}z_{t-1}+W_{i_2}y_t+W_{i_3}x_t+W_{i_4}s+b_i)\\ Output\ gate:o_t = \sigma(W_{o_1}z_{t-1}+W_{o_2}y_t+W_{o_3}x_t+W_{o_4}s+b_o)\\ Forget \ gate:f_t = \sigma(W_{f_1}z_{t-1}+W_{f_2}y_t+W_{f_3}x_t+W_{f_4}s+b_f)\\ 其中 z_{t-1} 是 LSTM 的隐藏状态，\sigma(·) 是 sigmoid 激活函数。门修改 LSTM 的隐藏状态和单元状态，如下所示：$

$Hidden\ state: z_t = o_t·tanh(c_t)\\ Cell \ stateL c_t = f_t·c_{t-1}+ i_t·tanh(\sigma(W_{c_1}z_{t-1}+W_{c_2}y_t+W_{c_3}x_t+W_{c_4}s+b_c))\\ 其中·是逐元素 (Hadamard) 乘积，tanh(d·) 是 tanh 激活函数。$

与贝叶斯过滤的关系

正如 [39] 中所检查的那样，贝叶斯过滤器 [45] 和 RNN 在维护随时间递归更新的隐藏状态方面都很相似。对于贝叶斯滤波器，例如卡尔曼滤波器 [46]，推理是通\过更新潜在状态的充分统计信息来执行的——使用一系列状态转换和纠错步骤。由于贝叶斯过滤步骤使用确定性方程来修改足够的统计数据，因此 RNN 可以看作是两个步骤的同时逼近——记忆向量包含预测所需的所有相关信息

(iii) 注意力机制

注意力机制 [47, 48] 的发展也导致了长期依赖学习的改进——Transformer 架构在多种自然语言处理应用程序中实现了最先进的性能 [12, 49, 50]。注意层使用动态生成的权重聚合时间特征（参见图 1c），使网络能够直接关注过去的重要时间步长——即使它们在回溯窗口中非常遥远。从概念上讲，注意力是一种基于给定查询 [51] 的键值查找机制，采用以下形式：
$h_t = \sum_{τ=0}^k \alpha(k_t,q_τ)v_{t-τ}\\ 其中键 k_t、查询 q_τ 和值 v_{t-τ} 是网络较低层在不同时间步生成的中间特征。\\ 此外，\alpha(k_t,q_τ)\in [0; 1] 是在时间 t 生成的 t-τ 的注意权重，h_t 是注意层的上下文向量输出。\\ 请注意，根据 CNN 的情况，多个注意力层也可以一起使用，最后一层的输出形成编码的潜在变量 z_t。$

$\alpha(t)=softmax(\eta_t)\\ \eta_t = W_{\eta_1}tanh(W_{\eta2}k_{t-1}+W_{\eta3}q_τ+b_\eta)\\ 其中\alpha(t)=[\alpha(t,0),...\alpha(t,k)] 是注意力权重的向量，\\ k_{t-1},q_t是用于特征提取的 LSTM 编码器的输出，softmax(:) 是 softmax 激活函数。$

最近，[53、54] 中也考虑了 Transformer 架构，它将标量点积自注意力 [49] 应用于回溯窗口中提取的特征。从时间序列建模的角度来看，注意力提供了两个主要好处。首先，具有注意力的网络能够直接关注发生的任何重大事件。例如，在零售预测应用程序中，这包括可能对销售产生积极影响的假期或促销期。其次，如 [54] 所示，基于注意力的网络还可以通过为每个状态使用不同的注意力权重模式来学习特定于状态的时间动

(iv) 输出和损失函数

鉴于神经网络的灵活性，深度神经网络已被用于对离散 [55] 和连续 [37、56] 目标进行建模——通过定制神经网络的解码器和输出层以匹配所需的目标类型。在一步预测问题中，这可以简单到将编码器输出的线性变换（即等式（2.2））与目标的适当输出激活结合起来。无论目标的形式如何，预测都可以进一步分为两个不同的类别——点估计和概率预测。

点估计

一种常见的预测方法是确定未来目标的预期值。这基本上涉及将问题重新表述为离散输出的分类任务（例如预测未来事件）和连续输出的回归任务——使用上述编码器。对于二进制分类情况，解码器的最后一层具有一个带有 S 形激活函数的线性层——允许网络预测事件在给定时间步发生的概率。对于二进制和连续目标的一步预测，网络分别使用二进制交叉熵和均方误差损失函数进行训练：
$L_{classification} = -\frac{1}{T}\sum_{t=1}^Ty_tlof(\hat y_t)+(1-y_t)log(1-\hat y_t)\\ L_{regression} =\frac{1}{T}\sum_{t=1}^T(y_t-\hat y_t)^2\\$
虽然上述损失函数在应用程序中最常见，但我们注意到神经网络的灵活性也允许采用更复杂的损失——例如分位数回归 [56] 和多项分类 [32] 的损失。

概率输出

虽然点估计对于预测目标的未来价值至关重要，但了解模型预测的不确定性对于不同领域的决策者可能很有用。例如，当预测的不确定性很大时，模型用户在将预测纳入决策时可以更加谨慎，或者依赖其他信息来源。在某些应用程序中，例如金融风险管理，获得完整的预测分布将使决策者能够在出现罕见事件时优化他们的行动——例如，允许风险管理者使投资组合免受市场崩溃的影响。对不确定性建模的一种常见方法是使用深度神经网络生成已知分布的参数 [27、37、38]。例如，高斯分布通常用于预测具有连续目标的问题，网络在每个步骤输出预测分布的均值和方差参数，如下所示
$y_{t+τ} ~ N(\mu(t,τ),\zeta(t,τ)^2)\\ \mu(t,τ) = W_\mu h_t^L+b_\mu\\ \zeta(t,τ)=softplus(W_{\sum} h_t^L+b_{\sum})\\ 其中 h^L_t 是网络的最后一层，softplus(:) 是 softplus 激活函数，以确保标准差只取正值。$

(b) 多水平预测模型

在许多应用中，访问未来多个点的预测估计通常是有益的——允许决策者可视化未来水平的趋势，并优化他们在整个路径上的行动。从统计的角度来看，多水平预测可以看作是对一步预测问题（即方程（2.1））的轻微修改，如下所示：
$\hat y_{t+τ} = f(y_{t-k:t},x_{t-k:t},u_{t-k:t+τ},s,τ)\\ 其中τ\in \{1,...,τ_{max}\} 是一个离散的预测范围，u_t 是整个范围内已知的未来输入（例如日期信息，例如星期几或月份），\\ x_t 是只能在历史上观察到的输入。\\ 与传统的计量经济学方法 [57、58] 一致，用于多层次预测的深度学习架构可以分为迭代法和直接法——如图 2 所示，并在下面详细描述。$

(i) 迭代方法

多水平预测的迭代方法通常利用自回归深度学习架构 [37、39、40、53]——通过将目标样本递归地馈送到未来的时间步长来产生多水平预测（见图 2a） ).通过重复生成多个轨迹的过程，然后使用每个步骤中目标值的抽样分布生成预测。例如，可以使用蒙特卡洛估计

$\hat y_{t+τ}=\sum_{j=1}^J \frac{\bar y_{t+τ}^{(j)}}{J} 其中,$ 获得预测均值，其中 $\bar y_{t+τ}^{(j)}$ 是基于方程 (2.20) 的模型获取的样本。由于自回归模型的训练方式与前一步预测模型完全相同

图 2：多水平预测模型的主要类型。用于区分模型权重的颜色——迭代模型在整个范围内使用通用模型，直接方法采用序列到序列的方法。

（即通过时间反向传播），因此迭代方法可以轻松地将标准模型推广到多步预测。然而，由于在每个时间步都会产生少量误差，迭代方法的递归结构可能会导致在更长的预测范围内产生大量误差累积。此外，迭代方法假设除了目标之外的所有输入在运行时都是已知的——只需要将目标样本输入到未来的时间步长中。在存在观察到的输入的许多实际场景中，这可能是一个限制，激发了对更灵活方法的需求。

(ii) 直接方法

直接方法通过使用所有可用输入直接生成预测来减轻迭代方法的问题。他们通常使用序列到序列架构 [52、54、56]，使用编码器总结过去的信息（即目标、观察到的输入和先验已知输入），并使用解码器将它们与已知的未来输入结合起来——如图 2b 所示。如 [59] 中所述，替代方法是使用更简单的模型直接生成与所需预测范围匹配的固定长度向量。然而，这确实需要指定最大预测范围（即最大值），并且仅在预定义的离散间隔内进行预测。

3. 将领域知识与混合模型相结合

尽管它很受欢迎，但机器学习在时间序列预测中的功效历来受到质疑——正如 M-competitions [60] 等预测竞赛所证明的那样。在 2018 年的 M4 竞赛 [61] 之前，普遍的看法是复杂的方法不会产生更准确的预测，而带有集成的简单模型往往会做得更好 [59、62、63]。已经确定了两个关键原因来解释机器学习方法的性能不佳。首先，机器学习方法的灵活性可能是一把双刃剑——使它们容易过度拟合 [59]。因此，更简单的模型可能在低数据条件下表现更好，这在预测具有少量历史观察的问题（例如季度宏观经济预测）中尤为常见。其次，与统计模型的平稳性要求类似，机器学习模型可以对输入的预处理方式敏感 [26、37、59]，从而确保训练和测试时的数据分布相似。深度学习的最新趋势是开发混合模型来解决这些限制，在各种应用程序中展示了比纯统计或机器学习模型更高的性能 [38、64、65、66]。混合方法将经过充分研究的定量时间序列模型与深度学习相结合——使用深度神经网络在每个时间步生成模型参数。一方面，混合模型允许领域专家使用先验信息为神经网络训练提供信息——减少网络的假设空间并提高泛化能力。这对于小型数据集特别有用 [38]，其中深度学习模型过度拟合的风险更大。此外，混合模型允许分离固定和非固定组件，并避免自定义输入预处理的需要。这方面的一个例子是指数平滑 RNN (ES-RNN) [64]，它是 M4 竞赛的获胜者，它使用指数平滑来捕捉非平稳趋势并通过 RNN 学习额外的效果。通常，混合模型以两种方式利用深度神经网络：a) 为非概率参数模型 [64、65、67] 编码时变参数，以及 b) 生成概率模型使用的分布参数 [38， 40, 66]。

(a) 非概率混合模型

对于参数时间序列模型，预测方程通常是分析定义的，并为未来目标提供点预测。因此，非概率混合模型修改这些预测方程以结合统计和深度学习组件。例如，ES-RNN 利用 Holt-Winters 指数平滑模型 [8] 的更新方程——将乘法水平和季节性成分与深度学习输出相结合，如下所示：
$\hat y_{i,t+τ}=exp(W_{ES}h_{i,t+τ}^L+b_{ES})*L_{i,t}*y_{i,t+τ}\\ l_{i,t}=\frac{β_1^{(i)}y_{i,t}}{y_{i,t}}+(1-\beta _1^{(i)})l_{i,t-1}\\ γ_{i,t}=\frac{\beta_2^{(i)}}{l_{i,t}}+(1-β_2^{(i)}γ_{i,t-K}\\ 其中， h_{i,t+τ}^L 是第 τ 步预测网络的最后一层\\ l_{i,t} 是水平分量，γ_{i,t} 是周期为k的季节性分量，\\ 并且β_1^{(i)}, β_2^{(i)}是实体特定的静态系数。\\ 从上面的等式中，我们可以看到指数平滑分量 (l_{i,t},γ_{i,t}) 处理数据集中更广泛的（例如指数）趋势，减少了额外输入缩放的需要。$

(b) 概率混合模型

概率混合模型也可用于分布建模很重要的应用程序——利用概率生成模型进行时间动态，例如高斯过程 [40] 和线性状态空间模型 [38]。概率混合模型不是修改预测方程，而是使用神经网络在每个步骤中为预测分布生成参数。例如，深度状态空间模型 [38] 对线性状态空间模型的时变参数进行编码，如下所示——通过卡尔曼滤波方程 [46] 执行推理：
$\alpha(h_{i,t+τ}^L)^Tl_t+φ((h_{i,t+τ}^L)\epsilon_t\\ l_t = F((h_{i,t+τ}^L)l_{t-1}+q(h_{i,t+τ}^L)+\sum(h_{i,t+τ}^L)* \sum_t \\ 其中 l_t 是隐藏的潜在状态，a(·), F(·), q(·) 是h_{i,t+τ}^L的线性变换；\phi(·), \sum(·) 是具有 softmax 激活的线性变换，\\ \epsilon_t~N(0; 1) 是单变量残差，\sum_t~N(0; I) 是多元正态随机变量$

4. 使用深度神经网络促进决策支持

虽然模型构建者主要关心预测的准确性，但最终用户通常使用预测来指导他们未来的行动。例如，医生可以利用临床预测（例如疾病发作和死亡的概率）来帮助他们确定测试的优先顺序、制定诊断并确定治疗过程。因此，虽然时间序列预测是关键的初步步骤，但更好地理解时间动态和模型预测背后的动机可以帮助用户进一步优化他们的行动。在本节中，我们探索了神经网络扩展的两个方向，以促进时间序列数据的决策支持——重点是可解释性和因果推理的方法。

(a) 时间序列数据的可解释性

随着神经网络在任务关键型应用程序中的部署 [68]，人们越来越需要了解模型如何以及为何做出某种预测。此外，随着近来数据集的规模和复杂性不断增加，最终用户对其数据中存在的关系几乎没有先验知识。鉴于标准神经网络架构的黑盒性质，在解释深度学习模型的方法方面出现了新的研究机构。我们在下面提供了一个摘要——请读者参考专门的调查以进行更深入的分析 [69、70]。

事后可解释性技术开发事后可解释模型来解释经过训练的网络，并帮助识别重要特征或示例，而无需修改原始权重。方法主要可以分为两大类。首先，一种可能的方法是在神经网络的输入和输出之间应用更简单的可解释代理模型，并依靠近似模型来提供解释。例如，局部可解释模型不可知论解释 (LIME) [71] 通过将特定于实例的线性模型拟合到输入的扰动来识别相关特征，线性系数提供重要性的度量。 Shapley 加性解释 (SHAP) [72] 提供了另一种替代方法，它利用合作博弈论中的 Shapley 值来识别数据集中的重要特征。接下来，提出了基于梯度的方法，例如显着图 [73、74] 和影响函数 [75]，它们分析网络梯度以确定哪些输入特征对损失函数的影响最大。虽然事后可解释性方法可以帮助进行特征归因，但它们通常会忽略输入之间的任何顺序依赖性——这使得它们很难应用于复杂的时间序列数据集。

AttentionWeights 的固有可解释性另一种方法是直接设计具有可解释组件的体系结构，通常以战略性放置注意力层的形式出现。由于注意力权重是作为 softmax 层的输出产生的，因此权重总和被限制为 1，即 Pk =0 (t; ) = 1。对于时间序列模型，方程式 (2.15) 的输出因此也可以解释为使用注意力层在每一步提供的权重，对时间特征进行加权平均。然后可以使用注意力权重分析来了解每个时间步特征的相对重要性。在 [53、55、76] 中进行了实例可解释性研究，其中作者使用具体示例来说明 (t;) 的大小如何指示哪些时间点对预测最重要。通过分析注意力向量随时间的分布，[54] 还展示了如何使用注意力机制来识别数据集中的持久时间关系——例如季节性模式。

(b) 随着时间的推移反事实预测和因果推理

除了理解网络学习的关系外，深度学习还可以通过在其观察数据集之外产生预测或反事实预测来帮助促进决策支持。反事实预测对于场景分析应用程序特别有用——允许用户评估不同的动作集如何影响目标轨迹。这从历史角度（即确定如果发生一组不同的情况会发生什么）和从预测角度（即确定要采取哪些行动来优化未来结果）都是有用的。虽然存在大量深度学习方法用于估计静态设置中的因果效应 [77、78、79]，但时间序列数据集中的主要挑战是存在时间依赖性混杂效应。当可能影响目标的动作也以对目标的观察为条件时，这是由于循环依赖而产生的。如果不对时间相关的混杂因素进行任何调整，直接的估计技术可能会导致有偏差的结果，如 [80] 所示。最近，基于统计技术的扩展和新损失函数的设计，出现了几种在调整时间相关混杂的同时训练深度神经网络的方法。利用统计方法，[81] 扩展了治疗加权的逆概率（ IPTW）流行病学边缘结构模型的方法——使用一组网络来估计治疗应用概率，以及一个序列到序列模型来学习无偏预测。 [82] 中的另一种方法扩展了 G 计算框架，使用深度学习联合建模目标和动作的分布。此外，[83] 中提出了新的损失函数，它采用域对抗训练来学习患者病史的平衡表示。

5. 结论和未来方向

随着近年来数据可用性和计算能力的增长，深度神经网络架构在预测跨多个领域的问题方面取得了很大的成功。在本文中，我们调查了用于时间序列预测的主要架构——突出了神经网络设计中使用的关键构建块。我们研究了它们如何将时间信息结合到一步预测中，并描述了如何扩展它们以供使用在多层次预测中。此外，我们概述了混合深度学习模型的最新趋势，该模型结合了统计和深度学习组件，在任一类别中都优于纯方法。最后，我们总结了两种可以扩展深度学习以随着时间的推移改进决策支持的方法，重点放在可解释性和反事实预测方面的方法。尽管已经为时间序列预测开发了大量的深度学习模型，但仍然存在一些局限性。首先，深度神经网络通常需要以固定间隔离散化时间序列，这使得难以预测观察可能缺失或以随机间隔到达的数据集。虽然一些关于连续时间模型的初步研究已经通过神经常微分方程 [84] 完成，但还需要做更多的工作来将这项工作扩展到具有复杂输入（例如静态变量）的数据集，并将它们与现有模型进行基准测试。此外，如 [85] 中所述，时间序列通常具有层次结构，在轨迹之间进行逻辑分组——例如，在零售预测中，同一地区的产品销售可能会受到共同趋势的影响。因此，开发明确说明此类层次结构的架构可能是一个有趣的研究方向，并有可能提高现有单变量或多变量模型的预测性能

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
Reflection 70B——HyperWrite推出的大型语言模型新加坡内哥谈技术语言模型人工智能自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/在AI技术飞速发展的过程中，我们已经见证了可以写作、编程，甚至创造艺术的模型问世。但有一
5条实操干货有效打造你的个人品牌长安行动派
这是ZerK的第46篇原创相信大家对个人品牌这个词已经不在陌生。尤其是在知识付费的年代，你的个人品牌，就是你的标签！在《深度工作》中说到，在未来有三种人会越来越贵第一种人:能与机器对话，操纵机器的人。人工智能时代的到来，机器毕竟部分取代人类。第二种人:IP，知识产权或者文学潜在财产就像有些网上课程一周卖出的钱和一个机构卖一年一样多。价值99元的课程，10万人购买，是很常见的。爱产出大概就是10万✖
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的