smile-yan

《异常检测——从经典算法到深度学习》23 TimesNet: 用于常规时间序列分析的时间二维变化模型

zz# 《异常检测——从经典算法到深度学习》

0 概论
1 基于隔离森林的异常检测算法
2 基于LOF的异常检测算法
3 基于One-Class SVM的异常检测算法
4 基于高斯概率密度异常检测算法
5 Opprentice——异常检测经典算法最终篇
6 基于重构概率的 VAE 异常检测
7 基于条件VAE异常检测
8 Donut: 基于 VAE 的 Web 应用周期性 KPI 无监督异常检测
9 异常检测资料汇总（持续更新&抛砖引玉）
10 Bagel: 基于条件 VAE 的鲁棒无监督KPI异常检测
11 ADS: 针对大量出现的KPI流快速部署异常检测模型
12 Buzz: 对复杂 KPI 基于VAE对抗训练的非监督异常检测
13 MAD: 基于GANs的时间序列数据多元异常检测
14 对于流数据基于 RRCF 的异常检测
15 通过无监督和主动学习进行实用的白盒异常检测
16 基于VAE和LOF的无监督KPI异常检测算法
17 基于 VAE-LSTM 混合模型的时间异常检测
18 USAD：多元时间序列的无监督异常检测
19 OmniAnomaly：基于随机循环网络的多元时间序列鲁棒异常检测
20 HotSpot：多维特征 Additive KPI 的异常定位
21 Anomaly Transformer: 基于关联差异的时间序列异常检测
22 Kontrast: 通过自监督对比学习识别软件变更中的错误
23TimesNet: 用于常规时间序列分析的时间二维变化模型

23. TimesNet: 用于常规时间序列分析的时间二维变化模型

论文名称：TIMESNET: TEMPORAL 2D-VARIATION MODELING FOR GENERAL TIME SERIES ANALYSIS
论文发表于 International Conference on Learning Representations 2023
论文下载：openreview
源码地址：https://github.com/thuml/TimesNet

23.1 论文概述

这篇论文的主要内容是介绍了一种新的方法来处理时间序列分析中的复杂时间模式。该方法将一维时间序列转换为二维张量，以便更好地发现多个周期内和周期间的变化。作者提出的TimesNet with TimesBlock 是一种通用的时间序列分析骨干（Backbone）网络，可以用于多种分析任务。该论文还介绍了一些实验结果和性能比较，以证明该方法的有效性和优越性。

该论文提出的方法主要包括以下技术：

TimesBlock：可以将一维时间序列自适应地转换为一组二维张量，并通过一个参数高效的Inception块来捕获二维空间中的周期内和周期间变化的模块。TimesBlock的设计使得它可以自适应地发现多个周期内和周期间的变化，并且可以通过Inception块来捕获这些变化。
TimesNet：这是一种通用的时间序列分析骨干网络，可以用于多种分析任务。TimesNet使用了TimesBlock模块来处理时间序列，并利用现有的视觉骨干网络来进一步提高性能。TimesNet的设计使得它可以自适应地发现多个周期内和周期间的变化，并且可以通过Inception块来捕获这些变化。
多周期性：该论文提出了一种新的思路，即将时间序列转换为二维张量，以便更好地发现多个周期内和周期间的变化。这种方法可以更好地捕获时间序列中的复杂模式，并且可以用于多种分析任务。
实验结果和性能比较：该论文通过实验结果和性能比较证明了TimesNet的有效性和优越性。作者在五个主流的时间序列分析任务中进行了实验，包括短期和长期预测、填充、分类和异常检测。实验结果表明，TimesNet在这些任务中均取得了一致的最先进性能。

23.2 相关技术

该论文提出的方法主要包括以下技术：

在该论文的RELATED WORK模块中，作者介绍了一些与他们的工作相关的先前研究。这些研究主要涉及时间序列分析和深度学习领域的一些关键技术和方法。以下是一些相关的研究：

时间序列分析：该部分介绍了时间序列分析的一些基本概念和方法，包括时间序列的基本特征、时间序列分解、周期性分析、自回归模型、移动平均模型等。
卷积神经网络（CNN）：该部分介绍了CNN在时间序列分析中的应用。CNN可以通过卷积操作来捕获时间序列中的局部模式，并且可以通过池化操作来减少参数数量和计算量。
循环神经网络（RNN）：该部分介绍了RNN在时间序列分析中的应用。RNN可以通过循环连接来处理时间序列中的时序信息，并且可以通过长短时记忆（LSTM）单元来处理长期依赖关系。
注意力机制：该部分介绍了注意力机制在时间序列分析中的应用。注意力机制可以通过对时间序列中不同部分的加权来提高模型的性能，并且可以通过自注意力机制来处理时间序列中的长期依赖关系。
时空卷积神经网络（ST-CNN）：该部分介绍了ST-CNN在时间序列分析中的应用。ST-CNN可以通过卷积操作来捕获时间序列中的时空信息，并且可以通过池化操作来减少参数数量和计算量。

23.3 核心方法

23.3.1 论文结构梳理

Section	内容概述
1. INTRODUCTION	相关背景介绍以及对本论文的概述
2. RELATED WORK	相关技术介绍
3. TIMESNET	论文主题部分
4. EXPERIMENTS	实验部分
5. CONCLUSION AND FUTURE WORK	总结以及未来工作

读者应当重点关注第3部分，如果需要对论文复现的话考虑读一些第4部分。

请一定不要太在意论文的结果复现时与你本地测试的结果不一致的问题，因为导致结果有所差异的原因很多，我们不是审稿员，也没有必要太较真实验结果。主要还是理清楚核心过程。

23.3.2 INTRODUCTION

本文从多周期性这一新的维度对时间序列进行分析，以解决复杂的时间变化问题。首先，我们观察到现实世界的时间序列通常呈现多周期性，例如天气观测的日变化和年变化，电力消耗的周变化和季度变化。这些多个时期相互重叠和相互作用，使得变化建模变得棘手。其次，对于每个时段，我们发现每个时间点的变化不仅受其相邻区域的时间模式的影响，而且与其相邻时段的变化高度相关。为了清楚起见，我们将这两种时间变化分别命名为期内变化和期间变化。前者表示一个时期内的短期时间模式。后者可以反映连续不同时期的长期趋势。注意，对于没有明确周期性的时间序列，变化将由周期内变化主导，并且等价于具有无限周期长度的时间序列。

由于不同的周期会导致不同的周期内和周期间的变化，多周期性可以自然地衍生出一个模块化的架构，用于时间变化建模，在那里我们可以捕获由某个特定的周期在一个模块中产生的变化。此外，这种设计使复杂的时间模式被解开，有利于时间变化建模。然而，值得注意的是，一维时间序列很难同时明确地呈现两种不同类型的变化。为了解决这个障碍，我们扩展到二维空间的时间变化的分析。具体来说，如图1所示，我们可以将一维时间序列重塑为二维张量，其中每列包含一个周期内的时间点，每行包含不同周期中同一阶段的时间点。因此，通过将一维时间序列变换为二维张量，可以突破一维空间的表征能力瓶颈，成功地将二维空间的周期内和周期间变化统一起来，得到时间二维变化。

在技术上，基于上述动机，我们超越了以前的骨干，提出了TimesNet作为一个新的任务通用模型的时间序列分析。通过TimesBlock的授权，TimesNet可以发现时间序列的多周期性，并在模块化架构中捕获相应的时间变化。具体来说，TimesBlock可以根据学习的周期自适应地将一维时间序列转换为一组二维张量，并通过参数高效的初始块进一步捕获二维空间中的周期内和周期间变化。在实验中，TimesNet在五个主流分析任务中实现了一致的最先进水平，包括短期和长期预测，插补，分类和异常检测。我们的贡献可归纳为三个方面：

基于多周期性和周期内、周期间复杂的相互作用，本文提出了一种时间变化建模的模块化方法。通过将一维时间序列转换到二维空间，我们可以同时呈现期内和期间的变化。
我们提出了TimesNet与TimesBlock发现多个周期和捕获时间的二维变化从变换的二维张量的参数有效的起始块。
作为一个通用的任务基础模型，TimesNet在五个主流的时间序列分析任务中达到了一致的先进水平。包括详细和有见地的可视化。

23.3.3 模型结构 1 —— 将一维变分变换为二维变分

如图1所示，每个时间点同时涉及两种类型的时间变化，即与其相邻区域的时间变化和不同时期之间的相同相位的时间变化，即期内变化和期间变化。然而，这种原始的时间序列的一维结构只能呈现相邻时间点之间的变化。为了解决这个问题，我们探索了时间变化的二维结构，它可以显式地呈现周期内和周期之间的变化，从而在表示能力方面具有更多优势，并有利于后续的表示学习。

具体地说，对于 $C$ 个长度为 $T$ 的时间序列记录变量（recorded variates），其原始一维组织形式为 $\mathbf{X}_\text{1D} \in \mathbb{R}^{T×C}$ 。为了表示周期间的变化，我们需要首先发现周期。从技术上讲，我们通过快速傅里叶变换（Fast Fourier Transform，FFT）在频域中分析时间序列如下：

$\mathbf{A}=\text{Avg}\left(\text{ Amp }\left(\text{ FFT}(\mathbf{X}_{\mathrm{lD}})\right)\right),\{f_1,\cdots,f_k\}=\text{ arg Topk }\left(\mathbf{A}\right),p_i=\left\lceil\frac{T}{f_i}\right\rceil,i\in\{1,\cdots,k\}.\tag{1}$

其中， $\text{FFT}(\cdot)$ 和 $\text{Amp}(\cdot)$ 表示FFT和幅度值的计算。 $\mathbf{A}\in \mathbb{R}^T$ 表示每个频率的计算振幅，这是从 $C$ 维平均 $\text{Avg}(\cdot)$ 。注意，第 $j$ 个值 $A_j$ 表示与周期长度对应的频率 $j$ 周期基函数的强度 $\lceil {\frac{T}{j}} \rceil$ 。考虑到频域的稀疏性和避免无意义的高频带来的噪声，我们只选择前 $k$ 个幅度值 $f_1,...,f_k$ 并获得最重要的频率 $\{\mathbf{A}_{f_1},....,\mathbf{A}_{f_k}\}$ ，其中 $k$ 是超参数。这些选择的频率也对应于 $k$ 个周期长度 ${p_i, ..., p_k\}$ 。由于频域的共轭性，我们只考虑 $\{1, ..., [\frac{T}{2}]\}$ 内的频率。我们将等式1总结如下：

$\mathbf{A},\{f_{1},\cdots,f_{k}\},\{p_{1},\cdots,p_{k}\}=\mathrm{Period}(\mathbf{X}_{1\text{D}} ) \tag{2}$

基于选定的频率 ${f_1, ..., f_k\}$ 和相应的周期长度 ${p_1, ..., p_k\}$ ，我们可以通过以下等式将一维时间序列 $\mathbf{X}_{1D} \in \mathbb{R}^{T\times C}$ 整形为多个二维张量：

$\mathbf{X}_{2 \mathrm{D}}^i=\operatorname{Reshape}_{p_i, f_i}\left(\operatorname{Padding}\left(\mathbf{X}_{1 \mathrm{D}}\right)\right), i \in\{1, \cdots, k\} \tag{3}$

其中 $\text{Padding}(\cdot)$ 是将时间序列沿着时间维度扩展零，以使其与 $\text{Reshape}_{p_i, f_i}$ $(\cdot)$ 兼容，其中 $p_i$ 和 $f_i$ 分别表示变换后的二维张量的行数和列数。注意， $\mathbf{X}^i_{\text{2D}} \in \mathbb{R}^{p_i \times f_i \times C}$ 表示基于频率 $f_i$ 的第 $i$ 个整型时间序列，其列和行分别表示相应周期长度 $p_i$ 下的周期内变化和周期间变化。最终，如图2 所示，基于所选择的频率和估计的周期，我们获得一组二维张量 $\mathbf{X}^1_{2D},...,\mathbf{X}^k_{2D}$ ，其指示由不同周期导出的 $k$ 个不同的时间二维张量。

同样值得注意的是，这种变换为变换后的2维张量带来了两种类型的局部，即相邻时间点（列，周期内变化）和相邻周期（行，周期间变化）之间的局部。因此，时间二维变换可以容易地由二维内核处理。

23.3.4 模型结构 2 —— TIMESBLOCK

如图3所示，我们以残差方式组织 TimesBlock。具体地说，对于长度为 $T$ 的一维输入时间序列 $\mathbf{X}_{\text{1D}} \in \mathbb{R}^{T \times C}$ ，我们首先通过嵌入层 $\mathbf{X}^0 _{\text{1D}} = \text{Embed}(\textbf{X}_{1\text{D}})$ 将原始输入投影到深度特征 $\mathbf{X}^0_{\text{1D}} \in \mathbb{R}^{T\times d}$ 模型中。对于 TimesNet 的第 $l$ 层，输入是 $\mathbf{X}^{l−1}_{\text{1D}} \in \mathbb{R}^{T\times d_{model}}$ ，该过程可以形式化为：

$\mathbf{X}_{1 \mathrm{D}}^l=\text { TimesBlock }\left(\mathbf{X}_{1 \mathrm{D}}^{l-1}\right)+\mathbf{X}_{1 \mathrm{D}}^{l-1} \tag{4}$

如图3所示，对于第 $L$ 个TimesBlock，整个过程包括两个连续的部分：捕获时间二维变化和自适应地聚合来自不同时期的表示。

捕获时间2D变化 类似于等式1，我们可以通过 $\text{Period}(\cdot)$ 估计深度特征 $\mathbf{X}^{l-1}_{\text{1D}}$ 的周期长度。基于估计的周期长度，我们可以将一维时间序列变换到二维空间，得到一组二维张量，从这组张量中我们可以得到二维空间的参数有效信息表示，并得到一组二维张量，从这组张量中我们可以方便地得到参数有效起始块的信息表示。该过程形式化如下：

$\begin{aligned} \mathbf{A}^{l-1},\left\{f_1, \cdots, f_k\right\},\left\{p_1, \cdots, p_k\right\} & =\operatorname{Period}\left(\mathbf{X}_{1 \mathrm{D}}^{l-1}\right) \\ \mathbf{X}_{2 \mathrm{D}}^{l, i} & =\operatorname{Reshape}_{p_i, f_i}\left(\operatorname{Padding}\left(\mathbf{X}_{1 \mathrm{D}}^{l-1}\right)\right), i \in\{1, \cdots, k\} \\ \widehat{\mathbf{X}}_{2 \mathrm{D}}^{l, i} & =\operatorname{Inception}\left(\mathbf{X}_{2 \mathrm{D}}^{l, i}\right), i \in\{1, \cdots, k\} \\ \widehat{\mathbf{X}}_{1 \mathrm{D}}^{l, i} & =\operatorname{Trunc}\left(\operatorname{Reshape}_{1,\left(p_i \times f_i\right)}\left(\widehat{\mathbf{X}}_{2 \mathrm{D}}^{l, i}\right)\right), i \in\{1, \cdots, k\}, \tag{5} \end{aligned}$

其中 $\mathbf{X}_{\text{2D}}^{l,i}\in\mathbb{R}^{p_i\times f_i \times d_{model}}$ 表示第 $i$ 个变换而得的二维向量。转换完成以后，我们通过参数有效的初始块将2D张量处理为初始 $\text{Inspection}(\cdot)$ ，该初始块涉及多维2D核（multi-scale 2D kernels），是最知名的视觉骨干之一。然后，我们将学习到的2D表示 $\widehat{\mathbf{X}}_{2 \mathrm{D}}^{l, i}$ 转换回一维空间 $\widehat{\mathbf{X}}_{1 \mathrm{D}}^{l, i} \in \mathbb{R}^{T \times d_{\text {model }}}$ 从而用于聚合，其中我们使用 $\text{Trunc}(\cdot)$ 将长度为 $(p_i \times f_i)$ 的填充序列截断为原始长度 $T$ 。

注意，得益于一维时间序列的转换，起始块中的2D核可以同时聚合多尺度周期内变化（列）和周期间变化（行），覆盖相邻时间点和相邻周期。此外，我们对不同的重构 2D 张量 $\left\{\mathbf{X}_{2 \mathrm{D}}^{l, 1}, \cdots, \mathbf{X}_{2 \mathrm{D}}^{l, k}\right\}$ 采用了共享的起始块来提高参数效率，这可以使模型大小对超参数k的选择保持不变。

自适应聚合 最后，我们需要为下一层融合 $k$ 个不同的 1D 表示 $\left\{\widehat{\mathbf{X}}_{1 \mathrm{D}}^{l, 1}, \cdots, \widehat{\mathbf{X}}_{1 \mathrm{D}}^{l, k}\right\}$ 。受自相关的启发，幅度 $A$ 可以反映所选择的频率和周期的相对重要性，从而对应于每个变换的2D张量的重要性。因此，我们基于振幅聚合1D表示：

$\begin{aligned} \widehat{\mathbf{A}}_{f_1}^{l-1}, \cdots, \widehat{\mathbf{A}}_{f_k}^{l-1} & =\operatorname{Softmax}\left(\mathbf{A}_{f_1}^{l-1}, \cdots, \mathbf{A}_{f_k}^{l-1}\right) \\ \mathbf{X}_{1 \mathrm{D}}^l & =\sum_{i=1}^k \widehat{\mathbf{A}}_{f_i}^{l-1} \times \widehat{\mathbf{X}}_{1 \mathrm{D}}^{l, i} \end{aligned} \tag{6}$

由于周期内和周期之间的变化已经涉及到多个高度结构化的2D张量，TimesBlock可以同时完全捕获多尺度时间2D变化。因此，TimesNet可以实现比直接从1D时间序列更有效的表示学习。

2D视觉主干的通用性 受益于1D时间序列到时间2D变化的转换，我们可以选择各种计算机视觉骨干来代替表示学习的初始块，例如广泛使用的 ResNet 和ResNeXt，先进的 ConvNeXt 和基于注意力的模型。因此，我们的时间二维变化设计也将一维时间序列与蓬勃发展的二维视觉骨干连接起来，使时间序列分析能够利用计算机视觉社区的发展。一般来说，用于表示学习的更强大的2D主干将带来更好的性能。考虑到性能和效率（图4右），我们基于参数高效的初始块进行主要实验，如公式5所示。

23.4 论文实验

特此声明：如果不打算基于这篇论文的源码开发，亦或者不需要了解代码细节，完全不需要运行所有源码。主要把论文思路梳理清楚就差不多了。因为复现这些源码比较麻烦，至少需要一张还过得去的显卡。不过有条件、有时间、感兴趣的同学可以试试。

23.4.1 数据准备

前去本论文的提到的github地址可以找到对应的谷歌云盘、清华云盘（当前已经失效）以及百度云盘的下载链接，如果觉得麻烦的话，可以考虑访问我的夸克云盘，地址如下：

夸克云盘
链接：https://pan.quark.cn/s/b167f0d17234
提取码：wQKX

数据文件解压的相对地址等，将在后面介绍。

23.4.2 源码准备

前去本论文提到的github地址，把源码clone或下载到本地，然后把前面下载的数据集压缩包接下，注意相对路径，而且需要把解压后的文件夹重命名为 dataset。如图所示：

23.4.3 安装相关依赖

为了尽可能地减少麻烦，先保证使用的python版本与论文实验一致，即 3.8，其次确保安装好了与显卡对应的驱动，确保cuda可用，这些方面的坑太多太多，所以为了避免继续踩坑，尽可能与原论文的版本保持一致。如图所示：

23.4.4 执行脚本

安装依赖以后，我们不妨写几行代码，确保 cuda 可用。

import torch

print(torch.cuda.is_available())

接着可以直接执行作者已经给我们写好的脚本，注意，可能出现GPU不能用的情况

编辑这个 sh 脚本文件，并如图所示，修改使用GPU的索引为0，因为我只有一张显卡，只能使用索引为0的显卡。

其他脚本皆是如此，如果只有一张显卡，就把脚本第一行最后一个值改为 0。

其他的脚本运行方法均是如此，唯一需要注意的就是 export CUDA_VISIBLE_DEVICES=0 确保是自己想用的显卡的序号。

23.5 速读源码

23.5.1 layers/Conv_Blocks.py

这段代码定义了两个不同版本的 Inception 模块（Inception_Block_V1 和 Inception_Block_V2），这些模块包含多个卷积核，用于从输入数据中提取不同尺度的特征。这些模块可以用于深度学习模型中，以提高特征提取的多样性。模块中的卷积核具有不同的大小和填充，以捕获不同尺度的信息。在前向传播中，模块对输入数据应用这些卷积核，并将它们的输出平均在一起，以生成最终的输出。

import torch
import torch.nn as nn

# 定义一个名为 Inception_Block_V1 的 PyTorch 模型类
class Inception_Block_V1(nn.Module):
    def __init__(self, in_channels, out_channels, num_kernels=6, init_weight=True):
        super(Inception_Block_V1, self).__init__()
        # 初始化模块的参数
        self.in_channels = in_channels
        self.out_channels = out_channels
        self.num_kernels = num_kernels

        # 创建卷积核列表，用于构建多个不同尺寸的卷积核
        kernels = []
        for i in range(self.num_kernels):
            # 添加卷积层，kernel_size为2 * i + 1，padding为i
            kernels.append(nn.Conv2d(in_channels, out_channels, kernel_size=2 * i + 1, padding=i))
        # 使用 nn.ModuleList 将卷积核列表转化为模块列表
        self.kernels = nn.ModuleList(kernels)
        # 如果 init_weight 为 True，则初始化模块的权重
        if init_weight:
            self._initialize_weights()

    def _initialize_weights(self):
        # 初始化模型参数的函数
        for m in self.modules():
            if isinstance(m, nn.Conv2d):
                # 使用 kaiming_normal_ 初始化权重，适用于 ReLU 激活函数
                nn.init.kaiming_normal_(m.weight, mode='fan_out', nonlinearity='relu')
                if m.bias is not None:
                    # 初始化偏置项为零
                    nn.init.constant_(m.bias, 0)
    # 前向传播方法，接受输入 x
    def forward(self, x):
        res_list = []
        # 对每个卷积核进行前向传播，并将结果添加到res_list中
        for i in range(self.num_kernels):
            res_list.append(self.kernels[i](x))
        # 在最后一个维度上堆叠结果，然后计算平均值
        res = torch.stack(res_list, dim=-1).mean(-1)
        return res

# 定义另一个名为 Inception_Block_V2 的 PyTorch 模型类
class Inception_Block_V2(nn.Module):
    def __init__(self, in_channels, out_channels, num_kernels=6, init_weight=True):
        super(Inception_Block_V2, self).__init__()
        # 初始化模块的参数
        self.in_channels = in_channels
        self.out_channels = out_channels
        self.num_kernels = num_kernels

        kernels = []
        for i in range(self.num_kernels // 2):
            # 创建两种不同尺寸的卷积核
            kernels.append(nn.Conv2d(in_channels, out_channels, kernel_size=[1, 2 * i + 3], padding=[0, i + 1]))
            kernels.append(nn.Conv2d(in_channels, out_channels, kernel_size=[2 * i + 3, 1], padding=[i + 1, 0]))
        # 添加一个额外的卷积核，kernel_size为1
        kernels.append(nn.Conv2d(in_channels, out_channels, kernel_size=1))
        # 使用 nn.ModuleList 将卷积核列表转化为模块列表
        self.kernels = nn.ModuleList(kernels)
        # 如果 init_weight 为 True，则初始化模块的权重
        if init_weight:
            self._initialize_weights()

    def _initialize_weights(self):
        # 初始化模型参数的函数
        for m in self.modules():
            if isinstance(m, nn.Conv2d):
                # 如果当前模块是卷积层
                # 使用 Kaiming 初始化（适用于 ReLU 激活函数的初始化）
                nn.init.kaiming_normal_(m.weight, mode='fan_out', nonlinearity='relu')
                if m.bias is not None:
                    # 如果卷积层具有偏置项，将其初始化为零
                    nn.init.constant_(m.bias, 0)

    def forward(self, x):
        res_list = []
        # 对每个卷积核进行前向传播，并将结果添加到res_list中
        for i in range(self.num_kernels + 1):
            res_list.append(self.kernels[i](x))
        # 在最后一个维度上堆叠结果，然后计算平均值
        res = torch.stack(res_list, dim=-1).mean(-1)
        return res

23.5.2 layers/Embed.py 其中的 DataEmbedding

这段代码定义了一个 DataEmbedding 模块，用于将输入数据进行嵌入处理，包括值嵌入、时间特征嵌入和位置编码。注释解释了每个函数的功能，包括初始化模块、创建不同类型的嵌入层、前向传播的操作以及如何应用 Dropout 以防止过拟合。根据 embed_type 参数的不同，可以选择不同的嵌入类型。根据是否提供时间特征 x_mark，可以选择不同的嵌入方式。

import torch
import torch.nn as nn
import torch.nn.functional as F
from torch.nn.utils import weight_norm
import math

### 前面的代码 TimesNet用不到，这里没有复制过来，也不做解释

### 以下代码是 TimesNet 用到的

class DataEmbedding(nn.Module):
    def __init__(self, c_in, d_model, embed_type='fixed', freq='h', dropout=0.1):
        super(DataEmbedding, self).__init__()

        # 初始化 DataEmbedding 模块
        # c_in：输入通道数，通常是词汇表的大小
        # d_model：输出维度（模型的维度）
        # embed_type：嵌入类型，可以是 'fixed' 或 'timeF'
        # freq：时间频率，可以是 'h'（小时）、't'（分钟）、's'（秒）、'm'（月份）、'a'（年份）、'w'（星期）、'd'（日期）、'b'（工作日）
        # dropout：Dropout 概率，用于防止过拟合

        # 创建值嵌入层，用于将输入值（例如，词汇表中的词）映射为模型维度
        self.value_embedding = TokenEmbedding(c_in=c_in, d_model=d_model)
        
        # 创建位置编码层，用于表示输入序列中的位置信息
        self.position_embedding = PositionalEmbedding(d_model=d_model)
        
        # 创建时间特征嵌入层，用于表示时间特征（如小时、星期等）
        # 嵌入类型根据 embed_type 参数选择，可以是 'fixed' 或 'timeF'
        self.temporal_embedding = TemporalEmbedding(d_model=d_model, embed_type=embed_type, freq=freq) if embed_type != 'timeF' else TimeFeatureEmbedding(d_model=d_model, embed_type=embed_type, freq=freq)
        
        # 创建 Dropout 层，用于防止过拟合
        self.dropout = nn.Dropout(p=dropout)

    def forward(self, x, x_mark):
        # 前向传播函数
        # x：输入值张量，形状为 [batch_size, sequence_length, c_in]
        # x_mark：时间特征张量，形状取决于时间特征的嵌入类型
        
        if x_mark is None:
            # 如果没有时间特征，只使用值嵌入和位置编码
            x = self.value_embedding(x) + self.position_embedding(x)
        else:
            # 如果有时间特征，使用值嵌入、时间特征嵌入和位置编码
            x = self.value_embedding(x) + self.temporal_embedding(x_mark) + self.position_embedding(x)
        
        # 应用 Dropout 以减少过拟合
        return self.dropout(x)

23.5.3 models/TimesNet.py

以下这段代码定义了一个名为 TimesBlock 的 PyTorch 模型类，它实现了一种时间序列分析方法。该模块接受一个时间序列输入 x，通过快速傅里叶变换（FFT）分析其周期性，并使用卷积操作对不同周期的信号进行处理。模块的作用是对输入的时间序列进行周期性分析和特征提取，以捕捉时间序列中的周期性变化。最终输出经过自适应聚合和残差连接后的时间序列。

import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.fft
from layers.Embed import DataEmbedding
from layers.Conv_Blocks import Inception_Block_V1


def FFT_for_Period(x, k=2):
    # 使用快速傅里叶变换（FFT）分析时间序列 x 的周期性
    # x: 输入的时间序列 [B, T, C]
    xf = torch.fft.rfft(x, dim=1)
    # 通过振幅找到频率分量
    frequency_list = abs(xf).mean(0).mean(-1)
    frequency_list[0] = 0
    _, top_list = torch.topk(frequency_list, k)
    top_list = top_list.detach().cpu().numpy()
    period = x.shape[1] // top_list
    # 返回估计的周期和相应的频率成分
    return period, abs(xf).mean(-1)[:, top_list]

# 定义一个名为 TimesBlock 的 PyTorch 模型类
class TimesBlock(nn.Module):
    def __init__(self, configs):
        super(TimesBlock, self).__init__()

        # 初始化模块的参数
        self.seq_len = configs.seq_len  # 输入序列的长度
        self.pred_len = configs.pred_len  # 预测序列的长度
        self.k = configs.top_k  # 周期估计的前 k 个频率成分

        # 创建一个卷积层序列，使用 Inception_Block_V1 模块
        self.conv = nn.Sequential(
            Inception_Block_V1(configs.d_model, configs.d_ff,
                               num_kernels=configs.num_kernels),  # 第一个卷积层
            nn.GELU(),  # GELU 激活函数
            Inception_Block_V1(configs.d_ff, configs.d_model,
                               num_kernels=configs.num_kernels)  # 第二个卷积层
        )

    # 前向传播方法，接受输入 x
    def forward(self, x):
        B, T, N = x.size()  # 获取输入 x 的维度信息

        # 使用 FFT_for_Period 函数分析输入 x 的周期性，并获取周期列表和周期权重
        period_list, period_weight = FFT_for_Period(x, self.k)

        res = []  # 存储结果的列表

        for i in range(self.k):
            period = period_list[i]  # 获取第 i 个周期

            # 填充输入，使其长度能够整除周期
            if (self.seq_len + self.pred_len) % period != 0:
                length = (((self.seq_len + self.pred_len) // period) + 1) * period
                padding = torch.zeros([x.shape[0], (length - (self.seq_len + self.pred_len)), x.shape[2]]).to(x.device)
                out = torch.cat([x, padding], dim=1)
            else:
                length = (self.seq_len + self.pred_len)
                out = x

            # 重塑输入，将时间序列变成 2D 形式
            out = out.reshape(B, length // period, period, N).permute(0, 3, 1, 2).contiguous()

            # 应用卷积层，将1D变化转化为2D变化
            out = self.conv(out)

            # 重塑回原始形状
            out = out.permute(0, 2, 3, 1).reshape(B, -1, N)
            res.append(out[:, :(self.seq_len + self.pred_len), :])  # 将结果添加到列表中

        res = torch.stack(res, dim=-1)  # 将结果堆叠在一起，形成一个多通道的输出
        period_weight = F.softmax(period_weight, dim=1)  # 对周期权重进行 softmax 归一化
        period_weight = period_weight.unsqueeze(1).unsqueeze(1).repeat(1, T, N, 1)  # 调整周期权重的形状
        res = torch.sum(res * period_weight, -1)  # 对多通道输出进行加权求和，进行自适应聚合
        res = res + x  # 添加残差连接
        return res  # 返回最终输出

这段代码定义了一个 PyTorch 模型类，用于处理不同类型的时间序列数据分析任务。根据任务类型，模型采用不同的网络架构和输出层。该模型类包括任务类型如长期预测、缺失值填充、异常检测和分类。根据不同的任务类型，模型进行数据标准化、数据嵌入、网络模型的运算、投影和反标准化等步骤，以满足任务要求。前向传播方法根据任务类型返回相应的结果。

# 定义一个名为 Model 的 PyTorch 模型类
class Model(nn.Module):
    """
    Paper link: https://openreview.net/pdf?id=ju_Uqw384Oq
    """

    def __init__(self, configs):
        super(Model, self).__init__()

        # 初始化模型的参数
        self.configs = configs
        self.task_name = configs.task_name  # 任务名称
        self.seq_len = configs.seq_len  # 输入序列的长度
        self.label_len = configs.label_len  # 标签序列的长度
        self.pred_len = configs.pred_len  # 预测序列的长度

        # 创建一系列的 TimesBlock 模块，数量为配置中的 e_layers
        self.model = nn.ModuleList([TimesBlock(configs) for _ in range(configs.e_layers)])

        # 创建数据嵌入模块
        self.enc_embedding = DataEmbedding(configs.enc_in, configs.d_model, configs.embed, configs.freq,
                                           configs.dropout)

        self.layer = configs.e_layers
        self.layer_norm = nn.LayerNorm(configs.d_model)

        # 根据任务类型不同，初始化不同的输出层
        if self.task_name == 'long_term_forecast' or self.task_name == 'short_term_forecast':
            self.predict_linear = nn.Linear(
                self.seq_len, self.pred_len + self.seq_len)  # 用于预测的线性层
            self.projection = nn.Linear(
                configs.d_model, configs.c_out, bias=True)  # 投影线性层
        if self.task_name == 'imputation' or self.task_name == 'anomaly_detection':
            self.projection = nn.Linear(
                configs.d_model, configs.c_out, bias=True)  # 投影线性层
        if self.task_name == 'classification':
            self.act = F.gelu  # 激活函数
            self.dropout = nn.Dropout(configs.dropout)  # 丢弃层
            self.projection = nn.Linear(
                configs.d_model * configs.seq_len, configs.num_class)  # 分类线性层

    # 用于长期预测任务的方法
    def forecast(self, x_enc, x_mark_enc, x_dec, x_mark_dec):
        # 标准化输入数据
        means = x_enc.mean(1, keepdim=True).detach()
        x_enc = x_enc - means
        stdev = torch.sqrt(
            torch.var(x_enc, dim=1, keepdim=True, unbiased=False) + 1e-5)
        x_enc /= stdev

        # 数据嵌入
        enc_out = self.enc_embedding(x_enc, x_mark_enc)

        # 预测线性层
        enc_out = self.predict_linear(enc_out.permute(0, 2, 1)).permute(0, 2, 1)

        # TimesNet 模型
        for i in range(self.layer):
            enc_out = self.layer_norm(self.model[i](enc_out))

        # 投影线性层
        dec_out = self.projection(enc_out)

        # 反标准化
        dec_out = dec_out * \
                  (stdev[:, 0, :].unsqueeze(1).repeat(
                      1, self.pred_len + self.seq_len, 1))
        dec_out = dec_out + \
                  (means[:, 0, :].unsqueeze(1).repeat(
                      1, self.pred_len + self.seq_len, 1))
        return dec_out

    # 用于缺失值填充任务的方法
    def imputation(self, x_enc, x_mark_enc, x_dec, x_mark_dec, mask):
        # 标准化输入数据
        means = torch.sum(x_enc, dim=1) / torch.sum(mask == 1, dim=1)
        means = means.unsqueeze(1).detach()
        x_enc = x_enc - means
        x_enc = x_enc.masked_fill(mask == 0, 0)
        stdev = torch.sqrt(torch.sum(x_enc * x_enc, dim=1) /
                           torch.sum(mask == 1, dim=1) + 1e-5)
        stdev = stdev.unsqueeze(1).detach()
        x_enc /= stdev

        # 数据嵌入
        enc_out = self.enc_embedding(x_enc, x_mark_enc)

        # TimesNet 模型
        for i in range(self.layer):
            enc_out = self.layer_norm(self.model[i](enc_out))

        # 投影线性层
        dec_out = self.projection(enc_out)

        # 反标准化
        dec_out = dec_out * \
                  (stdev[:, 0, :].unsqueeze(1).repeat(
                      1, self.pred_len + self.seq_len, 1))
        dec_out = dec_out + \
                  (means[:, 0, :].unsqueeze(1).repeat(
                      1, self.pred_len + self.seq_len, 1))
        return dec_out

    # 用于异常检测任务的方法
    def anomaly_detection(self, x_enc):
        # 标准化输入数据
        means = x_enc.mean(1, keepdim=True).detach()
        x_enc = x_enc - means
        stdev = torch.sqrt(
            torch.var(x_enc, dim=1, keepdim=True, unbiased=False) + 1e-5)
        x_enc /= stdev

        # 数据嵌入
        enc_out = self.enc_embedding(x_enc, None)

        # TimesNet 模型
        for i in range(self.layer):
            enc_out = self.layer_norm(self.model[i](enc_out))

        # 投影线性层
        dec_out = self.projection(enc_out)

        # 反标准化
        dec_out = dec_out * \
                  (stdev[:, 0, :].unsqueeze(1).repeat(
                      1, self.pred_len + self.seq_len, 1))
        dec_out = dec_out + \
                  (means[:, 0, :].unsqueeze(1).repeat(
                      1, self.pred_len + self.seq_len, 1))
        return dec_out

    # 用于分类任务的方法
    def classification(self, x_enc, x_mark_enc):
        # 数据嵌入
        enc_out = self.enc_embedding(x_enc, None)

        # TimesNet 模型
        for i in range(self.layer):
            enc_out = self.layer_norm(self.model[i](enc_out))

        # 输出
        output = self.act(enc_out)
        output = self.dropout(output)
        output = output * x_mark_enc.unsqueeze(-1)
        output = output.reshape(output.shape[0], -1)
        output = self.projection(output)
        return output

    # 前向传播方法
    def forward(self, x_enc, x_mark_enc, x_dec, x_mark_dec, mask=None):
        if self.task_name == 'long_term_forecast' or self.task_name == 'short_term_forecast':
            dec_out = self.forecast(x_enc, x_mark_enc, x_dec, x_mark_dec)
            return dec_out[:, -self.pred_len:, :]  # 返回预测结果
        if self.task_name == 'imputation':
            dec_out = self.imputation(
                x_enc, x_mark_enc, x_dec, x_mark_dec, mask)
            return dec_out  # 返回填充结果
        if self.task_name == 'anomaly_detection':
            dec_out = self.anomaly_detection(x_enc)
            return dec_out  # 返回异常检测结果
        if self.task_name == 'classification':
            dec_out = self.classification(x_enc, x_mark_enc)
            return dec_out  # 返回分类结果
        return None  # 若任务名称不匹配，则返回空值

23.6 总结

本篇论文介绍了一种新的方法，通过将一维时间序列转换为二维张量来处理时间序列分析中的复杂时间模式。作者提出的TimesNet with TimesBlock是一种通用的时间序列分析模型，可以发现时间序列中的多个周期内和周期间的变化。该模型在五个主流时间序列分析任务中表现出了很好的通用性和性能。作者还提出了未来的研究方向，包括在大规模预训练中进一步探索利用TimesNet作为骨干的方法，以及在实际应用中的潜在应用。

论文提供的源码集成了一些其他的算法，对于需要做比对实验的人来说，简直是太方便了。并且，如果你设计了某个算法，可以基于TimesNet 源码架构进行开发，然后合并到代码仓库中作为其中一个算子，简单方便直观，给作者团队点赞 ~

Smileyan
2023.10.31 22:58

你可能感兴趣的:(算法,深度学习,支持向量机,异常检测,时间序列)

搜索领域知识图谱的知识推理算法研究搜索引擎技术知识图谱算法人工智能 ai
搜索领域知识图谱的知识推理算法研究关键词：知识图谱、知识推理、搜索算法、图神经网络、路径推理、规则推理、表示学习摘要：本文深入探讨搜索领域中知识图谱的知识推理算法。我们将从知识图谱的基本概念出发，分析不同类型的知识推理算法原理，包括基于规则的推理、基于表示的推理和基于路径的推理。通过实际案例和代码实现，展示这些算法如何提升搜索效果，最后讨论该领域的未来发展趋势和挑战。背景介绍目的和范围本文旨在系统
数据结构与算法中单调栈的常见误区数据结构与算法学习服务器运维 ai
数据结构与算法中单调栈的常见误区关键词：单调栈、数据结构、算法、误区、栈、时间复杂度、应用场景摘要：单调栈是一种特殊的数据结构，它在解决某些特定问题时非常高效。然而，许多初学者在使用单调栈时容易陷入一些常见的误区。本文将详细介绍单调栈的概念、原理和应用，重点分析使用单调栈时的常见误区，并通过实际代码示例展示如何正确使用单调栈解决问题。背景介绍目的和范围本文旨在帮助读者深入理解单调栈的概念和工作原理
AI优化算法实战：使用粒子群优化求解复杂工程问题 AI学长带你学AI ai
AI优化算法实战：使用粒子群优化求解复杂工程问题关键词：粒子群优化（PSO）、全局优化、工程问题、智能算法、参数调优摘要：本文以“鸟群觅食”为灵感来源，深入浅出地讲解粒子群优化（ParticleSwarmOptimization,PSO）算法的核心原理，并通过机械结构轻量化设计的实战案例，展示其在复杂工程问题中的应用。文章从算法起源到数学模型，从代码实现到工程落地，层层拆解技术细节，帮助读者快速掌
open3d 使用 RANSAC 算法拟合平面扶子 python 点云处理平面 python open3d 经验分享点云拟合平面
1、功能介绍：一个python代码演示了如何使用open3d和numpy来完成一个完整的点云平面拟合任务。它包括以下几个主要部分：生成符合某一平面方程的随机点云数据、使用RANSAC算法对这些点云进行平面拟合、可视化原始点云和平面拟合结果2、代码部分：importnumpyasnpimportopen3daso3d#生成随机点云np.random.seed(42)n_points=100#假设这些
深度剖析AI人工智能在自动驾驶中的系统优化 AI云原生与云计算技术学院人工智能自动驾驶机器学习 ai
深度剖析AI人工智能在自动驾驶中的系统优化关键词：AI人工智能、自动驾驶、系统优化、传感器融合、决策算法摘要：本文深入探讨了AI人工智能在自动驾驶系统中的优化问题。从自动驾驶的背景入手，详细解释了相关核心概念，如传感器、决策算法等。阐述了这些核心概念之间的关系，介绍了核心算法原理和具体操作步骤，还通过数学模型和公式进行了理论支持。给出了项目实战案例，分析了实际应用场景，推荐了相关工具和资源，最后探
CRC3校验算法安庆平.Я C/C++语言总结 java 前端服务器 c语言 unix linux 算法
C在线工具|菜鸟工具CRC3，16位数据校验使用，多项式g(x)=x3+x+1->0b1011#include#includeuint8_tCrc3(constuint32_tdata,uint8_tlen){uint8_tchk=0x08;uint8_tpoly=0x03;/*多顶式1011*/uint8_tpoly_len=4;uint8_talu=0x00;alu=(data>>len-po
22种创新思路！今年必将是特征选择爆发的一年小唯啊小唯人工智能注意力机制特征选择
2025深度学习发论文&模型涨点之——特征选择特征选择是机器学习和数据挖掘领域中一个非常重要的步骤。它指的是从原始特征集合中挑选出对目标变量有较强预测能力的特征子集。在实际的数据集中，往往包含众多特征，但并非所有特征都对模型的性能有正面影响。例如在房价预测任务中，原始特征可能包括房屋的面积、房间数量、所在小区、周边配套设施等众多内容。通过特征选择，可以剔除一些无关的或者冗余的特征，比如可能存在的重
C++分发器 IT灰猫 c++开发语言
以调用某个算法为例，该算法有一个确定的函数Process，其参数不确定，返回值确定为bool类型，当然Process的返回值也可用模板进行替换，实现更灵活的返回值。#pragmaonce#include#include#include#include#include#includeclassAlgorithmDispatch{public:templatestd::shared_ptralgori
day043-负载均衡算法与高可用keepalived 孙克旭‌ 老男孩教育Linux运维99期负载均衡算法运维 linux
文章目录0.老男孩思想-运维能为公司创造的价值1.负载均衡轮询算法1.1加权轮询1.2ip哈希1.3url哈希2.负载均衡模块指令补充3.高可用4.keepalived4.1部署keepalived服务4.2脑裂故障4.2.1脑裂故障常见原因4.2.2脑裂故障解决方法5.思维导图0.老男孩思想-运维能为公司创造的价值省钱：服务器设备、机房带宽、云主机云服务减少CDN流量优化、架构改造，当流量增加时
模拟工作队列 - 华为OD机试真题(JavaScript卷) 什码情况算法面试 javascript 数据结构华为od
华为OD机试题库《C++》限时优惠9.9华为OD机试题库《Python》限时优惠9.9华为OD机试题库《JavaScript》限时优惠9.9针对刷题难，效率慢，我们提供一对一算法辅导，针对个人情况定制化的提高计划（全称1V1效率更高）。看不懂有疑问需要答疑辅导欢迎私VX：code5bug题目描述让我们来模拟一个工作队列的运作，有一个任务提交者和若干任务执行者，执行者从1开始编号。提交者会在给定的时
数据分类 - 华为OD机试真题(JavaScript 题解) 什码情况华为od javascript 开发语言数据结构算法机试
华为OD机试题库《C++》限时优惠9.9华为OD机试题库《Python》限时优惠9.9华为OD机试题库《JavaScript》限时优惠9.9针对刷题难，效率慢，我们提供一对一算法辅导，针对个人情况定制化的提高计划（全称1V1效率更高）。看不懂有疑问需要答疑辅导欢迎私VX：code5bug题目描述对一个数据a进行分类，分类方法为：此数据a（四个字节大小）的四个字节相加对一个给定的值b取模，如果得到的
【深度学习|学习笔记】什么是正则化？如何理解正则化？L0、L1、L2正则化的起源、发展、原理、应用和对比详解，附代码。努力毕业的小土博^_^ 深度学习学习笔记深度学习学习笔记人工智能机器学习
【深度学习|学习笔记】什么是正则化？如何理解正则化？L0、L1、L2正则化的起源、发展、原理、应用和对比详解，附代码。【深度学习|学习笔记】什么是正则化？如何理解正则化？L0、L1、L2正则化的起源、发展、原理、应用和对比详解，附代码。文章目录【深度学习|学习笔记】什么是正则化？如何理解正则化？L0、L1、L2正则化的起源、发展、原理、应用和对比详解，附代码。前言一、什么是正则化？为什么需要它？✅
GESP认证C++编程真题解析 | GESP202409 三级单选题和判断题热爱编程的通信人历年GESP CSP-J CSP-S真题解析 c++开发语言
欢迎大家订阅我的专栏：算法题解：C++与Python实现！本专栏旨在帮助大家从基础到进阶，逐步提升编程能力，助力信息学竞赛备战！专栏特色1.经典算法练习：根据信息学竞赛大纲，精心挑选经典算法题目，提供清晰的代码实现与详细指导，帮助您夯实算法基础。2.系统化学习路径：按照算法类别和难度分级，从基础到进阶，循序渐进，帮助您全面提升编程能力与算法思维。适合人群：准备参加蓝桥杯、GESP、CSP-J、CS
LeetCode 学习day3 不喜勿喷小小小新人12123 leetcode 学习算法 python
题目：给定一个数组prices，它的第i个元素prices[i]表示一支给定股票第i天的价格。你只能选择某一天买入这只股票，并选择在未来的某一个不同的日子卖出该股票。设计一个算法来计算你所能获取的最大利润。返回你可以从这笔交易中获取的最大利润。如果你不能获取任何利润，返回0。（LeetCode121.买卖股票的最佳时机）问题分析：简而言之为求最大差Python代码：importnumpyasnpc
算法优化：前缀和+哈希表雨声敲敲，风声潇潇算法算法 java leetcode 性能优化哈希表
今天在leetcode上写到6952.统计趣味子数组的数目这道题的时候出现了超时问题，由此学习了前缀和+哈希表的方法。目前看到与此知识点相关的题目有如下：560.和为k的子数组，非常经典的前缀和+哈希表，可以从这一道题入手。6952.统计趣味子数组的数目，这道题比上一到稍微难一点，但是不至于困难。下面介绍一下前缀和+哈希表以560题为例，题目：给你一个整数数组nums和一个整数k，请你统计并返回该
POS（权益证明机制） Chinatesila 区块链
由来：SunnyKing和ScottNadal首先建议使用权益证明作为工作量证明（PoW）的替代方案，并创造了权益一词。他们描述了一种算法，该算法根据个人钱包中代币的数量和年龄选择生产区块的节点。Peercoin（PPC）被创造出来，并成为第一个混合加密货币。PPC使用PoW分发令牌，并使用PoS验证交易。简介：权益证明机制的目的是让所谓的“权益者”、“锻造者”或者“验证者”来代替矿工，他们本质上
什么是 PoW（工作量证明，Proof of Work） MonkeyKing.sun 区块链
共识算法（ConsensusAlgorithm）是区块链的“心脏”，它决定了多个节点在没有中央机构的前提下，如何就“谁来记账”达成一致。什么是PoW（工作量证明，ProofofWork）定义：工作量证明（ProofofWork,简称PoW）是一种共识机制，要求节点通过解决一个高难度数学问题，来获得记账权。第一个算出答案的节点获得“打包交易→生成区块→获取奖励”的权利。它是比特币、以太坊（1.0）等
从决策树到随机森林：Python机器学习里的“树形家族“深度实战与原理拆解小张在编程机器学习决策树随机森林
引言在机器学习的算法森林中，有一对"树形兄弟"始终占据着C位——决策树像个逻辑清晰的"老教授"，用可视化的树状结构把复杂决策过程拆解成"是/否"的简单判断；而它的进阶版随机森林更像一支"精英军团"，通过多棵决策树的"投票表决"，在准确性与抗过拟合能力上实现了质的飞跃。无论是医疗诊断中的疾病预测，还是金融风控里的违约判别，这对组合都用强大的适应性证明着自己的"算法常青树"地位。今天，我们就从原理到实
什么是 PoS（权益证明） MonkeyKing.sun pos
PoS（ProofofStake，权益证明）是区块链中常用的一种共识算法，作为PoW（工作量证明）的替代方案，它通过“持币数量+持有时间”决定谁有权记账（打包区块），从而降低能耗、提升效率。一、什么是PoS（权益证明）？PoS是一种基于“持有代币数量”的区块链共识机制，持币越多、持币越久，获得打包新区块机会的概率越高。换句话说，不是靠算力挖矿，而是靠“你拥有多少币”来竞争记账权。二、PoS的核心原
实现make_power_of_two函数洞阳 c++面试 c++
目录代码make_power_of_two函数解析：将数值转换为大于等于它的最小2的幂一、函数功能与核心逻辑二、代码实现与逐行解析三、逐步骤原理解析四、位运算的数学原理五、不同输入的转换示例六、算法复杂度与适用场景七、与其他实现方式的对比八、注意事项总结代码该函数将任意n转换为大于等于n的最小2的幂（如n=10→16，n=16→16）size_tmake_power_of_two(size_tn)
深入详解：随机森林算法——概念、原理、实现与应用场景猿享天开算法随机森林机器学习
深入详解：随机森林算法——概念、原理、实现与应用场景随机森林（RandomForest,RF）是一种经典的集成学习算法，广泛应用于机器学习任务。本文将通过图文结合的方式，全面解析随机森林的核心原理、实现细节和应用实践，帮助读者建立系统认知。1.核心概念与直观理解1.1什么是随机森林？随机森林是一种基于决策树的集成学习算法，通过构建多棵决策树进行协同预测。其核心思想是"三个臭皮匠，顶个诸葛亮"——多
【项目实战】Redis使用场景之基于Redis实现分布式限流本本本添哥 002 -进阶开发能力 003 -数据库 redis 分布式数据库
一、技术概览1.1定义分布式限流是指在分布式系统中限制请求的速率，以保护后端服务不被过多的请求压垮。它可以帮助我们控制系统的负载，保证服务的稳定性。Redis是一个高性能的键值存储系统，常用于缓存、消息队列和实时分析等场景。由于其支持丰富的数据结构和原子操作，非常适合用来实现分布式限流。专业术语:令牌桶算法(TokenBucket):一种流量整形算法，允许突发流量但不超过平均速度。漏桶算法(Lea
人工智能大模型原理与应用实战：大模型在金融风控中的应用 AI天才研究院 LLM大模型落地实战指南大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
文章目录人工智能大模型原理与应用实战：大模型在金融风控中的应用01.背景介绍1.1金融风控的挑战1.2大模型的优势2.核心概念与联系2.1大模型在金融风控中的应用场景2.2大模型与传统风控技术的结合3.核心算法原理具体操作步骤3.1基于大模型的欺诈检测3.2基于大模型的信用评估4.数学模型和公式详细讲解举例说明4.1逻辑回归模型4.2XGBoost模型5.项目实践：代码实例和详细解释说明5.1基于
浅谈卷积神经网络(CNN) cyc&阿灿 cnn 人工智能神经网络
卷积神经网络(ConvolutionalNeuralNetworks,CNN)作为深度学习领域最具影响力的架构之一，已在计算机视觉、自然语言处理、医学影像分析等领域取得了革命性突破。本文将系统全面地剖析CNN的核心原理、关键组件、经典模型、数学基础、训练技巧以及最新进展，通过理论解析与代码实践相结合的方式，帮助读者深入掌握这一重要技术。一、CNN基础与核心思想1.1传统神经网络的局限性在处理图像等
Go项目限流全攻略：超越中间件的全方位解决方案码农老gou golang 中间件开发语言
引言：限流在分布式系统中的重要性在当今高并发的互联网应用中，流量控制已成为保障系统稳定性的关键手段。一次突发的流量洪峰可能导致整个系统崩溃，造成不可估量的损失。作为Go开发者，我们常常会面临这样的面试问题：Go项目中如何实现限流？仅仅使用中间件就足够了吗？本文将深入探讨Go项目中的限流策略，分析中间件的局限性，并介绍超越中间件的全方位解决方案。一、常见限流算法解析1.令牌桶算法（TokenBuck
随机森林详解：原理、优势与应用实践大千AI助手人工智能 Python #OTHER 随机森林算法机器学习决策树人工智能 DecisionTree 数据挖掘
本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！随机森林介绍1.定义：随机森林是一种强大的、高度灵活的集成学习（EnsembleLearning）算法，主要用于分类和回归任务。它的核心思想是构建多棵决策树（DecisionTree），并将这些树的预测结果进行组合（例如，分类任务采用投票，回归任务采用
【第二章:机器学习与神经网络概述】03.类算法理论与实践-(3)决策树分类器 IT古董人工智能课程机器学习算法神经网络
第二章:机器学习与神经网络概述第三部分：类算法理论与实践第三节：决策树分类器内容：信息增益、剪枝技术、过拟合与泛化能力。决策树是一种常用于分类和回归的树状结构模型，它通过一系列特征判断进行决策，有良好的可解释性。一、基本概念节点（Node）：表示特征判断条件边（Branch）：表示特征判断的结果路径叶子节点（Leaf）：表示分类结果二、划分准则：信息增益（InformationGain）信息增益衡
算法练习-02 亮亮爱刷题算法数据结构 c++
今天给大家带来的是第二天的几道练习题，包括几道思路特别巧妙的算法题，以及提升的背包问题，相信这类问题对大家算法能力的提升还是十分有帮助的，希望大家学完可以给博主点一个关注。第一题：问题描述给定一个长度为n的数组a，小蓝希望从数组中选择若干个元素（可以不连续），并将它们重新排列，使得这些元素能够形成一个先严格递增然后严格递减的子序列（可以没有递增部分或递减部分）。你需要求出在满足这个条件下，最多可以
基于Redis分布式的限流 chi_666 redis 分布式数据库
以下是基于Redis实现分布式限流的Java解决方案，包含多种限流算法和完整实现代码：一、限流算法选择与实现1.固定窗口算法（SimpleRateLimiter）publicclassRedisFixedWindowRateLimiter{privatefinalStringRedisTemplateredisTemplate;privatefinalStringscript="localcurr
【PyTorch】2024保姆级安装教程-Python-（CPU+GPU详细完整版）金枝玉叶9 程序员知识储备1 程序员知识储备2 程序员知识储备3 python pytorch 人工智能
【PyTorch】2024保姆级安装教程（CPU+GPU详细完整版）PyTorch是当前最受欢迎的深度学习框架之一。本文将详细讲解在Python环境中安装PyTorch，包括CPU和GPU版本的全方位指南。一、前置环境首先确保已安装Python环境，推荐使用Python3.8或以上版本。验证Python安装：python--versionpip--version推荐使用虚拟环境（如conda或ve
knob UI插件使用换个号韩国红果果 JavaScript jsonp knob
图形是用canvas绘制的 js代码 var paras = { max:800, min:100, skin:'tron',//button type thickness:.3,//button width width:'200',//define canvas width.,canvas height displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库白糖_ JQuery Mobile
目录导航 SQLite是轻量级的、嵌入式的、关系型数据库，目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好，很容易使用，很小，高效而且可靠。因为Android已经集成了SQLite，所以开发人员无需引入任何JAR包，而且Android也针对SQLite封装了专属的API，调用起来非常快捷方便。我也是第一次接触S
impala-2.1.2-CDH5.3.2 dayutianfei impala
最近在整理impala编译的东西，简单记录几个要点：根据官网的信息（https://github.com/cloudera/Impala/wiki/How-to-build-Impala）： 1. 首次编译impala，推荐使用命令： ${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format 2.仅编译BE ${I
求二进制数中1的个数周凡杨 java 算法二进制
解法一：对于一个正整数如果是偶数，该数的二进制数的最后一位是 0 ，反之若是奇数，则该数的二进制数的最后一位是 1 。因此，可以考虑利用位移、判断奇偶来实现。 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){ /
spring中hibernate及事务配置 g21121 Hibernate
hibernate的sessionFactory配置：  <bean id="sessionFactory" class="org.springframework.orm.hibernate3.LocalSessionFactoryBean"> <
log4j.properties 使用 510888780 log4j
log4j.properties 使用一.参数意义说明输出级别的种类 ERROR、WARN、INFO、DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告，比如session丢失 INFO 为一般要显示的信息，比如登录登出 DEBUG 为程序的调试信息配置日志信息输出目的地 log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图（2）布衣凌宇 jfreechart
上一篇中生成的图是静态的，这篇将按条件进行搜索，并统计成图表，左面为统计图，右面显示搜索出的结果。第一步：导包第二步；配置web.xml(上一篇有代码) 建BarRenderer类用于柱子颜色 import java.awt.Color; import java.awt.Paint; import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。 PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用 antlove maven test unit cobertura report
1. 创建一个maven项目 2. 创建com.CoberturaStart.java package com; public class CoberturaStart { public void helloEveryone(){ System.out.println("=================================================
程序的执行顺序百合不是茶 JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧代码如下; 经典的程序执行面试题 //关于程序执行的顺序 //例如： //定义一个基类 public class A(){ public A(
设置session失效的几种方法 bijian1013 web.xml session失效监听器
在系统登录后，都会设置一个当前session失效的时间，以确保在用户长时间不与服务器交互，自动退出登录，销毁session。具体设置很简单，方法有三种：（1）在主页面或者公共页面中加入：session.setMaxInactiveInterval(900);参数900单位是秒，即在没有活动15分钟后，session将失效。这里要注意这个session设置的时间是根据服务器来计算的，而不是客户端。所
java jvm常用命令工具 bijian1013 java jvm
一.概述程序运行中经常会遇到各种问题，定位问题时通常需要综合各种信息，如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据，进而提高问题解决速度。本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法，主要包含以下工具: &nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解 bit1129 Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后，对Spring一些常用注解的含义行为一直处于比较模糊的状态，写几篇总结下Spring常用的注解。本篇包含的注解有如下几个： Autowired Resource Component Service Controller Transactional 根据它们的功能、目的，可以分为三组，Autow
mysql 操作遇到safe update mode问题 bitray update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全. 在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行 SET
nginx_perl试用 ronin47 nginx_perl试用
因为空闲时间比较多，所以在CPAN上乱翻，看到了nginx_perl这个项目(原名Nginx::Engine)，现在托管在github.com上。地址见：https://github.com/zzzcpan/nginx-perl 这个模块的目的，是在nginx内置官方perl模块的基础上，实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能（这里
java-63-在字符串中删除特定的字符 bylijinnan java
public class DeleteSpecificChars { /** * Q 63 在字符串中删除特定的字符 * 输入两个字符串，从第一字符串中删除第二个字符串中所有的字符。 * 例如，输入”They are students.”和”aeiou”，则删除之后的第一个字符串变成”Thy r stdnts.” */ public static voi
EffectiveJava--创建和销毁对象 ccii 创建和销毁对象
本章内容： 1. 考虑用静态工厂方法代替构造器 2. 遇到多个构造器参数时要考虑用构建器（Builder模式） 3. 用私有构造器或者枚举类型强化Singleton属性 4. 通过私有构造器强化不可实例化的能力 5. 避免创建不必要的对象 6. 消除过期的对象引用 7. 避免使用终结方法 1. 考虑用静态工厂方法代替构造器类可以通过
[宇宙时代]四边形理论与光速飞行 comsci
从四边形理论来推论为什么光子飞船必须获得星光信号才能够进行光速飞行？一组星体组成星座向空间辐射一组由复杂星光信号组成的辐射频带，按照四边形-频率假说一组频率就代表一个时空的入口那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道，该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据 cywhoyi python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下，所以安装python、pip、pymysql等都极其方便，sudo apt-get install pymysql，但是在安装cx_Oracle（连接oracle的模块）出现许多问题，查阅相关资料，发现这边文章能够帮我解决，希望大家少走点弯路。http://www.tbdazhe.com/archives/602 1.安装python 2.安装pip、pymysql
Ajax正确但是请求不到值解决方案 dashuaifu Ajax async
Ajax正确但是请求不到值解决方案解决方案：1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法！！！！！！！例如： $.ajax({ &
windows安装配置php+memcached dcj3sjt126com PHP Install memcache
Windows下Memcached的安装配置方法 1、将第一个包解压放某个盘下面，比如在c:\memcached。 2、在终端（也即cmd命令界面）下输入 'c:\memcached\memcached.exe -d install' 安装。 3、再输入： 'c:\memcached\memcached.exe -d start' 启动。（需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议 dcj3sjt126com ios
iOS论坛里有朋友要求回答帖子，帖子的标题是：想学IOS开发高阶一点的东西，从何开始，然后我吧啦吧啦回答写了很多。既然敲了那么多字，我就把我写的回复也贴到博客里来分享，希望能对大家有帮助。欢迎大家也到帖子里讨论和分享，地址：http://bbs.csdn.net/topics/390920759 下面是我回复的内容：结合自己情况聊下iOS学习建议，
Javascript闭包概念 fanfanlovey JavaScript 闭包
1.参考资料 http://www.jb51.net/article/24101.htm http://blog.csdn.net/yn49782026/article/details/8549462 2.内容概述要理解闭包，首先需要理解变量作用域问题内部函数可以饮用外面全局变量 var n=999; 　　functio
yum安装mysql5.6 haisheng mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 2、yum install mysql 3、yum install mysql-server 4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介 IT_zhlp80 java BO VO DAO POJO po
JAVA几种对象的解释 PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作. VO:value object值对象。通常用于业务层之间的数据传递，和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式 kerryg java 设计模式
设计模式的分类：一、设计模式总体分为三大类： 1、创建型模式（5种）：工厂方法模式，抽象工厂模式，单例模式，建造者模式，原型模式。 2、结构型模式（7种）：适配器模式，装饰器模式，代理模式，外观模式，桥接模式，组合模式，享元模式。 3、行为型模式（11种）：策略模式，模版方法模式，观察者模式，迭代子模式，责任链模式，命令模式，备忘录模式，状态模式，访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇木头.java spring webservice CXF
Spring 版本3.2.10 CXF 版本3.1.1 项目采用MAVEN组织依赖jar 我这里是有parent的pom，为了简洁明了，我直接把所有的依赖都列一起了，所以都没version，反正上面已经写了版本 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授：菜鸟开发者一定要投资的十大目标 qindongliang1922 工作感悟人生
身为软件开发者，有什么是一定得投资的？ Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资，第一项就是身体健康，英文与数学也都是必备能力吗？来看看他怎么说。（以下文字以作者第一人称撰写））你的健康无疑地，软件开发者是世界上最久坐不动的职业之一。每天连坐八到十六小时，休息时间只有一点点，绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险，
linux打开最大文件数量1,048,576 tianzhihehe c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释衞酆夼 java VO BO POJO po
PO:persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。 BO:business object业务对象封装业务逻辑的java对象