h137437

Informer: Beyond Efficient Transformer for Long Sequence Time-Series Forecasting

Informer

Abstract
1 Introduction
2 Preliminary
3 Proposed Method
- - Efficient Self-attention Mechanism
  - Encoder: Allowing for processing longer sequential inputs under the memory usage limitation
  - Decoder: Generating long sequential outputs through one forward procedure
4 Experiments
- - Datasets
  - Experimental Details
  - Results and Analysis
  - Computation Efficiency
5 Conclusion

https://arxiv.org/pdf/2012.07436v2.pdf
备注：如有侵权，立即删除
code: https://github.com/zhouhaoyi/Informer2020
source: AAAI 2021

Abstract

许多实际应用需要对长序列时间序列进行预测，例如用电量规划。长序列时间序列预测（LSTF）要求模型具有很高的预测能力，即能够有效地捕捉输出和输入之间精确的长程相关性耦合。最近的研究表明，变压器具有提高预测能力的潜力。然而，Transformer存在一些严重的问题，使得它不能直接应用于LSTF，如二次时间复杂度、高内存使用率以及编码器-解码器体系结构的固有限制。为了解决这些问题，我们设计了一个有效的基于变压器的LSTF模型Informer，它具有三个显著的特点：

（i）ProbSparse的自我注意机制，该机制在时间复杂度和内存使用方面达到了O（Llog L），并且在序列依赖性对齐方面具有相当的性能。
（ii）自注意提取通过将级联层输入减半来突出控制注意，并有效地处理超长的输入序列。
（iii）产生式解码器虽然概念上简单，但在一个正向操作中预测长时间序列，而不是一步一步地进行，这大大提高了长序列预测的推理速度。在四个大规模数据集上的大量实验表明，Informer的性能明显优于现有的方法，为LSTF问题提供了一种新的解决方案

1 Introduction

时间序列预测是许多领域的关键因素，如传感器网络监测（Papadimitriou和Yu，2006年）、能源和智能电网管理、经济和金融（Zhu和Shasha，2002年）以及疾病传播分析（Matsubara等人，2014年）。在这些场景中，我们可以利用大量关于过去行为的时间序列数据进行长期预测，即长序列时间序列预测（LSTF）。然而，现有的方法是在有限的问题设置下设计的，例如预测48点或更少。越来越长的序列使模型的预测能力变得紧张，以至于有人认为这种趋势阻碍了LSTF的研究。作为一个经验例子，图（1）显示了实际数据集上的预测结果，其中LSTM网络预测了短期内（12点，0.5）变电站的每小时温度到长期（480分，20天）。当预测长度大于48点（图（1（c）中的实心星）时，整体性能差距很大。MSE得分上升到不满意的性能，推理速度急剧下降，LSTM模型失败。

LSTF的主要挑战是提高预测能力以满足日益增长的长序列需求，这需要

（a）非凡的长序列对齐能力和
（b）对长序列输入和输出的有效操作。

最近，Transformer模型比RNN模型在捕获长程依赖性方面表现出更好的性能。自注意机制可以将网络信号传播路径的最大长度减少到理论上的最短O（1），避免了循环结构，从而使变压器具有解决LSTF问题的巨大潜力。但另一方面，由于其L-二次计算和L长度输入/输出的内存消耗，自我注意机制违反了要求（b）。一些大型变压器模型在NLP任务上倾注了大量资源并产生了令人印象深刻的结果（Brown等人，2020），但是几十个GPU的培训和昂贵的部署成本使得这些模型在现实世界的LSTF问题上无法承受。自我注意机制和转换框架的效率成为将其应用于LSTF问题的瓶颈。因此，在本文中，我们试图回答这样一个问题：变压器模型是否可以改进为计算、存储和结构效率高，以及保持更高的预测能力？

Vanilla Transformer（Vaswani et al.2017）在解决LSTF时有三个显著的局限性：

1 自我注意的二次计算。自我注意机制的原子操作，即正则点积，使得时间复杂度和每层内存使用量为O（L2）。
2 为长输入堆叠层时的内存瓶颈。J编解码器层的堆栈使得总内存使用量为O（J·L2），这限制了接收长序列输入时模型的可伸缩性。
3 预测长期产出的速度骤降。vanilla Transformer的动态解码使得逐步推理与基于RNN的模型一样慢，如图（1c）所示。

在提高自我注意的效率方面已有一些研究。稀疏变换器（Child et al.2019）、对数稀疏变换器（Li et al.2019）和Longferer（Beltagy、Peters和Cohan 2020）都使用启发式方法来解决限制1问题，并将自我注意机制的复杂性降低到O（Llog L），其效率增益有限（Qiu et al.2019）。Reformer（Kitaev、Kaiser和Levskaya 2019）也通过局部敏感散列自我注意实现了O（Llog L），但它只适用于非常长的序列。最近，Linformer提出了一个线性复杂度O（L），但是对于现实世界中的长序列输入，项目矩阵不能固定，这可能有退化为O（L2）的风险。Transformer-XL（Dai et al.2019）和Compression-Transformer（Rae et al.2019）使用辅助隐态来捕获长程依赖，这可能会放大限制1，不利于打破效率瓶颈。所有的工作主要集中在限制1上，限制2和限制3仍然存在于LSTF问题中。为了提高预测能力，我们将解决所有这些问题，并在所建议的告密者中实现效率以外的改进。

为此，我们的工作深入研究了这三个问题。我们研究了自我注意机制中的稀疏性，对网络组件进行了改进，并进行了广泛的实验。本文的贡献总结如下：

我们提出Informer来成功地提高LSTF问题的预测能力，这验证了类变压器模型的潜在价值，以捕捉长序列时间序列输出和输入之间的个体长期依赖性。
我们提出了一种稀疏的自我注意机制来有效地替代规范的自我注意，实现了O（llogl）的时间复杂度和O（llogl）的内存使用率。
我们提出了在J-堆叠层中控制注意分数的自注意提取操作特权，并将总空间复杂度大幅降低到O（（2∈）Llog L）。
我们提出了一种生成式解码器，只需一个前向步骤即可获得长序列输出，同时避免了推理阶段的累积错误扩散。

2 Preliminary

我们首先给出问题的定义。在具有固定大小窗口的滚动预测设置下，输入X t={xt1。，xtLx | xti∈Rdx}在时间t，输出是预测相应的序列Yt={yt1。，ytLy | yit∈Rdy}。LSTF问题比以前的工作（Cho et al.2014；Sutskever、Vinyals和Le 2014）鼓励更长的输出长度Ly，并且特征维数不限于单变量情况（dy≥1）。

编码器-解码器架构许多流行的模型被设计成将输入表示X t“编码”为隐藏状态表示Ht，并从Ht={ht1。，htLh}。该推断涉及一个称为“动态解码”的分步过程，其中解码器从先前的状态htk计算新的隐藏状态htk+1，并且从第k步计算其他必要的输出，然后预测第（k+1）序列ytk+1。

为了增强时间序列输入的全局位置上下文和局部时间上下文，给出了统一的输入表示。为了避免描述的琐碎化，我们把细节放在附录B中。

3 Proposed Method

现有的时间序列预测方法大致可分为两类1。经典时间序列模型是时间序列预测的可靠工具（Box et al.2015；Ray 1990；Seeger et al.2017；Seeger，Salinas，and Flunkert 2016），深度学习技术主要通过使用RNN及其变体（Hochreiter和Schmidhuber 1997；Li等人，2018；Yu等人，2017）。我们提出的Informer持有编码器-解码器架构，同时针对LSTF问题。请参阅图（2）的概述和以下章节的细节。

Efficient Self-attention Mechanism

（Vaswani et al.2017）中的规范自我注意是在接收元组输入（查询、键、值）时定义的，并以（Q，K，V）=Softmax（QK>√d）V的形式执行缩放点积，其中Q∈RLQ×d，K∈RLK×d，V∈RLV×d，d是输入维。为了进一步探讨自我注意机制，让qi、ki、vi分别代表Q、K、V中的第i行。按照（Tsai et al.2019）中的公式，第i个查询的注意力被定义为概率形式的核平滑器：

Encoder: Allowing for processing longer sequential inputs under the memory usage limitation

Decoder: Generating long sequential outputs through one forward procedure

4 Experiments

Datasets

ETT、ECL、Weather

Experimental Details

基线：附录E.1给出了网络组件的详细信息。我们选择了5种时间序列预测方法作为比较，包括ARIMA（Ariyo、Adewumi和Ayo 2014）、Prophet（Taylor和Letham 2018）、LSTMa（Bahdanau、Cho和Bengio 2015）和LSTnet（Lai等人2018）以及DeepAR（Flunkert、Salinas和Gasthaus 2017）。为了更好地探索在我们提出的告密者中稀疏自我注意力的表现，我们在实验中使用了规范的自我注意变体（告密者†）、高效的变体改革者（Kitaev、Kaiser和Levskaya 2019）以及最相关的工作对数稀疏自我注意（Li et al.2019）。

超参数调整：我们对超参数进行网格搜索，详细范围见附录E.3。Informer在编码器和2层解码器中包含一个3层堆栈和一个2层堆栈（1/4输入）。我们提出的方法是用Adam优化器优化的，它的学习率从1ee4开始，每1ee4衰减10倍2个时代，共10个时代。我们按照建议设置比较方法，批量大小为32。设置：每个数据集的输入是零均值归一化的。在LSTF设置下，我们逐步延长预测窗口的大小，即{ETTh，ECL，Weather}中的{1d，2d，7d，14d，30d，40d}，ETTm中的{6h，12h，24h，72h，168h}。指标：我们在每个预测窗口使用两个评估指标，包括MSE=1n Pni=1（y yˆy）2和MAE=1n Pni=1 | y yˆy |（多变量预测的平均值），并以步长=1滚动整个集合。平台：所有型号都在单个Nvidia V100 32GB GPU上进行培训/测试。

Results and Analysis

表1和表2总结了所有方法在4个数据集上的单变量/多变量评价结果。随着对预测能力的要求越来越高，我们逐渐延长了预测时间。为了进行公平的比较，我们精确地控制了问题设置，使LSTF在每个方法的单个GPU上都是可处理的。最佳结果以黑体字突出显示。

单变量时间序列预测 在这种情况下，每种方法都可以在一个单一的变量中进行预测。从表1中，我们观察到：
（1）所提出的模型Informer极大地提高了所有数据集的推理性能（最后一列中的获胜计数），并且它们的预测误差在不断增长的预测范围内平稳而缓慢地上升。这说Informer在提高LSTF问题的预测能力方面取得了成功。
（2）告密者在胜算方面胜过其典型的降级告密者†，即28>14，这在提供可比较的注意力特征图时支持查询稀疏性假设。我们提出的方法也优于最相关的工作LogTrans和Reformer。我们注意到，该方法保持动态解码，并且在LSTF中的性能较差，而其他方法则受益于生成式解码器作为非自回归预测器。
（3）与递归神经网络LSTMa相比，Informer模型具有更好的结果。我们的方法的均方误差降低41.5%（16860.7%（336）和60.7%（720）。这表明在自注意机制中，较短的网络路径比基于RNN的模型具有更好的预测能力。
（4）与DeepAR、ARIMA和Prophet相比，本文提出的方法在MSE上取得了更好的效果，分别降低了20.9%（168）、61.2%（336）和平均51.3%（720）。在ECL数据集上，DeepAR在较短的视界（≤336）上表现更好，我们的方法优于在较长的视界上。我们把这归因于一个具体的例子，在这个例子中，预测能力的有效性反映在问题的可伸缩性上。

Computation Efficiency

使用多元设置和每个方法的当前最佳实现，我们在图（5）中执行了严格的运行时比较。在训练阶段，在基于变压器的方法中，信息者（红线）获得了最佳的训练效率。在测试阶段，我们的方法比其他生成式解码方法要快得多。表6总结了理论时间复杂度和内存使用的比较，Informer的性能与运行时实验一致。注意，LogTrans关注于自我注意机制，我们在LogTrans中应用我们提出的解码器进行公平比较（见表6）

5 Conclusion

本文研究了长序列时间序列预测问题，提出了长序列预测的Informer方法。具体地说，我们设计了ProbSparse自注意机制和提取操作来处理vanilla Transformer中二次时间复杂度和二次内存使用的挑战。此外，精心设计的产生式译码器减轻了传统编解码结构的局限性。在实际数据上的实验结果表明，Informer方法对于提高LSTF问题的预测能力是有效的。

Pytorch的一小步，昇腾芯片的一大步 BRUCE_WUANG pytorch 人工智能 python
Pytorch的一小步，昇腾芯片的一大步相信在AI圈的人多多少少都看到了最近的信息：PyTorch最新2.1版本宣布支持华为昇腾芯片！1、发生了什么事儿？在2023年10月4日PyTorch2.1版本的发布博客上，PyTorch介绍的beta版本新特性上有一个PRIVATEUSE1特性是提高了第三方设备的支持，并说明了华为AscendNPU（昇腾NPU芯片）的OSS小组已经成功将torch_npu
每天五分钟深度学习pytorch：基于Pytorch搭建ResNet模型的残差块每天五分钟玩转人工智能深度学习框架pytorch 深度学习 pytorch 人工智能 ResNet 机器学习
残差块我们分析一下这个残差块，x经过两个卷积层得到F(x)，然后F(x)+x作为残差块的输出，此时就有一个问题，这个问题就是F(x)+x的维度问题，如果图片数据经过两个卷积层之后F(x)变小（height和weight变小）或者通道数发生了变化，那么此时F(x)是没有办法和x相加的，当然我们可以学习前面的GoogLeNet的方式，也就是说卷积之后的F(x)和x一样，大小不变，或者对x变道和F(x)
实战1. 利用Pytorch解决 CIFAR 数据集中的图像分类为 10 类的问题啥都鼓捣的小yao 深度学习 pytorch 分类人工智能深度学习
实战1.利用Pytorch解决CIFAR数据集中的图像分类为10类的问题加载数据建立模型模型训练测试评估你的任务是建立一个用于CIFAR图像分类的神经网络，并实现分类质量>0.5。注意：因为我们实战1里只讨论最简单的神经网络构建，所以准确率达到0.5以上就符合我们的目标，后面会不断学习新的模型进行优化CIFAR的数据集如下图所示：我们大概所需要的功能包如下：importnumpyasnpimpor
Pycharm搭建CUDA，Pytorch教程（匹配版本，安装，搭建全保姆教程）_cuda12(1) 2401_84557821 程序员 pycharm pytorch ide
查看cuda版本![](https://img-blog.csdnimg.cn/direct/ba9a3507f82a43b8891b42ab1566a71c.png)输入setcuda查看环境变量![](https://img-blog.csdnimg.cn/direct/722e47935a14465a906ed5b923d3cd45.png)如上两图即为下载成功！##二、安装Pytorch#
Training-free Neural Architecture Searchthrough Variance of Knowledge of Deep Network Weights（预览版本）境心镜免训练深度学习人工智能 NAS
代码位置摘要深度学习彻底改变了计算机视觉，但它使用深度网络架构取得了巨大的成功，而这些架构大多是手工制作的，因此可能不是最理想的。神经架构搜索(NAS)旨在通过遵循明确定义的优化范式来弥补这一差距，该范式系统地寻找最佳架构，给定客观标准，例如最大分类准确度。然而，NAS的主要限制是其天文数字般的计算成本，因为它通常需要从头开始训练每个候选网络架构。在本文中，我们旨在通过基于Fisher信息提出一种
智能教育：DeepSeek在课堂管理中的应用与代码实现 Evaporator Core #DeepSeek快速入门系统架构设计师 Python开发经验 deepseek
课堂管理是教育领域的重要组成部分，它直接影响教学效果和学生的学习体验。随着人工智能技术的发展，DeepSeek正在通过其强大的算法和数据处理能力，推动课堂管理的智能化和高效化。本文将结合代码实现，深入探讨DeepSeek在课堂管理中的应用。一、智能课堂管理系统：从数据到实时监控智能课堂管理的核心在于通过实时监控学生的学习行为，提供及时的反馈和调整。DeepSeek通过深度学习算法，能够从课堂数据中
基于PyTorch的深度学习5——神经网络工具箱 Wis4e 深度学习 pytorch 神经网络
可以学习如下内容：•介绍神经网络核心组件。•如何构建一个神经网络。•详细介绍如何构建一个神经网络。•如何使用nn模块中Module及functional。•如何选择优化器。•动态修改学习率参数。5.1核心组件神经网络核心组件不多，把这些组件确定后，这个神经网络基本就确定了。这些核心组件包括：1)层：神经网络的基本结构，将输入张量转换为输出张量。2)模型：层构成的网络。3)损失函数：参数学习的目标函
python可應用在金融分析的那一個方面，如何部署在linux server上面。蠟筆小新工程師金融
Python在金融分析中應用廣泛，以下是幾個主要方面：###1.**數據處理與分析**-使用**Pandas**和**NumPy**等庫來處理和分析大規模數據集，進行清理、轉換和統計運算。-舉例：處理歷史市場數據，分析價格趨勢、交易量等。###2.**機器學習與預測**-使用**scikit-learn**、**TensorFlow**或**PyTorch**建立模型進行股票價格預測、信用風險評估
深入探讨如何在LangChain中将参数从一个步骤传递到下一个步骤：高级技巧与实际应用 m0_57781768 langchain
深入探讨如何在LangChain中将参数从一个步骤传递到下一个步骤：高级技巧与实际应用在现代软件开发中，特别是在复杂的自然语言处理（NLP）和人工智能应用中，数据的传递和处理是至关重要的。LangChainExpressionLanguage(LCEL)为开发者提供了一种强大的工具，能够有效地管理数据流，并确保任务链中的每一步都能顺利进行。在这些任务链中，开发者常常需要将数据从一个步骤无缝地传递到
如何成为LangChain项目的贡献者 eahba langchain easyui 前端 python
技术背景介绍LangChain是一个开源项目，致力于处理自然语言处理和生成任务。随着AI和机器学习领域的快速发展，LangChain项目的更新速度也很快。此项目欢迎社区的参与，无论是新功能、基础设施改进、文档提升还是Bug修复，都在积极寻求贡献。核心原则解析参与开源项目不仅能提升个人技能，还能为社区带来价值。对LangChain的贡献包括但不限于以下几个方面：文档改进：帮助改善项目文档，以便新人和
深度学习-Android-图片加载框架-Glide-(二)-切入源码层深入分析-Glide-缓存策略 2401_84123077 程序员 android glide 缓存
介绍在上一篇中，我们知道了Glide框架的最基本的执行流程，那么只知道基本执行流程，这显然是不够的，我们要深挖Glide框架的细节处理原理，比如缓存机制，图片处理等，这一篇我们就一起去探索Glide的缓存机制。Glide缓存机制可以说是设计的非常完美，考虑的非常周全，下面就以一张表格来说明下Glide缓存。缓存类型缓存代表说明活动缓存ActiveResources如果当前对应的图片资源是从内存缓存
【vLLM 教程】使用 TPU 安装
vLLM是一款专为大语言模型推理加速而设计的框架，实现了KV缓存内存几乎零浪费，解决了内存管理瓶颈问题。更多vLLM中文文档及教程可访问→https://vllm.hyper.ai/vLLM使用PyTorchXLA支持GoogleCloudTPU。依赖环境GoogleCloudTPUVM（单主机和多主机）TPU版本:v5e、v5p、v4Python:3.10安装选项：href="https://v
使用LangChain实现最新NLP研究成果 eahba langchain 自然语言处理人工智能 python
近年来，自然语言处理（NLP）领域的研究取得了显著的进展，而LangChain通过实现这些最新的研究成果，为开发者和研究人员提供了强大的工具与服务。在本文中，我们将探讨一些被LangChain所引用的arXiv研究论文，并展示如何通过API调用和具体示例来实现这些前沿技术。技术背景介绍LangChain作为一个强大且灵活的开源工具，旨在简化大语言模型（LLMs）的开发与应用。通过对最新研究的集成，
【Transformer优化】Transformer的局限在哪？ T-I-M transformer 深度学习人工智能
自2017年Transformer横空出世以来，它几乎重写了自然语言处理的规则。但当我们在享受其惊人的并行计算能力和表征能力时，是否真正理解了它的局限性？本文将深入探讨在复杂度之外被忽视的五大核心缺陷，并试图在数学维度揭示其本质。一、全局注意力的"诅咒"：从**O(n²)**到O(n³)的计算困境自注意力机制的数学表达式：Attention(Q,K,V)=softmax(QK⊤dk)V\text{
【人工智能基础】生成模型：让数据“无中生有”的神奇魔法 roman_日积跬步-终至千里 #人工智能基础知识人工智能
文章目录一、生成模型的发展脉络二、生成模型的基本原理三、主要生成模型及其逻辑1、生成对抗网络（GAN）2、变分自编码器（VAE）3、扩散模型（DPM）4、基于能量的模型（EBM）5、正规化流（NF）四、生成模型对比分析五、生成模型的应用拓展一、生成模型的发展脉络在深度学习尚未兴起的时期，计算机视觉领域的传统图像生成算法主要依赖纹理合成和纹理映射等技术。这些算法基于手工设计的特征进行图像构建，然而，
AIGC技术研究与应用 ---- 下一代人工智能：新范式！新生产力！（2.1-大模型发展历程之背景与开端） shiter AI重制版】人工智能系统解决方案与技术架构人工智能 AIGC 深度学习
文章大纲按照目标不同，AI大模型可分为四类，多模态为未来方向NLP大模型CV大模型科学计算大模型多模态大模型2022年是大模型技术的拐点,前期技术铺垫奠定了基础生成式模型的开端VAE与GANVAEGAN参考文献与学习路径GPT系列模型解析前序文章模型进化券商研报陆奇演讲按照目标不同，AI大模型可分为四类，多模态为未来方向NLP大模型自然语言处理（NaturalLanguageProcessing，
基于Python的微博舆情分析与可视化系统【附源码】 AI博士小张 python 数据分析数据库
基于Python的微博舆情分析与可视化系统摘要研究背景及意义一、数据流程总体架构二、详细处理流程与代码实现1.数据采集模块2.数据清洗与预处理3.情感分析与特征工程4.舆情分析模型5.可视化呈现三、性能优化要点摘要基于Python的微博舆情分析与可视化系统旨在利用大数据和自然语言处理技术，实时抓取、分析微博平台上的用户言论，并通过可视化手段揭示舆情的动态演变规律。系统采用Python技术栈，结合网
数字识别项目不要天天开心机器学习人工智能深度学习算法
集成算法·Bagging·随机森林构造树模型：由于二重随机性，使得每个树基本上都不会一样，最终的结果也会不一样。集成算法·Stacking·堆叠：很暴力，拿来一堆直接上（各种分类器都来了）·可以堆叠各种各样的分类器（KNN,SVM,RF等等）·分阶段：第一阶段得出各自结果，第二阶段再用前一阶段结果训练实现神经网络实例利用PyTorch内置函数mnist下载数据。·利用torchvision对数据进
2024年Python最新Pytorch--3，面试高分实战 m0_60666452 程序员 python 学习面试
（1）Python所有方向的学习路线（新版）这是我花了几天的时间去把Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。最近我才对这些路线做了一下新的更新，知识体系更全面了。（2）Python学习视频包含了Python入门、爬虫、数据分析和web开发的学习视频，总共100多个，虽然没有那么全面，但是对于入门
2024年最新PyTorch深度学习项目实战100例数据集_python 深度学习项目演练 2401_84585440 程序员深度学习 python pytorch
前言最近很多订阅了《PyTorch深度学习项目实战100例》的用户私信咨询有些数据集下载不了以及一些文章中没有给出数据集链接，为了解决这个问题，专门开设了本篇文章，提供数据集下载链接，打包100例的所有数据集。本专栏适用人群：深度学习初学者，刚刚接触PyTorch的用户群体，专栏将具体讲解如何快速搭建深度学习模型用自己的数据集实现深度学习小项目，快速让新手小白能够对基于深度学习方法有个基本的框架认
PyTorch 学习路线 gorgor在码农 #python入门基础 python pytorch
学习PyTorch需要结合理论理解和实践编码，逐步掌握其核心功能和实际应用。以下是分阶段的学习路径和资源推荐，适合从入门到进阶：1.基础知识准备前提条件Python基础：熟悉Python语法（变量、函数、类、模块等）。数学基础：了解线性代数、微积分、概率论（深度学习的基础）。机器学习基础：理解神经网络、损失函数、优化器（如梯度下降）等概念。学习资源Python入门：Python官方教程机器学习基础
Imagen原理与代码实例讲解 AI天才研究院计算 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Imagen原理与代码实例讲解1.背景介绍在人工智能领域中,图像生成一直是一个具有挑战性的任务。传统的计算机视觉模型通常专注于理解和分析现有图像,而生成全新的高质量图像则需要更高级的技术。随着深度学习技术的不断发展,生成式对抗网络(GenerativeAdversarialNetworks,GAN)等新型模型逐渐展现出了令人惊叹的图像生成能力。谷歌的Imagen就是一种基于大型视觉语言模型的全新图
当深度学习遇见禅宗：用东方智慧重新诠释DQN算法带上一无所知的我智能体的自我修炼：强化学习指南深度学习算法人工智能 DQN
当深度学习遇见禅宗：用东方智慧重新诠释DQN算法“好的代码如同山水画，既要工笔细描，又要留白写意”——一个在终端前顿悟的开发者DQN是Q-Learning算法与深度神经网络的结合体，通过神经网络近似Q值函数，解决传统Q-Learning在高维状态空间下的"维度灾难"问题。引言：代码与禅的碰撞♂️在某个调试代码到凌晨三点的夜晚，我突然意识到：强化学习的过程，竟与佛家修行惊人地相似。智能体在环境中探索
无监督AI训练:机遇与挑战并存 AI天才研究院计算 ChatGPT DeepSeek R1 &大数据AI人工智能大模型 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
无监督AI训练：机遇与挑战并存关键词：无监督学习、AI训练、机器学习、聚类算法、降维技术、深度学习摘要：本文深入探讨无监督AI训练这一新兴领域，首先介绍了其基本概念与原理，然后详细解析了无监督AI训练的核心技术，如聚类算法和降维技术，以及无监督深度学习。接着，本文通过实际项目案例分析，展示了无监督AI训练的应用实践。最后，本文分析了无监督AI训练面临的挑战，并展望了其未来发展趋势。通过本文的阅读，
提高客户体验：人类计算在营销中的应用 AI天才研究院 ChatGPT AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
人类计算与营销：开启个性化时代的未来人类计算与营销：开启个性化时代的未来关键词：人工智能、个性化营销、客户体验、数据驱动、客户关系管理摘要：本文探讨了人类计算在营销中的应用，包括语音识别、人脸识别、自然语言处理等技术，以及如何通过这些技术实现个性化营销、客户关系管理和用户体验优化。文章分析了当前技术的发展趋势和面临的挑战，并提出了未来发展的方向。引言随着人工智能技术的飞速发展，人类计算在各个领域中
PyTorch：Python深度学习框架使用详解零度° python python 深度学习 pytorch
PyTorch是一个开源的机器学习库，广泛用于计算机视觉和自然语言处理领域。它由Facebook的AI研究团队开发，因其动态计算图、易用性以及与Python的紧密集成而受到开发者的青睐。PyTorch的主要特点动态计算图：PyTorch的计算图在运行时构建，使得模型的修改和调试更加灵活。自动微分：自动计算梯度，简化了机器学习模型的训练过程。丰富的API：提供了丰富的神经网络层、函数和损失函数。跨平
关于自然语言处理（三）深度学习中的文字序列数据的分词操作 MatrixSparse 大模型人工智能自然语言处理深度学习人工智能
深度学习中的文字序列数据二维文字序列在文字数据中，样本与样本之间的联系是语义的联系，语义的联系即是词与词之间、字与字之间的联系，因此在文字序列中每个样本是一个单词或一个字（对英文来说大部分时候是一个单词，偶尔也可以是更小的语言单位，如字母或半词），故而在中文文字数据中，一张二维表往往是一个句子或一段话，而单个样本则表示单词或字。此时，不能够打乱顺序的维度是vocab_size，它代表了一个句子/一
【开源项目】2024最新PHP在线客服系统源码/带预知消息/带搭建教程于飞SEO 免费资源分享开源 php 开发语言
简介随着人工智能技术的飞速发展，AI驱动的在线客服系统已经成为企业提升客户服务质量和效率的重要工具。本文将探讨AI在线客服系统的理论基础，并展示如何使用PHP语言实现一个简单的AI客服系统。源码仓库地址：ym.fzapp.top在线客服系统的理论基础AI在线客服系统通过自然语言处理（NLP）、机器学习（ML）和深度学习（DL）技术，能够理解和响应客户的查询。这些系统通常包括以下几个关键组件：自然语
基于CNN-BIGRU-Attention模型的功率预测（模型详解及代码复现）清风AI 深度学习算法详解及代码复现深度学习人工智能算法机器学习计算机视觉 cnn 神经网络
整体架构基于CNN-BiGRU-Attention模型的功率预测模型是一种融合了卷积神经网络(CNN)、双向门控循环单元(BiGRU)和注意力机制(Attention)的深度学习架构。这种混合模型旨在充分利用CNN的局部特征提取能力、BiGRU的长序列处理能力以及Attention机制的关键特征突出能力，从而提高功率预测的准确性和可靠性。模型的整体架构主要包括以下几个关键组件：输入层：设计的输入特
文生图图生视频文生视频人工智能AI工具节选行思理 AI 人工智能文生图文生视频图生视频数字人
1、MidjourneyAI图像和插画生成工具，官网地址：Midjourney中文站,MJ中文站-专业AI绘图网站2、StableDiffusion一种基于扩散技术的深度学习文本转图像模型，演示地址：StabilityAI3、通义万相阿里云通义大模型旗下的AI创意作画与视频生成平台，官网地址：通义万相_AI创意作画_AI绘画_人工智能-阿里云4、PhotoStudioAI模特AI商品图及视频一键生
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方