I松风水月

LSTM长短期记忆网络，GRU

前言

上一篇博文我们介绍了RNN循环神经网络，虽然神经网络在解决时序问题是有着不错的表现，但是也有一个非常严重的问题，就是当网络结构比较深的时候，RNN网络由于前后的关联性导致了其在反向传播的时候会出现梯度消失或者梯度爆炸的情况，导致其很难实现真正落地。于是引出了我们今天要介绍的长短期记忆模型LSTM。

一. LSTM

1.1. 设计思路

RNN

RNN的设计思路是把所有的信息都记住，不管是有用的还是没用的信息。

LSTM

设计一个记忆细胞，具有选择性记忆的功能，可以选择记忆重要的信息，过滤掉噪声，减轻记忆负担

1.2. 前向传播

先来看下整体的网络结构：

乍一看LSTM很唬人，其实就是一个纸老虎，我们来拆分他的结构看一下。先跟RNN的网络结构对比一下看看区别是什么，下面是RNN的网络结构：

RNN和LSTM的区别：

LSTM内部多了很多的操作
RNN是一个箭头，LSTM是两个箭头，LSTM的上面一部分的箭头就是我们说的记忆细胞。

我们来详细看下LSTM的其中一部分的内部结构，如下图所示：

图示说明：

上面的 $C_{t-1}$ 和 $C_t$ 就是记忆细胞的部分，表示cell
$h_t$ 表示的是状态
$\sigma$ 表示门单元，输出介于0-1之间，其中 $f_t$ 表示遗忘门forget， $i_t$ 表示更新门， $o_t$ 表示输出门

我们把上面的内部结构的公式写出来如下，上面有一个门单元 $c_t$ 与C_t容易引起歧义，下面我们用 $g_t$ 代替：
$\left\{\begin{array}{l} i_t=\sigma\left(\tilde{i}_t\right)=\sigma\left(W_{x i} x_t+W_{h i} h_{t-1}+b_i\right) \\ f_t=\sigma\left(\tilde{f}_t\right)=\sigma\left(W_{x f} x_t+W_{h f} h_{t-1}+b_f\right) \\ g_t=\tanh \left(\tilde{g}_t\right)=\tanh \left(W_{x g} x_t+W_{h g} h_{t-1}+b_g\right) \\ o_t=\sigma\left(\tilde{o}_t\right)=\sigma\left(W_{x o} x_t+W_{h o} h_{t-1}+b_o\right) \\ c_t=c_{t-1} \odot f_t+g_t \odot i_t \\ m_t=\tanh \left(c_t\right) \\ h_t=o_t \odot m_t \\ y_t=W_{y h} h_t+b_y \end{array}\right.$

1.3. LSTM原理

上面我们列出了LSTM的计算过程，看起来很复杂，下面我们来看下他LSTM里面的各个单元所起到的作用是什么。

1.3.1. 记忆细胞

在LSTM的每个的每个时间步里面，都有一记忆cell，这个东西给予了LSTM记忆功能，使得LSTM有能力自由的选取每个时间步里面的记忆内容。简言之就是自己选择记住或者忘记。

举个栗子来解释，还是以下图为例：

场景：考试周，每个时间考一门试。
假设我们当前时间应该考概率论这门课，那么在此时 $X_t$ 时刻，我们应该复习的就是概率论这门课。这个结构的内部的一些操作就是复习过程中形成的记忆，在复习的过程中会生成新的记忆，然后带着这些记忆去参加考试， $h_t$ 就是考完概率论的得分。那么前面的 $C_{t-1}$ 就是上一门考试的记忆，假设是高数，那么 $h_{t-1}$ 就是考完高数的状态的结果。简言之， $h_t$ 是当前状态的结果, $C_t$ 是当前状态历史记忆的缓存。这里会有一个假设，假设我们的脑容量是有限的，意思就是考完高数之后就尽可能的把脑子里面的跟下一门考试概率论没有关系的记忆给抹除掉，腾出位置来给概率论做记忆的准备，这个就是遗忘门 $f_t$ 要干的事情， $f_t$ 里面很多介于0-1之间的值，比如说高数里面微积分对概率论有用，那么就保留，像空间向量这些对概率论没用的就抹除掉。那么更新门是干嘛用的呢？ $g_t$ （图中给的是 $c_t$ ，为了避免引起歧义，这里用 $g_t$ ）是我们看完概率论之后学习到的内容，但是里面有很多跟考点不想干，所以引入了更新门 $i_t$ 来更新学习到的内容。最终形成新的记忆 $C_t$ ， $C_t$ 有保留的上一次的状态+这次新学到的状态，可以理解为微积分能力+新学到的概率论的知识，然后去参加考试。
有没有发现上面有一个门我们一直没介绍，就是输出门 $o_t$ ，输出门是什么，为什么最后又加了一个输出么，作用是什么？同样结合上面的考试的例子来解释，考点很多，我们复习到的东西有很多，但是考试的时候就考那几题，所以 $o_t$ 就是让我只需要用我复习到的一部分的知识就行了。
总结：

遗忘门决定我要忘记哪些
更新门决定我要记住哪些新知识
输出门决定我要根据需要输出哪些

1.4. LSTM为什么能缓解梯度消失

在了解了LSTM的原理之后，我们来看下为什么LSTM能够缓解梯度消失的问题？
回顾一下RNN梯度消失的原因：
权重的连乘导致梯度消失或者梯度爆炸，罪魁祸首就是连乘项的权重。
下面我们来看一下为什么LSTM能够缓解梯度消失，看下下面的推到图，看着非常负复杂，有很多的参数，有点劝退，下面我们来注意剖析解开它神秘的面纱。

以图中的三个节点为例，最后一个是t=3，最前面是t=1，以推到 $w_{xf}$ 为例进行推导：

总共要对以上三个节点都求解导，记住核心就是复合函数的链式求导法则，涉及路线和变量过于复杂，这里就不推导了，直接贴一个哔站大佬的推导结果：LSTM反向传播推导。

由于推到过程过于繁琐复杂，对第一个节点的推导直接用路线表示：

最终化简成下面的式子：

对红色的部分求解，可以对着前向传播的公式求解：

$\left\{\begin{array}{l} i_t=\sigma\left(\tilde{i}_t\right)=\sigma\left(W_{x i} x_t+W_{h i} h_{t-1}+b_i\right) \\ f_t=\sigma\left(\tilde{f}_t\right)=\sigma\left(W_{x f} x_t+W_{h f} h_{t-1}+b_f\right) \\ g_t=\tanh \left(\tilde{g}_t\right)=\tanh \left(W_{x g} x_t+W_{h g} h_{t-1}+b_g\right) \\ o_t=\sigma\left(\tilde{o}_t\right)=\sigma\left(W_{x o} x_t+W_{h o} h_{t-1}+b_o\right) \\ c_t=c_{t-1} \odot f_t+g_t \odot i_t \\ m_t=\tanh \left(c_t\right) \\ h_t=o_t \odot m_t \\ y_t=W_{y h} h_t+b_y \end{array}\right.$
可以看出模型可以通过学习区控制权重系数的大小来控制 $\frac{\partial C_t}{\partial C_{t-1}}$ 让其接近于1，从而缓解梯度消失和梯度爆炸的现象。

二. GRU

上面经过梯度的反向传播的推导可以看出，LSTM可以缓解梯度消失和梯度爆炸的情况，但是他的参数量太多了，计算很复杂，训练的复杂度也变得很高，模型很容易出现过拟合。于是出现了LSTM的轻量版本GRU。我们下面来简单介绍下。

2.1. 结构和原理

其中：
$\begin{aligned} z_t & =\sigma\left(W_z \cdot\left[h_{t-1}, x_t\right]\right) \\ r_t & =\sigma\left(W_r \cdot\left[h_{t-1}, x_t\right]\right) \\ \tilde{h}_t & =\tanh \left(W \cdot\left[r_t * h_{t-1}, x_t\right]\right) \\ h_t & =\left(1-z_t\right) * h_{t-1}+z_t * \tilde{h}_t \end{aligned}$

对比下LSTM的结构，可以发现，GRU的门少了，并且GRU只有左边的一项输入，LSTM有两项，在GRU中可以认为 $h_{t}$ 是将 $C_t$ 和 $h_t$ 合二为一了。LSTM里面是遗忘门，更新门，输出门，GRU里面变为了更新门和重置门，对应到图里面就是 $r_t$ 和 $z_t$ 。核心的思路就是 $h_t =\left(1-z_t\right) * h_{t-1}+z_t * \tilde{h}_t$ ， $h_{t-1}$ 是前一时刻的内容，通过 $1-z_t$ 进行选择记忆哪些东西，遗忘掉哪些东西， $\tilde{h}_t$ 是当下所形成的新的内容，通过 $z_t$ 进行选择要记住哪些东西，过滤掉哪些东西。
同样我们举一个例子来解释GRU：以大学所修的学学科为例，如高数，线代，概率论，数电，模电，电路，C语言等，对这些学科我们都整理出了一部分的笔记代表这些学科的重点内容，那么：
$h_{t-1}= [高数，线代，概率论，数电，模电，电路，C语言] \ \\ x_t =机器学习 \ \\ h_t= [高数，线代，概率论，SVM，决策树，Python]$
我们将我们的笔记都放在了书柜里面，假设我们现在要学习机器学习这门课，我们现在要做的事情就是从以往的这些笔记中选取跟机器学习有关的笔记，挑选出来进行一波学习，但是我们的书柜容量是有限的，当我们学完之后我们需要把那些跟机器学习没关系的笔记给扔掉，然后把机器学习里面学习到的新的内容给它存进去，比如SVM,python等。下面我们来看下这些门做了些什么事情：
首先是重置门 $r_t$ ，他做了什么事情呢，首先就是从书柜中筛选出跟机器学习有关的笔记，比如通过这个sigmoid函数计算之后得出如下的向量，表示笔记对学习机器学习的帮助：
$r_t = [0.5, 0.6. 0.7, 0.01, 0.02, 0.01, 0.2]$
可以看出重置门就是一个求取相关系数的门，求得的结果是一个百分比。下面就将求得的结果应用于笔记，从中提取相关的内容，对应的就是 $\tilde{h}_t$ 中的 $r_t*h_{t-1}$ 的部分，可以理解成从这些学科里面吧跟机器学习相关的内容给提取出来了，要用提取出来的这部分的知识区阅读机器学习这个书本，前面的激活函数 $t anh$ 就相当于学习的过程，整理出一份关于机器学习得我笔记。假设我们整理出来的新笔记如下：
$\tilde{h}_t = [出版社，矩阵分解，极大似然估计线性回归，SVM，决策树，Python语言 ]$
可以看出里面会有一些跟我们学机器学习没关系的信息，比如出版社。以及一些冗余项，如矩阵分解在线性代数里面已经学过了，极大似然估计是概率论里面的。重复的内容吗，如python语言。我不需要再重复的把这些相似的这个笔记给存放进去，不相关的也不能放进书柜里面。所以就有了：
$z_t =\sigma\left(W_z \cdot\left[h_{t-1}, x_t\right]\right)$
从上面的前向传播可以看出，他的作用只有两个地方， $h_{t-1}$ 和 $h_t$ ， $z_t * \tilde{h}_t$ 可以理解成当前整理的笔记，把重复的，没用的部分抹除，有用的保留下来， $1-z_t )* h_{t-1}$ 可以理解成把没用的笔记清理掉，有用的保留下来，最终就得到了我们下面的公式：
$h_t =\left(1-z_t\right) * h_{t-1}+z_t * \tilde{h}_t$
$h_t$ 就是我们学习的机器学习的笔记。

1.3. LSTM和GRU的区别

事实上，这两种模型在许多任务中都不相上下，因此，与挑选出一个理想的架构相比，调整层数这些超参数等更重要；
GRU的参数较少，因此其训练速度更快，或需要归纳的数据更少。相对应的，如果有足够的训练数据，表达能力更强的LSTM或许效果更佳；
相比较于LSTM，GRU能降低过拟合风险；
GRU能够缓解梯度消失(可参考LSTM的推导，GRU只是LSTM的轻量版本，没有实质性差别)

问：为什么LSTM和GRU都能缓解梯度消失呢，从结构上解释。
答：核心就是因为这些门的设计，赋予了模型的一种选择记忆的功能，可以自由选择参数是否更新。

补充：
以上的不管是LSTM还是GRU举的例子，都只是为了便于理解，实际在炼丹的时候，模型的参数都是自己学的，能不能学到有用的信息要看网络怎么设计的，输入数据，超参数等各种因素。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
计算机网络八股总结 Petrichorzncu 八股总结计算机网络笔记
这里写目录标题网络模型划分（五层和七层）及每一层的功能五层网络模型七层网络模型（OSI模型）==三次握手和四次挥手具体过程及原因==三次握手四次挥手TCP/IP协议组成==UDP协议与TCP/IP协议的区别==Http协议相关知识网络地址，子网掩码等相关计算网络模型划分（五层和七层）及每一层的功能五层网络模型应用层：负责处理网络应用程序，如电子邮件、文件传输和网页浏览。主要协议包括HTTP、FTP
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
uniapp 获取各种小程序code 灵魂清零 uniapp 小程序
各种小程序在进入小程序是都需要去获取code才能拿到基础信息，自己记录一下用uniapp开发小程序是获取微信小程序、百度小程序、头条小程序、支付宝小程序的codeVue.prototype.$global={appLogin(){returnnewPromise((resole,reject)=>{varthat=this;varwxLoginUrl=app.globalData.url+"/lo
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性 aehrutktrjk 人工智能 easyui 前端 python
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性引言在机器学习和自然语言处理领域，选择合适的训练示例对模型性能至关重要。最大边际相关性(MaximalMarginalRelevance,MMR)是一种优秀的示例选择方法，它不仅考虑了示例与输入的相关性，还注重保持所选示例之间的多样性。本文将深入探讨如何使用MMR来选择示例，以提高AI模型的性能和泛化能力。什么是最大边际相关性(MM
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
数据分析-24-时间序列预测之基于keras的VMD-LSTM和VMD-CNN-LSTM预测风速皮皮冰燃数据分析数据分析
文章目录1普通的LSTM模型1.1数据重采样1.2数据标准化1.3切分窗口1.4划分数据集1.5建立模型1.6预测效果2VMD-LSTM模型2.1VMD分解时间序列2.2对每一个IMF建立LSTM模型2.2.1IMF1—LSTM2.2.2IMF2-LSTM2.2.3统一代码2.3评估效果3CNN-LSTM模型3.1数据预处理3.2建立模型3.3效果预测4VMD-CNN-LSTM模型4.1VMD分解
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
【机器学习与R语言】1-机器学习简介苹果酱0567 面试题汇总与解析 java 中间件开发语言 spring boot 后端
1.基本概念机器学习：发明算法将数据转化为智能行为数据挖掘VS机器学习：前者侧重寻找有价值的信息，后者侧重执行已知的任务。后者是前者的先期准备过程：数据——>抽象化——>一般化。或者：收集数据——推理数据——归纳数据——发现规律抽象化：训练：用一个特定模型来拟合数据集的过程用方程来拟合观测的数据：观测现象——数据呈现——模型建立。通过不同的格式来把信息概念化一般化：一般化：将抽象化的知识转换成可用
‌seq_len 不等于 hidden_size 难道不会报错吗，他们是一会事情吗 zhangfeng1133 python 人工智能开发语言 pytorch
seq_len与hidden_size在RNN中代表不同概念，不等不会报错‌。‌seq_len‌：序列长度，表示在处理数据时，每个批次（batch）中序列的长度。RNN网络会按照seq_len指定的长度进行循环计算‌1。‌hidden_size‌：隐藏层中隐藏神经元的个数，也是输出向量的长度。它决定了RNN网络中隐藏层的状态向量的维度‌12。在RNN的训练过程中，seq_len和hidden_si
【NLP5-RNN模型、LSTM模型和GRU模型】一蓑烟雨紫洛 nlp rnn lstm gru nlp
RNN模型、LSTM模型和GRU模型1、什么是RNN模型RNN（RecurrentNeuralNetwork)中文称为循环神经网络，它一般以序列数据为输入，通过网络内部的结构设计有效捕捉序列之间的关系特征，一般也是以序列形式进行输出RNN的循环机制使模型隐层上一时间步产生的结果，能够作为当下时间步输入的一部分（当下时间步的输入除了正常的输入外还包括上一步的隐层输出）对当下时间步的输出产生影响2、R
Python前沿技术：机器学习与人工智能 4.0啊 Python 人工智能 python 机器学习
Python前沿技术：机器学习与人工智能一、引言随着科技的飞速发展，机器学习和人工智能（AI）已经成为了计算机科学领域的热门话题。Python作为一门易学易用且功能强大的编程语言，已经成为了这两个领域的首选语言之一。本文将深入探讨Python在机器学习和人工智能领域的应用，以及一些前沿技术和工具。二、Python机器学习基础2.1机器学习概述机器学习是人工智能（AI）的一个关键子集，它的核心在于让
ajax 获取一步数据,ajax异步获取数据可可子姐姐教英语 ajax 获取一步数据
functioncreateXHR(){if(typeofXMLHttpRequest!="undefined"){returnnewXMLHttpRequest();}elseif(typeofActiveXObject!="undefined"){varversion=["MSXML2.XMLHttp.6.0","MSXML2.XMLHttp.3.0","MSXML2.XMLHttp"];fo
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include