水w

深度学习之 12 循环神经网络RNN2

本文是接着上一篇深度学习之 12 循环神经网络RNN_水w的博客-CSDN博客

回顾

1 长程依赖问题

◼ 为什么在实际应用中，RNN很难处理长距离的依赖？

◼ 梯度消失举例

◼ 三种方法应对梯度消失问题

◼ sigmoid函数与tanh函数比较：

◼ 更加推荐：ReLU函数的图像和导数图

2 长短期记忆网络（LSTM）

◼ LSTM使用三个控制开关

◼ LSTM 的重复模块

◼ LSTM 的核心思想

◼ “门”（gate）

◼ 逐步理解 LSTM之遗忘门

◼ 逐步理解 LSTM之输入门

◼ 逐步理解 LSTM之更新单元状态

◼ 逐步理解 LSTM之输出门

（1） LSTM训练算法框架

（2）关于公式和符号的说明

（3）误差项沿时间的反向传递

（4）将误差项传递到上一层

（5）权重梯度的计算

3 门控循环神经网络（GRU）

◼ 优点

◼ LSTM与GRU

4 深层循环神经网络

◼ 堆叠循环神经网络 (Stacked Recurrent Neural Network, SRNN)

◼ 双向循环神经网络(Bidirectional Recurrent Neural Network)

回顾

需要寻优的参数有三个，分别是 U、V、W 。

权重矩阵W和U的寻优过程需要追溯之 前的历史数据 （BPTT算法的重点）。

1 长程依赖问题

RNN 的长处之一是它可以利用先前的信息到当前的任务上，尤其当相关的信息和预测的词之间的间隔较小时效果明显。

如预测句子“the clouds are in the sky ”中的最后一个词。

然而在间隔不断增大时，RNN 会丧失学习到连接如此远的信息的能力。

如预测句子“I grew up in France… I speak fluent French ”中最后一个词。

◼ 为什么在实际应用中，RNN很难处理长距离的依赖？

上一节关于RNN的推导中，误差项沿时间反向传播的公式为：

根据下面的不等式，来获取的模的上界（模可以看做对中每一项值的大小的度量）:

其中，、分别是对角矩阵和矩阵W模的上界。

可以看到，误差项从时刻传递到时刻，其值的上界是的 指数函数 。

当 − 很大时(也就是误差传递很多个时刻时), 整个式子的值就会变得极小(当乘积小于1)或者极大(当乘积大于1)，前者是梯度消失，后者是梯度爆炸。

梯度消失或者梯度爆炸会导致梯度为0或NaN，没法继续训练更新参数，也就是RNN的长程依赖问题 。

◼ 梯度消失举例

RNN中权重矩阵W最终的梯度是 各个时刻的梯度之和 ，即：

假设某轮训练中，各时刻的梯度以及最终的梯度之和如下图：

从t-3时刻开始，梯度已经几乎减少到0了。即从此时刻开始再往之前走，得到的梯度（几乎为零）就不会对最终的梯度值有任何贡献。这就是原始RNN无法处理长距离依赖的原因。

◼ 三种方法应对梯度消失问题

通常来说， 梯度爆炸 更容易处理一些。因为梯度爆炸的时候，程序会收到 NaN 错误。也可以设置一个梯度阈值，当梯度超过这个阈值时直接截取。

梯度消失 更难检测，也更难处理一些。总的来说，有三种方法应对梯度消失问题：

1. 合理的初始化权重值。 初始化权重，使每个神经元尽可能不要取极大或极小

值，以躲开梯度消失的区域。

2. 使用relu代替sigmoid和tanh作为激活函数。

3. 使用其他结构的RNNs ，比如长短时记忆网络（LTSM）和门控循环神经网络Gated Recurrent Unit（GRU）。

接下来将重点介绍LSTM和GRU两种网络。

◼ sigmoid函数与tanh函数比较：

• sigmoid函数的导数值范围为 (0,0.25] ，反向传播时会导致梯度消失

• tanh函数的导数值范围为 (0,1] ，相对范围较大，但仍会导致梯度消失

• sigmoid函数不是原点中心对称，输出均大于0

• tanh函数是原点中心对称，可以使网络收敛的更好

sigmoid函数的函数图和导数图：

虽然tanh函数相较于sigmoid函数而言比较相似，但是tanh函数的导函数（0~1）比sigmoid函数的导函数（0~1/4）大，tanh函数的函数图和导数图：

◼ 更加推荐：ReLU函数的图像和导数图

ReLU函数的左侧导数为0，右侧导数恒为1，避免了小数的连乘，但反向传播中仍有权值的累乘。ReLU函数改善了“梯度消失”现象。

非常借鉴了人体神经元的单边抑制单边激活，ReLU函数的图像和导数图：

缺陷：左侧基本为0，容易使得神经元就直接学死了，所以基本上会使用ReLU函数的变体。

2 长短期记忆网络（LSTM）

Long Short Term Memory networks（以下简称 LSTMs ），一种特殊的RNN网络，该网络设计出来是为了解决长程依赖问题。

增加状态c，称为单元状态(cell state)，让它来保存长期的状态

LSTMs首先继承了RNN模型的特性，所以它是具有短期记忆功能的。其次，它的特殊的记忆单元的设置，也让它具备了长期记忆的功能。

◼ LSTM使用三个控制开关

LSTM通过所谓的开关设置，去实现我们的这样一个状态单元C以及隐藏层的输出，那么我们下面来看一下这三个非常重要的状态单元是什么。

LSTM的关键，就是怎样控制长期状态 c 。LSTM使用三个控制开关：

        ① 第一个开关，负责控制如何继续保存长期状态 c

        ② 第二个开关，负责控制把即时状态输入到长期状态 c ；

        ③ 第三个开关，负责控制是否把长期状态 c 作为当前的LSTM的输出；

◼ LSTM 的重复模块

每一个模块表示的是不同的时刻。

标准RNN的重复模块如下，其中某一个时刻里面其实就这样一个tanh激活函数这么一个过程，相对来说内部结构比较简单。

而LSTM 的重复模块如下，除了h在随时间流动，单元状态c也在随时间流动，单元状态c就代表着长期记忆。

黄框：表示我们学习得到的神经网络层；

粉色圆：表示的是一些运算操作；

单箭头：箭头流向表示向量传输的方向；

两个箭头合并：表示向量的一个拼接过程；

箭头分叉：表示向量的复制过程；

◼ LSTM 的核心思想

与RNN很大一个区别：LSTM 的关键是状态单元C，如水平线在图上方贯穿运行。

单元状态的传递类似于传送带，其直接在整个链上运行，中间只有一些少量的线性交互，容易保存相关信息。

◼ “门”（gate）

前面描述的开关是怎样在算法中实现的呢？

LSTM 通过精心设计的称作为 “门”（gate） 的结构来去除或者增加单元状态中的信息。门是一种让信息选择式通过的方法。

此门包含一个 sigmoid 神经网络层和一个 pointwise 乘法操作。

补充： LSTM用两个门来控制单元状态c的内容：

        ➢ 遗忘门（forget gate） ，它决定了上一时刻的单元状态 c t-1 有多少保留到当前时刻 c t （有多少会被记住） ；

        ➢ 输入门（input gate） ，它决定了当前时刻网络的输入 x t 有多少保存到单元状态 c t 。

                • LSTM用输出门 来控制单元状态 c t 有多少输出到 LSTM的当前输出值 h t

◼ 逐步理解 LSTM之遗忘门

这个门怎么做到“遗忘“的呢？怎么理解？既然是遗忘旧的内容，为什么这个门还要接收新的?

用人来举例，我们脑海中记住了很多知识，但是知识不用的时候，我们是想不起来的。

假设现在出一道题去考你，你就会对其相关的知识进行回忆，那么这个回忆的过程就会有意识地去遗忘一些内容，记住一些内容，那在这个里面，为什么有些被记住了，有些被遗忘了？

其实就是这个新刺激Xt做了一个选择，或者说做了一个鞭策，去决定哪些是需要被遗忘的，哪些是需要被记住的。当然这个记住和遗忘的比例是多少，那么我们用通过S得到一个0~1的值去进行一个权衡选择。

◼ 逐步理解 LSTM之输入门

sigmoid 函数称为输入门，决定将要更新什么值；

tanh 层创建一个新的候选值向量，会被加入到状态中；

◼ 逐步理解 LSTM之更新单元状态

由于遗忘门的控制，它可以保存很久很久之前的信息，

由于输入门的控制，它又可以避免当前无关紧要的内容进入记忆。

◼ 逐步理解 LSTM之输出门

输出门控制了长期记忆对当前输出的影响，其由输出门和单元状态共同确定。

（1） LSTM训练算法框架

遗忘门：公式1

输入门：公式2和公式3，公式4（当前状态单元Ct的一个更新过程）

输出门：公式5和公式6

LSTM的训练算法仍然是反向传播算法。主要有下面三个步骤：

        ① 前向计算每个神经元的输出值，对于LSTM来说，即五个向量的值。计算方法已经在上一页中描述过了。

        ② 反向计算每个神经元的误差项 值。与 循环神经网络 一样，LSTM误差项的反向传播也是包括两个方向： 一个是沿时间的反向传播 ，即从当前t时刻开始，计算每个时刻的误差项； 一个是将误差项向上一层传播 。

        ③ 根据相应的误差项，计算每个权重的梯度。

（2）关于公式和符号的说明

设定门gate的激活函数为 sigmoid函数 ，输出的激活函数为 tanh函数 。它们的导数分别为：

sigmoid和tanh函数的导数都是原函数的函数。这样，一旦计算原函数的值，就可以用它来计算出导数的值。

LSTM需要学习的参数共有8组，分别是：

遗忘门的权重矩阵和偏置项、

输入门的权重矩阵和偏置项、

输出门的权重矩阵和偏置项、

计算单元状态的权重矩阵和偏置项。

因为权重矩阵的两部分在反向传播中使用不同的公式，因此在后续的推导中，权重矩阵

都将被写为分开的两个矩阵:

当O作用于两个矩阵时，两个矩阵对应位置的元素相乘。按元素乘可以在某些情况下简化矩阵

和向量运算。例如，当一个对角矩阵右乘一个矩阵时，相当于用对角矩阵的对角线组成的向量

按元素乘那个矩阵：

当一个行向量右乘一个对角矩阵时，相当于这个行向量按元素乘那个矩阵对角线组成的向量：

上面这两点，在后续推导中会多次用到。

（3）误差项沿时间的反向传递

上述公式就是将误差沿时间反向传播一个时刻的公式。有了它，可以写出将误差项向前传递到任意时刻的公式：

（4）将误差项传递到上一层

（5）权重梯度的计算

对于

的权重梯度，我们知道它的梯度是各个时刻梯度之和 ，我们首先求出它们在t时刻的梯度，然后再求出他们最终的梯度。

对于偏置项bf,bi,bc,bo的梯度，也是将 各个时刻的梯度加在一起 。下面是各个时刻的偏置项梯度：

对于

的权重梯度，只需要根据相应的误差项直接计算即可

3 门控循环神经网络（GRU）

GRU（Gate Recurrent Unit）是循环神经网络RNN的一种。和LSTM一样，也是为了解决长期记忆和反向传播中的梯度等问题而提出来的。

◼ 优点

GRU是LSTM的一种变体，它较LSTM网络的结构更加简单，而且效果也很好。

LSTM引入了三个门函数： 输入门 、 遗忘门 和 输出门 来控制输入值、记忆值和输出值。而在GRU模型中只有两个门，分别是 更新门和重置门 。另外，GRU将单元状态与输出合并为一个状态h。

◼ LSTM与GRU

• GRU的参数更少，因而训练稍快或需要更少的数据来泛化。

• 如果你有足够的数据，LSTM的强大表达能力可能会产生更好的结果。

Greff, et al. (2016)对流行的LSTM变种做了对比实验，发现它们的表现几乎一致。 Jozefowicz, et al. (2015)测试了超过一万中RNN结构，发现某些任务情形下，有些变种比LSTM工作得更好。

4 深层循环神经网络

⚫ 循环神经网络是可深可浅的网络

        ➢ 深网络：把循环网络按时间展开，长时间间隔的状态之间的路径很长；

        ➢ 浅网络：同一时刻网络输入到输出之间的路径 x t → y t 非常浅；

⚫ 增加循环神经网络的深度的意义

        ➢ 增强循环神经网络的能力；

        ➢ 增加同一时刻网络输入到输出之间的路径 x t → y t , 如增加隐状态到输出 h t → y t ，以及输入到隐状态 x t → h t 之间的路径的深度；

◼ 堆叠循环神经网络 (Stacked Recurrent Neural Network, SRNN)

◼ 双向循环神经网络(Bidirectional Recurrent Neural Network)

双向循环神经网络(Bidirectional Recurrent Neural Network)由两层循环神经网络组成，它们的输入相同，只是信息传递的方向不同

基于nodejs+vue.js服装商店电子商务管理系统
如果你是一个小白,你不懂得像javaPHP、Python等编程语言，那么Node.js是一个非常好的选择。采用vscode软件开发,配套软件安装.包安装调试部署成功,有视频讲解前端:html+vue+elementui+jQuery、js、css数据库：mysql,Navicatvue框架于Node运行环境的Web框架,随着互联网技术的飞速发展，世界逐渐成了一个地球村，空间的距离也不再是那么重要。
《Effective Python》第十一章性能——延迟加载模块，通过动态导入减少 Python 程序启动时间不学无术の码农 Effective Python 精读笔记 python 开发语言
引言本文基于《EffectivePython:125SpecificWaystoWriteBetterPython,3rdEdition》第11章:性能中的Item98：Lazy-LoadModuleswithDynamicImportstoReduceStartupTime。本文旨在总结书中关于延迟加载模块的核心观点，并结合我自己的开发经验，深入探讨其在实际项目中的应用场景与优化价值。Pytho
「日拱一码」010 Python常用库——statistics 胖达不服输「日拱一码」python python常用库 statistics
目录平均值相关mean()：计算算术平均值，即所有数值相加后除以数值的个数fmean()：与mean()类似，但使用浮点运算，速度更快，精度更高geometric_mean()：计算几何平均值，即所有数值相乘后开n次方根（n为数值的个数）harmonic_mean()：计算调和平均值，即数值个数除以每个数值的倒数之和median()：计算中位数，即将一组数值按大小顺序排列后位于中间的数。如果数值个
「日拱一码」013 Python常用库——Numpy 胖达不服输「日拱一码」python numpy 常用库
目录数组创建numpy.array：创建一个ndarray对象numpy.zeros：创建一个指定形状和数据类型的全零数组numpy.ones：创建一个指定形状和数据类型的全1数组numpy.empty：创建一个指定形状和数据类型的未初始化数组。其元素值是随机的，取决于内存中的初始状态numpy.arange：类似于Python内置的range函数，但返回的是ndarraynumpy.linspa
python日记Day17——Pandas之Excel处理石石石大帅 Python笔记 excel python 数据分析
python日记——Pandas之Excel处理创建文件importpandasaspddf=pd.DataFrame({'ID':[1,2,3],'Name':['Tom','BOb','Gigi']})df.to_excel("C:/Temp/Output.xlsx")print("done!")读取文件importpandasaspdpeople=pd.read_excel("C:/Temp
尚未调用 CoInitialize 问题解决
在线程开头处添加即可importpythoncompythoncom.CoInitialize()执行完成需要用pythoncom.CoUninitialize释放资源
uni-app 多端开发中 AI 的集成与适配：一次开发，智能多端运行欧阳天羲大前端与 AI 的深度融合 #AI 与大前端框架结合篇 uni-app 人工智能前端
一、引言：uni-app与AI多端集成的背景在当今跨平台开发趋势下，uni-app凭借"一次编写，多端运行"的特性成为企业级应用开发的首选框架之一。随着人工智能技术的普及，将AI能力集成到多端应用中已成为提升用户体验的关键需求。然而，小程序、APP、Web等不同端的运行环境差异显著，如何实现AI功能的统一集成与高效适配成为开发难点。本文将系统讲解在uni-app框架中集成AI能力的完整方案，涵盖跨
大语言模型技术系列讲解：大模型应用了哪些技术知世不是芝士语言模型人工智能自然语言处理 chatgpt 大模型
为了弄懂大语言模型原理和技术细节，笔者计划展开系列学习，并将所学内容从简单到复杂的过程给大家做分享，希望能够体系化的认识大模型技术的内涵。本篇文章作为第一讲，先列出大模型使用到了哪些技术，目的在于对大模型使用的技术有个整体认知。后续我们讲一一详细讲解这些技术概念并解剖其背后原理。正文开始大语言模型（LLMs）在人工智能领域通常指的是参数量巨大、能够处理复杂任务的深度学习模型。这些模型使用的技术主要
【常见问题】Python自动化办公，打开输出的word文件，报错AttributeError: module ‘win32com.gen_py.00020905-0000-0000-
Python自动化办公，打开输出的word文件，出现ERROR：File"D:\Develop\Building_save_energy\BuildingDiagnoseRenovationTool.py",line2930,inopen_docdoc_app=win32.gencache.EnsureDispatch('Word.Application')File"C:\Users\Jay\.c
第十一节：Vben Admin 最新 v5.0 (vben5) + Python Flask 快速入门 - 角色菜单授权锅锅来了 Vben vben5 Vben Admin python3 后台管理框架
Vben5系列文章目录基础篇✅第一节：VbenAdmin最新v5.0(vben5)+PythonFlask快速入门✅第二节：VbenAdmin最新v5.0(vben5)+PythonFlask快速入门-PythonFlask后端开发详解(附源码)✅第三节：VbenAdmin最新v5.0(vben5)+PythonFlask快速入门-对接后端登录接口(上)✅第四节：VbenAdmin最新v5.0(v
python 内置函数大全及完整使用示例慧一居士 Python python
Python内置函数是预先定义好的高效工具，涵盖数学运算、类型转换、序列操作等多个领域。以下是常见内置函数的分类大全及使用示例：一、数学运算函数abs(x)返回数值的绝对值，支持整数、浮点数和复数[1][2][4]。abs(-10)#输出10abs(-3.5)#输出3.5abs(3+4j)#输出5.0divmod(a,b)返回商和余数的元组，等价于(a//b,a%b)[2][4]。divmod(9
Python —— pandas 主要方法和常用属性（一）墨码笔记知识点 python 数据分析 Pandas
Pandas基础类型Series类型创建SeriesSeries的自定义索引读取SeriesPandaspandas数据分析统计包，是一款功能强大的用于数据分析的操作工具，由于其的实用性对操作数据的方便性广受欢迎，今天就来学习一下Pandas数据包的用法吧！在此之前推荐了解一下numpy基础类型说道数据类型，大家熟知的大概都是intstrbool等数据类型，或者是Python中的listtuple
「日拱一码」014 Python常用库——Pandas
目录数据结构pandas.Series：一维数组，类似于数组，但索引可以是任意类型，而不仅仅是整数pandas.DataFrame：二维表格型数据结构，类似于Excel表格，每列可以是不同的数据类型数据读取与写入读取数据pd.read_csv()：读取CSV文件pd.read_excel()：读取Excel文件pd.read_sql()：从数据库读取数据写入数据DataFrame.to_csv()
Python 项目完整结构示例慧一居士 Python python
以下是一个典型的Python项目完整结构示例，适用于中等规模的应用程序或库。该结构遵循最佳实践，具有良好的模块化、可维护性和扩展性。项目结构示例my_project/├──src/#源代码目录│├──__init__.py#标记为Python包│├──main.py#主程序入口（可选）│├──core/#核心功能模块││├──__init__.py││├──app.py││└──utils.py│
python tab键自动补全怎么用_python Tab自动补全命令设置 weixin_39961636 python tab键自动补全怎么用
Mac/Windows下需要安装模块儿pipinstallpyreadlinepipinstallrlcompleterpipinstallreadline注意，需要先安装pyreadline之后才能顺利安装readlineMac下代码如下>>>importrlcompleter>>>importreadline>>>importos>>>importsys>>>>>>if'libedit'inr
python tab键自动补全_为python命令行添加Tab键自动补全功能 weixin_39692253 python tab键自动补全
在使用linux命令的时候我们习惯使用下Tab键，在python下我们也可以实现类似的功能。具体代码如下：$catstartup.py#!/usr/bin/python#pythonstartupfileimportsysimportreadlineimportrlcompleterimportatexitimportos#tabcompletionreadline.parse_and_bind(
python tab键自动补全没反应_CentOS下为python命令行添加Tab键自动补全功能 weixin_39741459 python tab键自动补全没反应
难道python命令就真的没办法使用Tab键的自动补全功能么？当然不是了，我们依然可以使用。只不过需要自己动手配置一下。操作系统环境：CentOSrelease6.4x86_32软件版本：Python2.6.6下面我们具体了解配置方法：1、编写一个Tab键自动补全功能的脚本。新手会说不会写怎么办？搜索引擎可以帮助你，关键字(pythontab键自动补全)1、编写一个Tab键自动补全功能的脚本。新手
python命令行添加Tab键自动补全 weixin_30600503 python
1、编写一个tab的自动补全脚本,名为tab.py#!/usr/bin/python#pythontabcompleteimportsysimportreadlineimportrlcompleterimportatexitimportos#tabcompletionreadline.parse_and_bind('tab:complete')#historyfilehistfile=os.pat
【Python】edge-tts ：便捷语音合成宅男很神经 python 开发语言
第一章：初识edge-tts——开启语音合成之旅1.1文本转语音(TTS)技术概述文本转语音（Text-to-Speech,TTS），顾名思义，是一种将输入的文本信息转换成可听的语音波形的技术。它是人机语音交互的关键组成部分，使得计算机能够像人一样“说话”。1.1.1TTS的发展简史与重要性TTS技术的研究可以追溯到上世纪中叶，早期的TTS系统通常基于参数合成或拼接合成的方法，声音机械、不自然。参
免费学中医，这些优质资源不容错过少林659 零基础学中医免费学中医
零基础学中医，学中医如何入门免费学中医！问止精一书院链接：https://tool.nineya.com/qrcode/1iv54b4ts想入门中医却担心成本太高？其实有不少免费又优质的学习资源，问止中医的系列免费课程就是其中的佼佼者，涵盖理论与实操，满足不同学习者的需求。问止中医旗下的精一书院，是免费学中医的绝佳平台。由问止中医联合创始人林大栋博士主讲，课程聚焦中医结构分析、人工智能中医大脑技术
学会了编程才知道店员是“AI机器人” IT-博通哥 Python python 开发语言
根据老罗点咖啡的视频中（"给我来杯中杯"、"这是大杯，中杯是我们最小的杯型"的对话）我用Python代码模拟这个场景：classStarbucks:def__init__(self):self.cup_sizes={"中杯":"Tall","大杯":"Grande","超大杯":"Venti"}deforder_coffee(self,size):ifsize=="中杯":print("店员：这是
思维树(Tree of Thoughts): 超越链式思维的AI推理新范式司南锤 LLM 人工智能
引言在人工智能快速发展的今天，大语言模型(LLM)的推理能力一直是研究的热点。从最初的直接问答，到链式思维(ChainofThoughts,CoT)的出现，再到如今的思维树(TreeofThoughts,TOT)，AI的推理方式正在变得越来越接近人类的思维过程。思维树作为一种全新的推理框架，不仅继承了链式思维的优势，更通过树状结构的探索和回溯机制，实现了更加复杂和深入的推理过程。本文将深入探讨TO
【深度学习-Day 33】从零到一：亲手构建你的第一个卷积神经网络（CNN）吴师兄大模型深度学习入门到精通深度学习 cnn 人工智能 python 大模型卷积神经网络（CNN）机器学习
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
小白学习Python的系统化路径 python观点资讯
学好Python需要系统化的学习和持续的实践，尤其对于小白来说，从基础到进阶需要循序渐进。以下是一份清晰的学习路径和建议，帮助你高效掌握Python：1.打好基础核心语法变量与数据类型：整数、浮点数、字符串、布尔值等。运算符：算术、比较、逻辑运算符。流程控制：if-else条件判断、for/while循环。函数：定义函数、参数传递、返回值、作用域。数据结构：列表、元组、字典、集合的常用操作。推荐资
Python发送HTTP请求：http.client vs requests 对比解析华科℡云 apache 负载均衡 http
在Python中，http.client与requests是两种常用的HTTP请求工具，分别适用于不同场景。以下从功能特性、易用性、性能等方面进行对比。1.功能特性http.client：作为Python标准库的一部分，提供底层的HTTP协议支持，支持GET、POST、PUT、DELETE等请求方法。用户需手动管理连接、请求头、响应解析等细节，适合对HTTP协议有深入理解且需要精细化控制的场景。r
AttributeError: module ‘openai‘ has no attribute ‘ChatCompletion‘解决方案爱编程的喵喵 Python基础课程 python AttributeError openai ChatCompletion 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了AttributeError:mod
RAG技术全面对比研究：探索最优检索增强生成策略
检索增强生成（RAG）技术全景解析：从基础到前沿在当今信息爆炸的时代，如何从海量数据中快速准确地获取所需信息，是人工智能领域的一大挑战。Retrieval-AugmentedGeneration（RAG，检索增强生成）技术应运而生，它结合了检索和生成的优势，通过从大量文档中检索相关信息，再利用这些信息生成高质量的回答。本文将系统性地介绍18种RAG技术，通过概念解析、代码示例和实际应用场景分析，帮
Python Arcade库【2D 游戏框架】全面讲解老胖闲聊 Python库大全 python 游戏 pygame
在AI加持下未来1W天内会发生什么?现货【官方旗舰店首刷印签版】2049未来10000天的可能《失控》《必然》作者凯文·凯利全新作品未来25年改变世界的十大科技浪潮思考AI时代与中国的全新可能凯文凯文凯利吴晨著中信出版社让AI成为我们的得力助手：《用Cursor玩转AI辅助编程——不写代码也能做软件开发》不被淘汰，AI赋能从现在开始AI赋能【作者寄语印签版+赠导读手册】领英联合创始人里德·霍夫曼新
短信验证码注册登录的Python实现：http.client与Requests实战仰望尾迹云
本文还有配套的精品资源，点击获取简介：短信验证码是用户注册和登录的常用安全措施。在Python中，http.client和Requests是两个关键模块，分别用于处理HTTP请求。http.client是Python标准库的一部分，适用于低级HTTP操作，而Requests是一个第三方库，提供了更简洁的HTTP请求处理方式。本课程将通过http.client.py和Requests.py两个文件的
http.client.HTTPConnection.POST和requests.post区别抖音运维厨师长 python http chrome python
http.client.HTTPConnection.POST和requests.post是用于在Python中执行HTTPPOST请求的两种方法，但它们在实现和使用上有很大的区别。http.client.HTTPConnection.POSThttp.client是Python标准库中的模块，用于低级别的HTTP协议操作。使用http.client.HTTPConnection，你可以手动构建H
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/[email protected]:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理

深度学习之 12 循环神经网络RNN2

回顾

1 长程依赖问题

◼ 为什么在实际应用中，RNN很难处理长距离的依赖？

◼ 梯度消失举例

◼ 三种方法应对梯度消失问题

◼ sigmoid函数与tanh函数比较：

◼ 更加推荐：ReLU函数的图像和导数图

2 长短期记忆网络（LSTM）

◼ LSTM使用三个控制开关

◼ LSTM 的重复模块

◼ LSTM 的核心思想

◼ “门”（gate）

◼ 逐步理解 LSTM之遗忘门

◼ 逐步理解 LSTM之输入门

◼ 逐步理解 LSTM之更新单元状态

◼ 逐步理解 LSTM之输出门

（1） LSTM训练算法框架

（2）关于公式和符号的说明

（3）误差项沿时间的反向传递

（4）将误差项传递到上一层

（5）权重梯度的计算

3 门控循环神经网络（GRU）

◼ 优点

◼ LSTM与GRU

4 深层循环神经网络

◼ 堆叠循环神经网络 (Stacked Recurrent Neural Network, SRNN)

◼ 双向循环神经网络(Bidirectional Recurrent Neural Network)

你可能感兴趣的:(#,深度学习,rnn,人工智能,深度学习,神经网络,python)