BrightLampCsdn

卷积convolution函数详解及反向传播中的梯度求导

摘要

本文给出 convolution 函数的定义, 并求解其在反向传播中的梯度

相关

配套代码, 请参考文章 :

Python和PyTorch对比实现卷积convolution函数及反向传播

系列文章索引 :
https://blog.csdn.net/oBrightLamp/article/details/85067981

正文

1. 概念

灰度图片单通道卷积 :

图片来源 : https://github.com/vdumoulin/conv_arithmetic

RGB图片三通道分别卷积, 将三个实数值结果相加 :

图片来源 : http://cs231n.github.io/convolutional-networks/

关于卷积的概念, 网络上已经有大量的详细资料, 都讲的很好, 这里就不再赘述了.

2. 卷积的定义

本文约定矩阵元素的脚标从 0 开始.

当 X 为 m x n 矩阵, W 为 2 x 2 矩阵, 步长为 1 时 :
$y_{ij} = \sum_{i=0}^{m-2}\sum_{j=0}^{n-2}(x_{i,j}w_{00} + x_{i,j+1}w_{01}+x_{i+1,j}w_{10} + x_{i+1,j+1}w_{11}) + b\\ \;\\ i\leqslant m-2 \\ \;\\ j\leqslant n-2 \\$
当 X 为 m x n 矩阵, W 为 p x q 矩阵, 步长为 1 时 :
$y_{ij} =\sum_{r=0}^{p-1}\sum_{s=0}^{q-1}x_{i+r,j+s}w_{rs}+ b\\ \;\\ i\leqslant m-p\\ \;\\ j\leqslant n-q\\$
当 W 为 p x q 矩阵, 步长为 t, 为保证整除, 填充后的 X 是 m x n 矩阵时 :
$y_{ij} = \sum_{r=0}^{p-1}\sum_{s=0}^{q-1}x_{i\cdot t+r,j\cdot t+s}w_{rs}+b\\ \;\\ i\leqslant (m-p)/t\\ \;\\ j\leqslant (n-q)/t\\$

偏置 b 为标量.

3. 反向传播

3.1 误差值对 X 的梯度的理论推导

当 W 为 p x q 矩阵, 步长为 t, 为保证整除, 填充后的 X 是 m x n 矩阵, 经 conv 卷积得到矩阵 g x h 矩阵 Y, 往前 forward 传播得到误差值 error (标量 e ). 上游的误差梯度向量 $\nabla e_{(Y)}$ 已在反向传播时得到, 求 e 对 X 的梯度.

已知 :
$y_{ij} = \sum_{r=0}^{p-1}\sum_{s=0}^{q-1}x_{i\cdot t+r,\;j\cdot t+s}w_{rs}+b\\ \;\\ i\leqslant (m-p)/t\\ \;\\ j\leqslant (n-q)/t\\$

$e=forward(Y)\\ \;\\ \nabla e_{(Y)}=\frac{de}{dY}=\begin{pmatrix} \partial e/ \partial y_{11}&\partial e/ \partial y_{12}&\partial e/ \partial y_{13}&\cdots& \partial e/ \partial y_{1h}\\ \partial e/ \partial y_{21}&\partial e/ \partial y_{22}&\partial e/ \partial y_{23}&\cdots& \partial e/ \partial y_{2h}\\ \partial e/ \partial y_{31}&\partial e/ \partial y_{32}&\partial e/ \partial y_{33}&\cdots& \partial e/ \partial y_{3h}\\ \vdots&\vdots&\vdots&\ddots&\vdots\\ \partial e/ \partial y_{g1}&\partial e/ \partial y_{g2}&\partial e/ \partial y_{g3}&\cdots& \partial e/ \partial y_{gh}\\ \end{pmatrix}$

求解过程 :

$\;\; i\cdot t+r =u,\;j\cdot t+s=r\;\;时\\ \;\\ \frac{\partial y_{ij}}{\partial x_{uv}}= \left\{ \begin{array}{rr} w_{u-i\cdot t,\;v-j\cdot t}\;\;, & i\cdot t \leqslant u \leqslant i\cdot t+p-1 \;\\ & \& \;\;j\cdot t\leqslant v \leqslant j\cdot t+q-1\\ 0\;\;, & others,\;其他情况 \end{array} \right.$
若卷积区出现重叠, 则:
$i(t+1)\leqslant i\cdot t+p-1 \;\; or \;\; j(t+1)\leqslant j\cdot t+q-1$
即 :
$1\leqslant t\leqslant p-1 \;\;or\;\; 1\leqslant t\leqslant q-1$
由于 :
$\frac{\partial e}{\partial x_{uv}} = \sum_{i=0}^{g-1}\sum_{j=0}^{h-1}\frac{\partial e}{\partial y_{ij}}\frac{\partial y_{ij}}{\partial x_{uv}}$
删除零值项后得 :

1.当 $u, v$ 满足:

$i\cdot t \leqslant u \leqslant i\cdot t+p-1 \;\; \& \;\;j\cdot t\leqslant v \leqslant j\cdot t+q-1\;\;(条件1)\\$

$\frac{\partial e}{\partial x_{uv}}= \left\{ \begin{array}{rr} (\partial e/\partial y_{ij}) w_{u-i\cdot t,\;v-j\cdot t}\;, & t\geqslant p,\; t\geqslant q\\ \sum_{x=0}^{p-t}(\partial e/\partial y_{i-x\cdot t\;,j}) w_{u-i\cdot t,\;v-j\cdot t}\;, & 1\leqslant t\leqslant p-1,\; t\geqslant q\\ \sum_{y=0}^{q-t}(\partial e/\partial y_{i,\;j-y\cdot t}) w_{u-i\cdot t,\;v-j\cdot t}\;, & t\geqslant p,\; 1\leqslant t\leqslant q-1\\ \sum_{x=0}^{p-t}\sum_{y=0}^{q-t}(\partial e/\partial y_{i-x\cdot t,\;j-y\cdot t}) w_{u-i\cdot t,\;v-j\cdot t}\;, & 1\leqslant t\leqslant p-1 ,\; 1\leqslant t\leqslant q-1\\ \end{array} \right.$

其中, 上游误差梯度 $(\partial e/\partial y_{ij})$ 已由上游计算给出. 这个式子从上到下分别为卷积区无重叠, 行重叠, 列重叠, 行列都重叠 4 种情况.
2.当 $u, v$ 不满足上述条件1:

$\frac{\partial e}{\partial x_{uv}} = 0$

3.2 编程方法

为方便编程实现, 定义一个操作 $f$ :
$\begin{array}{lr} f(D,W,i,j):\\ \;\;\;\;\;\;\;D[it:it+p,\;jt:jt+q]+\!=(\partial e/\partial y_{ij})W_{p \times q} \end{array}$
表示将 D 矩阵中, 从脚标为 $\cdot t,\;\; j\cdot t$ 的元素开始, 取和 W 形状相同的子矩阵, 并将该子矩阵的元素原位加上 W 矩阵乘以 $(\partial e/\partial y_{ij})$ 后的元素. 参考的是 numpy 的记法.

将矩阵 D 按照矩阵 X 的形状使用零值初始化, 然后操作 $f$ 按照 Y 的形状对所有的 i, j 遍历一遍. 最后矩阵 D 就是 e 对 X 的梯度矩阵, 和上面的数学公式是等价的.

3.3 误差值对 W 的梯度的理论推导

参考上例 :
$y_{ij} = \sum_{r=0}^{p-1}\sum_{s=0}^{q-1}x_{i\cdot t+r,j\cdot t+s}w_{rs}+b\\ \;\\ \frac{\partial y_{ij}}{\partial w_{uv}}=x_{i\cdot t+u,j\cdot t+v}\\ \;\\ \frac{\partial e}{\partial w_{uv}} = \sum_{i=0}^{g-1}\sum_{j=0}^{h-1}\frac{\partial e}{\partial y_{ij}}\frac{\partial y_{ij}}{\partial w_{uv}}= \sum_{i=0}^{g-1}\sum_{j=0}^{h-1}\frac{\partial e}{\partial y_{ij}}x_{i\cdot t+u,j\cdot t+v}\\$
结果简洁, 编程实现时可以直接使用.

3.4 误差值对 b 的梯度的理论推导

参考上例 :
$\frac{\partial y_{ij}}{\partial b}=1\\ \;\\ \frac{\partial e}{\partial b} = \sum_{i=0}^{g-1}\sum_{j=0}^{h-1}\frac{\partial e}{\partial y_{ij}}\frac{\partial y_{ij}}{\partial b}= \sum_{i=0}^{g-1}\sum_{j=0}^{h-1}\frac{\partial e}{\partial y_{ij}}\\$
结果简洁, 编程实现时可以直接使用.

4. 补充说明.

4.1 多通道卷积

如果输入的数据包含多通道, 比如RGB彩色图片有红, 绿, 蓝三个通道相同尺寸的数据. 只要分别在这三个通道上进行卷积操作, 然后将结果加起来就可以了.

这三个卷积操作拥有独立的卷积核 W, 但偏置 b 是共享的, 一样的, 在最后的结果时才加上.

4.2 加快计算效率

为了避免两层循环嵌套, 可以将矩阵 X 和 W 都拉伸成一维向量, 加快计算效率. 但这样做会增加公式推导的复杂度, 这里就不展开讨论了.

4.3 PADDING 填充

在常见的深度学习框架算法中, 卷积操作都会集成 PADDING 填充操作.

本文默认输入的矩阵 X 已经做好了 PADDING 填充处理, 简化推导过程.

有兴趣的读者可以自行在卷积前添加一个维度整除判断及预处理操作, 而这并不会影响卷积部分的代码.

全文完

你可能感兴趣的:(深度学习基础)

深度学习基础之循环神经网络 Ctrl+CV九段手机器学习和深度学习 rnn 深度学习神经网络人工智能机器学习学习
目录基本概念与特点定义与工作原理结构组成应用领域自然语言处理语音识别时间序列分析优缺点优点缺点改进方法总结循环神经网络在自然语言处理中的最新应用和研究进展是什么？长短期记忆网络（LSTM）与门控循环单元（GRU）在解决梯度消失和爆炸问题上的具体差异和优势是什么？LSTM的结构与优势GRU的结构与优势具体差异门的数量：计算复杂度：性能对比：总结双向循环神经网络如何增强模型的上下文捕捉能力，与单向RN
【学习笔记】第三章深度学习基础——Datawhale X李宏毅苹果书 AI夏令营 MoyiTech 人工智能学习笔记
局部极小值与鞍点梯度为0的点我们统称为临界点，包括局部极小值、鞍点等局部极小值和鞍点的梯度都为0，那如何判断呢？先请出我们损失函数：L(θ)，θ是模型中的参数的取值，是一个向量。由于网络的复杂性，我们无法直接写出损失函数，不过我们可以写出损失函数的近似取值。根据宋浩老师所讲的大学一年级高等数学的知识，我们可以通过三阶泰勒展开对损失函数在θ附近的取值进行近似：其中，θ是模型中的参数的取值，θ’是在θ
基于matlab的深度学习案例及基础知识专栏前言逼子歌 matlab 深度学习信号处理神经网络矩阵运算 CNN
专栏简介内容涵盖深度学习基础知识、深度学习典型案例、深度学习工程文件、信号处理等相关内容，博客由基于matlab的深度学习案例、matlab基础知识、matlab图像基础知识和matlab信号处理基础知识四部分组成。一、基于matlab的深度学习案例1.1、matlab:基于模板匹配的车牌识别_阐述基于模板匹配的车牌识别的字符识别-CSDN博客1.2、基于卷积神经网络(CNN)的车牌自动识别系统(
pytorch深度学习基础 7（简单的的线性训练，SGD与Adam优化器）不是浮云笙 pytorch实战深度学习 pytorch 人工智能
接下来小编来讲一下一些优化器在线性问题中的简单使用使用，torch模块中有一个叫optim的子模块，我们可以在其中找到实现不同优化算法的类SGD随机梯度下降基本概念定义：随机梯度下降（SGD）是一种梯度下降形式，对于每次前向传递，都会从总的数据集中随机选择一批数据，即批次大小1。参数更新过程：这个参数的更新过程可以描述为随机梯度下降法，随机梯度下降（SGD）是一种简单但非常有效的方法，多用于支持向
Datawhale AI夏令营第四期魔搭- AIGC文生图方向 task03笔记汪贤阳人工智能 AIGC 笔记
如何学习八图ai模型kolors1,Kolors是由快手公司开源的第三代文本到图像生成模型，基于StableDiffusion框架开发。它支持中英文输入，特别在中文内容的理解和生成上表现出色。2,深度学习基础：熟悉神经网络、卷积神经网络（CNN）、Transformer等深度学习模型的基本原理。自然语言处理（NLP）：了解文本编码、语言模型等NLP技术，因为Kolors在生成图像时需要理解并处理输
1.深度学习基础-模型评估指标 alstonlou 深度学习指南深度学习人工智能机器学习算法 python
模型评估指标针对不同类型的任务，需要通过不同的模型评价指标进行评价，在实际应用中，可能需要结合具体任务和需求选择合适的评估方法。有监督学习回归任务回归任务模型的评估主要通过误差和拟合优度来进行，常用的指标包括平均绝对误差（MAE）、均方误差（MSE）、均方根误差（RMSE）和决定系数（R²）。在回归任务中，我们主要关注模型预测值与实际值之间的差异大小以及模型对数据整体变化的解释能力。以下是具体介绍
深度学习基础——卷积神经网络（一）牛哥带你学代码 Python数据分析 python数学建模算法深度学习 cnn 人工智能
卷积操作与自定义算子开发卷积是卷积神经网络中的基本操作，对于图像的特征提取有着关键的作用，本文首先介绍卷积的基本原理与作用，然后通过编写程序实现卷积操作，并展示了均值、高斯与sobel等几种经典卷积核的卷积效果，接着调用MindSpore中的卷积算子Conv2d来实现卷积操作，最后介绍了MindSpore中pyfunc和TBE两种自定义算子实现方法。卷积基本原理1.1卷积的概念卷积操作发展于信号处
大语言模型学习路线：从入门到实战 Tim_Van 人工智能语言模型自然语言处理大语言模型大模型
大语言模型学习路线：从入门到实战在人工智能领域，大语言模型（LargeLanguageModels,LLMs）正迅速成为一个热点话题。本学习路线旨在为有基本Python编程和深度学习基础的学习者提供一个清晰、系统的大模型学习指南，帮助你在这一领域快速成长。本学习路线更新至2024年02月，后期部分内容或工具可能需要更新。适应人群已掌握Python基础具备基本的深度学习知识学习步骤本路线将通过四个核
深度学习基础叁：反向传播算法白拾Official #深度学习神经网络算法网络深度学习人工智能
注：封面画师：新雨林-触站说明本页面无手机端适配，强制缩放阅读。使用纯html格式，保存教学用ppt，添加了部分个人笔记。目录工作正常，可以跳转。反向传播这里对反向传播的讲解比较奇怪，可能比较适合初学者理解。想要通过严谨的数学推导理解反向传播的同学，可以搜索一下。反向传播算法反向传播算法什么是正向传播网络什么是反向传播反向传播算法为什么需要反向传播图解反向传播反向传播计算链式求导法则案例1：通过反
深度学习基础之《TensorFlow框架（2）—图》 csj50 机器学习深度学习
一、什么是图结构1、图包含了一组tf.Operation代表的计算单元对象和tf.Tensor代表的计算单元之间流动的数据图结构：数据(Tensor)+操作(Operation)二、图相关操作1、默认图通常TensorFlow会默认帮我们创建一张图查看默认图的两种方法：（1）通过调用tf.compat.v1.get_default_graph()访问，要将操作添加到默认图形中，直接创建OP即可（2
深度学习基础之《TensorFlow框架（4）—Operation》 csj50 机器学习深度学习
一、常见的OP1、举例类型实例标量运算add，sub，mul，div，exp，log，greater，less，equal向量运算concat，slice，splot，canstant，rank，shape，shuffle矩阵运算matmul，matrixinverse，matrixdateminant带状态的运算variable，assgin，assginadd神经网络组件softmax，sig
大致聊聊ChatGPT的底层原理，实现方法黑马程序员官方 chatgpt 人工智能机器学习
文目录深度学习基础ChatGPT的本质ChatGPT原理详解一、深度学习基础—深度学习是什么？如何理解神经网络结构？关于生物神经网络结构如下：神经网络介绍人工神经网络（ArtificialNeuralNetwork,简写为ANN）也简称为神经网络(NN),是一种模仿生物神经网络结构和功能的计算模型。当电信号通过树突进入到核细胞时，会逐渐聚集电荷。达到一定的电位后，细胞会被激活，通过轴突发出信号。从
深度学习基础 EEPI 深度学习人工智能
深度学习基础highvariance/datamismatchwhatisdatamismatchhowtosolvedatamismatchdatasynthesis数据合成迁移学习与预训练/微调什么时候用迁移学习highvariance/datamismatchwhatisdatamismatch如果训练集和验证集的loss不一样，且验证集的loss高很多，有2种原因：1.方差太大。模型没见过
深度学习基础--反向传播掰不开桃子的男人
Modelimage.png前向传播image.png反向传播求误差image.png求对J的影响image.pngimage.png求对J的影响image.pngimage.png误差反传image.pngimage.pngimage.png参考：深度学习—反向传播(BP)理论推导-Backpropagation算法的推导与直观图解-文之-博客园
深度学习基础之-3.3线性二分类的神经网络实现 SusanLovesTech 深度学习二分类神经网络线性实现 python
线性二分类的神经网络实现提出问题回忆历史，公元前206年，楚汉相争，当时刘邦项羽麾下的城池地理位置如下：0.红色圆点，项羽的城池1.绿色叉子，刘邦的城池其中，在边界处有一些红色和绿色重合的城池，表示双方激烈争夺的拉锯战。样本序号123…119经度相对值0.0254.109…7.767纬度相对值3.4088.012…1.8721=汉,0=楚110…1问题：经纬度相对值为(5,1)时，属于楚还是汉？经
深度学习入门资料整理 AI视觉网奇应该看的算法深度学习基础深度学习入门
深度学习基础总结，无一句废话（附完整思维导图）深度学习如何入门？-知乎深度学习入门基础讲义_shuzfan的博客-CSDN博客_深度学习入门神经网络15分钟入门！足够通俗易懂了吧-知乎深度学习基础知识点梳理-知乎
新书速览|PyTorch 2.0深度学习从零开始学全栈开发圈深度学习 pytorch 人工智能
实战中文情感分类、拼音汉字转化、中文文本分类、拼音汉字翻译、强化学习、语音唤醒、人脸识别01本书简介本书以通俗易懂的方式介绍PyTorch深度学习基础理论，并以项目实战的形式详细介绍PyTorch框架的使用。为读者揭示PyTorch2.0进行深度学习项目实战的核心技术，实战案例丰富而富有启发。02本书内容本书共分15章，内容包括PyTorch概述、开发环境搭建、基于PyTorch的MNIST分类实
基于Python的深度学习基础程序媛了了 python 开发语言
Python基础Python是一种开源的、简单易记、可以自由使用编程语言。深度学习将使用NumPy和Matplotlib这两种外部库Python有“解释器”和“脚本文件”两种运行模式Python能够将一系列处理集成为函数或类等模块NumPy中有很多用于操作多维数组的便捷方法类与对象变量是挂在对象身上的标签classMan:#定义了一个新类Man，类Man生成了实例（对象）m#类Man的构造函数（初
深度学习知识学习笔记 wyn20001128 图像处理深度学习算法
一相关的深度学习基础知识（1）线性回归设房屋的⾯积为x1x_1x1，房龄为x2x_2x2，售出价格为yyy。我们需要建⽴基于输⼊x1x_1x1和x2x_2x2来计算输出的表达式，yyy也就是模型（model）。顾名思义，线性回归假设输出与各个输⼊之间是线性关系：y=w1x1+w2x2+by=w_1x_1+w_2x_2+by=w1x1+w2x2+b 在模型训练中，我们需要衡量价格预测值与真实值
【深度学习基础】什么是卷积？为什么要用卷积？ BIT可达鸭 ▶深度学习-计算机视觉神经网络卷积计算机视觉深度学习 python
什么是卷积？为什么要用卷积？（一）卷积的原理：1.卷积核：2.卷积层参数：2.1卷积核数：2.2卷积核的大小：2.3步长：2.4填充：3.池化层：3.1最大池化层（maxpooling）：3.2均值池化层（averagepooling）：（二）卷积的作用：1.减少参数量：
Coursera吴恩达《深度学习》课程总结（全）双木的木吴恩达深度学习笔记 AI 笔记深度学习神经网络人工智能 python
这里有Coursera吴恩达《深度学习》课程的完整学习笔记，一共5门课：《神经网络和深度学习》、《改善深层神经网络》、《结构化机器学习项目》、《卷积神经网络》和《序列模型》，最后附上人工智能领域大师访谈，干货满满。第一门课：神经网络和深度学习基础，介绍一些基本概念。（四周）第二门课：深度学习方面的实践，严密的构建神经网络，如何真正让它表现良好。超参数调整，正则化诊断偏差和方差，高级优化算法，如Mo
深度学习简介与应用 jcfszxc 测试专栏深度学习
深度学习简介与应用深度学习是人工智能领域中备受关注的一项技术，通过模拟人脑神经网络的结构，实现了在大规模数据上进行复杂任务的能力。本文将简要介绍深度学习的基本概念，并探讨其在不同领域的应用。深度学习基础深度学习的核心是神经网络，它由多个层次组成，每一层都包含多个神经元。通过训练这些神经网络，系统能够自动学习数据中的模式和特征，从而实现分类、预测等任务。人工神经网络结构输入层：接收数据的第一层，每个
深度学习基础知识湘溶溶深度学习分割深度学习人工智能
卷积神经网络——图像卷积特征提取卷积核（算子）用来做图像处理时的矩阵，与原图像做运算的参数。卷积层基本参数（卷积核大小，步长【pytorch默认为1】，padding边缘填充）输出尺寸=（输入尺寸-卷积核尺寸+2*padding）/stride+1卷积神经网络的基本结构层输入层：批次通道图像大小卷积层激活函数：加入非线性因素，提高神经网络对模型的表达能力，解决线性模型所不能解决的问题，CNN较为常
大模型的学习路线图推荐—多维度深度分析【云驻共创】一见已难忘 IT分享/测评/交流学习大模型语言模型多维度深度分析
本文背景近年来，随着深度学习技术的迅猛发展，大模型已经成为学术界和工业界的热门话题。大模型具有数亿到数十亿的参数，这使得它们在处理复杂任务时表现得更为出色，但同时也对计算资源和数据量提出了更高的要求。学习大模型的路线图通常需要一系列的基础知识、进阶技能以及实际应用经验。以下是一些相关的背景信息：1.深度学习基础：学习大模型之前，对深度学习的基本概念、神经网络的原理、激活函数、损失函数等基础知识有一
深度学习基础之数据操作丘小羽 pytorch 深度学习人工智能
深度学习中最常用的数据是张量，对张量进行操作是进行深度学习的基础。以下是对张量进行的一些操作：首先我们需要先导入相关的张量库torch。元素构造（初始化）使用arange创造一个行向量，也就是0轴（0维）。默认是按顺序创建，从0开始，元素类型默认是整数，当然也可以指定为浮点数。比如:可以使用张量shape属性来访问张量（沿每个轴的长度）的形状（shape）。当然指的是形状，也可能不只是一个维度。我
Pytorch第2周：深度学习基础 - Day 8-9: 神经网络基础 M.D 深度学习神经网络人工智能 pytorch python tensorflow2
Pytorch第2周：深度学习基础-Day8-9:神经网络基础学习目标：理解神经网络的基础概念。学习如何使用PyTorch的nn模块构建神经网络。学习内容：神经网络基础概念：神经元：构成神经网络的基本单元，模拟生物神经元的功能。层：神经网络的构建块，包括输入层、隐藏层和输出层。激活函数：引入非线性因素，使网络能够学习复杂的模式，如ReLU、Sigmoid、Tanh等。使用PyTorch的nn模块：
吴恩达倾情推荐！28张图全解深度学习知识！深度学习算法与自然语言处理 NLP与大模型机器学习深度学习人工智能自然语言处理机器学习
本文约7500字，建议阅读15分钟本文将从深度学习基础（01-13）、卷积网络（14-22）和循环网络（23-28）三个方面介绍该笔记。吴恩达在推特上展示了一份由TessFerrandez完成的深度学习专项课程图，这套信息图优美地记录了深度学习课程的知识与亮点。因此它不仅仅适合初学者了解深度学习，还适合机器学习从业者和研究者复习基本概念。这不仅仅是一份课程笔记，同时还是一套信息图与备忘录。需要原版
【深度学习入门】深度学习基础概念与原理代码骑士 #深度学习人工智能
*（本篇文章旨在帮助新手了解深度学习的基础概念和原理，不深入讨论算法及核心公式）目录一、深度学习概述1、什么是深度学习？2、深度学习与传统机器学习的区别3、深度学习的应用领域二、深度学习基本原理1、神经网络的基本结构（1）什么是神经网络？（2）神经网络基本结构2、激活函数的作用和选择（1）什么是激活函数？（2）激活函数的作用与选择3、损失函数的定义和选择（1）什么是损失函数（2）损失函数的选择4、
深度学习基础数据结构之张量：从一维到多维 m0_61254808 深度学习 python 深度学习机器学习人工智能
张量在深度学习框架中广泛应用于模型的输入、输出以及中间计算过程。通过支持高维度矩阵运算、记录梯度信息等功能，张量成为实现深度学习算法的关键。张量是一个多维数据容器，可以用来表示各种数据类型，如数值、图像、音频、文本等。本文将介绍一维、二维、三维和四维张量的形象展示、应用以及对学习理解的作用。01一维张量一维张量通常被称为向量，如一维数组[1,4,3,2,5]，在数学和线性代数中，向量是指具有大小和
深度学习基础知识整理 Do1phln ML 深度学习人工智能
自动编码器Auto-encoders是一种人工神经网络，用于学习未标记数据的有效编码。它由两个部分组成：编码器和解码器。编码器将输入数据转换为一种更紧凑的表示形式，而解码器则将该表示形式转换回原始数据。这种方法可以用于降维，去噪，特征提取和生成模型。自编码器的训练过程是无监督的，因为它不需要标记数据。它的目标是最小化重构误差，即输入数据与解码器输出之间的差异。这可以通过反向传播算法和梯度下降等优化
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他