JingYuJingYuJingYu

LeNet-5 卷积神经网络论文笔记-Gradient-Based Learning Applied to Document Recognition第Ⅰ、Ⅱ部分笔记

文章目录

LeNet-5 卷积神经网络论文笔记-Gradient-Based Learning Applied to Document Recognition第Ⅰ、Ⅱ部分笔记
- 文章介绍
- 理论基础及现状
- - - 损失函数，聚焦在模型在训练集和测试集上的表现差异。
    - 论文中提到的方法，正则化 regularization
  - B.Gradient-Based Learning ，基于梯度的学习
  - - 随机梯度下降算法 -- 即使到当前，仍是在机器学习中最常用的方法
  - C. Gradient Back Propagation 梯度反向传播
  - - 反向传播算法
- 卷积神经网络与传统全连接神经网络的差异和表现上的优点
- - - 大量的参数，带来过拟合的风险，以及训练的成本增加。
  - 全连接层完全忽略了输入的拓扑结构
- Convolutional Networks 卷积网络三大核心思想
- - 局部感受野 local Reception field
  - 子采样层 Subsampling layer
- 权值共享
- LeNet - 5 模型结构
- 总结

文章介绍

LeNet:《Gradient-Based Learning Applied to Document Recognition》 作为CNN的开山之作，广为人知。也是手写体识别经典论文。发表于1998年

文章发表于1998年，首次提出卷积神经网络的概念，在这之前关于神经网络的研究都处于全连接神经网络的阶段，全连接神经网络的提出开启了神经网络研究的新阶段。其中提出的关于CNN的三大核心思想在当前的神经网络研究中不断推陈出新。作者提出的 LeNet-5 为师姐最早的卷积神经网络之一。

1998年，作者Yann LeCun等人回顾了纸上手写字符识别的各种方法，并使用标准手写数字来识别基准任务。对这些模型进行了比较，结果表明该网络优于所有其他模型。并发表了本文。

原文篇幅很大，不仅详细介绍了LeNet-5 ，以及卷积神经网络，还介绍了其在不同技术以及应用。因为知识底蕴有限，故主要阅读了第一二部分，作者在第一部分详细介绍了此前机器学习、神经网络的基础，第二部分详细介绍了卷积神经网络以及 LeNet-5。

在最后，我附上了在我读这篇论文过程中对我有很大帮助的博客、文章。

LeNet论文的翻译与CNN三大核心思想的解读 : 我是自己一边看原文，不懂的地方谷歌翻译，还是不明白的地方我会看这篇博客，作者叙述的很详细，本文中有很多地方的翻译我直接采用了博主的翻译，在这里强推一波。博主是： qianqing13579

理论基础及现状

在卷积神经网络提出之前，领域能对单个模式识别任务主要分为两个模块来完成。如下图。

特征提取器，将对系统的输入提前特，将他们表示为低纬度的向量或符号。
分类模块。这里的机器学习也主要对分类模块进行训练。

但这种方法有极大的局限性。

损失函数，聚焦在模型在训练集和测试集上的表现差异。

介绍了机器学习的目标：

计算： $Y^p = F(Z^p,W)$

其中 $Z^p$ 为第 $p$ 次输入的特征（原文中翻译为 pattern）, $W$ 表示系统中可调参数的集合，也可称为权重。 $Y^p$ 为模型的输出，另外还有 $ D^p$ 为第 $p$ 次输入对应的期望输出，或者为实际输出。

定义了损失函数： $E^p = D(D^p,F(W,Z^p))$ 。式中的第一个D 是指计算 $D^p$ 与 $F(W,Z^p)$ 的差异。

损失函数在训练集中的平均值为 $E_{train}$ ，在测试集中的损失函数平均值为 $E_{test}$ .（测试集与训练集互不相交）

两者之差定义为： $E_{test} - E_{train} = k (\frac{h}{p})^α$

P是指训练集中样本的数量， h 是是衡量机器的“有效容量”或复杂程度的指标。α 在0.5到 1 之间，k是一个常数。

我们期望这个差值越小越好，越小则证明模型的泛化能力越强，模型在真实世界上的表现可能越好。两者之差越大，则证明模型的表现越差，出现了过拟合的现象。论文中提到，两者间的差距，总会伴随着训练样本集的增大而减小。

This gap always decreases when the number of training samples increases.

这也是早期的机器学习的一大阻力，即难以从真实世界中收集到足够大的训练集。

论文中提到的方法，正则化 regularization

在实际上，降低过拟合风险是通过最小化

$E_{train} + βH(W)$

来实现的。将此式子作为基础 loss function 的替代，最小化这个函数，来抑制过拟合的风险，并以此来期望模型得到一个好的表现。

$H (W)$ 称为正则函数 （H(w) is called a regulation function and β is a constant）， β为一个常数，作为超参。

通过最小化 $E_{train} + βH(W)$ ，实际上就是限制参数 $W$ 的变化，抑制 $W$ 的变化范围，来减少对模型过拟合的影响。

B.Gradient-Based Learning ，基于梯度的学习

已经知道我们目标在于，最小化损失函数的输出，即让模型的输出与期望输出差异越来越低，并在真实世界中有出色的表现。我们需要基于梯度。

The loss function can be minimized by estimating the impact of small variations of the parameter values on the loss function.

通过估计参数值在微小变化上对损失函数的影响，来使损失函数最小化。

前提： $E (W)$ 连续且处处可微。基于梯度下降，参数W 的迭代过程为：

$W_k = W_{k-1} - ε \frac{\partial E(W)}{\partial W}$

$\epsilon$ 是一个标量常数，为超参，通常称为学习率、或者学习步长。这部分基于梯度的学习，在最优化计算方法的计算内容中。

最优化计算方法中有很多二阶的计算方法，用于最小化损失函数，例如共轭梯度发、牛顿法等等。但文章作者在文中说，这些二阶方法在大型机器学习中的帮助十分有限。而最常用的最小化方法是随机梯度算法（SGD），也称为在线更新。

随机梯度下降算法 – 即使到当前，仍是在机器学习中最常用的方法

当模型在每见到一组训练数据都对参数进行更新时，我们称这种梯度下降法为SGD，即如下过程：

1.初始化参数（ $W$ ，学习率 $\alpha$ ）
2.计算W中每个分量的梯度
3.更新参数
4.重复步骤2 和3，直到代价值稳定

在实际运用中，使用小批量进行参数更新的mini-batch gradient descent也常常被叫做SGD，一般我们对使用单个训练数据更新还是小批量更新不做过多区分，而主要关注算法本身。

C. Gradient Back Propagation 梯度反向传播

基于梯度的学习算法，在上世纪五十年代就有开始使用，但它主要被局限在线性系统中。

当以下三件事发生的时候，人们才认识到这种简单的梯度下降技术在复杂的机器学习任务重的惊人表现。

第一件事是：早期在非线性系统中，人们总是被局部最小点而困扰，但实际上最近（1998）人们发现局部极小值似乎并不是早期非线性梯度学习技术的主要障碍。

第二是：反向传播算法。

Rumelhart 等人推广的一个简单而有效的算法来计算由几个处理层组成的非线性中的梯度，即反向传播算法

第三是：证明了反向传播算法应用于带有单位的多层神经网络可以解决复杂的学习任务。

反向传播算法

反向传播的基本思想是通过从输出到输入的传播可以有效地计算梯度。

卷积神经网络与传统全连接神经网络的差异和表现上的优点

对于输入层，图片等数据的输入，虽然可以采用全连接的前馈网络来完成图片对网络的输入，并且可以取得一定的成功，但有很大的问题。

大量的参数，带来过拟合的风险，以及训练的成本增加。

First, typical images are large, often with several hundred variables (pixels). A fully connected first layer with, e.g., one hundred hidden units in the first layer would already contain several tens of thousands of weights. Such a large number of parameters increases the capacity of the system and therefore requires a larger training set.

首先，典型的图像是巨大的，通常有几百个变量(像素)。一个完全连接的第一层，例如，在第一层有100个隐藏单元，那么这个隐藏单元已经包含了几万个重量。如此大量的参数增加了系统的容量，因此需要更大的训练集。

这里的容量，原文中为（capacity），谷歌机翻为容量，我认为是不恰当的，我认为这里指代的是系统的假设空间。（假设空间的概念在周志华《机器学习》中了解到）。即系统的弹性大小。

大量的参数，带来的是系统的弹性变大，使其过拟合的风险更大，而最简单抑制过拟合的方式即加大训练集。

此外

存储如此多的权重，对计算机的硬件要求较高，某些模型甚至难以实现。且训练的时间成本可能变高。

故采用全连接的方式对图片输入、处理是不好的。

但是没有结构的网络的主要缺点是，对于图像或者音频这些应用来说，不具备平移，形变扭曲的不变性。在输入到固定大小输入的神经网络，字符图像的大小必须归一化，并且放在输入的中间，不幸的是，没有哪种预处理能够达到如此完美：由于手写体以字符为归一化单位，会导致每个字符的大小，倾斜，位置存在变化，再加上书写风格的差异，将会导致特征位置的变化，原则上，足够大小的全连接网络可以对这些变化鲁棒，但是，要达到这种目的需要更多的在输入图像不同位置的神经元，这样可以检测到不同的特征，不论他们出现在图像的什么位置。学习这些权值参数需要大量的训练样本去覆盖可能的样本空间，在下面描述的卷积神经网络中，位移不变性(shift invariance)可以通过权值共享实现。

通俗的讲，传统的非结构化网络（unstructured nets）以及全连接前馈神经网络，对于图片或语音信号，有很大的限制。以图片为例，要求输入的图片最好不要发生形变、局部失真，要求输入图像集大小归一化，都居中。这样才方便特征提取器提取数据。

全连接层完全忽略了输入的拓扑结构

全连接的网络的另一个缺点就是完全忽略了输入的拓扑结构。在不影响训练的结果的情况下，输入图像可以是任意的顺序。然而，图像具有很强的二维局部结构：空间相邻的像素具有高度相关性。局部相关性对于提取局部特征来说具有巨大优势，因为相邻像素的权值可以分成几类。CNN通过将隐藏结点的感受野限制在局部来提取特征。

Convolutional Networks 卷积网络三大核心思想

卷积网络结合了三种结构思想，保证了一定程度的移位、缩放和失真不变性。

CNN通过局部感受野(local receptive fields)，权值共享(shared weights)，空间和时间上的**子采样(sub-sampling)**实现位移，缩放，和形变的不变性(shift,scale,distortion invariance)。

在论文中，作者用的叙述单词是： sub-sampling- 直译过来即子采样，在神经网络、深度学习后面的发展，这个过程被成为Pooling（池化）（参见AlexNet）。

下图为论文中提出的最早的CNN网络结构 LeNet-5

输入层输入大小归一化并且字符位于中间的字符图像。每一层的每个神经元(each unit)接受上一层中一组局部领域的神经元的输入(就是局部感受野local Receptive field)。

局部感受野 local Reception field

局部感受野通俗来讲它的思想是检测图像或者输入中的特定特征。例如我们见到鸟嘴、鸟脚、羽毛我们判断输入的图像可能是一张鸟的照片。局部感受野则是检测这一个个的特征，映射到特征图中，再探寻特征之间的关系。（多层卷积层、是否也是将特征之间识别为一个更上层的高层特征？）

局部感受野在视觉学习神经模型中使用很多次了，使用局部感受野，神经元能够提取边缘，角点等视觉特征，这些特征在下一层中进行结合形成更高层的特征，

每一层中所有的神经元形成一个平面，这个平面中所有神经元共享权值。这种平面上各单元的输出集称为特征图(feature map)。

**神经元(unit)**的所有输出构成特征图，特征图中所有单元在图像的不同位置执行相同的操作，这样他们可以在输入图像的不同位置检测到同样的特征，一个完整的卷积层由多个特征图组成(使用不同的权值向量)，这样每个位置可以提取多种特征。

一个卷积核对应检测一种特征，对应生成一张特征图。故可以理解为卷积核越多，能检测的特征越多，但伴随而来的是参数数量增加。

一个卷积核为对应若干神经元，覆盖整个输入中。特征图的size 由卷积核的大小以及步长（stride）决定。stride 为相邻两个神经元的间隔。卷积核的大小即(kernel size)。

一个具体的示例就是图2 LeNet-5中的第一层，第一层隐藏层中的所有单元形成6个平面，每个是一个特征图。一个特征图中的一个单元对应有25个输入 (因为kernel size = 5)，这25个输入连接到输入层的5x5区域，这个区域就是局部感受野 (local Receptive field)。每个单元有25个输入，因此有25个可训练的参数加上一个偏置。由于特征图中相邻单元以前一层中连续的单元为中心，所以相邻单元的局部感受野是重叠的 (重叠区域取决于 stride)。比如，LeNet-5中，水平方向连续的单元的感受野存在5行4列的重叠。如下图：

一个特征图中所有单元共享25个权值和一个偏置，所以他们在输入图像的不同位置检测相同的特征，每一层的其他特征图使用不同的一组权值和偏置，提取不同类型的局部特征。如在图二的LeNet-5中，第一层每个输入局部感受野或提取6个不同的特征。

特征图的一种实现方式就是使用一个带有感受野的单元，扫面整个图像，并且将每个对应的位置的状态保持在特征图中，这种操作等价于卷积，后面加入一个偏置和一个函数，因此，取名为卷积网络，卷积核就是连接的权重。卷积层的核就是特征图中所有单元使用的一组连接权重。

卷积层的一个重要特性是如果输入图像移动，特征图输出将移动相同的量，否则特征图保持不变。这一特性是卷积网络对输入信号的移位和失真具有鲁棒性的基础。

子采样层 Subsampling layer

这里的子采样层的概念与现在的池化层的概念等同。但在本文中对其目的的叙述比较多样。但目前的池化层主要是为了降低特征图分辨率，降低模型训练难度，但会影响模型的表现能力。随着目前硬件设备的发展，越来越多的CNN模型选择不加入池化层。

以下为Yann LeCun 对子采样层的阐述。

一旦计算出feature map,那么精确的位置就变得不重要了，相对于其他特征的大概位置是才是相关的。

在特征图中降低特征位置的精度的方式是降低特征图的空间分辨率，这个可以通过子采样层达到，子采样层通过求局部平均降低特征图的分辨率，并且降低了输出对平移和形变的敏感度。

LeNet-5中的第二个隐藏层就是子采样层。这个层包含了6个特征图，与前一层的6个特征图对应。每个神经元的感受野是2x2,每个神经元计算四个输入的平均，然后乘以一个系数，最后加上一个偏执，最后将值传递给一个sigmoid函数。相邻的神经元的感受野没有重叠。因此，子采样层的特征图的行和列是前一层特征图的一半。系数和偏置影响了sigmoid函数的效果。如果系数比较小，子采样层相当于对输入做了模糊操作。如果系数较大，根据偏置的值子采样层可以看成是“噪音或”或者“噪音与”操作。卷积层和子采样层是交替出现的，这种形式形成一个金字塔：每一层，特征图的分辨率逐渐减低，而特征图的数量逐渐增加。LeNet-5中第三个隐藏层(C3层)的每个神经元的输入可以来自前一层(S2)的多个特征图。子采样以及多个特征结合可以大大提高网络对几何变换的不变性。

权值共享

局部感受野类似于图像的卷积操作，能够提取局部特征，而图像局部的特征检测器也可以用于整个图像，这样就可以提取整幅图像的特征，基于这个特性，我们可以将局部感受野位于不同位置的神经元设置为相同的权值，这些神经元的输出形成CNN中的一个特征图，这样直接将参数个数降到了100个，这就是权值共享的思想。

权值共享大大减少了被训练参数的数量，降低了模型的复杂性，也在一定程度上对过拟合产生了抑制。

上述就是CNN的三大核心思想：

局部感受野(local receptive fields):基于图像局部相关的原理，保留了图像局部结构，同时减少了网络的权值

权值共享(shared weights): 也是基于图像局部相关的原理，同时减少网络的权值参数

下采样(sub-sampling)：对平移和形变更加鲁棒，实现特征的不变性，同时起到了一定的降维的作用。（这个在之后的发展似乎逐渐被取代）

LeNet - 5 模型结构

Lenet-5包含七个层，不计入输入，所有这些层都包含可训练的参数(权重)。输入是32x32像素的图像。输入图像为32*32大小。这要比Mnist数据库（一个公认的手写数据库）中最大的字母还大（28*28）。这样做的原因是希望潜在的明显特征如笔画端点或角点能够出现在最高层特征监测器感受野的中心。

在LeNet-5中，最后一层卷积层的感受野的中心在32x32的输入图像中形成了一个20x20的区域，输入像素值被归一化了，这样背景(白色)对应-0.1，前景(黑色)对应1.175.这使得输入的均值约等于0，方差约等于1，这样能够加速学习[46]。这里没看懂 >

C1层是一个卷积层，由6个特征图Feature Map构成。特征图中每个神经元与输入中5*5的邻域相连。特征图的大小为28*28，这样能防止输入的连接掉到边界之外。C1有156个可训练参数（每个滤波器5*5=25个unit参数和一个bias参数，一共6个滤波器，共(5*5+1)*6=156个参数），共122,304个连接（26* 28* 28 * 6，每个神经元对应26个连接，每个feature map有28*28个unit, 一共有6个feature map）。

连接计算公式： 122304 = 28*28*25*6 + ( 28* 28 * 6)
可训练参数计算公式：156 = (5*5+1)*6

S2层是一个下采样层，有6个14*14的特征图。特征图中的每个单元与C1中相对应特征图的2*2邻域相连接。S2层每个单元的4个输入相加，乘以一个可训练参数，再加上一个可训练偏置。结果通过sigmoid函数计算。每个单元的2*2感受野并不重叠，因此S2中每个特征图的行列分别是C1中特征图的一半。S2层有 12 个可训练参数(每个feature map有一个系数和偏置)和5880个连接。

12 = （1 + 1）* 6
5880 = 14 * 14 * 5 * 6

C3是一个有16个特征图的卷积层。C3层的卷积核大小为5*5，每个特征图中的每个单元与S2中的多个特征图相连，表1显示了C3中每个特征图与S2中哪些特征图相连。

C3的前6个特征图以S2中3个相邻的特征图为输入。接下来6个特征图以S2中4个相邻特征图为输入，下面的3个特征图以不相邻的4个特征图为输入。最后一个特征图以S2中所有特征图为输入。

这里C3 并没有和 S2 全部相连，而现代CNN中，比如AlexNet,ResNet等, 特征图与前一层的所有特征图相连。这里的不同还不明白。

S4层是一个下采样层，由16个5 * 5大小的特征图构成。特征图中的每个单元与C3中相应特征图的2 * 2邻域相连接，跟C1和S2之间的连接一样。S4层有32个可训练参数（每个特征图1个系数和一个偏置）和2000个连接(555*16,对于S4的每个unit,对应感受野4个参数，加上一个偏置)。

C5层是一个卷积层，有120个特征图。每个单元与S4层的全部16个特征图的5 * 5领域相连。由于S4层特征图的大小也为5\ * 5（同滤波器一样），故C5特征图的大小为1 * 1：**这构成了S4和C5之间的全连接。之所以仍将C5标示为卷积层而非全连接层，是因为如果LeNet-5的输入变大，而其他的保持不变，那么此时特征图的维数就会比1 *1大。**C5层有48120个可训练连接((5 * 5 * 16+1) *120)。

F6为全连接层。有8484个节点，所以有84 *（120+1）=1016484 *（120+1）=10164个参数

F6层计算输入向量和权重向量之间的点积，再加上一个偏置。神经元 $i$ 的加权和表示为 $a_i$ ,然后将其传递给sigmoid函数产生单元 $ i $ 的一个状态，表示为 $x_i$ ,

$x_i = f(a_i)$

sigmod函数是一个双曲线正切函数:

$f (a) = A * t a n h (S a)$

A表示函数的振幅，S决定了斜率，这个函数是一个奇函数，水平渐近线为+A，-A。常量A通常取1.7159。

输出层为全连接层，共有10个节点，采用的是径向欧式距离函数（RBF）的网络连接方式。

总结

卷积神经网络能够很好的利用图像的结构信息。
卷积层借助局部感受野和共享权值，大大减少参数数量，以及抑制过拟合。

LeNet虽然年代久远，但它开启了神经网络的新篇章，站着现在的角度，LeNet-5可能并不是那么初始，但学习它对于理解学习卷积神经网络以及理解上周读的 AlexNet 有很大的帮助。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
100天持续行动—Day01 Richard_DL
今天开始站着学习，发现效率大幅提升。把fast.ai的Lesson1的后半部分和Lesson2看完了。由于Keras版本和视频中的不一致，运行notebook时经常出现莫名其妙的错误，导致自己只动手实践了视频中的一小部分内容。为了赶时间，我打算先把与CNN相关的视频过一遍。然后尽快开始做自己的项目。明天继续加油，争取把Lesson3和Lesson4看完。
yolov5＞onnx＞ncnn＞apk 图像处理大大大大大牛啊 opencv实战代码讲解 yolo onnx ncnn 安卓
一.yolov5pt模型转onnx条件：colabnotebookyolov51.安装环境!pipinstallonnx>=1.7.0#forONNXexport!pipinstallcoremltools==4.0#forCoreMLexport!pipinstallonnx-simplifier2.修改common.py在classFocus下面
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
神经网络-损失函数红米煮粥神经网络人工智能深度学习
文章目录一、回归问题的损失函数1.均方误差（MeanSquaredError,MSE）2.平均绝对误差（MeanAbsoluteError,MAE）二、分类问题的损失函数1.0-1损失函数（Zero-OneLossFunction）2.交叉熵损失（Cross-EntropyLoss）3.合页损失（HingeLoss）三、总结在神经网络中，损失函数（LossFunction）扮演着至关重要的角色，它
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
BP神经网络的传递函数大胜归来19 MATLAB
BP网络一般都是用三层的，四层及以上的都比较少用；传输函数的选择，这个怎么说，假设你想预测的结果是几个固定值，如1,0等，满足某个条件输出1，不满足则0的话，首先想到的是hardlim函数，阈值型的，当然也可以考虑其他的；然后，假如网络是用来表达某种线性关系时，用purelin---线性传输函数；若是非线性关系的话，用别的非线性传递函数，多层网络时，每层不一定要用相同的传递函数，可以是三种配合，可
探索创新科技： Lite-Mono - 简约高效的小型化Mono框架杭律沛Meris
探索创新科技：Lite-Mono-简约高效的小型化Mono框架Lite-Mono[CVPR2023]Lite-Mono:ALightweightCNNandTransformerArchitectureforSelf-SupervisedMonocularDepthEstimation项目地址:https://gitcode.com/gh_mirrors/li/Lite-Mono如果你在寻找一个轻
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l

LeNet-5 卷积神经网络论文笔记-Gradient-Based Learning Applied to Document Recognition第Ⅰ、Ⅱ部分 笔记

LeNet-5 卷积神经网络论文笔记-Gradient-Based Learning Applied to Document Recognition第Ⅰ、Ⅱ部分 笔记

文章目录

文章介绍

理论基础及现状

损失函数，聚焦在模型在训练集和测试集上的表现差异。

论文中提到的方法，正则化 regularization

B.Gradient-Based Learning ，基于梯度的学习

随机梯度下降算法 – 即使到当前，仍是在机器学习中最常用的方法

C. Gradient Back Propagation 梯度反向传播

反向传播算法

卷积神经网络与传统全连接神经网络的差异和表现上的优点

大量的参数，带来过拟合的风险，以及训练的成本增加。

全连接层完全忽略了输入的拓扑结构

Convolutional Networks 卷积网络 三大核心思想

局部感受野 local Reception field

子采样层 Subsampling layer

权值共享

LeNet - 5 模型结构

总结

你可能感兴趣的:(机器学习论文阅读,神经网络,cnn,深度学习,机器学习,1024程序员节)

LeNet-5 卷积神经网络论文笔记-Gradient-Based Learning Applied to Document Recognition第Ⅰ、Ⅱ部分笔记

LeNet-5 卷积神经网络论文笔记-Gradient-Based Learning Applied to Document Recognition第Ⅰ、Ⅱ部分笔记

Convolutional Networks 卷积网络三大核心思想