RK_Dangerous

【深度学习】计算机视觉（五）——神经网络详解

文章目录

卷积神经网络
- 1 基本概念及详解
- - 1.1 卷积
  - - 1.1.1 基本概念
    - 1.1.2 影响卷积的重要参数
    - 1.1.3 特征图计算公式
    - 1.1.4 卷积参数共享
  - 1.2 池化
  - 1.3 全连接
  - 1.4 感受野
- 2 卷积神经网络的过程
- - 2.1 前向传播的过程
  - 2.2 反向传播【没学会，所以没笔记】
  - - 2.2.1 全连接的反向传播
    - 2.2.2 卷积层的反向传播
    - 2.2.3 池化层的反向传播
- 3 经典网络
- 4 反卷积
- - 4.1 转置卷积
  - 4.2 双线性插值
【待学习】循环神经网络（递归神经网络）

卷积神经网络

1 基本概念及详解

卷积神经网络（CNN）

卷积神经网络基本上应用于图像数据。假设我们有一个输入的大小（28 * 28 * 3），如果我们使用正常的神经网络，将有2352（28 * 28 * 3）参数。并且随着图像的大小增加参数的数量变得非常大。我们“卷积”图像以减少参数数量。

CNN的输入和输出没什么特别之处，例如可以输入一个28×28×1的图片（注意这里参数分别表示H、W、C，因为是灰度图所以通道为1）。

1.1 卷积

1.1.1 基本概念

在提取特征的时候，由于一张图片中不同的地方有不同的特征，背景和物体的特征是不一样的，物体各部位的特征也是不一样的。我们首先会对输入的图片进行分割处理，将其分成许多个区域，每个区域中都有多个像素点，例如：

我们如何确定每个区域的特征值？在神经网络中，我们的特征值就是权重参数来表示，而在这里我们会用到的也是一个权重参数矩阵，我们的任务是找到最合适的权重参数矩阵使得特征提取的效果最好。我们把权重参数矩阵也称为滤波器。

CNN中的滤波器与加权矩阵一样，它与输入图像的一部分相乘以产生一个回旋输出。滤波器尺寸通常小于原始图像尺寸。
例如有滤波器：
与图像中一个5×5×1区域的每个3×3部分相乘以形成卷积特征。注意计算方法不是矩阵计算，而是内积计算，是将两个矩阵对应位置的数相乘然后求所有乘法结果加和。

我们注意到每次计算都向后（下）移动一格，也可以自己设置步长控制向后（下）移动的距离。
计算得到的矩阵称为“特征图”。
灰度图像的计算特别简单，RGB图像也同理，根据之前学的我们知道RGB是分为三个通道，这里三个通道需要分别计算，然后将得到的三个通道的特征图相加即为最终结果。然而滤波器不只是二维矩阵这么简单，它是用三个参数存储的三维矩阵，前两个参数表示滤波器的行列数尺寸，第三个参数与通道的个数相等，也就是说对应不同的通道我们有不同的权重矩阵。
与神经网络一样，得到的特征图要加上偏置项（bias）b。
若我们用多个滤波器对同一张输入图片进行卷积操作（注意滤波器的尺寸必须一样），我们则可以得到多个特征图，然后将特征图堆叠在一起，此时得到的三维矩阵，前两个参数还是H、W，第三个参数表示卷积的深度（也就是第几层卷积）。
以上就是卷积的计算方法。得到的特征图堆叠成的三维矩阵，又可以作为输入进行再一次卷积，注意这里由于第三个参数C不再是原始数据的RGB通道，而是表示卷积层的深度，因此下一次卷积的时候，滤波器第三个参数也要与C的数值对应，这样才能保证每一层通道都对应有滤波器的一层。

按照上面的讲解，便可以理解这张图中的内容。类似于神经网络中的隐藏层，我们可以不断地对上一层的输入进行卷积。

1.1.2 影响卷积的重要参数

滑动窗口步长
上面对于卷积的讲解中每次计算都向后（下）移动一格，也可以自己设置步长控制向后（下）移动的距离。当步长较小的时候，可以细粒度的提取特征，得到的特征比较丰富；当步长比较大的时候，得到的特征比较少。同时步长也会影响到结果的尺寸。
总之，步长的选择要根据实际任务，一般来说图像任务步长通常选择1。
卷积核尺寸
卷积核尺寸就是我上面说的那个滤波器前两个参数，显然也会影响结果的尺寸，同样，卷积核尺寸较小时提取特征是细粒度的，一般情况下选择3×3的尺寸。
边缘填充（Padding）
填充是指在图像之间添加额外的零层。

在卷积时，输入图像中间的像素在滤波器移动时会重复多次被计算在内，对结果的贡献较大，而边缘部分的数据只经过一次计算，越往边界的点被利用的次数越少，这显然是不公平的。为了使边界点也能被多次反复利用，我们在边界的外面填充数据，使原本在边界的点现在处于里层，能够在一定程度上弥补边界信息缺失的问题。
为什么添加的是0而不是其他数值呢？因为在卷积时，如果添加了其他数也会在运算的时候对结果产生影响，我们只需要利用被“拯救”的边缘数据，其他部分的0与滤波器中对应的数据相乘还等于0。
至于填充的层数，一般填充一层就可以，也可以为了后续运算方便自定义，视具体情况而定。
卷积核个数
通过设置卷积核个数我们可以控制得到多少特征图（无论是中间需要堆叠的还是最后输出的）。注意卷积核中的值是不一样的。

1.1.3 特征图计算公式

最后附上特征图尺寸的计算公式：

我是这样解读公式的：最后一个+1理解为，无论前面如何滑动，最后一次计算总是和输入网格的右边界对齐。因为最后一次是固定的，我们只需要在输入网格中减去一个卷积核的尺寸，然后看剩下的网格中足够我们移动几次，也就是看能有几次移动卷积核左边界，所以用H-F+2P得到剩余的网格，再除以s表示这些网格经得起几次平移，每次平移都会计算出一个特征值，再加上最右边的那次，就是总的特征值个数。
这样的理解只是为了便于公式的记忆，实际上它是挨着滑动的，直到卷积核窗口落在图像外面时，不再进行操作。所以就算有舍弃，也是舍弃最右边剩下的，不要混淆。
例如有一个14×14×1的区域，设置卷积核尺寸为3×3，padding=1，步长为2，根据公式算得H2=W2=7。图解如下：

下面用一个例题检验一下：输入数据是32×32×3的图像，用10个5×5×3的filter来进行卷积操作，指定步长为1，边界填充为2，问最终输入的规模为？
（答案是32×32×10）

1.1.4 卷积参数共享

如果给每个区域都选择不同的卷积核，那么数据的规模也是非常大的，而且容易出现过拟合问题。所以我们利用参数共享原则，对于每个区域使用的卷积核都不变。
例如，我们有一个32×32×3的图像，使用10个5×5×3的滤波器进行卷积操作，由于每个区域的使用的滤波器都一样，我们需要权重参数的个数为10*5*5*3=750，再加上每个特征图都需要一个偏置参数b，10个滤波器共需要10个b，所以一次卷积共需要760个参数。

1.2 池化

卷积得到的特征可能会非常多，我们使用池化（POOLING）对它进行压缩。注意池化可以改变特征图的长和宽，但是不能减少特征图的个数。

通常在卷积层之间定期引入池层。这基本上是为了减少一些参数，并防止过度拟合。

MAX POOLING

最常见的池化类型是使用MAX操作的滤波器尺寸（2,2）的池层，它将取原始图像的每个4×4矩阵的最大值。

为什么选择最大值呢？在神经网络中，值越大说明我们认为这个特征是越重要的，选择最大的值就相当于我们只挑选那些重要的。

还可以使用其他操作（如平均池）进行池化，但是最大池数量在实践中表现更好。

1.3 全连接

全连接（Fully Connected，FC）网络结构在整个卷积神经网络中起到“分类器”的作用。如果说卷积层、池化层和激活函数等操作是将原始数据映射到隐层特征空间的话，全连接层则起到将学到的“分布式特征表示”。映射到样本标记空间的作用。
全连接层将特征提取得到的高维特征图映射成一维特征向量，该特征向量包含所有特征信息，可以转化为最终分类成各个类别的概率。

我们可以把全连接层看成一次特殊的卷积，也是通过一个滤波器改变特征的形状的。例如我们有4096个3x3x5的输出，我们想得到4096×1的列向量，可以通过一个3x3x5的滤波器去卷积。（可能表述不准确，但是大致意思理解即可）

1.4 感受野

我们卷积是把一个滤波器大小的正方形区域的数据浓缩成一个数据，感受野就是对于某一个位置的数据向前推1次或多次卷积，即这个数据浓缩n次之前的尺寸。
比如一个5×5区域经3×3的卷积核卷积两次后得到的是1×1的区域，那么这个1×1的区域感受野就是5×5。

我们希望一个特征是经过多方面因素的综合才得到的，所以我们希望感受野越大越好。
假设我们堆叠了3个3×3的卷积层（就是进行了3次卷积），并且保持滑动窗口的步长为1，其感受野就是7×7。但是如果我们直接用一个7×7的卷积核也可以得到77×7的感受野，这种情况该如何选择呢？假设我们需要得到C个特征图，如果用一个7×7×C的卷积核，我们需要的参数为C×(7×7×C)=49C²，如果用3×3×C的卷积核堆叠三次，我们需要的参数为[(3×3×C)×C]×3=27C²，显然后者不仅参数少，而且特征提取是更细致的。

2 卷积神经网络的过程

2.1 前向传播的过程

根据上图我们了解卷积神经网络的过程。类似普通的神经网络，每次卷积（CONV）之后都需要激活函数（通常是RELU），池化操作有规律地穿插在每次卷积中，最后通过全连接计算每个分类的概率。如果特征图的尺寸是32×32×10，由于上图是5分类问题，FC层会得到一个[10240, 5]的结构表示每个特征对应每个分类的概率。这就是大致过程，具体计算稍后详细学习。

首先说明一下，我们认为神经网络是有很多层的结构，在卷积神经网络中，只有具有参数的计算才能叫做“层”，例如卷积时有卷积核和偏置参数，所以卷积是一层；全连接中也有卷积核，所以全连接也是一层；而池化无参数、激活函数也无参数。故上图中的网络我们认为有7层。

我的一些感悟：
通过上面对过程的了解，我认为卷积神经网络更突出我们对每个特征值的判断，在普通的神经网络中，我们直接是把输入的一系列数据直接去与权重进行运算，虽然运算的过程可能会分成好几步，对于某些权重为0的位置虽然没有考虑进去，但是对我们来说就是视为一个整体去理解的。而在卷积神经网络中，我们总是能直观地感受到每个特征值，算出特征值后再去与对应的激活函数计算，都是在网格中然后对值去进行操作，直到最后全连接也是根据值去计算概率，整个过程都是针对特征去操作的。

卷积层可以有目的的学习线条、轮廓和局部特征

然而卷积神经网络和普通的神经网络不是对立的两个类别，我口中“普通的神经网络”应该就是全连接神经网络。卷积神经网络对特征处理之后，我们会得到一张图片的特征列向量（我自己取的名字），若特征列向量长度为n，你可以批量输入m张图像，得到一个具有n行m列的输入X。在全连接层中对我们新的输入“X”进行之前讲过的处理，经过若干个隐藏层和输出层计算概率。

2.2 反向传播【没学会，所以没笔记】

卷积神经网络一般会借助 TensorFlow 或者 PaddlePaddle 来开发，仅需要开发正向传播，反向传播会自动生成，所以一般不要求掌握。

2.2.1 全连接的反向传播

在之前的反向传播中，我没有详细地学习过反向传播是如何实现的，所以在这里我希望能够完全弄懂。
求和的公式：

其中，上角标[l]表示第l层，上角标[l-1]表示l的上一层，即l-1层。A为上一层的输入即特征图，W为卷积核，b为偏置矩阵，Z为一次卷积得到的结果。注意：

这是最后一层的输出，G(Z)是经过激活函数变换后得到的值。因为变量实际上是W和b，所以损失函数虽然是用G(Z)表示的，但是整理到坐标上面，实际上还是W和b作为坐标轴。我们要求损失函数的最小值，就要求出每个维度的最小梯度，即dW和db（d表示梯度）。如果损失函数用F(x)表示：

同理

卷积神经网络由于表达式一样，所以算法也是一样的。

得到公式了，然后呢？

2.2.2 卷积层的反向传播

2.2.3 池化层的反向传播

3 经典网络

AlexNet
2012年的常用网络，但是现在已经不常用了，我觉得熟悉名字即可。
Vgg
Vgg有不同的版本，通常是16层或者19层的网络，它相对于AlexNet来说卷积核的大小比较小，也就是特征提取更细致。还有一个特点是，池化后通过添加特征图的个数去弥补特征图尺寸的减小。此外，由于它的层数和特征图增加、更加复杂，运算时间也很长。
Vgg层数的增加，使加入的非线性变换也随之增多（因为使用激活函数的次数变多）。
Resnet（残差网络）
按照一贯的想法，深度学习肯定是越深学习效果越好，但是在卷积神经网络中，由于我们是进行特征的提取，在已经很拟合的基础上再去提取特征，再加上我们不断池化，反而不一定能获得更好的效果。
残差网络提出了一个“同等映射”，对于添加之后会降低我们正确率，即效果不好的卷积层，我们不使用它。但是已经添加的层，我们是没有办法删除的，那怎么办呢？

通过添加旁路，将可能会降低正确率的第n层（或不止一层）加上之前第n-1层已算出的特征值x，表示为n+1层的结果，在我们不断更新权重的过程中，如果发现这层起不到积极作用，只需要把这层的权重设置为0，在后续的卷积中这层就相当于被剔除了。

4 反卷积

反卷积又称转置卷积(Transposed Convolution)、上采样(Upsampled )。当我们用神经网络生成图片的时候，经常需要将一些低分辨率的图片转换为高分辨率的图片，如下所示：

通过之前对卷积的学习，我们可以认为一个卷积操作是一个多对一(many-to-one)的映射关系，比如在一个3×3的卷积核作用下用输入图像的9个值计算得到1个值；而反卷积则是一个一对多(one-to-many)的映射关系，将输入矩阵中的一个值映射到输出矩阵的9个值。
如何进行反卷积呢？例如现在有卷积操作：
一个4×4的矩阵经3×3的滤波器后得到2×2的输出，我们通常是用滤波器在输入图像中滑动得到输出，但是将这个过程换种角度思考，把它与矩阵的乘法联系在一起。我们无法用4×4的矩阵与3×3的矩阵相乘得到2×2的矩阵，但是根据卷积的过程，我们理解到它是简单的乘法和加法操作，和矩阵的计算类似，所以我们把它变成另一种形式。以输出图像的第一个值“122”为例，我们设计一个1×9的卷积核与9×1的输入矩阵相乘，则可以得到1×1的输出。

但是把输入图像拆成4个9×1的矩阵肯定很复杂，类似上图的操作，我们可以把用不到的值设置为系数为0，仍以输出图像的第一个值“122”为例。

这样输入图像就可以统一，只改变卷积核补0的位置即可，其他三个输出同理，则我们可以用4×16的卷积核矩阵与16×1的输入图像矩阵相乘，得到4×1的输出矩阵。

如此得到的输出矩阵，变换为2×2即可。从这个角度理解卷积后，我们就可以更快地理解反卷积的过程。仍以这个例子，反卷积就是我们已知4×1的输出矩阵，要通过设计卷积核得到16×1的输入矩阵。按照矩阵的乘法规律，我们可以猜测用一个16×4的卷积核与4×1的输出矩阵相乘，即可得到16×1的输入矩阵。我们可以简单将原来4×16的卷积核进行转置去设计反卷积的卷积核，这也就解释了为什么反卷积又叫转置卷积（注意与逆矩阵不同，设置转置矩阵无法得到原始的输入图像，只是提供了矩阵形状，一般情况下卷积是不可逆的）。我也不知道该怎么解释把转置后的矩阵再变回最开始的3×3，反正也不重要，我就不详细阐述了，但是看了下面的过程就大概知道，它就是这么推出来的。

4.1 转置卷积

换回原来的角度，转置卷积其实和卷积一样，可以看成是通过填充0构造了一个更大的输入进行卷积。还是举之前的例子（由于之前得到的数值太大了，简化了一下）：

填充0的方式为：

在输入特征图的元素间填充s-1行（列）
在输入特征图的四周填充k-p-1行（列）

以本图为例，输入的是一个3×3的矩阵，s设置的步长不是卷积时的步长，而是指扫过原图（实际的蓝色区域）需要走的步长；p可以理解为正向卷积时的填充，由于当时填充了p个0层，所以在反向卷积的时候要输出填充前的特征图（即减去0层），所以p越大这里填充的0越少、输出的特征图尺寸越小。

输出的特征图尺寸：

化简后为：

4.2 双线性插值

我的理解，双线性插值的作用和转置卷积类似，能够放大图片（还原图片尺寸）。采用内插值法，即在原有图像像素的基础上，在像素点值之间采用合适的插值算法插入新的元素。

线性插值法(linear interpolation)：
线性插值法是指使用连接两个已知量的直线来确定在这个两个已知量之间的一个未知量的值的方法。假设已知两个坐标(x0,y0)和(x1,y1)，求该区间内某一位置x在直线上的值：

双线性插值：
双线性插值是插值算法中的一种，是线性插值的扩展。利用原图像中目标点四周的四个真实存在的像素值来共同决定目标图中的一个像素值，其核心思想是在两个方向分别进行一次线性插值。

【待学习】循环神经网络（递归神经网络）

22）循环神经元（Recurrent Neuron）
——循环神经元是在T时间内将神经元的输出发送回给它。如果你看图，输出将返回输入t次。展开的神经元看起来像连接在一起的t个不同的神经元。这个神经元的基本优点是它给出了更广义的输出。

23）循环神经网络（RNN）
——循环神经网络特别用于顺序数据，其中先前的输出用于预测下一个输出。在这种情况下，网络中有循环。隐藏神经元内的循环使他们能够存储有关前一个单词的信息一段时间，以便能够预测输出。隐藏层的输出在t时间戳内再次发送到隐藏层。展开的神经元看起来像上图。只有在完成所有的时间戳后，循环神经元的输出才能进入下一层。发送的输出更广泛，以前的信息保留的时间也较长。

然后根据展开的网络将错误反向传播以更新权重。这被称为通过时间的反向传播（BPTT）。

24）消失梯度问题（Vanishing Gradient Problem）
——激活函数的梯度非常小的情况下会出现消失梯度问题。在权重乘以这些低梯度时的反向传播过程中，它们往往变得非常小，并且随着网络进一步深入而“消失”。这使得神经网络忘记了长距离依赖。这对循环神经网络来说是一个问题，长期依赖对于网络来说是非常重要的。

这可以通过使用不具有小梯度的激活函数ReLu来解决。

25）激增梯度问题（Exploding Gradient Problem）
——这与消失的梯度问题完全相反，激活函数的梯度过大。在反向传播期间，它使特定节点的权重相对于其他节点的权重非常高，这使得它们不重要。这可以通过剪切梯度来轻松解决，使其不超过一定值。

参考：
深度学习入门基础概念
【神经网络】学习笔记九—学习率浅析
神经网络的归一化（batch normalization）
我居然3小时学懂了深度学习神经网络入门到实战，多亏了这个课程，看不懂你打我！！！
【深度学习】全连接层
深度学习系列5：卷积神经网络(CNN)，图像识别的利器
反向传播算法详解
深度学习系列6：卷积神经网络的反向传播
反卷积详解
转置卷积（transposed convolution）
转置卷积（Transposed Convolution）
深度学习之----双线性插值，转置卷积，反卷积的区别与联系
【转】FCN中反卷积、上采样、双线性插值之间的关系
上采样、下采样到底是个啥

软考中级软件设计师考点知识点笔记总结 day06 莫问alicia 软考中级软件设计师笔记数据结构算法
文章目录6、树和二叉树6.1、树的基本概念6.2、二叉树的基本概念6.3、二叉树的遍历6.4、查找二叉树（二叉排序树）BST6.5、构造霍夫曼树+6.6、线索二叉树6.7、平衡二叉树7、图7.1、存储结构-邻接矩阵7.2、存储结构-邻接表7.3、图的遍历7.4、拓扑排序7.5、最小生成树普利姆算法7.6、克鲁斯卡尔算法6、树和二叉树6.1、树的基本概念结点的度：一个结点的度是指该结点拥有的子树数量
python 底层原理processpoolexecutor_Python 并发编程：PoolExecutor 篇风投小虾 python
个人笔记，如有疏漏，还请指正。使用多线程(threading)和多进程(multiprocessing)完成常规的并发需求，在启动的时候start、join等步骤不能省，复杂的需要还要用1-2个队列。随着需求越来越复杂，如果没有良好的设计和抽象这部分的功能层次，代码量越多调试的难度就越大。对于需要并发执行、但是对实时性要求不高的任务，我们可以使用concurrent.futures包中的PoolE
环境配置（1）：笔记本window、虚拟机ubuntu、开发板三者互ping通信，并且虚拟机ubuntu和开发板能上网 lishing6 ubuntu linux mcu 嵌入式硬件 arm开发物联网硬件工程
1.配置网络我们配置网络是为了方便后续调试开发板系统或者应用程序时，能够使用tftp协议nfs协议等拷贝文件，以及设置文件系统启动方式为nfs挂载启动。2.设置Ubuntu使用NAT网络NAT是什么意思？NetworkAddressTranslation，网络地址转换。举个例子，在NAT里，Windows就是一个爱护孩子的父亲，Ubuntu就是受保护的小孩。小孩要买东西，都由他父亲代劳，别人根本不
systemd-networkd 的 *.network 配置文件详解笔记250323 kfepiza 网络通讯传输协议物联 #控制台命令行 Shell脚本 sh cmd 等 #Linux CentOS Ubuntu 等笔记 tcp/ip 网络 linux
systemd-networkd的*.network配置文件详解笔记250323查看官方文档可以用mansystemd.network命令,或访问:https://www.freedesktop.org/software/systemd/man/latest/systemd.network.html名称systemd.network—网络配置概要network.network描述一个纯INI风格的
systemctl restart 和 systemctl reload 和 systemctl daemon-reload 对比笔记250322 kfepiza #Linux CentOS Ubuntu 等 #控制台命令行 Shell脚本 sh cmd 等笔记 bash
systemctlrestart和systemctlreload和systemctldaemon-reload对比以下是systemctlrestart、systemctlreload和systemctldaemon-reload的对比总结：命令作用对象行为适用场景对服务的影响systemctlrestart服务名具体服务强制停止服务，再重新启动。配置或代码有重大变更，或服务出现异常需完全重启。服
Xilinx系ZYNQ学习笔记（二）ZYNQ入门及点亮LED灯贾saisai FPGA学习学习笔记 fpga开发
系列文章目录文章目录系列文章目录前言简单介绍简称xc7z020型号FPGAZYNQ实操通用IO点亮LED灯硬件逻辑基础前言简单入门一下ZYNQ是何种架构，如何编程，至于深入了解应该要分开深入学习Linux和FPGA简单介绍其基本架构都是在同一个硅片上集成FPGA和CPU，并通过高速、高带宽的互联架构连接起来。ARM的顺序控制、丰富外设，开源驱动、FPGA的并行运算、高速接口、灵活定制、数字之王的特
ZYNQ学习笔记_GPIO之输入输出凌星星星星星 ZYNQ学习笔记 gpio mio fpga 嵌入式单片机
ZYNQ学习笔记_GPIO之输入输出GPIO介绍MIO介绍EMIO介绍控制GPIO接口的寄存器原理_输入输出部分GPIO介绍GPIO的英文全称为General-purposeinput/output，即一种通用外设，可以通过MIO（MultiuseI/O）模块对器件的引脚做观测（input）和控制（output）。ZYNQ的PS端上的GPIO也可以通过EMIO（ExtraMIO）模块对PL端的IP
zynq设计学习笔记2——GPIO之MIO控制LED实验墨漓_lyl FPGA之zynq设计学习笔记嵌入式 fpga
vivado软件操作步骤与学习笔记1——helloworld差不多，这里不再过多赘述，不同点是在zynq的设置中添加上GPIO的设置即可。进入SDK软件后，程序如下：#include"stdio.h"#include"xparameters.h"#include"xgpiops.h"#include"sleep.h"#defineGPIO_DEVICE_IDXPAR_XGPIOPS_0_DEVIC
Ubuntu-Server 设置多个ip和多个ipv6 笔记250320 kfepiza #Linux CentOS Ubuntu 等 #控制台命令行 Shell脚本 sh cmd 等网络通讯传输协议物联 ubuntu tcp/ip 笔记
Ubuntu-Server设置多个ip和多个ipv6在UbuntuServer上为同一网卡配置多个IPv4和IPv6地址，Ubuntu-server-16用的是/etc/network/interfaces配置的networkingUbuntu-server-17.10及更新版本默认用的是systemd-networkd+Netplan,用Netplan来管理systemd-networkd对于U
大模型学习终极指南：从新手到专家的必经之路，全网最详尽解析，你敢挑战吗？大模型入门教程学习人工智能 AI 大模型大模型学习大模型教程 AI大模型
随着人工智能技术的飞速发展，大模型（Large-ScaleModels）已经成为推动自然语言处理（NLP）、计算机视觉（CV）等领域进步的关键因素。本文将为您详细介绍从零开始学习大模型直至成为专家的全过程，包括所需掌握的知识点、学习资源以及实践建议等。无论您是初学者还是有一定基础的专业人士，都能从中获得有价值的指导。一、基础知识准备在开始学习大模型之前，需要先掌握一些基础知识，这些知识将为后续的学
RK3588开发笔记-buildroot添加telnet服务 flypig哗啦啦 RK3588 buildroot busybox
目录前言一、Telnet服务背景与适用场景二、telnet服务开启Busybox配置三、固件编译及烧录RK3588烧录验证客户端连接测试3.1Linux/MacOS连接3.2Windows连接总结前言本文主要介绍在RK3588SDK文件包中添加telnet服务，由于sdkbuildroot默认添加的是ssh服务，如用户需要主动开启telnet，则需要另外在busybox中开启telnetd服务，下
Github上神仙级大模型项目：大语言模型(LLM)入门学习路线图，三个月让你从大模型基础到精通！ AI大模型-大飞 github 语言模型学习人工智能 AI大模型程序员 AI
Github项目上有一个大语言模型学习路线笔记，它全面涵盖了大语言模型的所需的基础知识学习，LLM前沿算法和架构，以及如何将大语言模型进行工程化实践。这份资料是初学者或有一定基础的开发/算法人员入门活深入大型语言模型学习的优秀参考。这份资料重点介绍了我们应该掌握哪些核心知识，并推荐了一系列优质的学习视频和博客，旨在帮助大家系统性地掌握大型语言模型的相关技术。大语言模型（LargeLanguageM
AI模型技术演进与行业应用图谱智能计算研究中心其他
内容概要当前AI模型技术正经历从基础架构到行业落地的系统性革新。主流深度学习框架如TensorFlow和PyTorch持续优化动态计算图与分布式训练能力，而MXNet凭借高效的异构计算支持在边缘场景崭露头角。与此同时，模型压缩技术通过量化和知识蒸馏将参数量降低60%-80%，联邦学习则通过加密梯度交换实现多机构数据协同训练。在应用层面，医疗诊断模型通过迁移学习在CT影像分类任务中达到98.2%的准
【第1章＞第6节】CMAC小脑模型神经网络的理论学习与MATLAB仿真 fpga和matlab #第1章·神经网络学习 matlab CMAC 小脑模型神经网络人工智能
目录1.使用软件和版本2.CMAC小脑模型神经网络概述2.1CMAC网络结构2.2CMAC地址映射2.3学习过程3.CMAC网络的MATLAB编程实现4.分辨率，重叠度，学习率对CMAC网络的训练性能影响分析4.1分辨率4.2重叠度4.3学习率5.视频操作步骤演示欢迎订阅FPGA/MATLAB/Simulink系列教程《★教程1:matlab入门100例》《★教程2:fpga入门100例》《★教程
《Operating System Concepts》阅读笔记：p460-p4470 操作系统
《OperatingSystemConcepts》学习第36天，p460-p4470总结，总计11页。一、技术总结无。二、英语总结(生词：3)1.lifespan(1)lifespan:life+span("theperiodoftimethatsthexistsorhappens")c.也写作life-span,thelengthoftimeforwhichathingexists(寿命)。(2
小菜鸟的Python笔记001：将Word文档中数据汇总到Excel表格蜉蝣2805 小菜鸟的Python笔记 python 数据分析
将Word文档中数据汇总到Excel表格前言一、应用场景二、程序思路及准备工作思路如下：准备工作：三、程序代码1、主程序2、获取Word文档列表3、提取文档内数据4、导入到Excel表格四、遇到的问题1、错误AttributeError:word.Application.Quit2、word文档中复选框的识别总结前言我并非一个专业的程序员，只是一个普通的编程爱好者、一只小菜鸟。得益于网络上各路大神
linux+docker安装常见中间件+shell学习笔记芦屋花绘 linux docker 中间件
初始设置下载虚拟机软件：选择适合的虚拟机软件（如VirtualBox或VMware）。下载操作系统ISO映像文件：选择并下载你想安装的Linux发行版（例如Ubuntu、CentOS等）的ISO文件。ISO映像文件：是包含了完整光盘内容的文件，包含引导记录、文件系统、数据文件和目录结构。导入ISO文件到虚拟机，并进行相关配置，如分配内存、硬盘空间等。了解基本linuxLinux常见目录及其用途Li
AI大模型训练教程 Small踢倒coffee_氕氘氚 python自学经验分享笔记
1.引言随着人工智能技术的快速发展，大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。训练一个大模型需要大量的计算资源、数据和专业知识。本教程将带你了解如何从零开始训练一个AI大模型。2.准备工作2.1硬件要求GPU：推荐使用NVIDIA的高性能GPU，如A100、V100等。内存：至少64GBRAM。存储：SSD存储，至少1TB。#2.2软件环境操作系统：Lin
使用Jupyter Notebook进行深度学习编程 - 深度学习教程 shandianfk_com ChatGPT AI jupyter 深度学习 ide
大家好，今天我们要聊聊如何使用JupyterNotebook进行深度学习编程。深度学习是人工智能领域中的一项重要技术，通过模仿人脑神经网络的方式进行学习和分析。JupyterNotebook作为一个强大的工具，可以帮助我们轻松地进行深度学习编程，尤其适合初学者和研究人员。本文将带领大家一步步了解如何在JupyterNotebook中开展深度学习项目。一、什么是JupyterNotebook？Jup
Opencv之计算机视觉一闭月之泪舞计算机视觉计算机视觉 opencv python
一、环境准备使用opencv库来实现简单的计算机视觉。需要安装两个库：opencv-python和opencv-contrib-python，版本可以自行选择，注意不同版本的opencv中的某些函数名和用法可能不同pipinstallopencv-python==3.4.18.65-ihttps://pypi.tuna.tsinghua.edu.cn/simplepipinstallopencv-
计算机视觉总结 Trank-Lw 计算机视觉深度学习人工智能
以下是针对上述问题的详细解答，并结合代码示例进行说明：1.改进YOLOv5人脸检测模块，复杂光照场景准确率从98.2%提升至99.5%优化具体过程：光照补偿：在数据预处理阶段，采用自适应光照补偿算法，对图像进行实时增强，以减少光照变化对人脸检测的影响。数据增强：在训练数据中增加复杂光照场景下的样本，如强光、弱光、背光等，通过数据增强提高模型对不同光照条件的适应性。模型调整：对YOLOv5模型的网络
深度学习 Deep Learning 第8章深度学习优化 odoo中国 AI编程人工智能深度学习人工智能优化
深度学习第8章深度学习的优化章节概述本章深入探讨了深度学习中的优化技术，旨在解决模型训练过程中面临的各种挑战。优化是深度学习的核心环节，直接关系到模型的训练效率和最终性能。本章首先介绍了优化在深度学习中的特殊性，然后详细讨论了多种优化算法，包括随机梯度下降（SGD）、动量法、Nesterov动量法、AdaGrad、RMSProp和Adam等。此外，还探讨了参数初始化策略、自适应学习率方法以及二阶优
rabbitmq笔记 java
消息可靠性rabbitmq向消费者投递消息后，有可能会丢失，有可能会重复投递。比如：投递过程网络故障消费者收到消息后宕机消费者接收到消息后处理不当导致异常...rabbitmq需要做的事：机制消费者确认机制消费者处理成功后需要通知发幂等性幂等性指同一个业务，执行一次或多次对业务状态的影响是一致的例如唯一消息id业务状态判断但是数据的更新往往不是幂等的，所以需要确保幂等性确保幂等性方法有两种方案唯一
景联文科技提供高质量文本标注服务，驱动AI技术发展景联文科技科技人工智能
文本标注是指在原始文本数据上添加标签的过程，这些标签可以用来指示特定的实体、关系、事件等信息，以帮助计算机理解和处理这些数据。文本标注是自然语言处理（NLP）领域的一个重要环节，它通过为文本的不同部分提供具体的含义和上下文信息，增强机器学习和深度学习模型对文本内容的理解能力。标注类型情感分析情感极性：确定文本表达的情感倾向，如正面、负面或中立。强度评估：衡量情感的强烈程度，从轻微到极端不等。命名实
mysql数据库学号数据类型_MySQL数据库学习笔记（二）----MySQL数据类型艾萨里昂之光 mysql数据库学号数据类型
【正文】上一章节中，我们学习了MySQL软件的安装，既然软件都装好了，现在就正式开始MySQL的基础知识的学习吧，即使是零基础，也要一步一个脚印。恩，首先要学习的就是MySQL的数据类型。一、数据类型：1、整型(xxxint)2、浮点型(float和double)3、定点数(decimal)4、字符串(char,varchar,xxxtext)5、二进制数据(xxxBlob)6、日期时间类型二、数
笔记本Win7系统无线网名称显示乱码解决方案 mmoo_python windows
笔记本Win7系统无线网名称显示乱码解决方案在使用Windows7操作系统的笔记本电脑时，用户可能会遇到无线网络名称显示乱码的问题。这一问题不仅影响了用户识别无线网络的便利性，还可能阻碍正常的网络连接。本文将详细介绍解决这一问题的方法，帮助用户恢复无线网名称的正常显示。具体解决方法1.打开控制面板首先，我们需要进入Windows7的控制面板。可以通过点击开始菜单，然后在搜索框中输入“控制面板”来快
mysql笔记 m0_67015473 mysql 笔记
mysql日志分析错误日志日志默认开启，查询showvariableslike“%error_log%”，日志存在于/var/log/mysqld.log二进制日志日志默认开启，记录所有的DDL(Create等)和DML(insert等)，但不包括数据查询（SELECT、SHOW)语句作用：灾难时的数据恢复mysql的主从复制查询showvariableslike“%log_bin%”，日志存在于
学习笔记——GPU 鹤岗小串 gpu算力分布式信息与通信系统架构硬件架构运维笔记
本文为学习笔记，故只对知识点依据自己的理解作概要总结，方便以后复习激活记忆。注：本文中GPU的讲解以A100型号为例，V100跟A100的架构差别不大也可适用，但是其他架构可能会有所出入。一、GPU硬件结构NVIDIAA100GPU的硬件结构HBM2：显存MemoryController：负责控制HBM2和L2Cache之间的通信High-SpeedHub：GPU总线，将NVLink、PCIE、E
【QT入门】 Qt槽函数五种常用写法介绍不吃~香菜 QT入门 qt 开发语言槽函数信号槽
声明：该专栏为本人学习Qt知识点时候的笔记汇总，希望能给初学的朋友们一点帮助(加油！)往期回顾：【QT入门】实现一个简单的图片查看软件-CSDN博客【QT入门】图片查看软件(优化)-CSDN博客【QT入门】lambda表达式(函数)详解-CSDN博客【QT入门】Qt槽函数五种常用写法介绍一、信号槽基本概念Qt的信号槽是一种用于处理事件和通信的机制，是Qt框架中的一个重要特性。信号槽机制使得对象之间
【QT入门】qmake和cmake的简单区别不吃~香菜 QT入门 qt 开发语言学习 qmake cmake
声明：该专栏为本人学习Qt知识点时候的笔记汇总，希望能给初学的朋友们一点帮助(加油！)往期回顾：【QT入门】Windows平台下QT的编译过程-CSDN博客【QT入门】VS2019+QT的开发环境配置-CSDN博客【QT入门】VS2019和QTCreator如何添加第三方模块-CSDN博客【QT入门】qmake和cmake的简单区别qmake和cmake是两种常用的构建工具，用于自动化构建C++项
JAVA基础灵静志远位运算加载 Date 字符串池覆盖
一、类的初始化顺序 1 （静态变量，静态代码块）-->（变量，初始化块）--> 构造器同一括号里的，根据它们在程序中的顺序来决定。上面所述是同一类中。如果是继承的情况，那就在父类到子类交替初始化。二、String 1 String a = "abc"; JAVA虚拟机首先在字符串池中查找是否已经存在了值为"abc"的对象，根
keepalived实现redis主从高可用 bylijinnan redis
方案说明两台机器（称为A和B），以统一的VIP对外提供服务 1.正常情况下，A和B都启动，B会把A的数据同步过来（B is slave of A） 2.当A挂了后，VIP漂移到B；B的keepalived 通知redis 执行：slaveof no one，由B提供服务 3.当A起来后，VIP不切换，仍在B上面；而A的keepalived 通知redis 执行slaveof B，开始
java文件操作大全 0624chenhong java
最近在博客园看到一篇比较全面的文件操作文章，转过来留着。 http://www.cnblogs.com/zhuocheng/archive/2011/12/12/2285290.html 转自http://blog.sina.com.cn/s/blog_4a9f789a0100ik3p.html 一.获得控制台用户输入的信息 &nbs
android学习任务不懂事的小屁孩工作
任务完成情况搞清楚带箭头的pupupwindows和不带的使用已完成熟练使用pupupwindows和alertdialog，并搞清楚两者的区别已完成熟练使用android的线程handler,并敲示例代码进行中了解游戏2048的流程，并完成其代码工作进行中-差几个actionbar 研究一下android的动画效果，写一个实例已完成复习fragem
zoom.js 换个号韩国红果果 oom
它的基于bootstrap 的 https://raw.github.com/twbs/bootstrap/master/js/transition.js transition.js模块引用顺序 <link rel="stylesheet" href="style/zoom.css"> <script src=&q
详解Oracle云操作系统Solaris 11.2 蓝儿唯美 Solaris
当Oracle发布Solaris 11时，它将自己的操作系统称为第一个面向云的操作系统。Oracle在发布Solaris 11.2时继续它以云为中心的基调。但是，这些说法没有告诉我们为什么Solaris是配得上云的。幸好，我们不需要等太久。Solaris11.2有4个重要的技术可以在一个有效的云实现中发挥重要作用：OpenStack、内核域、统一存档（UA）和弹性虚拟交换（EVS）。
spring学习——springmvc（一） a-john springMVC
Spring MVC基于模型-视图-控制器（Model-View-Controller，MVC）实现，能够帮助我们构建像Spring框架那样灵活和松耦合的Web应用程序。 1，跟踪Spring MVC的请求请求的第一站是Spring的DispatcherServlet。与大多数基于Java的Web框架一样，Spring MVC所有的请求都会通过一个前端控制器Servlet。前
hdu4342 History repeat itself-------多校联合五 aijuans 数论
水题就不多说什么了。 #include<iostream>#include<cstdlib>#include<stdio.h>#define ll __int64using namespace std;int main(){ int t; ll n; scanf("%d",&t); while(t--)
EJB和javabean的区别 asia007 bean ejb
EJB不是一般的JavaBean,EJB是企业级JavaBean,EJB一共分为3种,实体Bean,消息Bean,会话Bean,书写EJB是需要遵循一定的规范的,具体规范你可以参考相关的资料.另外,要运行EJB,你需要相应的EJB容器,比如Weblogic,Jboss等,而JavaBean不需要,只需要安装Tomcat就可以了 1.EJB用于服务端应用开发, 而JavaBeans
Struts的action和Result总结百合不是茶 struts Action配置 Result配置
一:Action的配置详解: 下面是一个Struts中一个空的Struts.xml的配置文件 <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC &quo
如何带好自已的团队 bijian1013 项目管理团队管理团队
在网上看到博客" 怎么才能让团队成员好好干活"的评论，觉得写的比较好。原文如下：我做团队管理有几年了吧，我和你分享一下我认为带好团队的几点： 1.诚信对团队内成员，无论是技术研究、交流、问题探讨，要尽可能的保持一种诚信的态度，用心去做好，你的团队会感觉得到。 2.努力提
Java代码混淆工具 sunjing ProGuard
Open Source Obfuscators ProGuard http://java-source.net/open-source/obfuscators/proguardProGuard is a free Java class file shrinker and obfuscator. It can detect and remove unused classes, fields, m
【Redis三】基于Redis sentinel的自动failover主从复制 bit1129 redis
在第二篇中使用2.8.17搭建了主从复制，但是它存在Master单点问题，为了解决这个问题，Redis从2.6开始引入sentinel，用于监控和管理Redis的主从复制环境，进行自动failover，即Master挂了后，sentinel自动从从服务器选出一个Master使主从复制集群仍然可以工作，如果Master醒来再次加入集群，只能以从服务器的形式工作。什么是Sentine
使用代理实现Hibernate Dao层自动事务白糖_ DAO spring AOP 框架 Hibernate
都说spring利用AOP实现自动事务处理机制非常好，但在只有hibernate这个框架情况下，我们开启session、管理事务就往往很麻烦。 public void save(Object obj){ Session session = this.getSession(); Transaction tran = session.beginTransaction(); try
maven3实战读书笔记 braveCS maven3
Maven简介是什么？ Is a software project management and comprehension tool.项目管理工具是基于POM概念(工程对象模型) [设计重复、编码重复、文档重复、构建重复，maven最大化消除了构建的重复] [与XP：简单、交流与反馈；测试驱动开发、十分钟构建、持续集成、富有信息的工作区] 功能：
编程之美-子数组的最大乘积 bylijinnan 编程之美
public class MaxProduct { /** * 编程之美子数组的最大乘积 * 题目: 给定一个长度为N的整数数组，只允许使用乘法，不能用除法，计算任意N-1个数的组合中乘积中最大的一组，并写出算法的时间复杂度。 * 以下程序对应书上两种方法，求得“乘积中最大的一组”的乘积——都是有溢出的可能的。 * 但按题目的意思，是要求得这个子数组，而不
读书笔记-2 chengxuyuancsdn 读书笔记
1、反射 2、oracle年-月-日时-分-秒 3、oracle创建有参、无参函数 4、oracle行转列 5、Struts2拦截器 6、Filter过滤器(web.xml) 1、反射 (1)检查类的结构在java.lang.reflect包里有3个类Field,Method,Constructor分别用于描述类的域、方法和构造器。 2、oracle年月日时分秒 s
[求学与房地产]慎重选择IT培训学校 comsci it
关于培训学校的教学和教师的问题,我们就不讨论了,我主要关心的是这个问题培训学校的教学楼和宿舍的环境和稳定性问题我们大家都知道，房子是一个比较昂贵的东西，特别是那种能够当教室的房子... &nb
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系 daizj oracle rman filesperset PARALLELISM
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系转 PARALLELISM --- 我们还可以通过parallelism参数来指定同时"自动"创建多少个通道： RMAN > configure device type disk parallelism 3 ; 表示启动三个通道，可以加快备份恢复的速度。
简单排序:冒泡排序 dieslrae 冒泡排序
public void bubbleSort(int[] array){ for(int i=1;i<array.length;i++){ for(int k=0;k<array.length-i;k++){ if(array[k] > array[k+1]){
初二上学期难记单词三 dcj3sjt126com sciet
concert 音乐会 tonight 今晚 famous 有名的；著名的 song 歌曲 thousand 千 accident 事故；灾难 careless 粗心的，大意的 break 折断；断裂；破碎 heart 心（脏） happen 偶尔发生，碰巧 tourist 旅游者；观光者 science （自然）科学 marry 结婚 subject 题目；
I.安装Memcahce 1. 安装依赖包libevent Memcache需要安装libevent,所以安装前可能需要执行 Shell代码收藏代码 dcj3sjt126com redis
wget http://download.redis.io/redis-stable.tar.gz tar xvzf redis-stable.tar.gz cd redis-stable make 前面3步应该没有问题，主要的问题是执行make的时候，出现了异常。异常一： make[2]: cc: Command not found 异常原因：没有安装g
并发容器 shuizhaosi888 并发容器
通过并发容器来改善同步容器的性能，同步容器将所有对容器状态的访问都串行化，来实现线程安全，这种方式严重降低并发性，当多个线程访问时，吞吐量严重降低。并发容器ConcurrentHashMap 替代同步基于散列的Map，通过Lock控制。 &nb
Spring Security（12）——Remember-Me功能 234390216 Spring Security Remember Me 记住我
Remember-Me功能目录 1.1 概述 1.2 基于简单加密token的方法 1.3 基于持久化token的方法 1.4 Remember-Me相关接口和实现
位运算焦志广位运算
一、位运算符Ｃ语言提供了六种位运算符： & 按位与 | 按位或 ^ 按位异或 ~ 取反 << 左移 >> 右移 1. 按位与运算按位与运算符"&"是双目运算符。其功能是参与运算的两数各对应的二进位相与。只有对应的两个二进位均为1时，结果位才为1 ，否则为0。参与运算的数以补码方式出现。例如：9&am
nodejs 数据库连接 mongodb mysql liguangsong mongodb mysql node 数据库连接
1.mysql 连接 package.json中dependencies加入 "mysql":"~2.7.0" 执行 npm install 在config 下创建文件 database.js
java动态编译 olive6615 java HotSpot jvm 动态编译
在HotSpot虚拟机中，有两个技术是至关重要的，即动态编译(Dynamic compilation)和Profiling。 HotSpot是如何动态编译Javad的bytecode呢？Java bytecode是以解释方式被load到虚拟机的。HotSpot里有一个运行监视器，即Profile Monitor,专门监视
Storm0.9.5的集群部署配置优化 roadrunners 优化 storm.yaml
nimbus结点配置（storm.yaml）信息： # Licensed to the Apache Software Foundation (ASF) under one # or more contributor license agreements. See the NOTICE file # distributed with this work for additional inf
101个MySQL 的调节和优化的提示 tomcat_oracle mysql
　1. 拥有足够的物理内存来把整个InnoDB文件加载到内存中——在内存中访问文件时的速度要比在硬盘中访问时快的多。　　2. 不惜一切代价避免使用Swap交换分区 – 交换时是从硬盘读取的，它的速度很慢。　　3. 使用电池供电的RAM（注：RAM即随机存储器）。　　4. 使用高级的RAID（注：Redundant Arrays of Inexpensive Disks，即磁盘阵列
zoj 3829 Known Notation(贪心) 阿尔萨斯 ZOJ
题目链接：zoj 3829 Known Notation 题目大意：给定一个不完整的后缀表达式，要求有2种不同操作，用尽量少的操作使得表达式完整。解题思路：贪心，数字的个数要要保证比∗的个数多1，不够的话优先补在开头是最优的。然后遍历一遍字符串，碰到数字+1，碰到∗-1,保证数字的个数大于等1，如果不够减的话，可以和最后面的一个数字交换位置（用栈维护十分方便），因为添加和交换代价都是1