AI科技大本营

神探Sherlock如何用AI破案？教你在Excel中搭建一个人脸识别CNN网络

作者 | Dave Smith

译者 | 刘畅

编辑 | 阿司匹林、Jane

出品 | AI科技大本营

【导读】人脸识别技术已经有了非常广泛的应用，国内大规模监控系统背后运用的技术就是人脸识别。

与大家常规见到的搭建人脸识别的神经网络方法不同，本文作者 Dave Smith 走了一次不同寻常路，他在 Excel 中用 9 步就搭建了一个人脸识别的CNN 神经网络，让神探 Sherlock 识别出世界的终结者 “Elon”！在这篇文章中，作者试图以直观的可视化方式呈现出代码背后发生的事情，希望可以帮助大家消除学习过程中的一些疑虑，

本文的目标就是为您提供一个简单的机器学习入门，将涵盖下图所示的 9 个步骤。

补充工具：帮助大家了解如何在 30 秒左右的时间将任意一张图片转换为有条件格式的Excel 文件

http://think-maths.co.uk/spreadsheet

终结者视角—在电子表格中创建卷积神经网络

背景

我们首先假设，在终结者的大脑中有一个名叫'Sherlock Convolution Holmes'的特殊侦探。他的工作就是仔细查看证据（输入图像）并使用敏锐的眼睛和推演能力（特征检测），预测图片中的人物是谁以此来破案（正确分类图像）。

注：为了减少大家对后面内容的疑惑，首先剧透一点，这篇文章的“男主”其实是 Sherlock Convolution Holmes 。作者可能是神探夏洛克的粉丝，整篇文章都是围绕 Sherlock 是如何破案来展开的。

我们将用电子表格模型来查看图片，分析像素值,并预测它是否是 Elon Musk，Jeff Bezos 或者 Jon Snow,显然这三个人是 Skynet 最大的威胁。用图像化来比喻，CNN就像 Sherlock Holmes。这个过程中会使用到一些数学公式，我们在这里给出了参考链接，方便大家学习。

参考链接：

https://drive.google.com/open?id=1TJXPPQ6Cz-4kVRXTSrbj4u4orcaamtpGvY58yuJbzHk

以下9个步骤中的每个步骤都是这个图像化比喻的一部分。

卷积神经网络体系结构

第一步

▌输入：一张图片就像是成千上万的数字

下面是我们的输入图片，我们是如何对这张照片进行操作的呢？

将数码照片看作3个电子表格（1个红色，1个绿色，1个蓝色）堆叠在一起，每个电子表格都是一个数字矩阵。拍摄照片时，相机会测量每个像素的红色，绿色和蓝色光量。然后，按 0-255 的等级对每个像素进行排名，并将它们记录在电子表格中：

在上面的 28x28 图像中，每个像素由 3 行（1个红色，1个蓝色和1个绿色）表示，其值为 0-255。其中像素已根据其值进行了格式化。

没有看到真实的眼睛，看到的只是一堆数字

如果我们将每种颜色分成单独的矩阵，就会得到 3 个 28x28 矩阵，而每个矩阵都是训练神经网络的输入：

模型输入

▌训练概述

在你刚出生的时候并不认识什么是狗。但在你成长的过程中，你的父母会在书中，动画片，现实生活中向你展示狗的照片，最终你可以指着那些四条腿毛茸茸的动物说“这是只狗”。这是由于大脑中数十亿神经元之间的联系变得足够强大，让你可以识别狗。

终结者也是以同样的方式学会谁是 Elon。通过一个监督训练的过程，我们给它展示成千上万张 Elon Musk，Jeff Bezos 和 Jon Snow 的照片。起初，它有三分之一的机会猜中，但就像一个小孩，随着时间的推移这个几率会提高。网络的连接或“权重/偏差”就会随着时间更新，使得它可以基于像素级的输入去预测图片输出。

那么是什么使卷积神经网络与普通神经网络不同呢？

5个字：平移不变性。让我们来简单解析它一下：

平移 = 从一个地方移动到另一个地方
不变性 = 保持不变

对于计算机视觉，这意味着无论我们把目标移动到哪个位置（平移），它都不会改变目标的内容（不变性）。

平移不变性（还可加上尺度不变性）

无论他在图像中什么位置（平移），什么大小（尺度不变），卷积神经网络经过训练都能识别到 Elon 的特征。CNN 擅长识别图像任何部分的模式，然后将这些模式叠加在一起，以构建更复杂的模式，就像人类一样。

在普通神经网络中，我们将每个单独的像素视为我们模型的输入（而不是3个矩阵），但这忽略了相邻像素是具有特殊的意义和结构。对于 CNN，我们关注彼此相邻的像素组，这允许模型学习像形状，线条等的局部模式。例如，如果 CNN 在黑色圆圈周围看到许多白色像素，它会将此模式识别为眼睛。

为了让 CNN 实现 translation variance，他们必须依靠特征检测，也就是Sherlock Convolution Holmes 。

第二步

▌特征检测：遇见 Sherlock Convolution Holmes

Sherlock 使用放大镜，仔仔细细地检查每一张图像，找到该图像的重要特征或“线索”。然后将这些简单的线条和形状特征堆叠在一起，就可以开始看到像眼睛或鼻子这样的面部特征。

每个卷积层都会包含一堆特征图或相互构建的“线索”。在所有卷积完成过后，他将所有这些线索放在一起，就破解了案件并正确识别出目标。

每个特征图都像是另一个“线索”

网络的每个卷积层都有一组特征图，这些特征图使用分层方式来识别越来越复杂的图案/形状。CNN 使用数字模式识别来确定图像最重要的特征。它使用更多的层将这些模式堆叠在一起，因此可以构建非常复杂的特征图。

卷积神经网络检测特征

让人吃惊的是，CNN 他们可以自己学习到这些特征，而不需要工程师编写代码教他学习什么是2只眼睛，1个鼻子，嘴巴等等。

在这种方式下，工程师更像是建筑师。他们告诉 Sherlock，“我给你 2 个空白特征图（“线索”）的堆栈（“卷积层”），你的工作是分析图片并找到最重要的线索。第一个堆栈包含 16 个特征图（“线索”），第二个堆栈包含 64 个特征图.。接下来就可以利用这些侦探技巧去解决问题吧！”

第三步：

为了让 Sherlock 找到案件中的“线索”（即“计算一张特征图”），他需要使用几个工具，我们将一一介绍：

滤波器——sherlock 的放大镜
卷积数学——滤波器的权重x输入图像的像素
步长——在输入图像上移动滤波器
填充——像“犯罪现场的警戒线”，用来保护线索

▌Sherlock 的放大镜（滤波器）

Sherlock 毫无疑问非常敏锐且具有极高的洞察能力。但如果没有他的特殊放大镜或“滤波器”，他就无法完成他的工作。因此他使用不同的放大镜来帮助他填充每个空白特征图的细节。所以，如果他有 16 张特征图，他就会用 16 个放大镜。

每个放大镜由多层玻璃组成，每层玻璃重量不同。玻璃层的数量，也就是我们的“滤波器深度”，总是与观察的神经网络层的深度相匹配。

一开始，Sherlock查看的输入图像，它有3层，红色，绿色和蓝色。所以，我们的放大镜也有 3 层。当我们构建 CNN时，随着层深度增加，我们的放大镜也会变得更厚。

为了建立 1 个特征图或“线索”，Sherlock 首先取出 1 个放大镜并将其放在输入图像的左上部分。红色玻璃层只能看到红色输入图像，绿色玻璃看到绿色图像，而蓝色玻璃看到的是蓝色图像。

接下来是进行数学计算。

▌卷积数学

我们特征图中的每个像素都是线索的一部分。为了计算每个像素，Sherlock 必须运用一些基本的乘法和加法。

在下面的例子中，我们将使用 5x5x3 的输入图像和 3x3x3 的滤波器，每个像素点需要 27 次乘法：

3 层 x 每层 9 次卷积= 27
将 27 个数字加在一起。
将 27 个计算结果加在一起之后，我们再加上1个数字—也就是偏置(bias)。

卷积计算——建立特征地图

让我们放大来看。一个像素由27次乘法组成，下面图片显示了 27次乘法中的 9 次：

就偏置而言，您可以将其视为每个放大镜的手柄。与权重一样，它是模型的另一个参数，每次训练都会调整这些参数以提高模型的准确性并更新特征图。

滤波器权重——在上面的例子中，将权重保持在1 和 0 是为了计算更方便; 但是，在正常神经网络中，可以使用随机较低的值来初始化权重，如使用（0.01）和（0.1）之间的钟形曲线或正态分布类型方法。

元素乘法—用来计算1条线索

▌步长：移动放大镜

在计算了特征图中的第一个像素后，Sherlock 会怎样移动他的放大镜？

答案就是步长参数。作为神经网络的建筑师/工程师，在 Sherlock 计算特征图下一个像素之前，我们必须告诉他应该向右移动多少像素。在实践中，2 或 3 的步长是最常见的，为了便于计算我们这里设置步长为 1。这意味着 Sherlock 将他的放大镜向右移动 1 个像素，然后再执行与之前相同的卷积计算。

当放大镜到达输入图像的最右边时，他会将放大镜向下 1 个像素并移动到最左边。

▌为什么步长会超过 1？

优点：通过减少计算和缓存，使模型训练速度更快。

缺点：步长大于 1 时，你会因为跳过一些像素从而导致丢失图片的信息，并可能错过一些学习模式。

但是设置步幅为 2 或 3 也是合理的，因为紧邻的像素通常具有相似的值，但是如果它们相距 2-3 个像素，则更有可能是对于特征图/模式更重要的像素值变化。

▌如何防止信息丢失（丢失线索）

为了破解这个案子，Sherlock 在一开始的时候就需要很多线索。在上面的例子中，我们采用了一张 5x5x3 图像，也就是 75 位像素的信息（75 = 5 x 5 x 3）。在第一个卷积层后，我们只得到了一个 3x3x2 图像，也就是 18 位像素（18 = 3 x 3 x 2）。这意味着我们丢失了部分证据，这将会让他的搭档John Watson 非常生气。

在 CNN 的前几层中，Sherlock 会看到很多细微的模式，这是一个增加线索的过程。而在后面的层中，可以通过“下采样”的方法来减少线索，Sherlock会将细微的线索堆积起来以便查看更清晰的模式。

▌那么我们如何防止信息丢失呢？

1：填充：我们必须在图像周围进行“填充”来保护犯罪现场。

在我们的例子中，在到达右边缘之前需要移动滤波器 3 次，从上到下都是一样的。这意味着我们得到的输出高度/宽度为 3x3，那我们从左到右时丢失了2 个像素，而从上到下移动时我们又损失了 2 个像素。

为了防止这种信息丢失，通常用零填充原始图像（称为“零填充”或“相同填充”），就像犯罪现场布置的警戒线一样，来保证没有人篡改线索。

在填充之后，如果 Sherlock 再次使用相同的放大镜，那他的 2 个特征图将是 5x5 而不是 3x3。这意味着我们将留下 50 个像素的信息，因为这个卷积的新输出是 5x5x2 = 50。50 像素比 18 像素要好。但是，我们是从 75 像素开始的，所以我们仍然丢失了一些线索。

除此之外我们还能做些什么呢？

2：使用更多的滤波器—通过在卷积层中添加至少 1 个特征图，为 Sherlock提供更多线索

我们模型的特征图或“线索”数量是没有限制，这是一个可以控制的参数。

如果我们将特征图从 2 增加到 3（5x5x2 到 5x5x3），那么总输出像素（75）与输入像素（75）刚好匹配，可以确保没有信息丢失。如果我们将特征图增加到 10，那么就会有更多的信息（250像素= 5 x 5 x 10）让Sherlock 筛选以找到线索。

总之，前几层中的总像素信息通常高于输入图像，是因为我们希望为Sherlock 提供尽可能多的线索/模式。在我们网络的最后几层中，通常做法是下采样得到少量的特征。因为这些层是用来识别图像更明确的模式。

第四步

▌ReLU：非线性模式识别

给 Sherlock 提供充足的信息是非常重要的，但现在是时候进行真正的侦探工作了——非线性模式识别！像识别耳廓或鼻孔等。

到目前为止，Sherlock 已经做了一堆数学来构建特征图，但每个计算都是线性的（取输入像素并对每个像素执行相同的乘法/加法），因此，他只能识别像素的线性模式。

为了在 CNN 中引入非线性，我们使用称为 Relu 的激活函数。从第一个卷积计算我们的特征图之后，激活函数会检查每个值来确认激活状态。如果输入值为负，则输出变为零。如果输入为正，则输出值保持不变。ReLU 的作用类似于开/关，每个特征图的像素值经过 Relu 后，就得到了非线性的模式识别。

回到我们最初的 CNN 示例，我们将在卷积后立即应用 ReLU：

虽然有许多非线性激活函数可用于将非线性引入神经网络（比如 sigmoids，tanh，leakyReLU 等），但 ReLU 是 CNN 中最常用的，因为它们计算效率高，并可以加速训练过程。

第五步

▌Max Pooling：保留关键的少数信息在大脑中

现在，Sherlock 已经有了一些特征图或“线索”，那么他如何确定哪些信息是不相关的细节，哪些是重要的？答案就是最大池化！

Sherlock 认为人脑就像一个记忆宫殿。傻瓜会存储各种各样的信息，最终有用的信息却在杂乱无章中丢失了。而聪明人只存储最重要的信息，这些信息可以帮助他们迅速做出决定。Sherlock 采取的方法就是 Max Pooling，使他只保留最重要的信息，从而可以快速做出决定。

最大池化就像Sherlock Holmes 记忆宫殿

通过最大池化，他可以查看像素的邻域并仅保留“最大”值或“最重要”的证据。

例如，如果他正在观察 2x2 的区域（4个像素），那只保留最高值的像素并丢掉其他 3 个。这种技术使他能够快速学习还有助于归纳出可以存储和记忆未来图像中的线索。

与之前的放大镜滤波器类似，我们还可以控制最大池化的步长和池的大小。在下面的示例中，我们假设步长为 1，最大池化为 2x2：

最大池化—在定义的值邻域中选择“最大”值

在最大池化做完之后，我们就完成了 1 轮卷积 / ReLU / 最大池化的过程。

在典型的CNN中，进入分类器之前，我们一般会有几轮卷积 / ReLU / 池的过程。每一轮，我们都会在增加深度的同时挤压高度/宽度，这样我们就不会丢失一些证据。

前面的这 1-5 步，重点就是收集证据，接下来就是 Sherlock 查看所有线索并破案的时候了：

第六步

当 Sherlock 训练循环结束时，他有很多零散的线索，然后他需要一个方法可以同时看到全部的线索。其实每条线索都对应一个简单的二维矩阵，但是有成千上万条这样的线索堆积在一起。

现在他必须获得的全部线索都收集并组织起来，以便在法庭上展示给陪审团。

拉平前的特征图

他采用了 Flatten Layer 来完成这项工作（Flatten Layer 常用在从卷积层到全连接层的过渡），简单来说这个技术的做法就是：

每个 2 维像素矩阵变成 1列像素
将 2 维矩阵进行叠加

下图展示了人眼识别的示例：

回到我们的例子，下面是计算机看到的

现在 Sherlock 已经组织完了他的证据，接下来他需要让陪审团相信他的证据最终都指向同一个嫌疑人。

第七步

在全连接层中，我们将证据与每个嫌疑人相连。换句话说就是我们在展示证据与每个嫌疑人之间的联系。

全连接层—连接证据与每个嫌疑人

以下是计算机看到的内容：

全连接层

在 Flatten Layer 和 3 个输出的每个证据之间是权重和偏差。与网络中的其他权重一样，当我们首次开始训练 CNN 时，这些权重将以随机值初始化，并且随着时间的推移，CNN 会“学习”如何调整这些权重/偏差来得到越来越准确的预测结果。

现在是 Sherlock 破解案件的时候了！

第八步

在 CNN 的图像分类器阶段，模型的预测结果就是最高分数的输出。

这个评分函数有两部分：

Logit Score：原始分数
Softmax：每个输出的概率在 0-1 之间。所有分数的总和等于 1。

▌第1部分：Logits ——逻辑分数

每个输出的 logit 分数是基本的线性函数：

Logit分数 =（证据x权重）+ 偏差

每一个证据乘以连接证据与输出的权重。所有这些乘法都加在一起，然后在末尾添加一个偏差项，得到的最高分就是模型的猜测。

Logit 分数计算

为什么得到了最高分数却不是最终结果？有 2 个直观的原因：

Sherlock 的置信水平：我们想知道 Sherlock 有多么自信。当他很自信并且结果是对的时候，我们可以对他进行奖励；但当信他很自信，结果却是错误的时候，我们要对他进行惩罚。当我们在最后计算损失（“Sherlock的准确性”）时，Sherlock 会获得相应的奖励/惩罚。
Sherlock 的置信加权概率：我们希望用一种简单的方法，通过 0 到 1 之间的概率来描述这些结果，并得到与实际输出（0或1）相同的预测分数。正确匹配的图像（Elon）为 1，其他不正确的图像（Jeff和Jon）为 0。将正确输出转换为 1 并将错误输出转换为 0 的过程称为独热编码。

Sherlock 的目标是让他的预测尽可能接近 1，以此获得正确的输出。

▌第2部分：Softmax——Sherlock 的置信度加权概率分数

2.1．Sherlock 的置信水平：

为了找到 Sherlock 的置信水平，我们取字母 e（等于2.71828）为底，并计算 logit 得分做幂运算。让高分值越高，而低分值越低。

在进行幂运算中还保证了没有负分数。由于 logit 分数“可能”为负数，所以下图是置信度曲线：

置信度曲线

2.2. Sherlock 的置信加权概率：

为了找到置信加权概率，我们将每个输出的置信度量除以所有置信度得分的总和，就可以得到每个输出图像的概率，所有这些加起来为 1。用 Excel 示例如下：

Softmax

这个 softmax 分类器非常直观。Sherlock 认为，终结者看到的照片是 Elon Musk 的机率是97％（置信度加权）。我们模型的最后一步是计算损失。损失值告诉我们侦探 Sherlock 的辨识能力究竟有多好（或者多差）。

第九步

损失函数

每个神经网络都有一个损失函数，我们将预测结果与实际情况进行比较。当训练 CNN 时，随着网络权重/偏差的调整，我们的预测结果会得到改善（Sherlock的侦探技能变得更好）。

CNN 最常用的损失函数是交叉熵损失函数。在 Google 上搜索交叉熵会出现很多希腊字母的解释，很容易混淆。尽管描述各不相同，但它们在机器学习的背景下都是相同的，我们将覆盖下面最常见的3个。

比较正确类（Elon，1.00）的概率与 CNN 预测 Elon （his softmax score，0.97）的概率
当CNN的预测接近1时，奖励 Sherlock
当CNN的预测接近0时，惩罚 Sherlock

以上得到的答案都相同！存在 3 种不同的解释

▌解释 1：实际概率与预测概率之间距离的度量

直觉是，如果我们的预测概率接近 1，则我们的损失接近 0。如果我们的预测接近于 0，那么将受到严厉的惩罚。目标是最小化预测结果（Elon，0.97）与实际概率（1.00）之间的“距离”。

交叉熵 1.距离解释

▌解释 2：最大化对数似然或最小化负对数似然

在 CNN 中，“log” 实际上意味着“自然对数（ln）”，它是在 softmax 的步骤1中完成的“指数/置信度”的倒数。

我们不是用实际概率（1.00）减去预测概率（0.97）来计算损失，而是通过log 来计算损失，当 Sherlook 的预测结果离 1 越远的时候，损失是指数级增长的。

交叉熵 2.对数损失解释

▌解释 3：KL 散度（Kullback–Leibler divergence）

KL 散度是用来衡量预测概率（softmax得分）与实际概率的差异程度。

该公式分为两部分：

实际概率不确定的数量。在监督学习的不确定量始终为零。我们 100％肯定训练图像是 Elon Musk。
如果我们使用预测概率，会损失多少的“信息”。

交叉熵 3.KL散度解释

总结

在侦探 Sherlock Holmes 的帮助下，我们给了终结者一双眼睛，所以他现在有能力寻找并摧毁自由世界的保护者 Elon Musk。（Sorry Elon！）

虽然，我们只训练终结者来辨别 Elon，Jeff 和 Jon，但是 Skynet 拥有无限多的资源和训练图像，它可以利用我们构建的网络去训练终结者来识别世间万物！

原文链接：

https://towardsdatascience.com/cutting-edge-face-recognition-is-complicated-these-spreadsheets-make-it-easier-e7864dbf0e1a

——【完】——

你可能感兴趣的:(神经网络)

ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
神经网络-损失函数红米煮粥神经网络人工智能深度学习
文章目录一、回归问题的损失函数1.均方误差（MeanSquaredError,MSE）2.平均绝对误差（MeanAbsoluteError,MAE）二、分类问题的损失函数1.0-1损失函数（Zero-OneLossFunction）2.交叉熵损失（Cross-EntropyLoss）3.合页损失（HingeLoss）三、总结在神经网络中，损失函数（LossFunction）扮演着至关重要的角色，它
BP神经网络的传递函数大胜归来19 MATLAB
BP网络一般都是用三层的，四层及以上的都比较少用；传输函数的选择，这个怎么说，假设你想预测的结果是几个固定值，如1,0等，满足某个条件输出1，不满足则0的话，首先想到的是hardlim函数，阈值型的，当然也可以考虑其他的；然后，假如网络是用来表达某种线性关系时，用purelin---线性传输函数；若是非线性关系的话，用别的非线性传递函数，多层网络时，每层不一定要用相同的传递函数，可以是三种配合，可
神经网络传递函数sigmoid,神经网络传递函数作用快乐的小荣荣神经网络机器学习深度学习人工智能
神经网络传递函数选取不同会有特别大差别嘛？只是最后一层，但前面层是非线性，那么可能存在区别不大的情况。线性函数f(a*input)=af(input),一般来说，input为向量，最简化情况下，可以假设input的各个维度，a1=a2=a3。。。意味着你线性层只是简单的对输入做了scale~而神经网络能起作用的原因，在于通过足够复杂的非线性函数，来模拟任何的分布。所以，神经网络必须要用非线性函数。
Python和R均方根误差平均绝对误差算法模型亚图跨际 Python 交叉知识 R 回归模型误差指标归一化均方根误差生态状态指标神经网络成本误差气体排放气候模型多项式拟合
要点回归模型误差评估指标归一化均方根误差生态状态指标神经网络成本误差计算气体排放气候算法模型Python误差指标均方根误差和平均绝对误差均方根偏差或均方根误差是两个密切相关且经常使用的度量值之一，用于衡量真实值或预测值与观测值或估计值之间的差异。估计器θ^\hat{\theta}θ^相对于估计参数θ\thetaθ的RMSD定义为均方误差的平方根：RMSD⁡(θ^)=MSE⁡(θ^)=E((θ^−θ
【NLP5-RNN模型、LSTM模型和GRU模型】一蓑烟雨紫洛 nlp rnn lstm gru nlp
RNN模型、LSTM模型和GRU模型1、什么是RNN模型RNN（RecurrentNeuralNetwork)中文称为循环神经网络，它一般以序列数据为输入，通过网络内部的结构设计有效捕捉序列之间的关系特征，一般也是以序列形式进行输出RNN的循环机制使模型隐层上一时间步产生的结果，能够作为当下时间步输入的一部分（当下时间步的输入除了正常的输入外还包括上一步的隐层输出）对当下时间步的输出产生影响2、R
基于深度学习的农作物病害检测 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的农作物病害检测利用卷积神经网络（CNN）、生成对抗网络（GAN）、Transformer等深度学习技术，自动识别和分类农作物的病害，帮助农业工作者提高作物管理效率、减少损失。1.农作物病害检测的挑战病害种类繁多：农作物病害的类型多样，不同病害在同一作物上的表现差异很大，同时同一种病害在不同生长阶段的症状也可能不同。环境影响：天气、光照、湿度等外部环境因素会影响农作物的表现，使得病害检
深度学习--对抗生成网络（GAN, Generative Adversarial Network） Ambition_LAO 深度学习生成对抗网络
对抗生成网络（GAN,GenerativeAdversarialNetwork）是一种深度学习模型，由IanGoodfellow等人在2014年提出。GAN主要用于生成数据，通过两个神经网络相互对抗，来生成以假乱真的新数据。以下是对GAN的详细阐述，包括其概念、作用、核心要点、实现过程、代码实现和适用场景。1.概念GAN由两个神经网络组成：生成器（Generator）和判别器（Discrimina
chatgpt赋能python：如何在Python中安装Keras库？ turensu ChatGpt python chatgpt keras 计算机
如何在Python中安装Keras库？Keras是一个简单易用的神经网络库，由FrançoisChollet编写。它在Python编程语言中实现了深度学习的功能，可以使您更轻松地构建和试验不同类型的神经网络。如果您是一名Python开发人员，肯定会想知道如何在您的Python项目中安装Keras库。在本文中，我们将向您展示如何安装和配置Keras库。步骤1：安装Python要使用Keras库，您需
如何理解深度学习的训练过程奋斗的草莓熊深度学习人工智能 python scikit-learn virtualenv numpy pandas
文章目录1.训练是干什么？2.预训练模型进行训练，主要更改的是预训练模型的什么东西？1.训练是干什么？以yolov5为例子，训练的目的是把一组输入猫狗图像放到神经网络中，得到一个输出模型，这个模型下次可以直接用来识别哪个是猫，哪个是狗2.预训练模型进行训练，主要更改的是预训练模型的什么东西？超参数（Hyperparameters）：这是模型结构中定义的参数，比如：卷积核大小（kernel_size
Keras深度学习框架入门及实战指南司莹嫣Maude
Keras深度学习框架入门及实战指南keraskeras-team/keras:是一个基于Python的深度学习库，它没有使用数据库。适合用于深度学习任务的开发和实现，特别是对于需要使用Python深度学习库的场景。特点是深度学习库、Python、无数据库。项目地址:https://gitcode.com/gh_mirrors/ke/keras一、项目介绍Keras简介Keras是一款高级神经网络
每天五分钟玩转深度学习PyTorch：模型参数优化器torch.optim 幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 人工智能神经网络机器学习优化算法
本文重点在机器学习或者深度学习中，我们需要通过修改参数使得损失函数最小化(或最大化)，优化算法就是一种调整模型参数更新的策略。在pytorch中定义了优化器optim，我们可以使用它调用封装好的优化算法，然后传递给它神经网络模型参数，就可以对模型进行优化。本文是学习第6步(优化器)，参考链接pytorch的学习路线随机梯度下降算法在深度学习和机器学习中，梯度下降算法是最常用的参数更新方法，它的公式
如何有效的学习AI大模型？ Python程序员罗宾学习人工智能语言模型自然语言处理架构
学习AI大模型是一个系统性的过程，涉及到多个学科的知识。以下是一些建议，帮助你更有效地学习AI大模型：基础知识储备：数学基础：学习线性代数、概率论、统计学和微积分等，这些是理解机器学习算法的数学基础。编程技能：掌握至少一种编程语言，如Python，因为大多数AI模型都是用Python实现的。理论学习：机器学习基础：了解监督学习、非监督学习、强化学习等基本概念。深度学习：学习神经网络的基本结构，如卷
【3.6 python中的numpy编写一个“手写数字识”的神经网络】 wang151038606 深度学习入门 python numpy 神经网络
3.6python中的numpy编写一个“手写数字识”的神经网络要使用Python中的NumPy库从头开始编写一个“手写数字识别”的神经网络，我们通常会处理MNIST数据集，这是一个广泛使用的包含手写数字的图像数据集。但是，完全用NumPy来实现神经网络（包括数据的加载、预处理、模型定义、前向传播、损失计算、反向传播和权重更新）是一个相当复杂的任务，因为NumPy本身不提供自动微分或高级优化算法（
yolov5单目测距+速度测量+目标跟踪 cv_2025 YOLO 目标跟踪人工智能计算机视觉机器学习图像处理 opencv
要在YOLOv5中添加测距和测速功能，您需要了解以下两个部分的原理：单目测距算法单目测距是使用单个摄像头来估计场景中物体的距离。常见的单目测距算法包括基于视差的方法（如立体匹配）和基于深度学习的方法（如神经网络）。基于深度学习的方法通常使用卷积神经网络（CNN）来学习从图像到深度图的映射关系。单目测距代码单目测距涉及到坐标转换，代码如下：defconvert_2D_to_3D(point2D,R,
探索深度学习的奥秘：从理论到实践的奇幻之旅小周不想卷深度学习
目录引言：穿越智能的迷雾一、深度学习的奇幻起源：从感知机到神经网络1.1感知机的启蒙1.2神经网络的诞生与演进1.3深度学习的崛起二、深度学习的核心魔法：神经网络架构2.1前馈神经网络（FeedforwardNeuralNetwork,FNN）2.2卷积神经网络（CNN）2.3循环神经网络（RNN）及其变体（LSTM,GRU）2.4生成对抗网络（GAN）三、深度学习的魔法秘籍：算法与训练3.1损失
卷积神经网络（CNN）详细介绍及其原理详解（二） FFmpeg123 Pytorch cnn 深度学习人工智能
接上一文继续;五、全连接层假设还是上面人的脑袋的示例，现在我们已经通过卷积和池化提取到了这个人的眼睛、鼻子和嘴的特征，如果我想利用这些特征来识别这个图片是否是人的脑袋该怎么办呢？此时我们只需要将提取到的所有特征图进行“展平”，将其维度变为1×x1×x1×x，这个过程就是全连接的过程。也就是说，此步我们将所有的特征都展开并进行运算，最后会得到一个概率值，这个概率值就是输入图片是否是人的概率，这个过程
【图像压缩】奇异值分解SVD灰色图像压缩（可设置压缩比）【含Matlab源码 4358期】 Matlab武动乾坤 Matlab图像处理（进阶版）matlab
✅博主简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，Matlab项目合作可私信。个人主页：海神之光代码获取方式：海神之光Matlab王者学习之路—代码获取方式⛳️座右铭：行百里者，半于九十。更多Matlab仿真内容点击Matlab图像处理（进阶版）路径规划（Matlab）神经网络预测与分类（Matlab）优化求解（Matlab）语音处理（Matlab）信号处理（Matlab）车间调度
TextCNN：文本卷积神经网络模型一只天蝎编程语言---Python cnn 深度学习机器学习
目录什么是TextCNN定义TextCNN类初始化一个model实例输出model什么是TextCNNTextCNN（TextConvolutionalNeuralNetwork）是一种用于处理文本数据的卷积神经网（CNN）。通过在文本数据上应用卷积操作来提取局部特征，这些特征可以捕捉到文本中的局部模式，如n-gram（连续的n个单词或字符）。定义TextCNN类importtorch.nnasn
基于VGG的猫狗识别卑微小鹿 tensorflow tensorflow
由于猫和狗的数据在这里，所以就做了一下分类的神经网络1、首先进行图像处理：importcsvimportglobimportosimportrandomos.environ['TF_CPP_MIN_LOG_LEVEL']='2'importtensorflowastffromtensorflowimportkerasfromtensorflow.kerasimportlayersimportnum
机器学习到底是个啥旷_9b08
机器学习是装逼神器？曾几何时，当我还在本科打dota玩屁股的时候，身边总有一帮大神。听他们谈话我的心情是。。。大佬中有各路高手前端、后段、java三大架构。。。但最令本渣一听到就仰慕甚至肃然起敬的是当听到卷积神经网络的时候。顿时就有种掉线三十分钟别人都是六神装的感觉。另外，班会上别班小哥用说用机器学习把图片转换成梵高风格时自己班妹纸那一声声尖叫怕是很难忘掉了。。。好在家里爸妈给了次重新做人的机会，
入门篇，带你了解CPU, GPU, TPU, NPU, DPU 今夕是何年，视觉算法部署深度学习算法人工智能
目录CPU(中央处理器)GPU(图形处理器)TPU(张量处理单元)NPU(神经网络处理器)DPU(数据处理器)CPU(中央处理器)专业介绍：CPU是计算机系统的核心，负责执行操作系统和应用程序的指令。它由多个核心组成，每个核心可以独立执行任务。CPU的设计重点是处理复杂的逻辑运算和顺序任务，如分支预测、指令调度等。现代CPU通常包含多个层级的缓存（如L1、L2和L3缓存），以减少访问主存储器的延迟
深度学习之基于Tensorflow卷积神经网络水果蔬菜分类识别系统 qq1744828575 python python plotly
欢迎大家点赞、收藏、关注、评论啦，由于篇幅有限，只展示了部分核心代码。文章目录一项目简介二、功能三、系统四.总结一项目简介一、项目背景与目标背景：在现代农业、智能零售等领域，自动化分类与识别技术对于提高效率、优化供应链管理具有重要意义。为了响应这一需求，本项目旨在构建一个基于深度学习技术的水果蔬菜分类识别系统。目标：构建一个准确率高、性能稳定的水果蔬菜分类识别模型，利用Tensorflow框架
【深度学习实战】使用深度学习模型可视化工具——Netron在线可视化深度学习神经网络量子-Alex 深度学习神经网络人工智能
一直以来，对于深度学习领域的开发者，可视化模型都是非常迫切的需求，今天主要介绍一款可视化工具——NetronNetron有三种使用方式：在线、本地安装、pip安装今天在这里只介绍在线使用这种方式。Netron有个官方的网站：Netron点击进去是这样的一个界面我们可以点击openmodel从本地选择一个预训练模型可以看到这里就显示出来了
PHP中使用grpc服务的教程详解 Oona_01 php android 开发语言
这篇文章主要为大家详细介绍了PHP中使用grpc服务的教程相关知识,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下grpc是通过定义服务端和客户端的代码来实现的通信的。但是要实现通信，还是要将其方法包装为一个http请求，除非你把grpc的服务端代码放在本地的端口上。grpc是面对微服务框架而风生水起的，上次我用python编写了一个图神经网络处理的微服务，使用grpc放在我的服务
每天五分钟玩转深度学习框架PyTorch：获取神经网络模型的参数幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 神经网络人工智能模型参数 python
本文重点当我们定义好神经网络之后，这个网络是由多个网络层构成的，每层都有参数，我们如何才能获取到这些参数呢？我们将再下面介绍几个方法来获取神经网络的模型参数，此文我们是为了学习第6步（优化器）。获取所有参数Parametersfromtorchimportnnnet=nn.Sequential(nn.Linear(4,2),nn.Linear(2,2))print(list(net.paramet
每天五分钟玩转深度学习框架PyTorch：将nn的神经网络层连接起来幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 神经网络人工智能机器学习 python
本文重点前面我们学习pytorch中已经封装好的神经网络层，有全连接层，激活层，卷积层等等，我们可以直接使用。如代码所示我们直接使用了两个nn.Linear（），这两个linear之间并没有组合在一起，所以forward的之后，分别调用了，在实际使用中我们常常将几个神经层组合在一起，这样不仅操作方便，而且代码清晰。这里介绍一下Sequential()和ModuleList()，它们可以将多个神经网
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h