图像超分辨率重建 VDSR解析

Accurate Image Super-Resolution Using Very Deep Convolutional Networks

论文地址：https://arxiv.org/abs/1511.04587v1

代码：https://github.com/huangzehao/caffe-vdsr

https://github.com/Jongchan/tensorflow-vdsr

作者在该文章中提取了一个更加精确的网络。网络相比于之前的网络，要更加的深，有20层。通过在深度网络结构中多次层叠小型的过滤器，这样可以有效的利用大图像区域的上下文信息。但是随着深度的增加，收敛速度也会变慢。作者说提出了一种比较有效的训练方法。在作者的网络中，仅仅学习残差，并且使用可调整的梯度裁剪来实现很高的学习率。

SRCNN表现了很不错的效果。但是作者发现其有三个缺陷：

图像的上下文信息太少了（也就是说感受野太小少了，因为只有3层网络分别是9X9,1X1,5X5，感受野是13*13）。
训练收敛太慢了，学习速率也比较慢。
该网络仅仅适用于单个比例/尺寸。

于是，本文中的作者就从这三个方向去下手：

一：上下文信息（Context）

作者说利用到了非常深的图像区域上的上下文信息，（We utilize contextual information spread over very large image regions）。我觉得说的就是提高网络的深度以此来提高感受野，让图像特征提取到更多的细节。

二：收敛（Convergence）

如果学习率使用的比较小，那么对于很深的网络来说，收敛速度就非常慢。作者提出用残差网络和极高的学习率去加快训练速度（We suggest a way to speed-up the training: residual-learning CNN and extremely high learning rates.）。使用高的学习率可以加快收敛速度，但是同时也会导致梯度爆炸。于是作者就想到用残差学习和梯度裁剪来进行优化。另外作者提到，低分辨率图像和高分辨率图像在很大程度上是共享相同的信息的（这里说的就是低频信息，因为高分辨率图像可以分解为低频信息(也就是低分辨率图像)和高频信息(也就是残差图像或者说图像细节)），因此对LR和HR图像之间的差异（即残差）进行显示建模是很有利的。另外，作者将初始的学习率设置的很大（是SRCNN的10000倍），而这是通过残差学习和梯度裁剪来实现的。作者也分析了SRCNN和VDSR的收敛区别，作者认为，SRCNN直接对高分辨率图像建模，因此有两个用途：将输入传送到端层以及重建残差。而作者认为，将输入传递到端层与自动编码器的工作类似，因此训练时间大都都花在了学习此自动编码器上面去了，而使得学习其他部分（细节图像）的收敛速度大大降低。而VDSR是直接对残差图像进行建模的，因此收敛速度更快，精度更高。

三：比例因子（Scale Factor）

对于图像的尺寸，通常是用户任意指定的。而作者认为，训练和存储许多依赖于比例的模型以应对所有可能的情况是不切实际的（Training and storing many scale-dependent models in preparation for all possible scenarios is impractical.）。同时作者发现，对于单个的卷积网络足够实现多尺度因子的超分辨了。对于SRCNN来说，只能为单个指定的尺寸进行训练，而当需要新的比例的时候，就需要重新训练新的模型了。除了上述所的以外，作者还提及到：通过在训练期间每层填充零，我们的输出图像具有与输入图像相同的大小，而SRCNN的输出小于输入。最后，我们仅对所有层使用相同的学习率，而SRCNN对不同层使用不同的学习率以实现稳定的收敛。

*************************************************************************************************************************************************

接下来看看提出的网络模型：

作者提到：使用非常深的网络来预测密集输出的一个问题是，每次应用卷积运算时，特征图的大小都会减小。这与其他超分辨率方法一致，因为许多方法都要求周围的像素正确推断中心像素。这种中心-环绕关系很有用，因为周围区域对该不适定问题（SR）提供了更多约束。对于接近图像边界的像素，无法充分利用这种关系，许多SR方法会裁剪结果图像。但是，如果所需的环绕区域很大，则此方法无效。裁剪后，最终图像太小而无法从视觉上欣赏。要解决此问题，我们在卷积之前填充零以使所有要素图（包括输出图像）的大小保持不变。事实证明，零填充的效果出奇地好。因此，我们的方法与大多数其他方法的不同之处在于，还可以正确预测图像边界附近的像素。预测完图像细节后，会将其添加回输入的ILR图像中以提供最终图像（HR）。

接着作者从四个方面讲解了提出的模型和方法：

（1）残差学习

在SRCNN中，输入的确切副本必须经过所有层，直到到达输出层。对于许多权重层，这成为需要非常长时记忆的端到端关系。因此，梯度消失/爆炸问题可能很关键。作者提到，可以用残差学习去解决梯度消失/爆炸问题。

由于输入和输出图像非常相似，作者定义了残差图像r = y - x，其中大多数值可能为零或较小。作者的目标就是去预测该残留图像。

在作者提到的网络中，这反映在损耗层上，其损耗层采用三个输入：残差估计，网络输入（ILR图像）和地面真实HR图像。损失计算为重建图像（网络输入和输出之和）与地面真实情况之间的欧几里得距离。

通过使用基于反向传播的小批量梯度下降优化回归目标来进行训练（LeCun等人[14]）。我们将动量参数设置为0.9。训练由权重确定（L2罚分乘以0.0001）。

（2）高学习率

训练深度模型可能无法在现实的时间限制内收敛。 SRCNN 在三个以上的重量层上均未显示出优异的性能。尽管可能有多种原因，但一种可能性是他们在网络融合之前就停止了训练过程。他们的学习率10^-5太小，以至于网络无法在一周内在通用GPU上融合。从SRCNN的图9来看，很难说它们的更深层网络已经融合并且其性能已达到饱和。尽管更多的培训最终可以解决问题，但是使用SRCNN将深度增加到20似乎并不实际。

提高学习率以促进训练是基本的经验法则。但是简单地将学习率设置得很高也可能导致梯度消失/爆炸。因此，我们建议使用可调整的梯度裁剪，以最大程度提高速度，同时抑制梯度爆炸。

（3）可调梯度剪枝

梯度剪枝是一种经常用于训练递归神经网络的技术[17]。但是，据我们所知，它在训练CNN中的使用受到限制。尽管存在许多限制梯度的方法，但常见的策略之一是将各个梯度限制在预定义范围[-θ，θ]中。

通过裁剪，使得梯度在一定范围内。通过通常用于训练的随机梯度下降，可以将学习率乘以调整步长。如果使用高学习率，则有可能将θ调整为较小以避免在高学习率方案中爆炸梯度。但是，随着学习速率逐渐变小，有效梯度（梯度乘以学习速率）接近零，并且如果学习速率在几何上降低，则训练可能需要按指数级进行多次迭代才能收敛。

为了获得最大的收敛速度，我们将梯度裁剪为[θ/γ，θ/γ]，其中γ表示当前学习速率。我们发现可调梯度裁剪使得我们的收敛过程变得非常快。我们的20层网络培训在4个小时内完成，而3层SRCNN则需要几天的培训时间。

（4）多尺度

虽然非常深入的模型可以提高性能，但现在需要更多参数来定义网络。通常，为每个比例因子创建一个网络。考虑到经常使用分数比例因子，我们需要一种经济的方式来存储和检索网络。

因此，我们还训练了一个多尺度模型。通过这种方法，可以在所有预定义比例因子之间共享参数。训练多尺度模型非常简单。几个指定比例的训练数据集被合并为一个大数据集。

数据准备类似于SRCNN，但有一些区别。现在，输入色块大小等于接受区域的大小，并且图像被分成没有重叠的子图像。微型批处理包含64个子图像，其中不同比例的子图像可以在同一批处理中。

接着作者提到了该网络的三个属性：深度，残差学习，多尺度因子

4.1网络的属性

接着作者对网络的属性就行了介绍，总的来说有三个：（1）该网络层数比较深，作者也验证了，网络越深，效果越好。（2）该网络中用到的残差学习，使得网络的收敛速度比标准CNN快很多。（3）证明了使用单个网络的方法与使用针对每个规模训练的多个网络的方法的效果相同。下面是论文中的翻译部分：

（在本节中，我们将研究所提出方法的三个属性。首先，我们证明了执行SR任务需要深度较大。一个非常深的网络在图像中利用更多的上下文信息，并对具有许多非线性层的复杂功能进行建模。我们通过实验验证了较深层的网络比浅层网络具有更好的性能。

其次，我们证明了我们的残差学习网络的收敛速度比标准CNN快得多。此外，我们的网络极大地提高了性能。

我们证明了使用单个网络的方法的效果与使用针对每个规模训练的多个网络的方法的效果相同。我们可以有效地减少多网络方法的模型容量（参数数量）。）

接下来依次对网络的相关属性进行讲解：

4.1 网络越深，效果越好：

下面是论文相关翻译：

卷积神经网络通过强制相邻层神经元之间的局部连通性模式来利用空间局部相关性[1]。换句话说，第m层中的隐藏单元将第m-1层中的单元的子集作为输入，它们形成空间连续的感受野。

每个隐藏单元对于输入相对于感受野之外的变化均无响应。因此，该体系结构确保学习的滤波器对空间局部输入模式产生最强的响应。

然而，堆叠许多这样的层导致滤波器变得越来越全局化（即，响应于更大的像素空间区域）。换句话说，具有很大支撑的过滤器可以有效地分解为一系列小的过滤器。

在这项工作中，我们对所有图层使用大小相同的3×3滤镜。对于第一层，感受野的大小为3×3;对于第二层，感受野的大小在高度和宽度上都增加2。对于深度D网络，接收场的大小为（2D +1）×（2D +1）。它的大小与深度成正比。

在SR的任务中，这对应于可以用来推断高频分量的上下文信息量。较大的感受野意味着网络可以使用更多上下文来预测图像细节。由于SR是一个不适定的逆问题，因此收集和分析更多相邻像素可提供更多线索。例如，如果在感受野中完全包含一些图像图案，则可以认为该图案被识别并用于超分辨图像。

另外，非常深的网络可以利用高优先级。我们使用19个整流线性单元，并且我们的网络可以使用中等数量的通道（神经元）对非常复杂的函数进行建模。 Simonyan和Zisserman的论文很好地解释了建立薄型深层网络的优势

现在，我们通过实验表明，非常深的网络可以显着提高SR性能。我们训练和测试深度范围为5到20的网络（仅计算除非线性层之外的权重层）。在图3中（如下图），我们显示了结果。在大多数情况下，性能随着深度的增加而提高。随着深度的增加，性能会迅速提高。

4.2：残差学习

下面是论文的翻译部分：

由于我们已经有一个低分辨率的图像作为输入，因此对于SR而言，预测高频分量就足够了。尽管在先前的方法中已经使用了预测残差的概念，但尚未在基于深度学习的SR框架的背景下对其进行研究。

在这项工作中，我们提出了一种学习残差图像的网络结构。现在，我们详细研究此修改对标准CNN结构的影响。

首先，我们发现该残才网络收敛得更快。通过实验比较了两个网络：残差网络和标准非残差网络。我们使用深度10（权重层）和比例因子2。各种学习率的性能曲线如图4所示（下图）。所有网络都使用相同的学习率调度机制上面已经提到。

其次，在融合时，残差网络显示出优异的性能。在图4中，训练完成后，残差网络会提供较高的PSNR。

另一点是，如果使用较小的学习率，则网络不会在给定的时期内收敛。如果使用初始学习速率0.1，则残差学习网络的PSNR在10个周期内达到36.90。但是，如果改用0.001，则网络将永远无法达到相同的性能水平（80个周期后的性能为36.52）。以类似的方式，残留和非残留网络在10个时间段后显示出巨大的性能差距（速率0.1时分别为36.90和27.42）。

简而言之，对标准非残差网络结构的这种简单修改非常强大，可以在输入与输出图像高度相关的其他图像恢复问题中探索该思想的有效性。

4.3单个模型适用于多尺度

下面是论文的翻译：

训练过程中的规模扩展是为网络配备多规模超分辨率机器的一项关键技术。我们的多规模机器可以执行许多不同规模的SR过程，而这种多规模机器的容量要比单规模机器的总和小得多。

我们从一个有趣的实验开始，如下所示：我们使用单个比例因子S_train训练网络，并在另一个比例因子S_test下对其进行测试。这里，考虑了在SR比较中广泛使用的因子2，3和4。尝试对数据集“ Set5”进行可能的配对（S_train，S_test）。实验结果总结在表2中。

如果S_train != S_test，说明性能下降了。对于比例因子2，使用因子2训练的模型的PSNR为37.10（以dB为单位），而使用因子3和4训练的模型分别给出30.05和28.13。经过单尺度数据训练的网络无法处理其他尺度。在许多测试中，它甚至比双三次插值（用于生成输入图像的方法）还要糟糕。

现在，我们测试使用比例增强训练的模型是否能够在多个比例因子下执行SR。上面使用的同一网络使用多个比例因子S1 = {2，3，4}进行训练。此外，我们还对S1 = {2，3}，{2，4}，{3，4}的情况进行了实验，以进行更多比较。

我们观察到该网络可以应付训练期间使用的任何规模。当S1 = {2，3，4}（表2中的×2，3，4）时，其每个标度的PSNR可与从单标度网络的相应结果获得的PSNR相比：37.06 vs. 37.10（× 2），33.27与32.89（×3），30.95与30.86（×4）。

另一个模式是，对于大型（×3、4），我们的多尺度网络优于单尺度网络：我们的模型（×2、3），（×3、4）和（×2、3、4）给出PSNR测试标度3分别为33.22、33.24和33.27，而（×3）给出32.89。同样，（×2，4），（×3、4）和（×2、3、4）分别给出30.86、30.94和30.95（相对于×4模型为30.84），由此我们观察到训练多尺度模型能够提高大尺度的性能。

结论
在这项工作中，我们提出了使用非常深的网络的超分辨率方法。由于收敛速度慢，很难训练一个非常深的网络。我们使用残差学习和极高的学习率来快速优化非常深的网络。收敛速度被最大化，并且我们使用梯度裁剪来确保训练的稳定性。我们已经证明，在基准图像上，我们的方法大大优于现有方法。我们相信我们的方法很容易适用于其他图像恢复问题，例如降噪和压缩伪影去除。

总结就是：作者用了非常深的网络（20层，其实相比于ResNet的100多层还是小巫见大巫）去拓展感受野的大小。另外，由于网络越深，会出现梯度爆炸/消失等，同时，对于学习率比较小的情况下，深的网络收敛速度非常慢，因此作者使用了残差学习+极高的学习率+梯度剪枝来进行优化。。另外，作者做了一个额外的工作就是验证了单个模型完全适合于多尺度比例因子。

下面几个博客讲的不错，可以借鉴一下：

https://blog.csdn.net/u011692048/article/details/77512310

https://blog.csdn.net/u010327061/article/details/80094724

https://blog.csdn.net/wangkun1340378/article/details/74231352

【Python】一文详细介绍 py格式文件高斯小哥 Python基础【高质量合集】python 新手入门学习
【Python】一文详细介绍py格式文件个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文章目录一、py格式文件简介二、如何创建和编辑py格式文件三、如何运行py
大创项目推荐深度学习 opencv python 公式识别(图像识别机器视觉) laafeer python
文章目录0前言1课题说明2效果展示3具体实现4关键代码实现5算法综合效果6最后0前言优质竞赛项目系列，今天要分享的是基于深度学习的数学公式识别算法实现该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：4分创新点：4分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1课题
python清华大学出版社答案_Python机器学习及实践 weixin_39805119 python清华大学出版社答案
第1章机器学习的基础知识1.1何谓机器学习1.1.1传感器和海量数据1.1.2机器学习的重要性1.1.3机器学习的表现1.1.4机器学习的主要任务1.1.5选择合适的算法1.1.6机器学习程序的步骤1.2综合分类1.3推荐系统和深度学习1.3.1推荐系统1.3.2深度学习1.4何为Python1.4.1使用Python软件的由来1.4.2为什么使用Python1.4.3Python设计定位1.4.
深度学习项目-基于深度学习的股票价格预测研究雅致教育计算机毕业设计深度学习人工智能
概要随着经济的发展，中国股票市场的规模持续扩大，早已成为金融投资的重要部分，掌握股票市场的变化规律无论是对监管者还是投资者都具有极其重要的意义。正因如此，人们不断探索着股票市场的变化规律，其中使用深度学习预测股价是当前国内国际研究与应用的热点。本文首先从有效市场假说和分形市场假说两个角度讨论了中国股票市场的有效性，说明股票市场具有复杂的非线性特征。其次，结合股票市场特征对比了当前的预测方法
ChatGPT技巧大揭秘：AI写代码新境界 2401_83550420 chatgpt4.0 chatgpt chatgpt 人工智能 AI写作
ChatGPT无限次数:点击直达ChatGPT技巧大揭秘：AI写代码新境界随着人工智能技术的不断进步，开发人员现在有了更多有趣的工具来提高他们的工作效率。其中，ChatGPT作为一种基于深度学习的自然语言处理模型，已经成为许多开发者的新宠。在本文中，我们将揭秘使用ChatGPT来帮助编写代码的技巧，探索AI在编程领域的新境界。ChatGPT简介ChatGPT是一种基于大型神经网络的对话生成模型，它
AI大模型学习：开启智能时代的新篇章游向大厂的咸鱼人工智能学习
随着人工智能技术的不断发展，AI大模型已经成为当今领先的技术之一，引领着智能时代的发展。这些大型神经网络模型，如OpenAI的GPT系列、Google的BERT等，在自然语言处理、图像识别、智能推荐等领域展现出了令人瞩目的能力。然而，这些模型的背后是一系列复杂的学习过程，深度学习技术的不断演进推动了AI大模型学习的发展。首先，AI大模型学习的基础是深度学习技术。深度学习是一种模仿人类大脑结构的机器
【Python】成功解决ModuleNotFoundError: No module named ‘torchinfo‘ 高斯小哥 BUG解决方案合集 python pytorch 新手入门学习 debug
【Python】成功解决ModuleNotFoundError:Nomodulenamed‘torchinfo’个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文
ChatGPT神技：AI成为你的编程良友 2401_83481083 chatgpt4.0 chatgpt chatgpt 人工智能 AI写作
ChatGPT无限次数:点击直达ChatGPT神技：AI成为你的编程良友近年来，人工智能技术的发展迅猛，ChatGPT作为其中一项创新技术，正逐渐走进我们的生活。在编程领域，AI不仅可以助力我们提高效率，还能成为我们的良友，帮助解决各种编程难题。一、ChatGPT简介ChatGPT是一种基于自然语言处理技术的人工智能模型，它能够生成类人对话。ChatGPT通过深度学习模型，能够理解输入的文本并生成
深度学习如何入门？科学的N次方深度学习
入门深度学习需要系统性的学习和实践经验积累，以下是一份详细的入门指南，包含了关键的学习步骤和资源：预备知识：•编程基础：熟悉Python编程语言，它是深度学习领域最常用的编程语言。确保掌握变量、条件语句、循环、函数等基本概念，并学习如何使用Python处理数据和文件操作。•数学基础：理解线性代数（矩阵运算、向量空间等）、微积分（导数、梯度求解等）、概率论与统计学（期望、方差、概率分布、最大似然估计
深度学习与（复杂系统）事物的属性科学禅道深度学习模型专栏深度学习人工智能
深度学习与复杂系统中事物属性的关系体现在：特征学习与表示:深度学习通过多层神经网络结构，能够自动从原始输入数据中学习和提取出丰富的特征表示。每一层神经网络都可能对应着事物属性的不同抽象层次，底层可能对应简单直观的属性，而随着网络深度的增加，顶层可以学习到更抽象、复杂的属性及其相互关系。非线性关系建模:深度学习特别擅长处理非线性关系，而在复杂系统中，事物属性间的相互作用往往表现为非线性，例如，某些属
智合同如何助力建筑行业合同智能化管理智合同（小智）合同智能应用 AI技术降本增效提质人工智能自然语言处理知识图谱深度学习大数据
#建筑行业#人工智能#AI#合同智能应用#深度学习#自然语言处理技术#知识图谱智合同-采用深度学习、自然语言处理技术、知识图谱等人工智能技术，为企业提供专业的合同相关的智能服务。其主要服务包含：合同智能审查、合同要素智能提取、合同版本对比、合同智能起草、ICR智能识别、合同履约追踪、文本一致性对比、广告审查、合同范本库等服务。智合同在助力建筑行业合同智能化管理方面具有显著的优势。首先，智合同利用A
神经网络（深度学习，计算机视觉，得分函数，损失函数，前向传播，反向传播，激活函数） MarkHD 深度学习神经网络计算机视觉
神经网络，特别是深度学习，在计算机视觉等领域有着广泛的应用。以下是关于你提到的几个关键概念的详细解释：神经网络：神经网络是一种模拟人脑神经元结构的计算模型，用于处理复杂的数据和模式识别任务。它由多个神经元（或称为节点）组成，这些神经元通过权重和偏置进行连接，并可以学习调整这些参数以优化性能。深度学习：深度学习是神经网络的一个子领域，主要关注于构建和训练深度神经网络（即具有多个隐藏层的神经网络）。通
MATLAB 2023a：强化学习算法的实战演练与性能评估 zmjia111 机器学习 matlab matlab 算法开发语言深度学习机器学习 yolo
在深度学习领域，MATLAB2023版深度学习工具箱以其完整的工具链和高效的运行环境，为研究人员和开发者提供了前所未有的便利。这一工具箱不仅集成了建模、训练和部署的全部功能，更以其简洁易用的语法和强大的算法库，为深度学习任务的快速实现铺平了道路。相较于Python等编程语言，MATLAB的语法更为直观，上手更为迅速。无需繁琐的环境配置和库安装，用户只需打开MATLAB界面，即可轻松开始深度学习之旅
动手学习深度学习——2.5 自动微分 X_Imagine 动手学习深度学习深度学习人工智能自动微分
2.5自动微分正如【2.4微积分】所说，微分是深度学习中几乎所有最优化算法的关键步骤。虽然求这些导数的计算过程很简单，只需要一些基本的微积分知识。但对于复杂的模型，手工计算参数的更新可能很痛苦(而且经常容易出错)。深度学习框架通过自动计算导数加快了这一工作，即自动微分（AutomaticDifferentiation）。在实践中，基于我们设计的模型，系统构建了一个计算图，跟踪哪些数据结合哪些操
飞桨科学计算套件PaddleScience skywalk8163 人工智能 paddlepaddle 人工智能飞桨
PaddleScience是一个基于深度学习框架PaddlePaddle开发的科学计算套件，利用深度神经网络的学习能力和PaddlePaddle框架的自动(高阶)微分机制，解决物理、化学、气象等领域的问题。支持物理机理驱动、数据驱动、数理融合三种求解方式，并提供了基础API和详尽文档供用户使用与二次开发。安装当然要先安装好飞桨PaddlePaddle，再安装PaddleSciencepipinst
最新ChatGPT支持下的PyTorch机器学习与深度学习 zkzhzy ChatGPT 机器学习 python 机器学习深度学习 pytorch chatgpt 数据分析人工智能
近年来，随着AlphaGo、无人驾驶汽车、医学影像智慧辅助诊疗、ImageNet竞赛等热点事件的发生，人工智能迎来了新一轮的发展浪潮。尤其是深度学习技术，在许多行业都取得了颠覆性的成果。另外，近年来，Pytorch深度学习框架受到越来越多科研人员的关注和喜爱。郁磊（副教授）主要从事AI人工智能、大语言模型及软件开发、生理系统建模与仿真、生物医学信号处理，具有丰富的科研经验，主编《MATLAB智能算
神经网络量化小厂程序猿人工智能
神经网络量化（NeuralNetworkQuantization）是一种技术，旨在减少神经网络模型的计算和存储资源需求，同时保持其性能。在深度学习中，神经网络模型通常使用高精度的参数（例如32位浮点数）来表示权重和激活值。然而，这种表示方式可能会占用大量的内存和计算资源，特别是在部署到资源受限的设备（如移动设备或嵌入式系统）时会受到限制。神经网络量化通过将模型参数和激活值从高精度表示（例如32位浮
神奇的微积分科学的N次方人工智能人工智能 ai
微积分在人工智能（AI）领域扮演着至关重要的角色，以下是其主要作用：优化算法：•梯度下降法：微积分中的导数被用来计算损失函数相对于模型参数的梯度，这是许多机器学习和深度学习优化算法的核心。梯度指出了函数值增加最快的方向，通过沿着负梯度方向更新权重，可以最小化损失函数并优化模型。•反向传播：在神经网络训练中，微积分的链式法则用于计算整个网络中每个参数对于最终损失函数的影响（偏导数），这一过程就是反向
线性代数在卷积神经网络（CNN）中的体现科学的N次方人工智能线性代数 cnn 人工智能
案例：深度学习中的卷积神经网络（CNN）在图像识别领域，卷积神经网络（ConvolutionalNeuralNetworks,CNN）是一个广泛应用深度学习模型，它在人脸识别、物体识别、医学图像分析等方面取得了显著成效。CNN中的核心操作——卷积，就是一个直接体现线性代数应用的例子。假设我们正在训练一个用于识别猫和狗的图像分类器，原始输入是一幅RGB彩色图片，可以将其视为一个高度、宽度和通道数（R
【PyTorch】成功解决ModuleNotFoundError: No module named ‘torch’ 高斯小哥 PyTorch零基础入门教程 pytorch 人工智能 python conda debug 深度学习机器学习
【PyTorch】成功解决ModuleNotFoundError:Nomodulenamed‘torch’个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文章目录
深度学习pytorch——索引与切片 Echo-J AI 深度学习 pytorch 人工智能
indexingimporttorcha=torch.rand(4,3,28,28)#表示4张28*28的rgb图print(a[0].shape)#a[0]获得第一张图片print(a[0,0].shape)#a[0,0]获得第一张图片的r图print(a[0,0,2,4])#获得第一张图片第一个通道的一个像素点，因此得到的是一个标量selectfirst/lastN#selectfirst/l
计算机设计大赛题目：基于卷积神经网络的手写字符识别 - 深度学习 iuerfee python
文章目录0前言1简介2LeNet-5模型的介绍2.1结构解析2.2C1层2.3S2层S2层和C3层连接2.4F6与C5层3写数字识别算法模型的构建3.1输入层设计3.2激活函数的选取3.3卷积层设计3.4降采样层3.5输出层设计4网络模型的总体结构5部分实现代码6在线手写识别7最后0前言优质竞赛项目系列，今天要分享的是基于卷积神经网络的手写字符识别该项目较为新颖，适合作为竞赛课题方向，学长非常推荐
【深度学习笔记】1 数据操作 RIKI_1 深度学习深度学习笔记人工智能
注：本文为《动手学深度学习》开源内容，仅为个人学习记录，无抄袭搬运意图数据操作在深度学习中，我们通常会频繁地对数据进行操作。作为动手学深度学习的基础，本节将介绍如何对内存中的数据进行操作。在PyTorch中，torch.Tensor是存储和变换数据的主要工具。如果你之前用过NumPy，你会发现Tensor和NumPy的多维数组非常类似。然而，Tensor提供GPU计算和自动求梯度等更多功能，这些使
科技革新的引擎-2024年AI辅助研发趋势 lzyever 科技人工智能
随着科技的飞速发展，人工智能（AI）已经在许多领域展现出了其强大的潜力和价值。特别是在研发领域，AI的辅助作用日益凸显，成为推动科技革新的重要引擎。在2024年，这种趋势将更加明显，我们可以从以下几个方面来探讨这一趋势。首先，AI辅助研发将极大地提升研发效率并降低成本。在研发过程中，AI可以通过自动化流程、数据挖掘和深度学习等技术，加速实验和设计的过程，从而缩短研发周期。同时，AI还可以优化资源配
【python】成功解决ModuleNotFoundError: No module named ‘tensorboardX‘ 高斯小哥 BUG解决方案合集 python 学习 debug
【python】成功解决ModuleNotFoundError:Nomodulenamed‘tensorboardX’个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注
深度学习——梯度消失、梯度爆炸小羊头发长深度学习机器学习人工智能
本文参考：深度学习之3——梯度爆炸与梯度消失梯度消失和梯度爆炸的根源：深度神经网络结构、反向传播算法目前优化神经网络的方法都是基于反向传播的思想，即根据损失函数计算的误差通过反向传播的方式，指导深度网络权值的更新。为什么神经网络优化用到梯度下降的优化方法？深度网络是由许多非线性层(带有激活函数)堆叠而成，每一层非线性层可以视为一个非线性函数f(x)，因此整个深度网络可以视为一个复合的非线性多元函数
阿里云分布式深度学习训练架构Whale qwfys200 Reading 阿里云分布式深度学习
阿里云分布式深度学习训练架构Whale阿里云分布式深度学习训练架构Whale参考文献Whale基于Tensorflow深度学习分布式训练框架|学习笔记Whale:EfficientGiantModelTrainingoverHeterogeneousGPUs阿里云机器学习平台PAI论文高效大模型训练框架Whale入选USENIXATC’22
计算机设计大赛深度学习驾驶行为状态检测系统(疲劳抽烟喝水玩手机) - opencv python iuerfee python
文章目录1前言1课题背景2相关技术2.1Dlib人脸识别库2.2疲劳检测算法2.3YOLOV5算法3效果展示3.1眨眼3.2打哈欠3.3使用手机检测3.4抽烟检测3.5喝水检测4最后1前言优质竞赛项目系列，今天要分享的是基于深度学习的驾驶行为状态检测系统该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：3分创新点：5分更多资料,项目
【深度学习】COCO API源码解读 CS_Zero 深度学习人工智能
COCOAPI从C、cython，到PythonAPI：实现语义分割标注mask的解析，从具体实现cocoapi/common/maskApi.hcocoapi/common/maskApi.c到Cython封装实现pycocotools._maskcocoapi/PythonAPI/pycocotools/_mask.pyx#distutils:language=c#distutils:sour
深度学习踩坑记录（持续更新）芒果不茫QAQ 深度学习人工智能
目录4060显卡cuda版本异常transformers初始化TrainingArguments时output_dir指定问题4060显卡cuda版本异常环境：torch1.11.0+cu113程序报错RuntimeError:nvrtc:error:invalidvaluefor--gpu-architecture(-arch)可能原因与解决办法4060显卡是sm_89架构，支持11.7以上cu
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p

图像超分辨率重建 VDSR解析

Accurate Image Super-Resolution Using Very Deep Convolutional Networks

你可能感兴趣的:(深度学习)