Chris-2021

各种经典卷积网络架构介绍

内容来自论文：A Survey of the Recent Architectures of Deep Convolutional Neural Networks

参考网上的翻译：csdnblog
部分内容来自 cs231n 讲义

摘要

深度 CNN 的超强学习能力主要是通过使用多个非线性特征提取阶段实现的，这些阶段能够从数据中自动学习分层表征。
深度 CNN 架构研究表明，创新的架构理念以及参数优化可以提高 CNN 在各种视觉相关任务上的性能。
在表征能力方面的主要改进是通过重构处理单元来实现的。
- 使用块而不是层作为结构单元

介绍

CNN 具有吸引力的特征是它提取数据中空间或时间关系的能力。
- 卷积核的输出被分配给非线性处理单元，这不仅有助于学习抽象表示，而且还将非线性嵌入到特征空间中。这种非线性为不同的响应生成了不同的激活模式，因此有助于学习图像中的语义差异。
- 非线性函数的输出通常经过下采样，这有助于总结结果，并使输入对于几何变形不变。
- 可以自动学习特征，而不需要很复杂的处理。
CNN 的重要特点：层次的学习，自动特征提取，多任务和权重共享。
当处理复杂的学习问题时，深层架构比浅层架构具有优势。
CNN 学习策略和结构经过了多种改进，以使CNN可扩展到大而复杂的问题。
- NN的重大创新主要在2012年以来提出，主要包括处理单元的重组和新区块的设计。
- Zeiler 和 Fergus 引入了特征的逐层可视化的概念
- Google 小组提出了一个有趣的想法，即分割、变换和合并，并且相应的块称为 inception 块。
  - inception 块首次给出了在层内进行分支的概念，该概念允许在不同的空间尺度上提取特征
- ResNet 引入的用于深层 CNN 训练的跳跃连接概念广为人知，随后，此概念被大多数后续的网络使用，例如 Inception-ResNet，WideResNet，ResNext 等
- 为了提高CNN的学习能力，不同的结构设计，例如 WideResNet，Pyramidal Net，Xception 等，从附加基数和增加宽度的角度探讨了多尺度转换的效果
- 这种转变带来了许多新的体系结构思想，例如通道提升，空间和通道智能开发以及基于注意力的信息处理等。
本综述中讨论的各种 CNN 架构可以大致分为以下七个主要类别：空间利用，深度，多路径，宽度，特征图利用，通道提升和基于注意的 CNN

基础的 CNN 模块

典型的 CNN 体系结构通常包括卷积和池化层的交替，最后是一个或多个全连接层。在某些情况下，全连接层替换为全局平均池化层。除了学习的各个阶段外，还结合了不同的正则化单元，例如批次归一化和 dropout，以优化 CNN 性能。
卷积层由一组卷积核（每个神经元充当核）组成。这些核与图像的一小部分区域相关，称为 感受野。
- 通过使用相同的权重卷积核在整个图像上滑动来提取图像中的不同特征集。
- 与全连接网络相比，卷积运算的这种权重共享功能使 CNN 参数更有效。
进行池化或下采样是一个有趣的局部操作。它汇总了感受野附近的相似信息，并在该局部区域内输出主要响应。
激活功能起决策功能，有助于学习复杂的模式。选择适当的激活功能可以加快学习过程。
- 不同的激活函数，例如 sigmoid，tanh，maxout，ReLU 和 ReLU 的变体，例如 leaky ReLU，ELU 和 PReLU 用于引入特征的非线性组合。
- ReLU 及其变体优于其他激活函数，因为它有助于克服梯度消失问题。
批归一化用于解决与特征图中内部协方差偏移有关的问题。
- 内部协方差偏移量随隐藏层的分布变化
  - 会降低收敛速度（通过将学习率设置为小值可以缓解）
  - 对参数初始化要求高。
Dropout 引入了网络内的正则化，通过以一定概率随机跳过某些单元或连接来提高泛化性。
全连接层通常在网络末端用于分类任务。与池化和卷积不同，它是全局操作。

深度 CNN 的结构进化史

深度 CNN 演化史
1980年代末至1999年：CNN 的起源
- 1989年，LeCuN 等人提出了第一个名为 ConvNet 的多层 CNN。LeCuN 提出了 ConvNet 的监督训练，使用了反向传播算法，为现代 2D CNN 奠定了基础。成功解决了手写数字和邮政编码识别相关问题。
- 1998年， LeCuN 改进了 ConvNet，并用于文档识别程序中的字符分类。它可以从原始像素中以分层的方式提取特征表示。
- 存在的主要问题：识别能力并未扩展到除手写识别之外的其他分类任务。
2000年初：CNN 停滞不前
- 其他统计方法，尤其是 SVM 比 CNN 更为流行
- Simard等人在2003年改进了 CNN 架构，并在 MNIST 上得到了与 SVM 相比更好的结果。
- 通过将其在光学字符识别（OCR）中的应用扩展到其他的字符识别，如部署在视频会议中用于面部检测的图像传感器中以及对街头犯罪的管制等
2006-2011年：CNN 的复兴
- Hinton 在 2006 年针对深度架构提出了贪婪的 逐层预训练 方法，从而复兴并恢复了深度学习的重要性。
- 黄等（2006）使用最大池化而不是下采样，通过学习不变特征显示出良好的结果。
- 在 2006 年末，研究人员开始使用图形处理单元（GPU）来加速深度 NN 和 CNN 体系结构的训练。这是改善 CNN 性能和增加其使用的转折点。
2012-2014年：CNN 的崛起
- CNN性能的主要突破体现在 AlexNet。AlexNet 赢得了 2012-ILSVRC 竞赛，这是图像检测和分类中最困难的挑战之一。
  - AlexNet 通过利用深度提高了性能，并在 CNN 中引入了正则化。
- 2013 年，Zeiler 和 Fergus 定义了一种机制，可以可视化每个 CNN 层学习的滤波器。可视化方法用于通过减小过滤器的尺寸来改进特征提取阶段。
- 牛津大学小组提出的 VGG 架构在2014年 ILSVRC 竞赛中获得亚军，与 AlexNet 相比，其感受野要小得多（11×11变为3×3）。深度从 9 层增加到 16 层和 19 层。
  - 提出一个有建设性的观点：三个 3×3 的卷积核堆叠起来的感受野与 7×7 的卷积核感受野相同
  - 但是带来的好处是网络更深了，有了更多的非线性，而且有更少的参数
- 同年，赢得 2014-ILSVRC 竞赛的 GoogleNet 不仅致力于通过更改层设计来降低计算成本，而且根据深度扩展了宽度，以改善 CNN 性能。
  - GoogleNet 引入了分割、变换和合并块的概念，其中合并了多尺度和多层转换信息以获取局部和全局信息。
  - 使用多层转换信息有助于 CNN 处理不同层级的图像细节。
2015 年至今：CNN 的结构创新和应用迅速增长
- CNN 的表示能力取决于其深度，从某种意义上说，它可以通过定义从简单到复杂的各种级别特征来帮助学习复杂的问题。
- 深度架构所面临的主要挑战是梯度消失的问题。
- 2015 年初，Srivastava 等人使用跨通道连接和信息门控机制的概念来解决梯度消失问题并提高网络表示能力。
  - 这个想法在 2015 年末成名，并提出了类似的概念：残差块或跳跃连接。
  - 残差块是跨通道连接的一种变体，它通过规范跨块的信息流来平滑学习。
  - 这个想法在 ResNet 体系结构中用于训练 150 层深度网络。跨通道连接的思想被 DelugeNet，DenseNet 等进一步扩展到了多层连接，以改善表示性。
- 在 2016 年，研究人员还结合深度探索了网络的宽度，以改进特征学习。
- Hu 等人介绍了特征图开发的思想，并指出少量信息和领域无关的特征可能会在更大程度上影响网络的性能。他利用了上述想法，并提出了名为“挤压和激发网络（SE-Network）”的新架构。

CNN 中的结构创新

基于空间利用的卷积网络。通常，小尺寸滤波器会提取细粒度信息，大尺寸过滤器会提取粗粒度信息。这样，通过调整滤波器大小，CNN可以在粗粒度和细粒度细节上均表现良好。
- LeNet。LeNet 由 LeCuN 在 1998 年提出。它以其历史重要性而闻名，因为它是第一个 CNN，显示了手写体识别的最佳性能。
  - 结构是 Conv-Pool-Conv-Pool-FC-FC
  - LeNet 利用了图像的潜在基础，即相邻像素彼此相关并分布在整个图像中。因此，使用可学习的参数进行卷积是一种在很少参数的情况下从多个位置提取相似特征的有效方法。
- AlexNet。AlexNet 被认为是第一个深度 CNN架构，它显示了图像分类和识别任务的开创性成果。
  - 由于显存的关系，AlexNet 在两张显卡上面训练。
  - 使用了 ReLU 来减弱梯度消失的问题。
  - 使用了局部相应归一化（但现在已经不常见了）
  - 使用了 0.5 的 dropout
  - 在初始阶段使用感受野很大的卷积核 （11×11 和 7 × 7）
    *
- ZfNet。2013年，Zeiler 和 Fergus 提出了一种有趣的多层反卷积神经网络（DeconvNet），该网络以ZefNet 闻名。
  - 开发 ZfNet 是为了定量可视化网络性能。网络活动可视化的想法是通过解释神经元的激活来监视CNN的性能。
  - DeconvNet 的工作方式与前向 CNN 相同，但颠倒了卷积和池化操作的顺序。这种反向映射将卷积层的输出投影回视觉上可感知的图像模式，给出了在每一层学习的内部特征表示的神经元级别的解释
  - 结果表明在网络的第一层和第二层中只有少数神经元处于活动状态，而其他神经元则死了（处于非活动状态）
  - 此外，它表明第二层提取的特征表现出混叠伪像（aliasing artifacts）
  - 基于这些发现，Zeiler 和 Fergus调整了 CNN 拓扑并进行了参数优化。Zeiler 和 Fergus 通过减小卷积核尺寸和步幅以在前两个卷积层中保留最大数量的特征，从而最大限度地提高了CNN的学习能力。
- VGG。Simonyan 等人提出了一种简单有效的 CNN 架构设计原则。他们的名为 VGG 的体系结构是模块化的分层模式。在 14 年的比赛中分类排亚军，图像目标定位排冠军。
  - VGG的深度为19层，以模拟深度与网络表示能力的关系。
  - VGG用 3x3 卷积层的堆叠代替了 11x11 和 5x5 滤波器
    - 通过实验证明，同时放置 3x3 滤波器可以达到大尺寸滤波器的效果（感受野同大尺寸滤波器同样有效（5x5和7x7））。
    - 小尺寸滤波器的另一个好处是通过减少参数的数量提供了较低的计算复杂性。
  - VGG 通过在卷积层之间放置 1x1 卷积来调节网络的复杂性，此外，还可以学习所得特征图的线性组合。
  - 为了调整网络，将最大池化层放置在卷积层之后，同时执行填充以保持空间分辨率
  - VGG 的主要限制是计算成本太高，参数量太大。
- GoogleNet。GoogleNet 赢得了 2014-ILSVRC 竞赛的冠军，也被称为 Inception-V1。GoogleNet 体系结构的主要目标是在降低计算成本的同时实现高精度。
  - 在 CNN 中引入了 inception 块的新概念，通过拆分、变换和合并思想整合了多尺度卷积变换。
  - inception 块封装了不同大小的滤波器（1x1、3x3和5x5），以捕获不同尺度（细粒度和粗粒度）的空间信息。
  - 有助于解决与学习同一图像类别中存在的各种类型的变体有关的问题。
  - GoogleNet 的重点还在于提高 CNN 参数的效率。在采用大尺寸内核之前，GoogleNet通过使用 1x1 卷积滤波器添加**瓶颈层（Bottleneck layer）**来减少计算量。
  - 它使用稀疏连接（并非所有输出特征图都连接到所有输入特征图），从而通过省略不相关的特征图（通道）来克服冗余信息和降低成本的问题。
  - 通过在最后一层使用全局平均池化来代替全连接层，从而降低了连接密度。
基于深度的 CNN。深度 CNN 架构基于以下假设：随着深度的增加，网络可以通过许多非线性映射和改进的特征表示来更好地近似目标函数。理论研究表明，与浅层架构相比，深层网络可以更有效地表示某些功能类别。
- Highway Networks。基于直觉，可以通过增加网络深度来提高学习能力。2015年，Srivastava 等人提出了一个名为 Highway Networks 的深层CNN。
  - 通过引入新的跨层连接（在多路径章节中详细讨论），利用深度来学习丰富的特征表示。
  - 也被归类为基于多路径的 CNN 体系结构
  - 具有 50 层的 Highway Networks 的收敛速度要好于薄而深的架构
  - 即使深度为 900 层，Highway Networks 的收敛速度也比普通网络快得多
- ResNet。ResNet由 He 等人提出，被认为是 Deep Nets 的延续。
  - ResNet 通过在 CNN 中引入残差学习的概念彻底改变了 CNN 架构，并设计了一种有效的方法来训练深度Nets。
  - 也属于多路径的 CNN。
  - 使用 152 层的网络，赢得了 2015-ILSVRC 竞赛。
  - ResNet 在图像识别和定位任务上的良好性能表明，深度对于许多视觉识别任务至关重要。
- Inception-V3, V4 and Inception-ResNet。
  - Inception-V3 的想法是在不影响泛化的情况下降低更深网络的计算成本。
    - Szegedy 等用小型非对称滤波器（1x7 和 1x5）替换大型滤波器（ 5x5 和 7x7）
    - 并在大型过滤器之前使用 1x1 卷积作为瓶颈
    - 在 Inception-V3 中，使用了 1x1 卷积运算，该运算将输入数据映射到小于原始输入空间的3或4个独立空间中，然后通过常规 3x3 或 5x5 卷积映射这些较小的3D空间中的所有相关性。
  - 在 Inception-ResNet 中，Szegedy 等人结合了残差学习和 Inception 块的作用。这样做时，滤波器的拼接被残差连接所代替。
    - 带有残差连接的 Inception-V4（Inception-ResNet）具有与普通 Inception-V4 相同的泛化能力，但深度和宽度增加了。但是 Inception-ResNet 的收敛速度比 Inception-V4 更快，这清楚地说明了使用残差连接进行训练会显著加快对 Inception 网络的训练。
基于多路径的CNN。为了训练更深的网络，研究人员提出了多路径或跨层连接的概念。多个路径或快捷方式连接可以通过跳过某些中间层来系统地将一层与另一层连接，以允许专门信息流的跨层。跨层连接将网络分为几个块。这些路径还尝试通过使较低的层可访问梯度来解决梯度消失问题。
- Highway Networks
  - 基于长期短期记忆（LSTM）的递归神经网络（RNN）的启发
  - - 其中 H 是隐含层的输出，T 是转换门，控制输出与输入的比例
- Resnet（参考上一节）
  - 始终传递残差信息，并且永远不会关闭快捷连接。
- DenseNet
  - ResNet 存在的问题：它通过附加信息转换显式地保留信息，因此许多层可能贡献很少或根本没有信息。
  - 为了解决此问题，DenseNet 使用了一种修改后的跨层连接。
  - DenseNet 以前馈的方式将每一层连接到其他每一层，将所有先前层的特征图用作所有后续层的输入。
  - 特点
    - 由于 DenseNet 是将先前的特征拼接起来，因此，网络可以具有显式区分添加到网络的信息和保留的信息的能力。
    - 随之带来的缺点：随着特征图数量的增加，参数量很大。
    - 通过损失函数使每一层直接进入梯度，可以改善整个网络中的信息流。这具有正则化效果，
基于宽度的多连接CNNs
- WideResNet
  - 值得关注的是，深度残差网络相关的主要缺点是特征重用问题，其中某些特征转换或块可能对学习的贡献很小
  - 深层残差网络的学习潜力主要是由于残差单元，而深度具有补充作用。
  - WideResNet 通过使 ResNet 变宽而不是变深来利用残差块的功能
    - 引入附加因子k，该因子控制网络的宽度。
  - 参数数量是 ResNet 的两倍，但可以比深度网络更好地进行训练
  - 更宽的残差网络是基于以下观察结果：与 ResNet 相比，残差网络之前的几乎所有体系结构（包括最成功的 Inception 和 VGG ）都更宽。在 WideResNet 中，通过在卷积层之间而不是在残差块内部添加 dropout 来使学习有效。
- Pyramidal Net
  - 与 ResNet 随深度的增加而导致的空间宽度的急剧减小相反，金字塔形网络逐渐增加了每个残差单位的宽度。
  - 这种策略使金字塔网络能够覆盖所有可能的位置，而不是在每个残差块内保持相同的空间尺寸，直到下采样为止。
  - 由于特征图的深度以自上而下的方式逐渐增加，因此被命名为金字塔网。
  - 其中，D_l 表示第 l 个残差单元的维数，n 是残差单元的总数，而 γ 是阶跃因子，并且 γ/n 调节深度的增加。深度调节因子试图分配特征图增加的负担。
  - 金字塔形网络使用两种不同的方法来扩展网络，包括基于加法和乘法的扩宽。两种类型的拓宽之间的区别在于，加法的的金字塔结构线性增加，乘法的金字塔结构在几何上增加。
  - 金字塔形网的主要问题在于，随着宽度的增加，空间和时间都发生二次方的增加。
- Xception
  - Xception 可以被认为是一种极端的 Inception 架构，它利用了AlexNet 引入的深度可分离卷积的思想。
  - Xception修改了原始的 inception 块，使其更宽，并用一个单一的维度（3x3）紧跟 1x1 替换了不同的空间维度（1x1、5x5、3x3），以调节计算复杂度。
  - Xception 通过解耦空间和特征图（通道）相关性来提高网络的计算效率。
  - 它先使用 1x1 卷积将卷积输出映射到低维嵌入，然后将其空间变换 k 次，其中 k 为cardinality 的宽度，它确定变换的次数。
  - 在传统的 CNN 架构中，传统的卷积运算仅使用一个变换的分段，Inception 使用三个变换的分段，而在 Xception 中，变换分段的数量等于特征图的数量。尽管 Xception 采用的转换策略不会减少参数的数量，但是它使学习更加有效并提高了性能。
- ResNext，Aggregated Residual Transform Network，聚合残差变换网络，是对 Inception 网络的改进。
  - Inception 网络存在的缺陷：由于在转换分支中使用了多种空间嵌入（例如使用3x3、5x5和1x1滤波器），因此需要分别自定义每一层。
  - 主要思想：通过多个并行的通路增加网络的宽度。
  - ResNext 通过将 split，transform 和 merge 块中的空间分辨率固定为 3x3 滤波器，利用了 VGG 的深度同质拓扑和简化的 GoogleNet 架构。它还使用残差学习。ResNext 的构建块如下图所示。ResNext 在 split，transform 和 merge 块中使用了多个转换，并根据 cardinality 定义了这些转换。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
Pyorch中 nn.Conv1d 与 nn.Linear 的区别迪三 #NN_Layer 神经网络
即一维卷积层和全联接层的区别nn.Conv1d和nn.Linear都是PyTorch中的层，它们用于不同的目的，主要区别在于它们处理输入数据的方式和执行的操作类型。nn.Conv1d通过应用滑动过滤器来捕捉序列数据中的局部模式，适用于处理具有时间或序列结构的数据。nn.Linear通过将每个输入与每个输出相连接，捕捉全局关系，适用于将输入数据作为整体处理的任务。1.维度与输入nn.Conv1d（一
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
深度学习-13-小语言模型之SmolLM的使用皮皮冰燃深度学习深度学习
文章附录1SmolLM概述1.1SmolLM简介1.2下载模型2运行2.1在CPU/GPU/多GPU上运行模型2.2使用torch.bfloat162.3通过位和字节的量化版本3应用示例4问题及解决4.1attention_mask和pad_token_id报错4.2max_new_tokens=205参考附录1SmolLM概述1.1SmolLM简介SmolLM是一系列尖端小型语言模型，提供三种规
基于深度学习的农作物病害检测 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的农作物病害检测利用卷积神经网络（CNN）、生成对抗网络（GAN）、Transformer等深度学习技术，自动识别和分类农作物的病害，帮助农业工作者提高作物管理效率、减少损失。1.农作物病害检测的挑战病害种类繁多：农作物病害的类型多样，不同病害在同一作物上的表现差异很大，同时同一种病害在不同生长阶段的症状也可能不同。环境影响：天气、光照、湿度等外部环境因素会影响农作物的表现，使得病害检
基于深度学习的文本引导的图像编辑 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的文本引导的图像编辑（Text-GuidedImageEditing）是一种通过自然语言文本指令对图像进行编辑或修改的技术。它结合了图像生成和自然语言处理（NLP）的最新进展，使用户能够通过描述性文本对图像内容进行精确的调整和操控。1.文本引导的图像编辑的挑战文本和图像之间的对齐：如何将文本中的语义信息准确地映射到图像中的特定区域或元素是一个关键挑战。这涉及到多模态数据的对齐和理解。编
深度学习--对抗生成网络（GAN, Generative Adversarial Network） Ambition_LAO 深度学习生成对抗网络
对抗生成网络（GAN,GenerativeAdversarialNetwork）是一种深度学习模型，由IanGoodfellow等人在2014年提出。GAN主要用于生成数据，通过两个神经网络相互对抗，来生成以假乱真的新数据。以下是对GAN的详细阐述，包括其概念、作用、核心要点、实现过程、代码实现和适用场景。1.概念GAN由两个神经网络组成：生成器（Generator）和判别器（Discrimina
深度学习：怎么看pth文件的参数奥利给少年深度学习人工智能
.pth文件是PyTorch模型的权重文件，它通常包含了训练好的模型的参数。要查看或使用这个文件，你可以按照以下步骤操作：1.确保你有模型的定义你需要有创建这个.pth文件时所用的模型的代码。这意味着你需要有模型的类定义和架构。2.加载模型权重使用PyTorch的load_state_dict方法来加载权重。这里是如何操作的：importtorchimporttorch.nnasnn#定义模型结构
chatgpt赋能python：如何在Python中安装Keras库？ turensu ChatGpt python chatgpt keras 计算机
如何在Python中安装Keras库？Keras是一个简单易用的神经网络库，由FrançoisChollet编写。它在Python编程语言中实现了深度学习的功能，可以使您更轻松地构建和试验不同类型的神经网络。如果您是一名Python开发人员，肯定会想知道如何在您的Python项目中安装Keras库。在本文中，我们将向您展示如何安装和配置Keras库。步骤1：安装Python要使用Keras库，您需
如何理解深度学习的训练过程奋斗的草莓熊深度学习人工智能 python scikit-learn virtualenv numpy pandas
文章目录1.训练是干什么？2.预训练模型进行训练，主要更改的是预训练模型的什么东西？1.训练是干什么？以yolov5为例子，训练的目的是把一组输入猫狗图像放到神经网络中，得到一个输出模型，这个模型下次可以直接用来识别哪个是猫，哪个是狗2.预训练模型进行训练，主要更改的是预训练模型的什么东西？超参数（Hyperparameters）：这是模型结构中定义的参数，比如：卷积核大小（kernel_size
Keras深度学习框架入门及实战指南司莹嫣Maude
Keras深度学习框架入门及实战指南keraskeras-team/keras:是一个基于Python的深度学习库，它没有使用数据库。适合用于深度学习任务的开发和实现，特别是对于需要使用Python深度学习库的场景。特点是深度学习库、Python、无数据库。项目地址:https://gitcode.com/gh_mirrors/ke/keras一、项目介绍Keras简介Keras是一款高级神经网络
深度学习驱动的车牌识别：技术演进与未来挑战逼子歌深度学习车牌识别神经网络字符识别 YOLO 卷积神经网络
一、引言1.1研究背景在当今社会，智能交通系统的发展日益重要，而车牌识别作为其关键组成部分，发挥着至关重要的作用。车牌识别技术广泛应用于交通管理、停车场管理、安防监控等领域。在交通管理中，它可以用于车辆识别、交通违法监控和车流统计等，提高交通管理的效率和准确性。在停车场管理中，实现车辆的自动识别和收费，提升管理和服务水平。在安防监控领域，可用于追踪嫌疑人及犯罪行为。深度学习的出现为车牌识别带来了重
每天五分钟玩转深度学习PyTorch：模型参数优化器torch.optim 幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 人工智能神经网络机器学习优化算法
本文重点在机器学习或者深度学习中，我们需要通过修改参数使得损失函数最小化(或最大化)，优化算法就是一种调整模型参数更新的策略。在pytorch中定义了优化器optim，我们可以使用它调用封装好的优化算法，然后传递给它神经网络模型参数，就可以对模型进行优化。本文是学习第6步(优化器)，参考链接pytorch的学习路线随机梯度下降算法在深度学习和机器学习中，梯度下降算法是最常用的参数更新方法，它的公式
什么是AIGC？有哪些免费工具？ chent_某位 AIGC
AIGC（AIGeneratedContent），即“人工智能生成内容”，是指通过人工智能技术自动生成各种类型的数字内容。AIGC让机器能够根据输入的信息或数据生成符合人类需求的文本、图像、音频、视频等内容，极大提高了内容创作的效率。AIGC的背景与起源随着深度学习和自然语言处理技术的快速发展，人工智能已经不再局限于简单的任务，如分类、预测和数据分析，而是具备了生成内容的能力。生成式AI模型，如O
xml解析小猪猪08 xml
1、DOM解析的步奏准备工作： 1.创建DocumentBuilderFactory的对象 2.创建DocumentBuilder对象 3.通过DocumentBuilder对象的parse(String fileName)方法解析xml文件 4.通过Document的getElem
每个开发人员都需要了解的一个SQL技巧 brotherlamp linux linux视频 linux教程 linux自学 linux资料
对于数据过滤而言CHECK约束已经算是相当不错了。然而它仍存在一些缺陷，比如说它们是应用到表上面的，但有的时候你可能希望指定一条约束，而它只在特定条件下才生效。使用SQL标准的WITH CHECK OPTION子句就能完成这点，至少Oracle和SQL Server都实现了这个功能。下面是实现方式： CREATE TABLE books ( id &
Quartz——CronTrigger触发器 eksliang quartz CronTrigger
转载请出自出处：http://eksliang.iteye.com/blog/2208295 一.概述 CronTrigger 能够提供比 SimpleTrigger 更有具体实际意义的调度方案，调度规则基于 Cron 表达式，CronTrigger 支持日历相关的重复时间间隔（比如每月第一个周一执行），而不是简单的周期时间间隔。二.Cron表达式介绍 1）Cron表达式规则表 Quartz
Informatica基础 18289753290 Informatica Monitor manager workflow Designer
1. 1）PowerCenter Designer：设计开发环境，定义源及目标数据结构；设计转换规则，生成ETL映射。 2）Workflow Manager：合理地实现复杂的ETL工作流，基于时间，事件的作业调度 3）Workflow Monitor：监控Workflow和Session运行情况，生成日志和报告 4）Repository Manager：
linux下为程序创建启动和关闭的的sh文件，scrapyd为例酷的飞上天空 scrapy
对于一些未提供service管理的程序每次启动和关闭都要加上全部路径，想到可以做一个简单的启动和关闭控制的文件下面以scrapy启动server为例，文件名为run.sh： #端口号，根据此端口号确定PID PORT=6800 #启动命令所在目录 HOME='/home/jmscra/scrapy/' #查询出监听了PORT端口
人--自私与无私永夜-极光
今天上毛概课,老师提出一个问题--人是自私的还是无私的,根源是什么? 从客观的角度来看,人有自私的行为,也有无私的
Ubuntu安装NS-3 环境脚本随便小屋 ubuntu
将附件下载下来之后解压，将解压后的文件ns3environment.sh复制到下载目录下（其实放在哪里都可以，就是为了和我下面的命令相统一）。输入命令： sudo ./ns3environment.sh >>result 这样系统就自动安装ns3的环境，运行的结果在result文件中，如果提示 com
创业的简单感受 aijuans 创业的简单感受
2009年11月9日我进入a公司实习，2012年4月26日，我离开a公司，开始自己的创业之旅。今天是2012年5月30日，我忽然很想谈谈自己创业一个月的感受。当初离开边锋时，我就对自己说：“自己选择的路，就是跪着也要把他走完”，我也做好了心理准备，准备迎接一次次的困难。我这次走出来，不管成败
如何经营自己的独立人脉 aoyouzi 如何经营自己的独立人脉
独立人脉不是父母、亲戚的人脉，而是自己主动投入构造的人脉圈。“放长线，钓大鱼”，先行投入才能产生后续产出。现在几乎做所有的事情都需要人脉。以银行柜员为例，需要拉储户，而其本质就是社会人脉，就是社交！很多人都说，人脉我不行，因为我爸不行、我妈不行、我姨不行、我舅不行……我谁谁谁都不行，怎么能建立人脉？我这里说的人脉，是你的独立人脉。以一个普通的银行柜员
JSP基础百合不是茶 jsp 注释隐式对象
1,JSP语句的声明 <%! 声明 %> 　　声明：这个就是提供java代码声明变量、方法等的场所。表达式 <%= 表达式 %> 　　这个相当于赋值，可以在页面上显示表达式的结果，程序代码段/小型指令　<% 程序代码片段 %> 2,JSP的注释
web.xml之session-config、mime-mapping bijian1013 java web.xml servlet session-config mime-mapping
session-config 1.定义： <session-config> <session-timeout>20</session-timeout> </session-config> 2.作用：用于定义整个WEB站点session的有效期限，单位是分钟。 mime-mapping 1.定义： <mime-m
互联网开放平台（1） Bill_chen 互联网 qq 新浪微博百度腾讯
现在各互联网公司都推出了自己的开放平台供用户创造自己的应用，互联网的开放技术欣欣向荣，自己总结如下： 1.淘宝开放平台(TOP) 网址：http://open.taobao.com/ 依赖淘宝强大的电子商务数据，将淘宝内部业务数据作为API开放出去，同时将外部ISV的应用引入进来。目前TOP的三条主线： TOP访问网站：open.taobao.com ISV后台：my.open.ta
【MongoDB学习笔记九】MongoDB索引 bit1129 mongodb
索引可以在任意列上建立索引索引的构造和使用与传统关系型数据库几乎一样,适用于Oracle的索引优化技巧也适用于Mongodb 使用索引可以加快查询,但同时会降低修改,插入等的性能内嵌文档照样可以建立使用索引测试数据 var p1 = { "name":"Jack", "age&q
JDBC常用API之外的总结白糖_ jdbc
做JAVA的人玩JDBC肯定已经很熟练了，像DriverManager、Connection、ResultSet、Statement这些基本类大家肯定很常用啦，我不赘述那些诸如注册JDBC驱动、创建连接、获取数据集的API了，在这我介绍一些写框架时常用的API，大家共同学习吧。 ResultSetMetaData获取ResultSet对象的元数据信息
apache VelocityEngine使用记录 bozch VelocityEngine
VelocityEngine是一个模板引擎，能够基于模板生成指定的文件代码。使用方法如下： VelocityEngine engine = new VelocityEngine();// 定义模板引擎 Properties properties = new Properties();// 模板引擎属
编程之美-快速找出故障机器 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; public class TheLostID { /*编程之美假设一个机器仅存储一个标号为ID的记录，假设机器总量在10亿以下且ID是小于10亿的整数，假设每份数据保存两个备份，这样就有两个机器存储了同样的数据。 1.假设在某个时间得到一个数据文件ID的列表，是
关于Java中redirect与forward的区别 chenbowen00 java servlet
在Servlet中两种实现： forward方式：request.getRequestDispatcher(“/somePage.jsp”).forward(request, response); redirect方式：response.sendRedirect(“/somePage.jsp”); forward是服务器内部重定向，程序收到请求后重新定向到另一个程序，客户机并不知
[信号与系统]人体最关键的两个信号节点 comsci 系统
如果把人体看做是一个带生物磁场的导体,那么这个导体有两个很重要的节点,第一个在头部,中医的名称叫做百汇穴, 另外一个节点在腰部,中医的名称叫做命门如果要保护自己的脑部磁场不受到外界有害信号的攻击,最简单的
oracle 存储过程执行权限 daizj oracle 存储过程权限执行者调用者
在数据库系统中存储过程是必不可少的利器，存储过程是预先编译好的为实现一个复杂功能的一段Sql语句集合。它的优点我就不多说了，说一下我碰到的问题吧。我在项目开发的过程中需要用存储过程来实现一个功能，其中涉及到判断一张表是否已经建立，没有建立就由存储过程来建立这张表。 CREATE OR REPLACE PROCEDURE TestProc IS fla
为mysql数据库建立索引 dengkane mysql 性能索引
前些时候，一位颇高级的程序员居然问我什么叫做索引，令我感到十分的惊奇，我想这绝不会是沧海一粟，因为有成千上万的开发者（可能大部分是使用MySQL的）都没有受过有关数据库的正规培训，尽管他们都为客户做过一些开发，但却对如何为数据库建立适当的索引所知较少，因此我起了写一篇相关文章的念头。最普通的情况，是为出现在where子句的字段建一个索引。为方便讲述，我们先建立一个如下的表。
学习C语言常见误区如何看懂一个程序如何掌握一个程序以及几个小题目示例 dcj3sjt126com c 算法
如果看懂一个程序，分三步 1、流程 2、每个语句的功能 3、试数如何学习一些小算法的程序尝试自己去编程解决它，大部分人都自己无法解决如果解决不了就看答案关键是把答案看懂，这个是要花很大的精力，也是我们学习的重点看懂之后尝试自己去修改程序，并且知道修改之后程序的不同输出结果的含义照着答案去敲调试错误
centos6.3安装php5.4报错 dcj3sjt126com centos6
报错内容如下: Resolving Dependencies --> Running transaction check ---> Package php54w.x86_64 0:5.4.38-1.w6 will be installed --> Processing Dependency: php54w-common(x86-64) = 5.4.38-1.w6 for
JSONP请求 flyer0126 jsonp
使用jsonp不能发起POST请求。 It is not possible to make a JSONP POST request. JSONP works by creating a <script> tag that executes Javascript from a different domain; it is not pos
Spring Security（03）——核心类简介 234390216 Authentication
核心类简介目录 1.1 Authentication 1.2 SecurityContextHolder 1.3 AuthenticationManager和AuthenticationProvider 1.3.1 &nb
在CentOS上部署JAVA服务 java--hhf java jdk centos Java服务
本文将介绍如何在CentOS上运行Java Web服务，其中将包括如何搭建JAVA运行环境、如何开启端口号、如何使得服务在命令执行窗口关闭后依旧运行第一步：卸载旧Linux自带的JDK ①查看本机JDK版本 java -version 结果如下 java version "1.6.0"
oracle、sqlserver、mysql常用函数对比[to_char、to_number、to_date] ldzyz007 oracle mysql SQL Server
oracle &n
记Protocol Oriented Programming in Swift of WWDC 2015 ningandjin protocol WWDC 2015 Swift2.0
其实最先朋友让我就这个题目写篇文章的时候，我是拒绝的，因为觉得苹果就是在炒冷饭，把已经流行了数十年的OOP中的“面向接口编程”还拿来讲，看完整个Session之后呢，虽然还是觉得在炒冷饭，但是毕竟还是加了蛋的，有些东西还是值得说说的。通常谈到面向接口编程，其主要作用是把系统设计和具体实现分离开，让系统的每个部分都可以在不影响别的部分的情况下，改变自身的具体实现。接口的设计就反映了系统
搭建 CentOS 6 服务器(15) - Keepalived、HAProxy、LVS rensanning keepalived
（一）Keepalived （1）安装 # cd /usr/local/src # wget http://www.keepalived.org/software/keepalived-1.2.15.tar.gz # tar zxvf keepalived-1.2.15.tar.gz # cd keepalived-1.2.15 # ./configure # make &a
ORACLE数据库SCN和时间的互相转换 tomcat_oracle oracle sql
SCN（System Change Number 简称 SCN）是当Oracle数据库更新后，由DBMS自动维护去累积递增的一个数字，可以理解成ORACLE数据库的时间戳，从ORACLE 10G开始，提供了函数可以实现SCN和时间进行相互转换；　　用途：在进行数据库的还原和利用数据库的闪回功能时，进行SCN和时间的转换就变的非常必要了；　　操作方法：　　1、通过dbms_f
Spring MVC 方法注解拦截器 xp9802 spring mvc
应用场景，在方法级别对本次调用进行鉴权，如api接口中有个用户唯一标示accessToken,对于有accessToken的每次请求可以在方法加一个拦截器，获得本次请求的用户，存放到request或者session域。 python中，之前在python flask中可以使用装饰器来对方法进行预处理，进行权限处理先看一个实例,使用@access_required拦截： ?

各种经典卷积网络架构介绍

各种经典卷积网络架构介绍

摘要

介绍

基础的 CNN 模块

深度 CNN 的结构进化史

CNN 中的结构创新

你可能感兴趣的:(深度学习,卷积,计算机视觉)