qq_24375467

炼丹-深度学习-《Aggregated Residual Transformations for Deep Neural Networks》

Aggregated Residual Transformations for Deep Neural Networks

原文地址：Aggregated Residual Transformations for Deep Neural Networks

文章目录

Aggregated Residual Transformations for Deep Neural Networks
- 生词：
- Abstract
- Introduction
- Related Work
- - Multi-branch convolutional networks
  - Group convolutions
  - Compressing convolutional networks
  - Ensembling
- Method
- - Template
  - Revisiting Simple Neurons
  - Aggregated Transformations
  - - 相比较于Inception-ResNet
    - 相比较于Grouped Convolutions
  - Model Capacity
- Implementation details
- Experiments
- - Experiments on ImageNet-1K
  - - Notations
    - Cardinality vs. Width
    - Increasing Cardinality vs. Deeper/Wider
    - Residual connections
    - Performance
    - Comparisons with state-of-the-art results
  - Experiments on ImageNet-5K

生词：

单词	释义
topology	拓扑
aggregate	聚合
cardinality	基数
minimal	最小的;极简主义
compelling	引人入胜的，难以抗拒的
concrete	具体的，有形的，钢筋混
decomposition	分解；腐烂
harnesses	挽具，马具，保护带
recast	重新安排，重新浇铸
succinct	简洁的
proportional	成比例的

Abstract

Resnext的网络结构聚合了一系列的block，这些block都是基于同样的拓扑结构的。按照这个思路，模型的机构是一个同质、多分枝的网络结构，并且只有很少的参数需要去设置。branch个数的作为一个新的维度，我们成为cardinality，中文基数。

实验表明，即使是在限制了复杂度的情况下，增加cardinality也可以增加分类的准确率。更确切的说，增加cardinality比加深或者加宽模型深度更加有效。

Introduction

计算机视觉的任务已经从"feature engineering"转向"network engineering"。初期的时候网络结构不会太深，所以特征的学习需要极少的人工干预，现在随着网络层数的增多，各类超参的数量爆炸式的增长，所以网络结构的设计变得越来越难。

我们都知道vgg通过堆叠简单的、具有相同尺寸的building-block来构建更深的网络，ResNet也继承了vgg的工作，采用相同的堆叠方式来构建模型，这一简单的规则带来一个问题：超参数选择的自由度减少了，并且深度变成了神经网络中的一个essential dimension。但是，作者认为这种简单的规则是可以降低超参数过度自适应数据集的风险的。

不同于vgg网络，Inception系列的模型已经证明了，经过精心设计的拓扑结构可以在很低复杂度的情况下依旧达到很好的效果。虽然Inception模型已经升级换代了好几次，但是最基本的策略依旧是：split-transform-merge。这个策略首先将input通过1x1的卷积映射到不同的低维embedding，最后通过一些3x3或者5x5的卷积核来改变形状，然后通过concatenation来merge。可以被证明这种结构的解空间是单独层（例如5x5的卷积核）在高维空间操作的解空间的子空间。这种做法当然是有弊端的，由于有过多复杂的参数，例如filter的个数，size等，对于每一种transformation都需要定做，虽然仔细的组合对于特定数据集能产生很好的效果，但是对于新的数据集却需要重新调整超参数。

在本文中，作者两种结构都用，既用了VGG/ResNets’中的简单堆叠，又探索了split-transform-merge策略的更加简单的使用方式。和Inception不通，每一个module里面的transformations不需要逐个精细的设计，而是统一采用一样的拓扑结构，这样的话就可以直接拓展到任何数量的transformations而不需要额外的特殊设计。具体见下图，右边就是文章中的一个module结构

下面是作者提出的三种resnext block的等价形式：

3(a)是最初始的形式，3(b)是resnet-inception的类似形式，对所有的transications进行concatenate后再进行卷积，和Inception不同的是所有的path都是一样的shape。3©是简要格式，中间层采用了组卷积。

作者通过实验证明，cardinality这个参数在提升准确率的性价比上高于增加模型的宽度和深度。

在成果上，resnext比resnet-101/152，ResNet-200，Inception-v3和Inception-ResNet-v2的表现都更加优异。实验中，一个101-layer的ResNeXt就比200层的ResNet效果好，并且复杂度只有其50%。作者用ResNeXt在ILSVRC 2016的图像分类任务上拿到了第二名。并在ImageNet-5K数据集上和COCO物体检测任务上拿到了比ResNet更好的成绩。

Related Work

Multi-branch convolutional networks

Inception系列的模型有很多成功的多分枝网络。ResNet也可以堪称一个简单的二分支网络，其中一个分支是identity mapping。Deep neural decision forests是一个树形的多分枝网络。

Group convolutions

最早的组卷积应该是AlexNet中提出的，但是这篇文章提出组卷积的目的在于把模型分布运行在两个GPU上。就目前而言，有很少的迹象表明组卷积有提升模型准确率的优点。一个比较特殊的例子就是channel-wise convolutions。

Compressing convolutional networks

Decomposition：在空间或者通道上对网络进行分解，是一个减少网络复杂度的有效手段。

Ensembling

将一系列独立的模型进行平均是用来提升准确率的有效手段，这种方式被广泛的应用于竞赛。我们的模型中虽然聚合了一堆transformations，但是不能称为ensemble，因为各个模块不是独立训练而是联合训练的。

Method

Template

网络是通过堆叠一系列的residual-block组成的。这些blocks有相同的拓扑结构，并且满足下面两个简单的原则：

(i) 如果产生相同size的map，那么这些blocks的超参数相同，例如宽高度，卷积核个数。
(ii) 每次spatial map以2为倍数下采样，blocks的宽度就增加一倍。这条规则是为了确保计算复杂度相同。这里的block的宽度指的是block-neck中，把原始输入做降维时卷积核的个数。

根据这两个原则，我们只需要设计一个template module，那么整个网络就可以被确定下来。这两个原则极大的缩小了网络的搜索空间，让设计网络的人只需要关注极少的几个变量，下面事物网络结构和resnet的对比图，两者的FLOPS基本相当。

Revisiting Simple Neurons

我们以最简单的线性神经元为例，这种split-transform-merge方法我们可以拆分成split,transforming和aggregating。

split:就是把x拆分成一个个独立的xi
transforming:把拆分后的低纬表示进行转换。在这里就是wixi。
aggregating：把所有的transformations都aggregate，这里就是加和操作。

Aggregated Transformations

根据上述对于线性网络的分析，我们再来看wixi，假如我们把它看成一个更加抽象的方程，那么是不是就可以看成为Network-in-Neuron，这个说法是相当于Network-in-Network而言的，Network-in-Network主要指depth这个维度，而Network-in-Neuron主要是指cardinality这个维度。

把transformations看成一般式的话，那这个aggregated transformations就可以表达成如下的公式：

$F(x)=\sum_{i=1}^{C}T_{i}(x)$
其中 $T_i(x)$ 可以看成是任意的方程，其目的是把x映射到一个相对低维的空间并做转换，也就是split和transformations。

其中C代表transformations的个数，也就是上文中的cardinality。等价于在linear function中的D。

在本文中，从cardinality角度出发，所有的 $T_i$ 都设计为相同的拓扑结构，从depth角度出发，和VGG一样，网络通过简单堆叠在增加网络的深度。这个策略的好处就是既减少了超参的个数，也拓展到可以设计任意数量的transformations。在本文中，所有的 $T_i$ 采用了bottle-neck的结构。

在上述公式的基础上，如果加入残差操作，那么式子就会变成如下的形式：

$y=x+\sum_{i=1}^{C}T_i(x)$

除了最初的式子，还有两种等价的形式见下图：

相比较于Inception-ResNet

(a)中的操作可以等价于(b)，b中采用了early concatenation策略，这和Inception-ResNet的策略是一致的，和Inception-ResNet不同的是，所有的transformation都是相同的拓扑结构。

其实假如没有激活函数的话，(a)和(b)是等价的，但是引入激活函数之后会不一样点。文中的证明是考虑了卷积核不带非线性激活的，带非线性激活会有些不太一样，可以自己证明一下：

相比较于Grouped Convolutions

采用了grouped convolutions后，整个block会更加简洁，如©所示。在原来的形式(a)下，256通道的输入分别被32组4个的卷积核映射到了32组4通道的low-dimensional embeddings，在©中，直接替换成了一个单独的1x1x128的卷积核。其实两者是等价的，可以这样考虑：对于每一个输出通道上的单个值，计作 $y_{d,i,j}=$ ，表示在输出在d通道上，i行j列的值，在(b)的形式下:
$y_{d,i,j}=\sigma(\sum_{c=1}^{256}x_{c,i,j}*w_{m})$
可以看出输出通道的每个值的计算是与其他的输出完全无关的，所以把(b)中的32组卷积核堆叠起来，就等价于一个单一的1x1x128的卷积核，计算方式完全没有差别。

第二部组卷积相当于输入channel为4，输出channel也为4，所以和(a),(b)中的第二步也无异，主要看第三步，组卷积的结果类似于(b)中的堆叠，所以(b)和©是等价的，上一节讨论时说到(a)和(b)只有在线性组合的情况下是等价的，所以(b)和©是等价的，(a)和©在线性情况下等价。

Model Capacity

这篇文章的实验证明了，在相同的模型复杂度和参数数量下，resNeXt的准确率提升最大。这不仅在生产实践中有用，同时，模型复杂度和参数数量代表着模型的容量，所以被认为时深度网络的基本属性。

为了在保证模型复杂度的情况下，评估不同的cardinality，也就是基数这个超参数对模型性能的影响，我们需要修改其他超参数以保证模型的复杂度。为了简化以及最小化模型修改的工作量，文章选择了bottle-neck结构中，bottle的宽度来作为保持模型复杂度不变的控制参数，bottle的宽度在上面的图的例子的就是4，也就是input在映射到低维空间时的channel数量。这种修改策略对网络的修改非常小，可以让实验专注于cardinality对网络性能的影响。

根据上面这张图我们分别来计算一下resNet的block和resNeXt的block的复杂度：

(1) resNet:

$256 * 64 + 64 * 3 * 3 * 64 + 64 * 256 = 70 k$
(2) resNeXr

$C*(256*d+d*3*3*d+d*256) = 512*C*d + 9*C*d^2$

Implementation details

Experiments

Experiments on ImageNet-1K

作者在1000-class的ImageNet数据集上做了消融学习实验，主要基于两个网络结构：50-layer和101-layer的残差网络，resNeXt的实验是简单的把里面的block换成文章提出的block。

上面的表格结构展示了ResNet-50和ResNeXt-50的区别。

Notations

回顾一下上文提到的两个原则：

(i) 如果产生相同size的map，那么这些blocks的超参数相同，例如宽高度，卷积核个数。
(ii) 每次spatial map以2为倍数下采样，blocks的宽度就增加一倍。这条规则是为了确保计算复杂度相同。这里的block的宽度指的是block-neck中，把原始输入做降维时卷积核的个数。

在conv2中，由于cardinality=32，block-neck的wdith=4，所以这个网络称为ResNeXt-50(32x4d)，实际上，随着网络的深度加深，在下采样的过程中，由于feature map的宽度和高度在成倍的减少，为了保证复杂度和原来的resNet一致，在cardinality不变的情况下，每次feature map的宽度、高度减半，block-neck的宽度就加倍（也就是在做第一步的1x1卷积时，卷积核的个数翻倍，例如在conv2是1x1x4的卷积核，在conv3中就是1x1x8的卷积核）。

Cardinality vs. Width

作者在保持模型复杂度的情况下，比较了不同cardinality和bottleneck宽度的实验结果，其中cardinality和bottleneck宽度的设置如下：

之所以是这样的设置没可以根据前面的复杂度计算公式而来：

(1) resNet:

$256 * 64 + 64 * 3 * 3 * 64 + 64 * 256 = 70 k$
(2) resNeXr

$C*(256*d+d*3*3*d+d*256) = 512*C*d + 9*C*d^2$

下面的表格和曲线分别代表了实验的结果和训练中epochs vs error曲线。从表中可以看出，随着cardinality增加，在复杂度不变的情况下，模型的错误率一直下降到了22.2%。从左边一张曲线可以看出，模型不仅仅在最终的测试结果上有良好的性能，在训练集和验证集上也表现的比baseline的resNet好，说明resNeXt比resNet有更好的特征抽取能力，这个收益不是来自正则化的。

从右边的曲线可以看出，在101-layer的实验上，虽然验证集的收益是低于50-layer的实验的，101-layer的实验加上32c，4d后只减少了0.8%的错误率而50-layer的实验加上后减少了1.7%的错误率，但是在训练集的增益上确实相当的。

Increasing Cardinality vs. Deeper/Wider

在这一部分，作者主要是想比较哪种增加模型复杂度的方式，对模型性能的提升最有帮助。简单来说就是，通过一些操作，使得101-layer baseline的resNet的FLOPs变成原来的两边，这些操作包括

(i) 增加模型深度，变成resNet-200
(ii) 增加bottleneck的宽度
(iii) 翻倍cardinality

下面的表格展示了上面实验的结果：

从上面表格中，很明显可以看出来这几点：

增加深度的收益和增加bottleneck宽度的收益只有0.3%和0.7%。而翻倍1x64d的cardinality和翻倍32x4d的cardinality的收益却分别有1.3%和1.6%。
同时，resNeXt-101 32x4d网络在只有ResNet-200和ResNet-101,wider两个网络一半复杂度的情况下，依然能比他们的性能好，这部分实验充分说明了cardinality这个参数的优越性。

Residual connections

上面表格展示的是用到残差结构和不用到残差结构的实验结果对比，很明显用残差会好非常多。

Performance

虽然在理论计算上，计算的复杂度resNet和ResNeXt是相等的，但是实际用torch实现时，一个batch的ResNet-50是0.95s，一个batch的ResNeXt时0.7s。这个误差可能是由于过于高级和暴力的torch实现接口导致的，可能底层的编程会更加有效率。

Comparisons with state-of-the-art results

在测试集single-crop下的结果如下表：

在单个模型下，如果用到了multi-scale和multi-crop的testing设置，可以达到3.03%的top5error。是2016ILSVRC比赛的第二名。

Experiments on ImageNet-5K

从1K的实验来看，结果已经趋于饱和了，作者认为这并不是因为网络的容量达到了饱和，而是因为模型的复杂度达到了饱和，所以作者在ImageNet-5K上再做了一个实验来评估。

作者的实验设置是这样的：模型是在5K的数据集上训练的，训练了一个5K分类的模型，然后评估只在1K的验证集上进行，评估的方式分为两种：

直接作为一个5k分类问题，分到非验证集1k类的类别就视为错误。
在softmax只在其中1k类上进行。

下面的曲线和表格是实验的结果

发现模型在训练5k任务的时候，虽然在1k的评估上有所下降，但下降不多，说明模型的表示能力很强。

Pytorch 三小时极限入门教程 power-辰南人工智能深度学习 pytorch 人工智能
一、引言在当今的人工智能领域，深度学习占据了举足轻重的地位。而Pytorch作为一款广受欢迎的深度学习框架，以其简洁、灵活的特性，吸引了大量开发者投身其中。无论是科研人员探索前沿的神经网络架构，还是工程师将深度学习技术落地到实际项目，Pytorch都提供了强大的支持。本教程将带你从零基础开始，一步步深入了解Pytorch的核心知识，助你顺利踏上深度学习的征程。二、Pytorch基础环境搭建安装An
PCL 点云高程渲染：实现点云高程信息的颜色渲染技术征服冒险 PCL
PCL点云高程渲染：实现点云高程信息的颜色渲染点云渲染在计算机视觉和图形学中具有重要的应用价值。在处理点云数据时，一种常见的需求是通过将高程信息映射到颜色空间，以实现对点云的可视化。本文将介绍如何使用PCL（PointCloudLibrary）库实现点云的高程渲染，并提供相应的源代码。引言在开始之前，我们首先需要了解点云的基本概念。点云是由大量的三维点组成的数据集合，每个点都具有X、Y和Z坐标。点
Python机器学习之XGBoost从入门到实战(基本理论说明) 雪域枫蓝 Python Atificial Intelligence 机器学习 python 分布式
Xgboost从基础到实战XGBoost:eXtremeGradientBoosting*应用机器学习领域的一个强有力的工具*GradientBootingMachines(GBM)的优化表现，快速有效—深盟分布式机器学习开源平台(DistributedmachinelearningCommunity，DMLC)的分支—DMLC也开源流行的深度学习库mxnet*GBM：Machine：机器学习模型
【YOLOv8杂草作物目标检测】 stsdddd YOLO目标检测目标检测 YOLO 目标检测人工智能
YOLOv8杂草目标检测算法介绍模型和数据集下载算法介绍YOLOv8在禾本科杂草目标检测方面有显著的应用和效果。以下是一些关键信息的总结：农作物幼苗与杂草检测系统：基于YOLOv8深度学习框架，通过2822张图片训练了一个目标检测模型，用于检测田间的农作物幼苗与杂草对象。该系统支持图片、视频以及摄像头进行目标检测，并能保存检测结果。系统界面可实时显示目标位置、目标总数、置信度、用时等信息。YOLO
深度学习(1) 浅忆へ梦微凉深度学习人工智能深度学习学习方法 python
一、torch的安装基于直接设备情况，选择合适的torch版本，有显卡的建议安装GPU版本，可以通过nvidia-smi命令来查看显卡驱动的版本，在官网中根据cuda版本，选择合适的版本号，下面是安装示例代码GPU：pipinstalltorch==2.5.0torchvision==0.20.0torchaudio==2.5.0--index-urlhttps://download.pytorc
深度学习常用格式转化脚本xml2yolo/coco2yolo/bdd2yolo/frame2video等 qq1309399183 计算机视觉实战项目集合深度学习人工智能格式转化脚本 voc2yolo格式转化数据集格式转换 xml2yolo coco2yolo
文章目录1.**数据集格式转换脚本**`coco2yolo.py`示例注释：注释说明：`xml2yolo.py`示例注释：注释说明：2.**数据集可视化与统计**`vis_yolo_files.py`示例注释：注释说明：3.**其他工具脚本**`frames2video.py`示例注释：注释说明：该项目提供了一系列用于深度学习的数据处理工具，主要功能包括：数据集格式转换：提供多种脚本，将不同格式的
LLMs，即大型语言模型 maopig AI 语言模型人工智能自然语言处理
LLMs，即大型语言模型，是一类基于深度学习的人工智能模型，它们通过海量的数据和大量的计算资源进行训练，可以理解和生成自然语言。LLMs的核心架构是Transformer，其关键在于自注意力机制，使得模型能够同时对输入的所有位置进行“关注”，从而更好地捕捉长距离的语义依赖关系。LLMs在众多领域都有广泛的应用，如自然语言理解（NLU），语言生成，以及语音识别和合成等。例如，它们能够理解人类的语言
【LLM】大语言模型（LLMs）林九生人工智能语言模型人工智能自然语言处理
大型语言模型（LLMs）1.什么是大型语言模型？大型语言模型（LargeLanguageModel，LLM）是基于深度学习的自然语言处理模型，能够理解和生成自然语言文本。它们通过在大规模文本数据上进行训练，学习语言的语法、语义和各种语言特征，从而可以执行诸如文本生成、翻译、总结、问答等多种语言任务。以下是大型语言模型的定义和基本原理：1.1定义大型语言模型是由大量参数组成的神经网络，这些参数通过在
全新 Hopper 架构的Transformer 引擎有什么特点？扫地的小何尚人工智能
Transformer引擎是全新Hopper架构的一部分，将显著提升AI性能和功能，并助力在几天或几小时内训练大型模型。Transformer模型是当今广泛使用的语言模型（例如asBERT和GPT-3）的支柱。Transformer模型最初针对自然语言处理用例而开发，但因其通用性，现在逐步应用于计算机视觉、药物研发等领域。与此同时，模型大小不断呈指数级增长，现在已达到数万亿个参数。由于计算量巨大，
【Python】已解决：ModuleNotFoundError: No module named ‘sklearn‘ 屿小夏 python sklearn 人工智能
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
如何快速在Windows 10 + Anaconda 3 中使用Mxnet及gluon qianchess mxnet使用 mxnet win10 anaconda gluon 人工智能
如何快速在Windows10+Anaconda3中使用Mxnet及gluon网络上Mxnet的安装以及使用方法很多，自从其作者之一李沐推出了基于Mxnet的深度学习课程之后，我也尝试着去使用了一下Mxnet。首先第一步就是在自己的系统中安装Mxnet及其相关组建。现在的Mxnet常常会跟其虚拟环境Gluon结合在一起，所以下文就一起阐述一下，顺便记录一下自己踩的坑。注意本文的大部分内容都可以在官网
3D UNet和Swin-UNETR 学無芷境计算机视觉
3DUNet和Swin-UNETR都是用于医学图像分析的深度学习网络，它们对三维（3D）数据进行特征提取和分割。3DUNet3DUNet是UNet架构的一个变体，专门设计用于处理三维医学图像数据。UNet最初是为二维（2D）图像分割任务设计的，具有典型的编码器-解码器结构。3DUNet扩展了这种架构，以便更好地处理具有深度信息的体积数据，如CT或MRI扫描。主要特点：编码器：逐渐下采样图像，提取并
推荐3D UNet实现：深度学习3D体素数据语义分割的利器！滑辰煦Marc
推荐3DUNet实现：深度学习3D体素数据语义分割的利器！去发现同类优质开源项目:https://gitcode.com/在这个快速发展的深度学习时代，3DUNet已经成为3D图像处理领域中不可或缺的工具，尤其在医疗影像分析和3D物体识别等任务上展现出强大的潜力。这个开源项目为我们提供了一个高效、灵活的3DUNet实现，支持Tensorflow、PyTorch和Chainer三种主流深度学习框架。
MATLAB语言的计算机基础疯狂小小小码农包罗万象 golang 开发语言后端
MATLAB语言的计算机基础引言在当今信息技术飞速发展的时代，编程能力已成为当代人士必备的一项基本技能。MATLAB（矩阵实验室）作为一种高级编程语言和环境，广泛应用于数据分析、算法开发、模型创建、数字图像处理和计算机视觉等多个领域。MATLAB以其强大的矩阵运算和可视化能力，成为了科研人员和工程师的重要工具，尤其在数学、物理、工程等学科中，它的应用不可或缺。本文将从MATLAB的基本概念、环境搭
锐捷路由器网关RG-NBR6135-E和锐捷交换机 Ruijie Reyee RG-ES224GC 电脑登录web方法 zh7314 硬件工程
2025年1月17日22:29:35最近淘了点东西，准备在家里搞一套深度学习的服务器，先把网关和交换机搞到了锐捷路由器网关RG-NBR6135-E电脑登录web方法在拿到机器的时候，如果不是全新建议拿根牙签，差入reset5-10秒,灯光会全部闪几下，重置机器，因为有些机器会配置的ip和网段无法访问默认的web服务ip，在机器上面的默认配置单配置参考：https://baijiahao.baidu
PyTorch机器学习与深度学习技术方法 Teacher.chenchong 机器学习 python 开发语言
近年来，随着AlphaGo、无人驾驶汽车、医学影像智慧辅助诊疗、ImageNet竞赛等热点事件的发生，人工智能迎来了新一轮的发展浪潮。尤其是深度学习技术，在许多行业都取得了颠覆性的成果。另外，近年来，Pytorch深度学习框架受到越来越多科研人员的关注和喜爱。Python基础知识串讲1、Python环境搭建（Python软件下载、安装与版本选择；PyCharm下载、安装；Python之HelloW
深度学习模块C2f代码详解你是狒狒吗目标检测人工智能计算机视觉 pytorch YOLO 神经网络
C2f是一个用于构建卷积神经网络（CNN）的模块，特别是在YOLOv5和YOLOv8等目标检测模型中。这个模块是一个改进的CSP（CrossStagePartial）Bottleneck结构，旨在提高计算效率和特征提取能力。下面是对C2f类的详细解释：类定义和初始化Python复制classC2f(nn.Module):“”“FasterImplementationofCSPBottleneckw
华为 Ascend 平台 YOLOv5 目标检测推理教程 Lunar* 目标检测华为 YOLO 目标检测
1.背景介绍随着人工智能技术的快速发展，目标检测在智能安防、自动驾驶、工业检测等领域中扮演了重要角色。YOLOv5是一种高效的目标检测模型，凭借其速度和精度的平衡广受欢迎。华为Ascend推理框架（ACL）是AscendCANN软件栈的核心组件，专为AscendAI加速硬件（如Atlas300I）设计，可实现高性能的深度学习推理。在本文中，我们将介绍如何基于华为AscendACL推理框架对YOLO
机器学习和深度学习的概念你好呀我是裤裤深度学习笔记机器学习深度学习人工智能
MachineLearning机器学习，可以看作是找一个函数。这个函数是人类找不到的，所以交给机器来找。DifferenttypesofFunctions**Regression：**函数的输出是一个数值forexample：**Classification：**给出选项，让机器去选择。forexample：检测一个邮件是不是垃圾文件，就可以通过这个来做。选项是两个：垃圾文件or非垃圾文件。下面，
Pytorch实现：LSTM-火灾温度预测骑猪玩狗 pytorch lstm 人工智能
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊前期工作语言环境：Python3.9.18编译器：JupyterLab深度学习环境：Pytorch1.12.11.设置GPUimporttorchimporttorch.nnasnnimporttorchvisionfromtorchvisionimporttransforms,datasetsimportos,PIL,pathlibde
深度学习项目--基于LSTM的火灾预测研究(pytorch实现) 羊小猪~~ RNN LSTM神经网络案例机器学习/数据分析案例深度学习 lstm pytorch 人工智能机器学习 rnn gru
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊前言LSTM模型一直是一个很经典的模型，这个模型当然也很复杂，一般需要先学习RNN、GRU模型之后再学，GRU、LSTM的模型讲解将在这两天发布更新，其中：深度学习基础–一文搞懂RNN深度学习基础–GRU学习笔记(李沐《动手学习深度学习》)这一篇：是基于LSTM模型火灾预测研究，讲述了如何构建时间数据、模型如何构建、pytorch中LST
每天五分钟深度学习框架pytorch：基于vgg块搭建VGG卷积神经网络每天五分钟玩转人工智能深度学习框架pytorch 深度学习 pytorch cnn VGG 卷积神经网络
本文重点前面我们使用pytorch搭建了vgg块，本文我们使用vgg块搭建卷积神经网络VGG16，我们先来看一下vgg16的模型结构是什么样的：搭建vgg16importtorchfromtorchimportnndefvgg_block(num_convs,in_channels,out_channels):net=[nn.Conv2d(in_channels,out_channels,kern
深度学习 Pytorch 张量（Tensor）的创建和常用方法白白糖深度学习pytorch python 深度学习 pytorch 人工智能
1张量的基本创建及其类型和Numpy中的array一样，张量的本质也是结构化地组织了大量的数据。并且在实际操作中，张量的创建和基本功能也与其非常类似。1.1张量(Tensor)函数创建方法张量的最基本创建方法和Numpy中创建Array的格式一致。#Numpy创建数组importnumpyasnp#导入numpya=np.array([1,2,3])importtorch#首次使用,导入torch
PyTorch 神经协同过滤 (NCF) 推荐系统教程陌北v1 pytorch python NCF 神经协同过滤
目录教程概述1.神经协同过滤模型概述NCF模型的主要组成部分：2.数据加载与预处理3.定义神经协同过滤模型4.训练模型5.模型评估6.推荐物品7.完整示例8.总结在本教程中，我们将使用PyTorch实现一个神经协同过滤（NeuralCollaborativeFiltering，简称NCF）推荐系统。神经协同过滤是一种基于深度学习的推荐系统模型，通过学习用户和物品的嵌入表示来预测用户对物品的评分，进
【大模型LoRa微调】Qwen2.5 Coder 指令微调【代码已开源】 FF-Studio 大语言模型开源
本文需要用到的代码已经放在GitHub的仓库啦，别忘了给仓库点个小心心~~~https://github.com/LFF8888/FF-Studio-Resources第001个文件哦~一、引言：大语言模型与指令微调1.1大语言模型发展简史随着深度学习的飞速发展，特别是Transformer架构在自然语言处理（NLP）领域的成功，大语言模型（LLM,LargeLanguageModel）成为近年来
10 个免费的 AI 图片生成工具分享程序员
原文：https://openaigptguide.com/ai-picture-generator/在人工智能（AI）图像生成技术的推动下，各类AI图片生成网站如雨后春笋般涌现，为我们的日常生活提供了丰富多彩的视觉体验。AI图片生成技术原理人工智能（AI）图片生成技术原理是通过计算机程序使用深度学习算法从大量的数据中学习特征，并根据特征创建新的图片。该技术可以模拟人类的绘画过程，学习输入图像的潜
假新闻检测论文（24）A comprehensive survey of multimodal fake news detection techniques... weixin_41964296 假新闻检测自然语言处理
本文综述了利用深度学习架构和注意力机制进行假新闻检测的最新和全面的研究一介绍假新闻定义：虚假或误导性新闻，或“假新闻”，是任何捏造或故意欺骗的媒体内容。假新闻危害：它可以被利用来操纵公众情绪，传播错误信息，甚至干预政治选举。它的主要目的是扭曲、欺骗或操纵个人的信仰和观点。假新闻的形式（类型）：虚假信息在媒体上传播的形式多种多样，包括讽刺、谣言、点击诱饵、错误信息等。讽刺作品通常充满幽默，用来强调特
YOLOv8重磅升级：引入DenseOne密集网络革新主干设计，重塑YOLO目标检测性能新高度程序员杨弋 YOLO 目标检测人工智能
随着深度学习技术的不断进步，目标检测作为计算机视觉领域的重要任务之一，其性能和应用范围也在不断扩大。作为目标检测领域的佼佼者，YOLO（YouOnlyLookOnce）系列算法以其出色的性能和实时性受到了广泛关注。而最近提出的YOLOv8更是在前代版本的基础上进行了多项优化，进一步提升了检测精度和速度。然而，尽管YOLOv8已经取得了显著的进步，但在处理复杂场景和遮挡问题时，仍然存在一定的挑战。为
深度学习驱动的极端天气预测：时空数据异常检测与应用全解析（基于Python + TensorFlow） AI_DL_CODE 深度学习 python tensorflow 人工智能天气预测
摘要：时空数据异常检测在气象领域识别偏离正常模式的数据点，对极端天气预测至关重要。深度学习，尤其是LSTM网络，因其强大的特征学习能力在该领域显示出巨大潜力。通过整合多源气象数据，深度学习模型能够自动挖掘复杂模式和非线性关系，提高预测准确性。然而，挑战依然存在，包括数据质量问题、模型可解释性不足以及极端天气的内在复杂性和不确定性。未来，通过模型架构创新、训练算法优化以及探索深度学习在气候预测、气象
基于深度学习的人脸表情识别系统：YOLOv5 + YOLOv8 + YOLOv10 + UI界面 + 数据集 2025年数学建模美赛深度学习 YOLO ui 分类人工智能
引言随着人工智能的飞速发展，深度学习技术已广泛应用于各个领域，尤其是在计算机视觉领域。人脸识别和表情识别是其中的一个重要应用，能够在多种场景下提供重要的信息，例如安全监控、情感分析、智能客服、健康监测等。在人脸表情识别任务中，准确识别人脸的情感状态（如高兴、愤怒、悲伤等）是一个极具挑战性的任务。随着YOLO系列算法的不断进步，YOLOv5、YOLOv8和YOLOv10的推出大大提高了目标检测的精度
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D