VarGNet论文阅读笔记

VarGNet是地平线2019年新提出的一种轻量级网络，适用嵌入式系统的计算。

原文链接：https://arxiv.org/abs/1907.05653

摘要

通过观察发现，如果网络中操作的计算强度更平衡，则网络计算图更容易优化。我们提出了基于深度可分离卷积的可变组卷积[25,8,47]。在可变组卷积中，每个组的输入通道数是固定的，可以作为超参数进行调整，这与组卷积中组数是固定的是不同的。这样做的好处有两方面:从编译器的角度来看，固定通道的数量更适合于优化，因为它具有更一致的计算模式和数据布局;与[20,38]中（MobileNet）设置组数为信道号的深度卷积相比，可变组卷积具有更大的网络容量[38]，从而允许更小的信道号，这有助于减轻片外通信的时间消耗。

1，引言

授权嵌入式系统运行众所周知的深度学习架构，如卷积神经网络(convolutional neural networks, CNNs)，是近年来的一个热门话题。对于智能物联网应用而言，具有挑战性的部分是要求整个系统具有能量约束和体积小的特点。为了应对这一挑战，提高整个计算过程的效率的工作大致可以分为两个方向:一是设计具有小FLOPs的轻量级网络[20,38,52,30]，从而对低功耗平台友好;二是优化硬件端配置，如基于FPGA的加速器[13,50]，或者通过改进编译器和生成更多智能指令来提高整个计算过程的效率[2,6,48]。

上述工作都表明了它们在各种应用中的巨大实用价值。然而，由于两个不同的优化方向之间的差距，实际性能可能达不到设计者的期望。具体来说，对于精心调优的网络，如果有小的FLOPs，那么总的延迟可能会很高，而对于精心设计的编译器或加速器，真正的网络可能很难处理。

在这项工作中，我们打算通过系统地分析对嵌入式硬件和相应的编译器友好的轻量级网络的必要特性来弥补现有的差距。更准确地说，由于嵌入式系统中芯片的计算模式受到严格的限制，因此我们提出一个嵌入式系统友好的网络应该适合目标计算模式和理想的数据布局。通过拟合理想的数据布局，可以降低片内存储器与片外存储器之间的通信成本，从而充分利用计算吞吐量。

通过观察发现，如果网络中操作的计算强度更平衡，则网络计算图更容易优化。我们提出了基于深度可分离卷积的可变组卷积[25,8,47]。在可变组卷积中，每个组的输入通道数是固定的，可以作为超参数进行调整，这与组卷积中组数是固定的是不同的。这样做的好处有两方面:从编译器的角度来看，固定通道的数量更适合于优化，因为它具有更一致的计算模式和数据布局;与[20,38]中（MobileNet）设置组数为信道号的深度卷积相比，可变组卷积具有更大的网络容量[38]，从而允许更小的信道号，这有助于减轻片外通信的时间消耗。

我们网络的另一个关键组件是更好地利用基于反向残差block[38]的片上存储器。然而在MobileNetV2[38]中，channel的数量是通过逐点卷积来调整的，而逐点卷积的计算模式不同，在逐点卷积之间是3×3的深度卷积，因此由于计算模式有限，很难进行优化。因此，我们提出先通过可变组卷积将具有C个channel的输入特征扩展到2C个，然后通过点卷积将其返回到C个。通过这种方式，两种类型的层之间的计算成本更加平衡，因此对硬件和编译器更加友好。综上所述，我们的贡献可以总结如下:

•我们从网络架构和嵌入式系统的硬件/编译器的角度系统地分析了如何优化CNNs的计算。我们发现在这两个优化方向之间存在一个gap，即在嵌入式系统中，由于计算模式的限制，一些精心设计的架构很难被优化

•考虑到更统一的计算模式和数据布局对嵌入式系统更友好，我们提出了可变组卷积和相应的改进的全网络，简称可变组网络，VarGNet。

•对常见的视觉任务，如分类、检测、分割、人脸识别等，以及相应的大规模数据集进行实验，验证了我们提出的VarGNet的实用价值。

1.1相关工作

轻量级的cnn。设计轻量化的CNNs是近年来的一个热点问题。具有代表性的人工设计网络包括SqueezeNet[22]、Xception[8]、MobileNets[20,38]、ShuffleNets[52,30]和IGC[51,46,41]。此外，神经结构搜索(neural architecture search, NAS)[53,35,37,54,28]是一个很有前途的自动设计轻量级CNNs的方向。上述方法能够有效地加速识别过程。最近，提出了支持NAS的平台方法[4,44,10,40]，用于搜索在某些硬件平台上有效的特定网络。我们的网络VarGNet是对现有的NAS方法平台的补充，因为所提出的变量组卷积有助于在NAS方法中设置搜索空间。

CNN加速器的优化。 为了加速神经网络，已经广泛研究了FPGA [13，50，17，31]和ASIC设计[7，36，23，29，19]。一般而言，流架构（SA）[42、45]和单计算引擎（SCE）[15、5、2]是两种基于FPGA的加速器[43]。这两个方向之间的区别在于定制和通用性。 SA设计不仅仅在通用性上寻求定制，而SCE则强调灵活性和定制之间的权衡。在这项工作中，我们希望提出一个可以通过现有的加速器更轻松地优化的网络，从而提高整体性能。

2，在嵌入式系统中设计有效的网络

芯片在嵌入式系统使用,如FPGA和ASIC,低单价以及快速的上市时间在设计整个系统是至关重要的因素。这样的结果在一个相对简单的芯片配置至关重要的点。换句话说,计算方案严格限制相比,通用的处理单元。然而,在SOTA网络中的操作是如此的复杂,有些层可以加通过硬件设计加速而其他层则不行。因此,设计高效的网络嵌入式系统,第一直觉就是网络中的层彼此在某种意义上应该类似。

另一个重要的直觉是基于CNNs中使用的卷积的两个属性。第一个属性是计算模式。在卷积中，几个滤波器(kernels)在整个特征图上滑动，表示kernel被重复使用，而来自特征图的值只使用一次。第二个属性是卷积核和feature map的数据大小。通常情况下，卷积核的大小远远小于feature map的大小，例如在2D卷积中，kernel的k2C, feature map的2HWC。根据上述两个特性，一个巧妙的解决方案是先加载kernels的所有数据，然后依次进行提取和提取特征数据[48]的卷积。这种实用的解决方案是我们在嵌入式系统上高效网络设计的两个指导方针的第二个直觉:

•如果block之间的中间特征映射的大小更小就更好了。

•一个block中各层的计算强度应该是平衡的。

接下来，我们将详细介绍这两个准则。

blocks之间的小的中间特征映射。在SOTA网络中，通常的做法是先设计一个普通block和一个下采样block，然后将几个block叠加在一起，得到一个深度网络。此外，在这些block中，残差连接[18]被广泛采用。因此，在最近的编译器端优化[48]中，block中的层通常被分组并一起计算。在这种方式下，片外存储器和片内存储器只在启动或结束网络中一个block的计算时通信。因此，block与block之间较小的中间特征映射必然有助于减少block与block之间的数据传输时间.

block内平衡计算强度。如前所述，在实践中，在执行卷积之前要加载多个层中的权值。如果加载的层在计算强度方面有很大的差异，则需要额外的片上内存来存储特征映射的中间片。在MobileNetV1[20]中，使用了一个深度conv和一个点conv。与以前的定义不同，在我们的实现中，权重已经加载。因此，计算强度是通过FLOPs除以特征图的大小来计算的。那么，如果feature map的大小为28×28×256，则深度卷积和点卷积的计算强度分别为9和256。因此，当运行这两个层时，我们必须增加芯片上的缓冲区来满足点卷积，或者不将这两个层的计算分组在一起。

3，可变组卷积

在前面提到的两个准则的基础上，我们在本节中提出了一个新的网络。为了平衡计算强度，我们将网络中一个组中的channel数设置为常数，从而使得每个卷积层中的组都是可变的。如果我们看一下卷积的FLOPs，固定channel数的动机并不难理解，

因此，如果feature map的大小为常数，则通过固定G = Channels/ Groups，block内的计算强度更加均衡。此外，可以设置组中的channel数量来满足处理元素的配置，每次处理一定数量的channels。

与深度卷积相比，可变组卷积增加了FLOPs，增加了表达性[38]。因此，现在我们能够减少中间特征映射的channels数量，同时保持与以前网络相同的泛化能力。具体而言，我们设计了如图1所示的新型网络block。对于整个网络早期使用的普通block，由于此时权值的大小比较小，所以四层的权值都可以缓存到片上存储器中。当进入晚期,channel数增加和权重的大小增加,正常的block也能够优化只加载一个可变组卷积和点卷积。同样,下采样block的操作对compiler-side和硬件方面的优化也友好。一个普通block的整个计算过程如图2所示。然后，基于MobileNetV1[20]的架构，我们将他们的基本block替换为我们的block，整个详细的网络架构如表1所示。另外，另一个基于ShuffleNet v2的架构如表2所示。

图1 可变组卷积网络

图2 可变组网络中普通block的计算方案。首先将四种卷积运算的权值加载到片上存储器中，然后对特征进行处理。标题

4 实验

4.1 ImageNet分类

我们的模型在ImageNet上的结果如表3和表4所示。训练超参数设置为:batch size1024，crop ratio 0.875，学习率0.4，余弦学习率调整机制，权重衰减4e-5，训练epochs 240。从table(c)可以看出，当模型规模较小时，VarGNet v2的性能要比ShuffleNet v2差，这是由于VarGNet v2中使用的channel较少造成的。然后，当模型规模较大时，我们的网络表现得更好。

4.2 目标检测

在表5中，我们展示了我们提出的VarGNet的性能以及比较方法。我们评估了我们在COCO数据集[27]上提出的网络的目标检测性能，并将其与其他最先进的轻量级架构进行了比较。我们选择基于FPN的Faster R-CNN[26]作为框架，所有实验都在相同的设置下进行，输入分辨率为800×1333,epochs为18。特别地，我们发现如果使用更多的epoch来训练ShuffleNet v2可以获得更好的accuracy，因此我们为ShuffleNet v2训练了一个拥有27个epoch的模型。在测试时，RPN阶段评估每幅图像的1000个proposals。除8000张minimal图像外，我们使用train+val集合进行训练，最后在minival集合上进行测试。表中列出了mAP和模型复杂度。

4.3 像素级解释

4.3.1 Cityscapes
在Cityscapes数据集[9]上，我们设计了一个多任务结构(图3a)来进行两个重要的像素级解析任务:单图像深度预测和分割。

训练设置。我们使用标准的Adam优化器，将重量衰减设置为1e-5，batch size大小设置为16。初始化学习率为1e-4，多项式衰减，幂次为0.9。总训练epochs设置为100。为了增加数据，使用了随机水平翻转，并从0.6-1.2中随机选择比例来调整图像的大小。对于多任务训练，我们定义有损函数为:

当任务是全景分割时,我们设置λinstance = 0.2;λsemantic = 1.0。添加深度任务之后,我们设置λdepth = 0.08。

结果。参数和比较方法的FLOPs见表6。分割结果和深度预测的可视化示例分别见表7和图4。

4.4 KITTY

训练设置。对于KITTI数据集[14]上的单幅图像深度预测和立体任务，我们给出了基于VarGNet的模型的性能。实验采用了一个U-Net风格的体系结构(3b)。所有的深度模型都是在KITTI原始数据集上训练的，我们测试了来自Eigen等人[12]分割的29个场景中的697张图像，并对其余32个场景中的23488张图像进行了训练。所有实验结果均在0m ~ 80m、0m ~ 50m深度范围内进行评价。评价指标与以往工作相同。所有的立体模型都是在KITTI原始数据集上训练的，我们测试了Eigen等人分割的测试集[12]，并训练了KITTI15。原来的评价指标为EPE和D1。在训练期间，使用标准的SGD优化器，momentum设置为0.9。resnet18和resnet50的标准权重衰减设置为0.0001，其他设置为0.00004。迭代次数设置为300个epoch。初始学习速率为0.001，学习速率在[120,180,240]epoch处衰减0.1。我们使用4个GPU来训练模型，batch size设置为24。

结果。在表8和表9中，我们展示了我们在各种评价指标下的深度结果和立体结果。同时，我们报告了我们实现的MobileNet和ResNet作为比较。此外，视觉效果如图5和图6所示。

4.5 人脸识别

所有的网络都经在DeepGlint MS-Celeb-1M-v1c数据集[1]训练，[1]是从MS Celeb-1M[16]中清理出来的。从86,876个id中有3,923,399个对齐的人脸图像。验证数据集使用LFW[21]、CFP-FP[39]和AgeDB-30[32]。最后，在MegaFace Challenge 1[33]上对所有网络模型进行评估。表10列出了验证数据集的最佳人脸识别准确率，以及MegaFace数据集[11]的改进版本在1e-6 false接受率下的人脸验证true接受率。我们使用MobileNet v1和MobileNet v2作为基线模型。为了适应输入图像大小112x112，对于每个基线和VargNet模型，将第一卷积层的stride设置为1。为了获得更好的性能，我们进一步将池化层替换为“BN-Dropout-FC-BN”结构，即InsightFace[11]，然后是ArcFace loss[11]。标准的SGD优化器与momentum 0.9一起使用，batch size大小设置为512，配置8个gpu。学习速率从0.1开始，在100K、140K和160K迭代时除以10。我们设权重衰减为5e-4。嵌入特征维数为256，dropout率0.4。归一化比例为64,ArcFace margin设置为0.5。所有的训练都基于InsightFace工具箱[11]。

深度学习与（复杂系统）事物的属性科学禅道深度学习模型专栏深度学习人工智能
深度学习与复杂系统中事物属性的关系体现在：特征学习与表示:深度学习通过多层神经网络结构，能够自动从原始输入数据中学习和提取出丰富的特征表示。每一层神经网络都可能对应着事物属性的不同抽象层次，底层可能对应简单直观的属性，而随着网络深度的增加，顶层可以学习到更抽象、复杂的属性及其相互关系。非线性关系建模:深度学习特别擅长处理非线性关系，而在复杂系统中，事物属性间的相互作用往往表现为非线性，例如，某些属
深度学习——梯度消失、梯度爆炸小羊头发长深度学习机器学习人工智能
本文参考：深度学习之3——梯度爆炸与梯度消失梯度消失和梯度爆炸的根源：深度神经网络结构、反向传播算法目前优化神经网络的方法都是基于反向传播的思想，即根据损失函数计算的误差通过反向传播的方式，指导深度网络权值的更新。为什么神经网络优化用到梯度下降的优化方法？深度网络是由许多非线性层(带有激活函数)堆叠而成，每一层非线性层可以视为一个非线性函数f(x)，因此整个深度网络可以视为一个复合的非线性多元函数
ENAS：首个权值共享的神经网络搜索方法，千倍加速 | ICML 2018 VincentTeddy
NAS是自动设计网络结构的重要方法，但需要耗费巨大的资源，导致不能广泛地应用，而论文提出的EfficientNeuralArchitectureSearch(ENAS)，在搜索时对子网的参数进行共享，相对于NAS有超过1000x倍加速，单卡搜索不到半天，而且性能并没有降低，十分值得参考来源：【晓飞的算法工程笔记】公众号论文:EfficientNeuralArchitectureSearchvia
神经网络入门经典书籍,神经网络理论及应用小浣熊的技术神经网络人工智能深度学习算法
想要学习人工神经网络，需要什么样的基础知识？人工神经网络理论百度网盘下载：链接：提取码：rxlc简介：本书是人工神经网络理论的入门书籍。全书共分十章。第一章主要阐述人工神经网络理论的产生及发展历史、理论特点和研究方向；第二章至第九章介绍人工神经网络理论中比较成熟且常用的几种主要网络结构、算法和应用途径；第十章用较多篇幅介绍了人工神经网络理论在各个领域的应用实例。谷歌人工智能写作项目：神经网络伪原创
神经网络算法浅谈 dami_king 神经网络算法深度学习人工智能 AIGC
神经网络是一种模拟人脑神经元工作原理的计算模型，由大量的人工神经元相互连接形成复杂网络结构，用于解决各种机器学习和人工智能问题。以下是对神经网络算法的浅析:一、网络结构神经网络的核心在于其层次结构，其中包括：输入层(InputLayer)：接收原始特征数据。隐藏层(HiddenLayers)：包含若干层，每层包含多个神经元，每个神经元接收到上一层的输出作为输入，并通过加权和与非线性变换（激活函数）
CVPR 2023: Revisiting Residual Networks for Adversarial Robustness 结构化文摘人工智能 3d
我们使用以下6个分类标准对本文的研究选题进行分析：基于MECE原则，以及您提供的论文摘要，以下是对抗鲁棒性研究的六个分类标准：1.提高鲁棒性的重点：对抗训练方法:针对现有架构开发新的对抗训练算法/策略。架构设计:修改网络结构、组件或缩放方式，以获得固有的鲁棒性。2.架构修改级别:块级:更改网络内单个构建块的设计（例如，残差块）。网络缩放:更改网络的深度、宽度和其他宏观缩放参数。3.设计方法:经验实
LSTM原理解析 Andy_shenzl Deep Learing &pytorch lstm 深度学习神经网络
一、背景前文讲了RNN的基本原理，可以发现RNN是一个比较简单的神经网络结构，虽然为文本和时间序列的建模提供了一个很好的思路，但是也有一定的局限性。最直观的就是使用了Tanh函数造成梯度消失的问题。根据Tanh的性质，很容易出现一个现象就是激活函数结果太大，激活函数的绝对值在很接近于1的位置，而对应的激活函数的梯度就会接近于0。这样，在沿着时间反向传播的过程中，梯度就会逐渐减小，知道非常接近于0，
深度学习——概念引入韶光流年都束之高阁深度学习日记深度学习人工智能职场和发展
深度学习深度学习简介深度学习分类根据网络结构划分：循环神经网络卷积神经网络根据学习方式划分：监督学习无监督学习半监督学习根据应用领域划分：计算机视觉自然语言处理语音识别生物信息学深度学习简介深度学习（DeepLearning，DL）是机器学习领域中的一个新的研究方向，主要是通过学习样本数据的内在规律和表示层次，让机器能够具有类似于人类的分析学习能力。深度学习的最终目标是让机器能够识别和解释各种数据
引导方法深度补全系列—基于SPN模型—3—《Non-local spatial propagation network for depth completion》文章细读白纸一样的白深度学习人工智能计算机视觉神经网络
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档目录创新点文章贡献网络结构方法详解总结创新点1.CSDN使用固定局部邻域，固定的局部邻域通常具有不应与参考信息混合的无关信息，尤其是在深度边界上。NLSPN预测像素的非局部邻域.2.预测初始密集深度的置信度纳入亲和度归一化，归一化是为了减少误差，加入置信度为了指导预测值提示：以下是本篇文章正文内容，下面案例可供参考文章贡献1.NLSP
Pytorch关于CIFAR-10测试月疯【计算机视觉】pytorch 人工智能 python
下载CIFAR-10数据集：官网：https://www.cs.toronto.edu/~kriz/cifar.htmlCIFAR-10的网络结构：importtorchfromtorchimportnnfromtorch.nnimportConv2d,MaxPool2d,Flatten,Linear,Sequential#定义网络结构classModel(nn.Module):def__init
洪泛法：计算机网络中的信息洪流——原理、优化与应用全景解析程序员Chino的日记计算机网络
洪泛法-概述洪泛法（Flooding）是计算机网络中一种简单直接的数据传输技术。它不依赖于网络中的路由表或者路径选择算法。在洪泛法中，每个接收到消息的节点将消息复制并发送给除了消息来源外的所有其他节点。这个过程一直重复，直到消息到达网络中的所有节点或者达到了预设的跳数限制。洪泛法由于其简单性，在特定场景下非常有效，如在没有固定网络结构或者网络结构快速变化的环境中。工作原理洪泛法的工作原理基于“广播
神经网络——循环神经网络（RNN）爱吃柠檬的天天人工智能神经网络 rnn 人工智能
神经网络——循环神经网络（RNN）文章目录神经网络——循环神经网络（RNN）一、循环神经网络（RNN）二、循环神经网络结构1、一对一（OnetoOne）2、一对多（OnetoMany）3、多对多（ManytoMany）4、多对一（ManytoOne）三、循环神经网络原理四、RNN实战1、时间序列预测五、循环神经网络的弊端一、循环神经网络（RNN）循环神经网络（RecurrentNeuralNetw
深度学习疆界：探索基本原理与算法，揭秘应用力量，展望未来发展与智能交互的新纪元 Srlua 人工智能深度学习人工智能
目录什么是深度学习深度学习的基本原理和算法深度学习的应用实例深度学习的挑战和未来发展方向挑战未来发展方向深度学习与机器学习的关系深度学习与人类的智能交互什么是深度学习深度学习是一种基于神经网络的机器学习方法，旨在模仿人类大脑分析和学习数据的方式。深度学习的核心在于能够自动学习和提取数据中的复杂特征，它通过构建深层的神经网络结构来实现对数据的高层次抽象和理解。这种方法在图像识别、语音识别、自然语言处
pytorch神经网络入门代码 hehui0921 神经网络 pytorch 神经网络人工智能
importtorchimporttorch.nnasnnimporttorch.optimasoptimimporttorchvisionimporttorchvision.transformsastransforms#定义神经网络结构classSimpleNN(nn.Module):def__init__(self,input_size,hidden_size,num_classes):sup
深度学习发展的艺术科学禅道深度学习模型专栏深度学习人工智能
将人类直觉和相关数学见解结合后，经过大量研究试错后的结晶，产生了一些成功的深度学习模型。深度学习模型的进展是理论研究与实践经验相结合的产物。科学家和工程师们借鉴了人类大脑神经元工作原理的基本直觉，并将这种生物学灵感转化为数学模型和算法。在数十年的研究和发展过程中，他们不断探索并尝试各种网络结构、优化方法、激活函数等关键组件。一方面，研究人员运用严谨的数学理论来构建和分析深度学习模型，如线性代数、概
深度学习的魅力：探索人工智能的未来之路洞深视界人工智能深度学习
嗨，亲爱的读者朋友们！欢迎来到这篇关于深度学习的博客。在这个信息爆炸的时代，人工智能是一个备受瞩目的话题，而深度学习则是推动这一领域飞速发展的引擎。今天，我们将一同探索深度学习的进展，用通俗易懂的语言解释这个复杂而令人着迷的领域。深度学习的基础首先，让我们从深度学习的基础开始，理解它究竟是什么。深度学习是机器学习的一个分支，它模拟人脑的神经网络结构，通过大量的数据进行训练，从而使机器能够学到复杂的
深度学习的新进展：探索人工智能的未来屿小夏 IT杂谈人工智能深度学习 ai
文章目录引言深度学习技术概述计算机视觉领域的深度应用自然语言处理的深度革命跨领域应用的深度拓展深度学习的挑战与未来展望结语引言在科技日新月异的今天，深度学习作为人工智能领域的一颗璀璨明珠，正在引领着技术创新的浪潮。它通过模拟人类大脑的神经网络结构，让机器具备了强大的学习和推理能力。随着计算资源的不断提升和算法的不断优化，深度学习已经在许多领域取得了令人瞩目的成就，为人类生活带来了极大的便利。深度学
1.9 神经网络结构搜索(NAS) 构图笔记自动驾驶笔记神经网络自动驾驶
神经网络结构搜索(NAS)更多内容，请关注：github：https://github.com/gotonote/Autopilot-Notes.git一、引言神经网络架构搜索（NAS）是一种自动搜索最优神经网络架构的方法。通过使用NAS，研究人员可以避免手动设计网络架构的繁琐过程，从而节省时间和精力。本教程将介绍NAS的基本概念、方法和实现步骤。二、基本概念网络架构：神经网络的结构，包括层数、每
PointMixer论文阅读笔记 ZHANG8023ZHEN 论文阅读笔记
MLP-mixer是最近很流行的一种网络结构，比起Transformer和CNN的节构笨重，MLP-mixer不仅节构简单，而且在图像识别方面表现优异。但是MLP-mixer在点云识别方面表现欠佳，PointMixer就是在保留了MLP-mixer优点的同时，还可以很好的处理点云问题。PointMixer可以很好的处理intra-set,inter-set,hierarchical-set的点云。
Zeek实战—快速构建流量安全能力港南四大炮亡安全
第1章网络流量与网络安全1.2流量与网络从宏观角度进行观察，如果将计算机网络看作一个整体，可以很容易抽象出它是由以下3个部分组成的。1.网络终端。指连接在网络中的、能够产生或消费网络流量的软/硬件系统，是网络流量在正常情况下的起点或终点。2.网络结构。指能够决定网络流量流动方式的软/硬件系统，是是网络流量的中转点。3.网络流量。指一切正在网络中传输的数据。可以看出，网络终端及网络结构与网络流量有关
大致聊聊ChatGPT的底层原理，实现方法黑马程序员官方 chatgpt 人工智能机器学习
文目录深度学习基础ChatGPT的本质ChatGPT原理详解一、深度学习基础—深度学习是什么？如何理解神经网络结构？关于生物神经网络结构如下：神经网络介绍人工神经网络（ArtificialNeuralNetwork,简写为ANN）也简称为神经网络(NN),是一种模仿生物神经网络结构和功能的计算模型。当电信号通过树突进入到核细胞时，会逐渐聚集电荷。达到一定的电位后，细胞会被激活，通过轴突发出信号。从
网络七层协议与网络四层协议古佛青灯度流年
SSL协议位于传输层与应用层协议之间，因此SSL协议对传输层是透明的。OSI是一个开放性的通信系统互连参考模型，他是一个定义得非常好的协议规范。OSI模型有七层结构，每层都可以有几个子层。下图是OSI七层网络结构组成：在这里插入图片描述TCP/IP是一组用于实现网络互连的通信协议。Internet网络体系结构以TCP/IP为核心。基于TCP/IP的参考模型将协议分成四个层次，它们分别是：网络访问层
YOLOv5改进 | 一文汇总：如何在网络结构中添加注意力机制、C3、卷积、Neck、SPPF、检测头 Snu77 YOLOv5改进有效专栏 YOLO 深度学习人工智能计算机视觉目标检测 python pytorch
一、本文介绍本篇文章的内容是在大家得到一个改进版本的C3一个新的注意力机制、或者一个新的卷积模块、或者是检测头的时候如何替换我们YOLOv5模型中的原有的模块，从而用你的模块去进行训练模型或者检测。因为最近开了一个专栏里面涉及到挺多改进的地方，不能每篇文章都去讲解一遍如何修改，就想着在这里单独出一期文章进行一个总结性教程，大家可以从我的其它文章中拿到修改后的代码，从这篇文章学会如何去添加到你的模型
非线性回归的原理与实现 o0Orange 回归数据挖掘人工智能
1.激活函数：激活函数是为了让神经网络可以拟合复杂的非线性函数，比如torch.nn.functional.relu()2.人工神经网络是多层人工神经元组成的网络结构，输入层，隐含层，输出层3，隐含层大于2的神经网络，都可以叫深度神经网络。importtorchimportmatplotlib.pyplotaspltfromtimeimportperf_counter#增加一个维度100000行1
多尺度神经网络新一代创新！精度与速度完美平衡，实现多领域应用落地深度之眼深度学习干货人工智能干货深度学习计算机视觉人工智能
多尺度神经网络的设计通常基于对频率原则的理解，目的是为了解决高频成分学习慢的问题。这些网络通过特殊设计，比如给高频成分加更多的权重或者将高频成分平移到低频，来提高学习效率。为了满足在不同层次上理解和处理数据的需求，多尺度神经网络包含了各种网络结构，常见的多尺度神经网络类型有：多尺度图神经网络、多尺度卷积神经网络、多尺度注意力神经网络、多尺度特征融合网络等。其关键优势在于它们能够整合来自不同尺度的信
Task5 基于深度学习的文本分类2 listentorain_W
Task5基于深度学习的文本分类2在上一章节，我们通过FastText快速实现了基于深度学习的文本分类模型，但是这个模型并不是最优的。在本章我们将继续深入。基于深度学习的文本分类本章将继续学习基于深度学习的文本分类。学习目标学习Word2Vec的使用和基础原理学习使用TextCNN、TextRNN进行文本表示学习使用HAN网络结构完成文本分类文本表示方法Part3词向量本节通过word2vec学习
机器学习12-基本感知器 dracularking 机器学习机器学习人工智能感知器 Perceptron
感知器（Perceptron）是一种最简单的人工神经网络结构，由美国心理学家FrankRosenblatt在1957年提出。它是一种单层的前馈神经网络，通常用于二分类问题。基本感知器由多个输入节点、一个输出节点和一组权重参数组成。每个输入节点都与输出节点连接，并且具有一个对应的权重参数，用来调节输入的重要性。感知器的输出是输入的线性组合，通过一个激活函数进行转换，最终输出一个二进制值（通常是0或1
【CV论文精读】Pedestrian Detection Based on YOLO Network Model 基于YOLO的行人检测量子-Alex CV知识学习和论文阅读 YOLO 深度学习计算机视觉
【CV论文精读】PedestrianDetectionBasedonYOLONetworkModel0.论文摘要和作者信息摘要——经过深度网络后，会有一些行人信息的丢失，会造成梯度的消失，造成行人检测不准确。本文改进了YOLO算法的网络结构，提出了一种新的网络结构YOLO-R。首先，在原有YOLO网络的基础上增加了三个直通层。直通层由路由层和重组层组成。其作用是将浅层行人特征连接到深层行人特征，并
DL-Paper精读：Revisiting ResNets 星月野1
RevisitingResNets:ImprovedTrainingandScalingStrategiesRevisitingResNets:ImprovedTrainingandScalingStrategiesarxiv.orgBackground影响一个神经网络模型的认知能力的主要因素，可以被粗略的分为以下几个部分：结构（architecture）：关于网络结构的改进工作，一直以来最受人关
多GPU-TensorFlow 听风1996
首先，TensorFlow并行计算分为：模型并行，数据并行。模型并行:根据不同模型设计不同并行方式，模型不同计算节点放在不同GPU或者机器上进行计算。数据并行是比较通用简便的实现大规模并行方式，同时使用多个硬件资源计算不同batch数据梯度，汇总梯度进行全局参数更新。数据并行:多块GPU同时训练多个batch数据，运行在每块GPU模型基于同一神经网络，网络结构一样，共享模型参数。1.同步数据并行，
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l