初学者-图像处理

译文：FishNet

FishNet:用于图像、区域和像素级的多功能主干网络

摘要对于预测不同层级的目标对象（如图像级、区域级和像素级），设计卷积神经网络（CNN）结构的基本原则具有多样性。一般来讲，专门为图像分类任务所设计的网络结构，会默认作为其他任务（包括检查和分割）的主干网络结构。但是，多数网络的主干设计并没有考虑统一网络的优势，而为像素级或区域级的预测任务设计主干网络，原因可能是需要更高分辨率的深层特征。为了实现这一目标，本文设计了一个类似鱼形的主干网络，我们称为FishNet。在FishNet中，所有的解决方案信息都会被保留，并在最后的任务进行精炼。除此之外，我们观察到，现存的工作并不能直接将梯度信息从深层网络传递给浅层网络，而本文的设计可以更好地处理该问题。为了验证FishNet的性能表现，我们进行了大量实验。特别地，在ImageNet-1k数据集上，在参数较少的情况下，FishNet的性能可以完全超过DenseNet和ResNet。FishNet已经被应用在赢得2018年COCO检测挑战赛的一个模块中。代码被公开在：https://github.com/kevin-ssy/FishNet。

1 简介

在计算机视觉领域中，卷积神经网络（CNN，Convolutional Neural Network）已经被认为学习更好特征表达的最有效的方法[17, 26, 28, 9, 37, 27, 4]。CNN结构的设计也成为一项基本任务，良好的结构有助于提高许多相关性视觉任务的性能。随着CNN层设计的加深，近来的工作试图通过恒等映射[8]和直连接[13]来改进或重用前一层的网络特征。

此时，对于图像级、区域级和像素级的任务，在设计CNN结构上开始变得多样化。对于图像分类任务，网络往往使用连续下采样来获得低分辨率的深度特征。然而，低分辨率的特征并不适用于像素级任务，甚至是区域级任务。如果直接将高分辨率的浅层特征用于区域和像素级任务，模型应用效果却难以令人满意。为了获得更深层的高分辨率特征，对于像素级任务，已知的较好的网络结构如U-Net和沙漏状网络[22, 24, 30]。近来，对于区域级任务（如目标检测）的研究也使用具有上采样机制的网络结构[21, 19]，通过这种方式可以用相对高分辨率的深层特征描述小尺度物体对象。

在已经将高分辨率深层特征用于区域级和像素级任务的基础上，本文提出一种鱼状网络，即FishNet。它可以使高分辨率的深层特征包含高级别语义信息。通过该方式，将经过图像分类任务预训练的特征可以更好的用于区域级和像素级任务。

本文精心设计了一种具有以下三个优点的网络结构。

第一，它是第一个结合了各类网络结构优势的主干网络，并且是为像素级、区域级和图像级三类任务而设计的网络。与仅为图像分类任务而设计的网络相比，本文的主干网络对于处理像素级和区域级任务有更好的效果。

图1. ResNet（图左）和FishNet（图右）的上/下采样模块。黄色显示的为1×1卷积层，由于其为孤立卷积层（孤立卷积层，见章节2），这使得其得其无法通过直接BP完成输出层到浅层网络的梯度下降。

第二，它可以使极深层网络的梯度直接传递给浅层网络，本文称为直接BP。最近的研究表明，有两种设计可以完成直接BP，即通过残差块完成恒等映射[8]和直连接方式[13]。但是，不可否认的事实是现有网络的设计，如[9, 8, 13, 28, 34, 32]，仍然无法使用直接BP。造成该问题的原因是卷积层之间的特征分辨率不同。如图1所示，ResNet[9]利用跳跃连接具有步幅的卷积层来处理输入与输出通道数量不一致的问题，这使得恒等映射并没有使用。没有恒等映射或直连接的卷积层降低了输出到浅层网络的梯度。我们的结构设计更好地解决了这个问题，即将不同深度的特征直接连接最后的输出层。我们更加精细的设计了网络中的结构，以保证直接BP。通过本文的设计，特征的语义信息也可以在网络中得以保留。

第三，网络中，不同深度的特征被保留下来，并用于进一步的特征精细化提取。不同深度的特征对于图像的抽象程度不同。所以，对于这些特征都应该予以保存，以提高特征的多样性。同时，这些特征之间具有互补性，它们可以用来进行精细化提取。因此，我们设计了一种特征保持与精细化提取机制，去实现本文的最终目标。

本文的设计可能会有一个反直觉的效果，即在参数数量与图像分类精度的权衡中，它比传统的卷积网络表现得更好。原因如下：（1）保留特征和互补精细化提取，远比设计宽度或深度更大的网络更有用；（2）它有助于直接BP。实验结果表明，我们的紧凑模型FishNet-150的参数量接近于ResNet-50，而在ImageNet-1k数据集上的精度却能超过ResNet-101和DenseNet-161（k=48）。同时，对于区域级和像素级的任务，如目标检测和实例分割，我们的模型作为Mask R-CNN[10]的主干网络与基于ResNet-50的Mask R-CNN相比，在MS COCO数据集上AP值分别提高了2.8%和2.3%。

1. 1相关工作

对于图像分类任务的CNN结构。深层卷积神经网络的结构设计是深度学习中一项基础却极具挑战性的任务。优秀的网络可以有更好的特征提取能力，这也会提高许多处理其他任务的性能。AlexNet[17]在图像识别挑战赛ILSVRC[25]上的显著效果提升，标志着计算机视觉深度学习时代的来临。在此之后，许多网络设计出现，如VGG[26]、Inception[28]，所有的这些网络都是通过加深网络来提升其能力。然而，由于梯度消失的问题，此时的网络仍然无法设计过深。近来，在网络中引入跳跃连接[9]，极大地缓解了梯度消失问题。在这个方面上有系列正在进行的工作[29, 34, 32, 13, 2, 11, 31, 33]。但是，对于图像分类任务，在已有的所有网络设计中，高分辨率的特征是由感受野较小的浅层网络提取的，缺乏仅能在深层网络中获得的高级语义信息。我们的工作是首次提取高分辨率深层特征和高级语义信息，同时提高图像分类的精度。

采用不同层特征结合的网络结构设计。通过使用嵌套稀疏网络[16]、超列[7]、加法[18]和残差块[22, 21]（卷积与反卷积均使用残差块）等方法组合，可以得到不同分辨率或深度的特征。在文献[7]中，超列网络直接将来自不同层的特征进行连接后，用于图像分割和目标定位。但是，这种方法并没有将深层和浅层网络的特征进行相互精细化提取。文献[8]使用直接相加将深层与浅层网络的特征进行融合。然而，该方法只能将不同抽象级的特征进行混合，并不能同时保留或细化该混合特征。同样，采用卷积的串联方法与文献[8]的方法类似[23]。另外，残差块[22, 21]也会被用于组合特征，前提是已完成的工作必须给出一个预定的目标，等待特征的精细化提取。假如跳跃层是为了得到深度特征，那么浅层特征仅起到精细化提取出深度特征的作用，在此情况下，浅层特征也会在经过残差块之后被丢弃。综上所述，在现有的工作中，采用相加和残差块并不能保存浅层和深层的特征，而我们设计的网络却可以很好的保存并精炼这些特征。

使用上采样机制的网络。由于计算机视觉领域还有许多其他任务，如目标检测和目标分割，这些任务都需要较大的特征图来保证分辨率，所以，将上采样方法应用到网络中显得十分必要。这类方法通常包括不同深度的特征之间的信息交互。U-Net[24]、FPN[21]、堆叠沙漏网络[22]等一系列工作都展示了这类方法在像素级[22]和区域级任务[21, 19]的能力。但是，在图像分类任务上，这些方法都没有被证明是有效的。MSDNet[12]尝试保持高分辨率的特征图，这是与我们的网络结构最相似的工作。当然，MSDNet的结构仍然使用不同分辨率的特征，这也造成特征无法保存和表示。此外，该方法并没有采用上采样的方式，让特征具有更大的分辨率和更多的语义信息。DMSNet在结构中引入多尺度机制的目的仅是计算预测。但是，这种设计对于图像分类的准确度并没有显著的提升。我们的工作则保留和精细化了来自浅层和深层的特征，这在现有的上采样网络和MSDNet方法中是无法实现的。

特征/输出之间的信息传递。目前，一些方法可以使用特征之间的信息传递来完成分割[36]、姿态估计[3]和目标检测[35]。这些设计均基于主干网络架构的设计，而FishNet是对于主干网络设计很好的补充。

2 深度残差网络与孤立卷积之间的恒等映射

ResNet的基本构建模块被称为残差块。具有恒等映射[8]的残差块可以表示为

xl+1=xl+F(xl,Wl) (1)

其中，xl表示 l层残差块的输入特征，F(xl,Wl)表示输入xl与权重参数Wl的残差函数。我们考虑将分辨率相同的所有残差块进行堆叠，作为一个阶段。用xl,s表示阶段s的第l层特征，可以得到：

xLs,s=x0,s+l=1LsFxl,s,Wl,s,

∂L∂x0,s=∂L∂xLs,s(1+∂∂x0,sl=1LsFxl,s,Wl,s)

(2)

式中，Ls表示阶段s堆叠的残差块数量，L是一个损失函数。式子（2）中的附加项∂L∂xLs,s是确保xLs,s的梯度直接传递给x0,s。我们认为不同分辨率的特征处于不同的阶段。在之前的ResNet中，不同分辨率的特征在信道数量上是不同的。因此，需要转换函数h(∙)在下采样之前改变信道数量：

x0,s+1'=hxLs,s=σ(λs⊗xLs,s+bLs,s)

(3)

图2. FishNet概述。它由三部分组成。尾部使用现有的工作从输入图像中获取深度低分辨率特征。身体部位获取包含高级语义信息的高分辨率特征。头部保留并精细化提取从这三部分中获得的特征。

式中，σ(∙)是一个激活函数。λs和bLs,s分别是阶段s过渡层的滤波器和偏置。符号⊗代表卷积运算。由于xLs,s和x0,s+1'的信道数量不同，所以恒等映射并不适用。

孤立卷积（I-conv）的梯度传递问题。孤立卷积（I-conv）是式子（3）中没有恒等映射和直连接的卷积层。通过文献[8]中的实验分析与验证，它希望将深层网络的梯度直接传递到浅层网络。采用恒等映射的残差块[8]和采用直连接的密集块[13]都会促进直接梯度传递。如果存在I-conv，则深层的梯度并不能直接传递到浅层。而ResNet[8]在不同分辨率的特征之间存在I-conv，I-conv（在文献[13]中被称为过渡层）也存在于相邻的密集块之间，但是，这些方式均会阻碍梯度的直接传递。由于ResNet和DenseNet仍然存在I-conv，来自输出层的梯度并不能直接传递给浅层网络，这也类似于文献[17, 26]中的网络。文献[15]中的可逆下采样放大通过将当前阶段所有特征用于下一阶段的方式避免该问题。但是，这种方式的问题是，随着阶段数量的增加（在文献[15]中为188M），参数量将随着指数形式进行增加。通过分析，我们已经确定了现有网络中I-conv的梯度传递问题。因此，为了解决该问题，我们提出一种新的网络结构，即FishNet。

3 鱼网（FishNet）

图2展示FishNet的概述。整个网络分为三个部分：尾部、身部和头部。鱼尾部为一个现有的CNN结构，例如ResNet，随着CNN的深入，特征的分辨率会越来越小。鱼身体部位包含上采样和精细化提取块，用于精炼提取尾部和身部的特征。鱼头部包含下采样和精细化提取块，用于保存和精炼提取尾部、身部和头部的特征。头部的最后一个卷积层的精细化特征被用于最终的任务决策。

本文中的阶段是指提取相同分辨率特征的一组卷积块。根据输出特征的分辨率，FishNet的各个部分可以分为多个阶段。随着特征分辨率的减小，阶段的ID也会变高。例如，输出分辨率为56×56和28×28的卷积块分别位于FishNet三个部分中的第1阶段和第2阶段。因此，在鱼尾部和头部中，在完成网络前向传播时的阶段ID会越来越高，而在鱼身部的阶段ID会越来越小。

图3显示两个阶段的特征在尾部、身部和头部之间的相互作用。图3（a）中的鱼尾部可以看做残差网络。来自尾部的特征通过几个残差块后，也通过水平箭头传递到身部。图3（a）中的身部通过直连接既保留尾部特征，又保留身部上一阶段的特征。之后，这些特征将被用于上采样和精细化提取，具体细节如图3（b）所示，关于UR块的细节将在第3.1节中进行探讨。经过精细化后的特征随后被用于身部和头部的下一阶段。头部会保留和精细化身部和头部上一阶段的所有特征。然后，头部的下一阶段会使用精细化过的特征。头部的信息传递的详细表示如图3（c）以及在3.1节中继续探讨。水平连接表示尾部、身部和头部之间的信息传输模块。在图3（a）中，我们使用残差块作为

图3. （可以使用放大，以更好的看清颜色）（a）两个阶段的特征在尾部、身部和头部之间的相互作用，右侧所列两张图显示（b）上采样过程和精细化块（UR块），（c）下采样过程和精细化块（DR块）。在图（a）中，当垂直与水平箭头相交时，使用特征直连接。符号C*、*H和*W分别表示图像信道数、高度和宽度。k表示3.1节中方程式8中所数的信道数递减率。注意：鱼身部和头部并没有孤立卷积层（I-conv）。因此，损失的梯度可以直接传递到尾部、身部和头部的浅层网络。

传输块。

3. 1特征精细化

在FishNet中，有两个模块用于上/下采样和特征精细化：上采样和精细化模块（UR块），下采样和精细化块（DR块）。

UR块。使用xst和xsb分别表示尾部和身部在s阶段第一层的输出特征。s∈{1, 2,…,min⁡(Nt-1,Nb-1)}，Nt和Nb分别代表尾部和身部的阶段数量。将特征的直连接表示为concat(∙)。UR块可以表示为：

xs-1b=URxsb,Txst=up(xs'b) (4)

式中，T表示将尾部的特征xs-1t转移到身部的残差块。up(xs'b)表示在鱼身部对前一阶段的特征进行精细化。下一阶段的输出特征xs-1b是由xst和xsb共同精炼得到：

xs-1b=up(xs'b) (5)

xs'b=rxsb+M(xsb) (6)

xsb=concat(xsb,T(xst)) (7)

式子中，up(∙)表示上采样函数。总结，UR块在式子（7）中将来自身部和尾部的特征进行直连接并在式子（6）中完成精细化，之后，在式子（5）中进行上采样获得输出特征xs-1b。式子（6）中的M为从特征xsb中提取信息函数，我们将M作为卷积运算。类似于式子（1）中的残差函数F，式子（6）中的M也是由三层卷积构成的残差单元实现。式子（6）中的信道衰减函数r可以如下表示：

rx=x=x1,x2,…,xcout,

xn=j=0kxk∙n+j, n∈{0,1,..,cout}

(8)

式子中，x={x1, x2,…,x(cin)}表示输入特征图的cin个信道，x表示函数r的输出特征图的cout个信道，cincout=k。整体式子是从相邻的k信道到1信道的特征图像素级的求和。我们使用这样的简单操作使得信道数减少到1/ k，这种方式让连接前一阶段的信道数量减少，以减小计算量和参数量。

DR块。位于头部的DR块与UR块类似。在它们之间仅有两种不同的实现方式。第一种，我们在DR块中使用2×2最大池化层进行下采样。第二种，在DR块中，并不使用UR块中的信道衰减函数，因此在当前阶段的梯度可以直接传递给上一阶段的参数。在式子（5）-（7）的UR块基础上，DR块的可以用下式表示：

xs+1h=down(xs'h)

xs'h=xsh+M(xsh) (9)

xsh=concat(xsh,T(xsb))

式子中，xs+1h表示阶段s+1的头部特征。这样，整个网络的各个阶段的特征都能够通过直连接、跳跃连接和最大池化连接到最后一层。注意，我们并没有使用式子（6）中的信道求和操作r(∙)从式子（9）中DR块的xsh来获取xsh。因此，在DR块的xsh获取xsh的网络层实际上可以被看作为一个残差块[8]。

3. 2 详细设计与讨论

FishNet对于梯度传递问题的设计。在FishNet中设计了鱼身部和鱼头部，在鱼尾部和鱼身部的所有阶段的特征都被直连在鱼头部。我们精心设计了鱼头部的网络层，使其不存在I-conv层。鱼部的网络层由直连接、附带恒等映射的卷积层和最大池化层组成。因此，FishNet解决了之前主干网络在尾部的梯度传递问题，具体措施为（1）移除头部的I-conv层；（2）在身部和头部使用直连接。

上/下采样的选择。对于下采样，卷积核尺寸为2×2，步幅为2，以避免像素之间重叠。模型简化测试将会显示不同尺寸卷积核对网络的影响。为了避免I-conv影响，尽量不要在上采样阶段采用权重反卷积计算。为减少计算量，我们采用最近邻插值法进行上采样。由于在上采样过程中会以较低的分辨率稀释输入特征，因此，我们在精细化模块中使用扩张卷积。

鱼身部和尾部之间的桥连接模型。由于尾部将图像进行下采样得到分辨率为1×1的特征图，所以，需要在身部将1×1的特征上采样到7×7。我们在这里使用了一个SE模块[11]，即采用信道注意力机制将特征分辨率从1×1上升到7×7。

4 实验与结果

4. 1图像分类任务的实现细节

对于图像分类任务，在包含1000类的ImageNet2012数据集[25]上，我们对本文提出的网络进行了验证。此数据集包含120万张训练集和5万张验证集图像（以ImageNet-1k val表示）。我们使用目前流行的深度学习框架PyTorch[23]实现了FishNet。对于训练，我们对图像进行随机裁剪并统一分辨率为224×224，批量大小为256，并选择随机梯度下降算法作为优化方法，基础学习率为0.1。权重的衰减值和冲量值分别为10-4和0.9。我们对网络进行了100个轮次的训练，学习率每30轮次下降10倍。对于正则化过程，我们首先将每个像素值约束到[0,1]之间，然后，再减去平均值以及除以RGB模型每个信道的方差。为了公平比较，我们使用了文献[9]中的数据增强方法（随机裁剪、水平翻转和标准色增强[17]）。本文所有的实验结果都是在ImageNet-1k数据集上通过单目标验证过程得出。较为特殊的是，尺寸为224×224的图像区域会从输入图像的中心进行剪切出来，而该区域的短边会被放缩到256。224×224的图像区域为网络的输入尺寸。

FishNet是一个框架。它没有特定的构建模块。对于本文的实验验证结果，FishNet使用带有恒等映射的残差块[8]作为基础构建模块，FishNeXt使用带有恒等映射和组正则的残差块[29]作为基础构建模块。

4. 2 ImageNet数据集实验结果

图4展示了在ImageNet-1k验证数据集上，ResNet、DenseNet和FishNet三种方法的参数量与Top-1错误率的对比。当我们的网络使用预训练的ResNet参数作为FishNet尾部初始参数时，FishNet的性能远高于ResNet和DenseNet。

FishNet vs. ResNet。为了公平的对比，我们重新部署了ResNet，并在图4中展示了ResNet-50和ResNet-101的结果。在我们的报告中，带有恒等映射的ResNet-50和ResNet-101对于单目标识别的结果要高于原文[9]中的结果，主要原因是我们选择预训练的残差块参数作为网络的基本构建模型。与ResNet相比，FishNet显著地降低了错误率。而FishNet-150（错误率21.93%，参数量26.4M），其参数量仅接近ResNet-50（错误率23.78%，参数量25.5M），但是其性能却超过ResNet-101（错误率22.30%，参数量44.5M）。依据FLOPs（每秒浮点运算次数），如图4右所示，对比ResNet，FishNet也可以通过较低的FLOPs实现更好的识别效果。

FishNet vs. DenseNet。DenseNet通过直连接以迭代方式融合相同分辨率的特征，之后，通过过渡层减少每个密集块之间的维度。根据图4的结果，DenseNet可以使用更少的参数却能在识别精度上超越ResNet。由于FishNet保留了更好的多样性特征，以及合理的解决梯度传递问题，所以，FishNet比DenseNet的参数更少，而性能更好。此外，FishNet的存储成本也低于DenseNet。以FishNet-150为例，当在单个GPU上将批量大小设置为32时，FishNet-150的内存占有量为6506M，比DenseNet-161（9269M）的内存占有

图4. 分类任务Top-1（Top-5）错误率对比展示，采用方法为FishNet、DenseNet和ResNet。使用数据集为ImageNet验证集（单目标测试）。左图为参数量作为横轴，右图为FLOPs作为横轴。

表1：对于ResNeXt的结构，其在ImageNet-1k数据集的验证集上的Top-1错误率。FishNeXt-150（4d）中的4d表示一个组中最小的信道数量为4。表2：对于FishNet-150，采用不同下采样方法在ImageNet-1k数据集的验证集上的Top-1错误率。

量减小了2764M。

FishNeXt vs. ResNeXt。FishNet的结构可以与其他类型网络设计相结合，例如ResNet Xt采用的信道分组。我们的网络遵循的标准是，同一阶段的一组中每个模块（UR/DR模块和传输模块）的信道数应相同。当阶段指数增加1时，单个组的宽度增加1倍。这样，基于ResNet的FishNet可以构建成基于ResNeXt的网络，即FishNeXt。我们使用2600万个参数构建了紧凑模型FishNeXt-150。FishNeXt-150的参数量接近与ResNeXt-50。从表1中看出，与相应的ResNeXt框架相比，我们的网络将Top-1的错误率减少了0.7%。

4. 3消融学习

池化 vs. 卷积步长。我们探究了基于FishNet-150网络的四种下采样方式，包括卷积法、采用核尺寸为2×2和3×3的最大池化法、采用核尺寸为2×21的平均池化法。如表2所示，采用核尺寸为2×2的最大池化方法要优于其他方法。跨步卷积将会阻止梯度直接传递到浅层网络，而池化操作不会。我们还发现使用核尺寸为3×3的最大池化的识别效果要低于核尺寸为2×2的最大池化方法，原因是3×3的池化层内核存在池化重叠问题，可能会干扰网络的结构信息。

扩张卷积。Yu等人[32]发现空间视敏度的损失可能会限制图像分类的准确度。在FishNet中，UR块会稀疏原有的低分辨率特征，因此，在FishNet中采用扩张卷积。当在鱼身部使用扩张卷积核进行上采样时，对于FishNet-150网络的Top-1误差率下降了0.13%。但是，与未引入扩张卷积的模型相比，在鱼身部和头部均采用扩张卷积的情况下，绝对误差增加了0.1%。此外，我们将第一层的7×7的步幅卷积替换为两个残差块，这将Top-1误差率减小了0.18%。

4. 4 MS COCO数据集的实验研究

我们在MS COCO[20]数据集上评估了FishNet对目标检测和实例分割的泛化能力。为了公平对比，我们复现的所有模型实验均采用相同的设置，除了主干网络的参数设置不同。关于目标检测和实例分割任务，本文实验结果的代码与记录均公布在文献[1]中。

数据集与评价。MS COCO数据集[20]是目标检测和实例分割任务中最具有挑战性的数据集之一。数据集包含80个类别，并带有包围框和像素实例标注。

表3. MS COCO val-2017数据集，对于不同算法的的检测和分割平均精度（AP， Average Precision（%））。APs和APd分别表示分割和检测的平均精度。APS、APM和APL分别表示对于小目标、中目标和大目标的AP值。本文设计的主干网络分别应用与两种不同的分割和检测方法，例如Mask R-CNN[10]和FPN[21]。我们使用符号†表示我们复现的网络模型。FishNet-150不使用信道分组，以及它的总体参数量接近与ResNet-50和ResNeXt-50。

数据集由11.8万张训练图像（train-2017）和5千张验证图像（val-2017）组成。我们在train-2017数据上进行模型训练并在val-2017数据上得出实验结果。我们使用标准的COCO评估指标AP（不同IOU阈值下的平均mAP）[10]和APs、APM、APL（不同尺度的AP值）评价所有模型。

实验细节。我们在PyTorch[23]框架下重新复现了图像金字塔网络（FPN）和Mask R-CNN，并在表3中公布了复现的实验结果。我们复现的实验结果与Detectron[5]（官方公布的源码）实验结果相近。包括FishNet在内，我们在16个GPU上对所有网络进行训练，批量大小为16（每一个GPU包含一批），共训练32个总轮次。训练优化方法采用SGD，初始学习率为0.02，在第20轮和第28轮次学习率衰减10倍。因为批量尺寸较小，我们整个训练过程的网络中BN层[14]为固定设置。在第1个轮次进行预训练，在前2个轮次，梯度被限制在最大超参数5.0以下，用以处理初始训练阶段较大的梯度值下降。网络的输入尺寸被固定为224×224.我们使用0.0001的权重衰减值和0.9的冲量值。网络以端到端的方式进行训练和测试。实验中的所有其他超参数均遵循文献[5]的设置。

基于FPN的目标检测结果。我们将FishNet-150作为FPN主干网络对Val-2017数据进行了验证实验，以供对比。我们将FPN自上而下的路径与侧向连接与鱼头部连接，构成整体检测网络。如图3所示，相比于ResNet-50和ResNeXt-50，FishNet-150分别取得了2.6%和1.3%的AP值增加。

基于Mask R-CNN的实例分割与目标检测结果。与FPN采用类似的处理，我们将FishNet融入Mask R-CNN同时完成目标的分割与检测。如表3所示，对于实例分割任务，与ResNet-50和ResNeXt-50相比，获得了2.3%和1.3%的AP值增加。此外，当网络以这种多任务的方式进行训练时，目标检测的性能会更好。对于目标检测任务，使用FishNet的Mask R-CNN方法，相比于ResNet-50和ResNeXt-50，AP值分别提高了2.8%和1.5%。

需要注意的是，FishNet-150不使用信道分组，FishNet-150的参数量与ResNet-50和ResNeXt-50接近。与ResNeXt-50相比，对于图像分类任务，FishNet-150仅降低了0.2%d的绝对错误率，而对于目标检测和实例分割，它分别提高了1.3%和1.5%的AP值。由此可见，FishNet为目标检测区域级任务和分割的像素级任务提供了更加有效的特征。

2018年的COCO检测挑战赛。FishNet是获胜方法的主干网络之一。通过将FishNet嵌入我们的框架中，单模型FisNeXt-229可以在测试集上对实例分割任务实现43.4%的精度。

5 结论

在本文中，我们提出新的CNN网络结构，该结构结合了针对不同级别目标识别任务的网络设计的优势。特征保存和精细化处理设计不仅有助于解决直接梯度传递问题，而且对于像素级和区域级的任务更加适用。实验结果验证了我们的网络的优点。对于未来的工作，我们将对网络进行更加细致的设置，例如每个信道/模块的数量选择，以及与其他架构的网络的集成方式。未来，我们还将会报告在两个数据集上较大模型的性能结果。

参考文献

K. Chen, J. Pang, J. Wang, Y. Xiong, X. Li, S. Sun, W. Feng, Z. Liu, J. Shi, W. Ouyang, C. C. Loy, and D. Lin. mmdetection. https://github.com/ open-mmlab/mmdetection, 2018.
Y. Chen, J. Li, H. Xiao, X. Jin, S. Yan, and J. Feng. Dual path networks. In Advances in Neural Information Processing Systems, pages 4470–4478, 2017.
X. Chu, W. Ouyang, X. Wang, et al. Crf-cnn: Modeling structured information in human pose estimation. In Advances in Neural Information Processing Systems, pages 316–324, 2016.
P. Gao, H. Li, S. Li, P. Lu, Y. Li, S. C. Hoi, and X. Wang. Question-guided hybrid convolution for visual question answering. arXiv preprint arXiv:1808.02632, 2018.
R. Girshick, I. Radosavovic, G. Gkioxari, P. Dollár, and K. He. Detectron. https://github.com/facebookresearch/detectron, 2018.
P. Goyal, P. Dollár, R. Girshick, P. Noordhuis, L. Wesolowski, A. Kyrola, A. Tulloch, Y. Jia, and K. He. Accurate, large minibatch sgd: training imagenet in 1 hour. arXiv preprint arXiv:1706.02677, 2017.
B. Hariharan, P. Arbeláez, R. Girshick, and J. Malik. Hypercolumns for object segmentation and finegrained localization. In Proceedings of the IEEE conference on computer vision and pattern recognition, pages 447–456, 2015.
K. He, X. Zhang, S. Ren, and J. Sun. Identity mappings in deep residual networks. In European Conference on Computer Vision, pages 630–645. Springer, 2016.
K. He, X. Zhang, S. Ren, and J. Sun. Deep residual learning for image recognition. In CVPR, pages 770–778, 2016.
K. He, G. Gkioxari, P. Dollár, and R. Girshick. Mask r-cnn. In Computer Vision (ICCV), 2017 IEEE International Conference on, pages 2980–2988. IEEE, 2017.
J. Hu, L. Shen, and G. Sun. Squeeze-and-excitation networks. arXiv preprint arXiv:1709.01507, 2017.
G. Huang, D. Chen, T. Li, F.Wu, L. van der Maaten, and K. Q.Weinberger. Multi-scale dense convolutional networks for efficient prediction. arXiv preprint arXiv:1703.09844, 2017.
G. Huang, Z. Liu, K. Q. Weinberger, and L. van der Maaten. Densely connected convolutional networks. In Proceedings of the IEEE conference on computer vision and pattern recognition, 2017.
S. Ioffe and C. Szegedy. Batch normalization: Accelerating deep network training by reducing internal covariate shift. arXiv preprint arXiv:1502.03167, 2015.
J.-H. Jacobsen, A. Smeulders, and E. Oyallon. i-revnet: Deep invertible networks. arXiv preprint arXiv:1802.07088, 2018.
E. Kim, C. Ahn, and S. Oh. Nestednet: Learning nested sparse structures in deep neural networks. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pages 8669–8678, 2018.
A. Krizhevsky, I. Sutskever, and G. E. Hinton. Imagenet classification with deep convolutional neural networks. In Advances in neural information processing systems, pages 1097–1105, 2012.
G. Larsson, M. Maire, and G. Shakhnarovich. Fractalnet: Ultra-deep neural networks without residuals. arXiv preprint arXiv:1605.07648, 2016.
H. Li, Y. Liu, W. Ouyang, and X. Wang. Zoom out-and-in network with map attention decision for region proposal and object detection. International Journal of Computer Vision, Jun 2018. ISSN 1573-1405. doi: 10.1007/s11263-018-1101-7. https://doi.org/10.1007/s11263-018-1101-7.
T.-Y. Lin, M. Maire, S. Belongie, J. Hays, P. Perona, D. Ramanan, P. Dollár, and C. L. Zitnick. Microsoft coco: Common objects in context. In European conference on computer vision, pages 740–755. Springer, 2014.
T.-Y. Lin, P. Dollár, R. Girshick, K. He, B. Hariharan, and S. Belongie. Feature pyramid networks for object detection. In CVPR, 2017.
A. Newell, K. Yang, and J. Deng. Stacked hourglass networks for human pose estimation. In European Conference on Computer Vision, pages 483–499. Springer, 2016.
A. Paszke, S. Gross, S. Chintala, G. Chanan, E. Yang, Z. DeVito, Z. Lin, A. Desmaison, L. Antiga, and A. Lerer. Automatic differentiation in pytorch. 2017.
O. Ronneberger, P. Fischer, and T. Brox. U-net: Convolutional networks for biomedical image segmentation. In International Conference on Medical image computing and computer-assisted intervention, pages 234–241. Springer, 2015.
O. Russakovsky, J. Deng, H. Su, J. Krause, S. Satheesh, S. Ma, Z. Huang, A. Karpathy, A. Khosla, M. Bernstein, et al. Imagenet large scale visual recognition challenge. International Journal of Computer Vision, 115(3):211–252, 2015.
K. Simonyan and A. Zisserman. Very deep convolutional networks for large-scale image recognition. arXiv preprint arXiv:1409.1556, 2014.
S. Sun, Z. Kuang, L. Sheng, W. Ouyang, and W. Zhang. Optical flow guided feature: A fast and robust motion representation for video action recognition. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pages 1390–1399, 2018.
C. Szegedy, W. Liu, Y. Jia, P. Sermanet, S. Reed, D. Anguelov, D. Erhan, V. Vanhoucke, A. Rabinovich, et al. Going deeper with convolutions. In CVPR, 2015.
S. Xie, R. Girshick, P. Dollár, Z. Tu, and K. He. Aggregated residual transformations for deep neural networks. In Computer Vision and Pattern Recognition (CVPR), 2017 IEEE Conference on, pages 5987–5995. IEEE, 2017.
W. Yang, S. Li, W. Ouyang, H. Li, and X. Wang. Learning feature pyramids for human pose estimation. In arXiv preprint arXiv:1708.01101, 2017.
Y. Yang, Z. Zhong, T. Shen, and Z. Lin. Convolutional neural networks with alternately updated clique. arXiv preprint arXiv:1802.10419, 2018.
F. Yu, V. Koltun, and T. Funkhouser. Dilated residual networks. In Computer Vision and Pattern Recognition, volume 1, 2017.
F. Yu, D. Wang, and T. Darrell. Deep layer aggregation. arXiv preprint arXiv:1707.06484, 2017.
S. Zagoruyko and N. Komodakis. Wide residual networks. arXiv preprint arXiv:1605.07146, 2016.
X. Zeng, W. Ouyang, B. Yang, J. Yan, and X. Wang. Gated bi-directional cnn for object detection. In European Conference on Computer Vision, pages 354–369. Springer, 2016.
S. Zheng, S. Jayasumana, B. Romera-Paredes, V. Vineet, Z. Su, D. Du, C. Huang, and P. H. Torr. Conditional random fields as recurrent neural networks. In Proceedings of the IEEE International Conference on Computer Vision, pages 1529–1537, 2015.

37. H. Zhou, W. Ouyang, J. Cheng, X. Wang, and H. Li. Deep continuous conditional random fields with asymmetric inter-object constraints for online multi-object tracking. IEEE Transactions on Circuits and Systems for Video Technology, 2018

论文格式有问题，日后改进

你可能感兴趣的:(深度神经网络,深度学习,深度神经网络,目标检测与识别,译文)

开源模型应用落地-全能音频新纪元-Kimi-Audio-7B-Instruct-重塑多模态交互边界开源技术探险家开源模型-实际应用落地开源音视频 AIGC agi
一、前言在AI技术持续突破的2025年，音频交互正从单一任务处理迈向全场景融合的新阶段。4月27日，月之暗面（MoonshotAI）开源的Kimi-Audio-7B-Instruct，以“全能音频通才”之姿，为这一进程树立了里程碑式标杆。这款基于70亿参数架构的模型，首次在单一框架内整合语音识别（ASR）、情感分析（SER）、跨语言对话、语音生成（TTS）等十余项任务，并通过12.5Hz混合标记器
云是水波魂石岩磊简书
云是水波魂文/石岩磊人们常用“秋水”和“秋波”来比喻女人漂亮的眼睛，可两者好似也略有不同，一个侧重清澈和明亮，如成语望穿秋水，另外一个则偏重迷人与多情，像成语暗送秋波。为什么秋天的水波会和眼睛关联到一起呢？这或许是与天上的云有关吧。秋高气爽、天高云淡应该是对秋季天气最好的写照。随着昼短夜长的变化，气温开始慢慢下降，雷雨交加的气象渐行渐远，空气中令人胸闷气短的湿气变得日益稀薄，同时天上的云彩好似撒手
螺丝机器人的全球与中国市场2022-2028年：技术、参与者、趋势、市场规模及占有率研究报告麦田创投-晓晓人工智能物联网 big data
本文研究全球与中国市场螺丝机器人的发展现状及未来发展趋势，分别从生产和消费的角度分析螺丝机器人的主要生产地区、主要消费地区以及主要的生产商。重点分析全球与中国市场的主要厂商产品特点、产品规格、不同规格产品的价格、产量、产值及全球和中国市场主要生产商的市场份额。主要生产商包括：FIAMUtensiliPneumaticiSpa(1)RESIM(1)VisumaticIndustrialProduct
【031】2020.12.13 周日 Java类文件结构算法成瘾者
Java类文件结构1.无关性基石虚拟机和字节码存储格式2.Class类文件的结构2.1）定义Class文件是一组以8字节为基础单位的二进制流2.2）Class文件格式：类似于C语言结构体的伪结构存储两种数据类型无符号数u1,u2,u4,u8表_info结尾某一类型的“集合”2.3)魔数与Class文件的版本魔数定义：每个Class文件的头4个字节被称为“魔数”(magicnumber)作用：确定是
DK遇见未来：机器人祖爸
人工智能、AI、机械设计、BigData……这些听起来就很高端的专业究竟是什么？这些前沿学科相遇又会碰撞出什么？机器人，将这些前沿领域结合在一起越来越多的融入到我们的工作与生活中可问题来了机器人究竟是什么呢？又该如何给孩子讲机器人呢？这本《DK遇见未来：机器人》完美解决您的烦恼最新数据、系统知识、精美插图可以说这是一本儿童机器人大百科让孩子在这里遇见未来在讲读版视频中与您共同思考未来社会中机器人与
怎样学习2.0（也就是怎样实现自己的梦想）？希望是终结版 gjf05_05 初学者综合 google 百度
2$*******************************************************************324.怎样学习？41.前期：整体规划与局部规划52.中期：提出问题与解决问题与同行交流！63.后期:笔记（总结）。7******************************8解释1.整体规划:了解怎样实现梦想?9(也就是实现梦想大致应该做些什么？也就是把梦
高省app和返利网哪个平台返利高？高省_飞智666600
高省app的返利更高。高省app被广泛认为是返利最高的软件，它提供了高额的返利和补贴，接入京东、天猫、淘宝、拼多多、唯品会、饿了么等平台的隐藏大额优惠券和百亿补贴。高省与众多商家联盟达成合作，为用户提供购物、餐饮、休闲娱乐及本地生活服务等领域的高额返利消费优惠。此外，通过填写高省邀请码001100注册，用户可以直升2皇冠会员，享受更高的返利和更好的福利。相比之下，返利网虽然也是一款提供返利的APP
EXPLAIN：你的SQL性能优化透视镜哪里不会点哪里. MySQL sql 性能优化 oracle
目录一、EXPLAIN是什么？二、如何使用EXPLAIN？三、EXPLAIN输出解读（核心字段）四、EXPLAIN的实际应用场景五、实战优化案例六、使用EXPLAIN的注意事项与小贴士七、总结一、EXPLAIN是什么？简单来说，EXPLAIN是一条SQL命令（或命令前缀），你将它加在你的SELECT,INSERT,UPDATE,DELETE,REPLACE语句之前。数据库不会真正执行你的操作语句，
小修罗：幸福与自由的秘诀。小修罗投资
今天广州酒家暴跌，我继续把10%的承德露露仓位移了过去，目前广酒仓位占比已经是71.4%，基本就是梭哈了。这个事情和下面我要说的道理无关，只是顺便放在开头，总不能调个仓又发一篇文章吧？------------------------------前段时间我跟我妈闲聊，谈到某新区，她说新区的基建用先进的技术，又引入了多个项目，以后发展空间大，房价便宜。我问，那为什么某新区房价比市区便宜。她说是可能因为
眼中泪心中事与梦中人芦苇_2019
你知道吗？睡前想到的最后一个人睡醒想到的第一个人不是让你开心就是让你难过的人这就所谓眼中泪心中事梦中人图片发自App
今日份的晚安北渔说
无戒学堂IP营打卡第150天，1317字，累积269945字。今日份的晚安语录同样摘自花瓣志，与之共勉！你不一定非得长成玫瑰，你乐意的话，做茉莉，做蔷薇，做无名小花，做千千万万。就算公交上空无一人，司机也会把车开到终点站。我的意思是，你不要因为任何人的离开，而停止原本的生活。并不是只有鲜花才浪漫，愿意听我碎碎念也是浪漫。你来到这个世界，不是为了结婚生子、繁衍后代，而是为了看这个世界花怎么开、水怎么
拼多多购物攻略：用高省APP，轻松获得返利！高省_飞智666600
拼多多购物新纪元：高省APP助力轻松返利在拼多多这个以“拼团”闻名的购物平台上，消费者总能以超低的价格购买到心仪的商品。然而，你是否知道，在拼多多购物的同时，还可以通过高省APP获得额外的返利呢？本文将详细介绍如何通过高省APP在拼多多购物中获得返利。带你走进省钱购物的新纪元。高省APP：购物返利的神器高省APP，作为一款集优惠券领取、购物返利、分享赚钱于一体的综合性导购平台，与拼多多等主流电商平
浅谈RS232、RS422、RS485、LVDS总线仰望天空—永强 IO总线
浅谈RS232、RS422、RS485、LVDS总线在了解三种总线前，笔者认为应该先明白总线的分类，这样对总线有更清晰的概念一．总线的概念和分类：1.对总线可以分为片内总线、片间总线、系统总线、外总线片内总线：是微处理器等芯片内部各功能单元的连线（例CPU与片内存储的总线）片间总线：是微处理器等向外引出的总线（例处理器与DDR连接的总线）系统总线：主板上扩展卡与扩展卡之间连接的总线：（例如电脑两个
【手把手教学】NAS音乐远程播放从入门到精通：无需公网IP的内网穿透+手机端秒播微学AI tcp/ip 网络协议网络
文章目录前言1.本教程使用环境：2.制作音频分享链接3.制作永久固定音频分享链接：前言当您需要跨越地理界限获取家中数字资产时，本文将提供一套创新性的解决方案。通过构建智能网络架构，您可在任何场景下——无论是移动办公、差旅途中还是短途外出——实现对本地音频数据的即时访问。本方案依托于分布式网络架构设计，通过部署安全通信协议，建立设备与家庭存储中心的加密传输链路。借助先进的远程访问技术，用户可将Syn
三胡堂中医故事会第100集本能学堂a昨年
本能医学教你知冷知热：戴阳&格阳与高血压热目录1，高血压热：四季光头赤脚还嫌热2，格阳和戴阳源自《伤寒论》，临床并不少见3，格阳是真热假寒：内热伤津致热不外传4，戴阳是真寒假热：生理功能濒临衰竭正文:1，高血压热：四季光头赤脚还嫌热有一部分人，他一年四季头就是发热，他每天洗头的时候，都可以用凉水用冰水去洗头，洗了很舒服，一辈子不戴帽子，天天把这个脑袋剃得锃亮，越冷越觉得舒服，有这种人吧？与之相反，
未来的奇点冲击，人类能否永世超脱 395fadf137d6
科技的进步，在过去漫长的历史中极大地改变了我们的生活方式及产业结构。在遥远的过去，石器与土器等技术登上历史舞台时，就曾给人类的生活带来了翻天覆地的变化。在距离我们较近的时代，回首第二次世界大战后的那段时期，也可以举出几个例子来印证科技给人们的生活所带来的强烈冲击。譬如曾被日本人称为“三大神器”的黑白电视机、洗衣机、冰箱这三项耐用消费品，以及被称为“3C”的彩色电视机、空调、汽车等。在过去的短短20
Jetson平台编译Tengine space01 AIoT Jetson 人工智能深度学习计算机视觉
1.Tengine简介Tengine于2017年在GitHub（https://github.com/OAID/Tengine）开源，是OPENAILAB（开放智能）推出的自主知识产权的边缘AI计算框架，致力于解决AIoT产业链碎片化问题，加速AI产业化落地。Tengine兼容多种操作系统和深度学习算法框架，简化和加速面向场景的AI算法在嵌入式边缘设备上快速迁移，以及实际应用部署落地，可以十倍提升
函数对象 tal0n
函数对象是STL库提供的除了迭代器，迭代器配接器以外的另外一种概念。简单来说：函数对象提供了一种方法，将要调用的函数与准备传递给这个函数的隐藏参数捆绑在一起。即：该对象实现了operator()的同时还提供了部分执行时的上下文环境。下面我们通过例子来详细看下函数对象。例子STL中有一个find_if的算法实现，他的参数包括：一组表示范围的迭代器，一个用于生成bool类型值的判断式。例如我们需要在一
Java 进阶之路：探索更强大的编程世界七七&556 面试学习路线阿里巴巴 java 开发语言
在编程的浩瀚海洋中，Java如同一艘坚固的巨轮，引领着开发者们驶向创新与高效的彼岸。当我们掌握了Java的基础知识后，进阶之旅便悄然开启。一、面向对象的深入理解封装、继承与多态封装不仅仅是将数据隐藏起来，更是一种对代码的保护和组织方式。通过合理的封装，可以提高代码的可维护性和安全性。继承是代码复用的重要手段，但要避免过度继承带来的复杂性。理解继承的层次结构和正确使用继承，可以使代码更加清晰和易于扩
TypeScript 完全指南：实战与前沿技术深度解析老三不说话、前端 typescript javascript 前端
一、企业级项目架构1.微前端架构的类型治理随着微前端架构在大型项目中普及，多团队协作开发的类型统一成为难题。想象一个电商平台，购物车、商品详情等模块由不同团队开发，若类型不一致，数据交互时极易出错。通过共享d.ts声明文件，定义全局类型，如User接口、Product类型，各子应用引用统一的类型定义，确保数据格式一致。此外，借助模块联邦技术，在子应用间安全传递类型化数据，例如：//主应用定义全局类
工业物联网中的时序数据库应用
1.引言工业物联网（IndustrialInternetofThings,IIoT）通过传感器、边缘计算和云计算等技术，实现设备数据的实时采集、存储与分析，以提高生产效率、预测设备故障并优化资源管理。然而，IIoT环境通常涉及高频、海量、多源异构的时序数据，传统数据库（如MySQL、Oracle）难以满足其高吞吐写入、低延迟查询和高效存储的需求。时序数据库（Time-SeriesDatabase,
超异能族【韩剧】全集1080p超清中字免费在线观看超异能族完整未删减版百度云/夸克资源网盘免费高清链接下载全集迅雷（推荐热门剧） 6a3de85245co
近年来，韩剧以其独特的魅力在全球范围内吸引了大量粉丝。其中，一部名为《超异能族》的剧集凭借其精彩的剧情、引人入胜的角色以及独特的超能力设定，成为了不少观众的心头好。提示：文章排版原因，观影资源链接地址放在文章结尾，往下翻就行提示：文章排版原因，观影资源链接地址放在文章结尾，往下翻就行如今，该剧全集1080p超清中字版已正式上线，让我们一起穿越现实与幻想的界限，共同领略这个充满无限可能的世界。《超异
网络安全-动态风险评估工作原理、详细过程和架构及案例 hao_wujing web安全架构安全
大家读完觉得有帮助记得关注和点赞！！！动态风险评估（DynamicRiskAssessment,DRA）是一种通过实时数据采集、AI分析和闭环反馈实现风险持续演算的主动防御技术。以下从工作原理、详细过程、架构设计及行业案例展开系统性解析：一、核心工作原理1.多源数据融合与实时感知异构数据采集：整合网络流量、端点行为、环境变量（如设备指纹、地理位置）、业务日志等多维数据，构建动态基线15。环境感知驱
践行乡村支教，助力乡村振兴 bc1bd9748b57
在大数据时代，大量农村青年进城寻求机遇，在工资待遇环境各个方面追求改善，导致大批留守儿童与孤寡老人，教育环境差，师资力量薄弱，这些孩子的教育问题受到大众关注。同时，大学毕业生在求职时也更加倾向于留在大城市，发展较快的地方寻求更大的发展机遇。当然也不乏大学生回乡为新一代的成长奉献自己，通过支教或者直接就业的形式，为乡村孩子的成长奉献自己的力量。有一些有才华的人放弃自己在大城市继续深造的机会，专心于这
机器人-组成结构-感知 - 决策 - 执行具身智能-查布嘎具身智能机器人人工智能
目录一、感知系统内部传感器：外部传感器：二、智能决策系统机器学习家族1.1机器学习2.1深度学习2.2深度学习模型(主要属于监督/强化学习范畴，但结构通用)：3.1监督学习3.2监督学习模型4.1半监督学习4.2无/半监督学习模型：5.1无监督学习5.2生成模型(可属于监督/无监督)：6.1强化学习7.1其他学习三、控制系统（运控）①对应小脑和脊柱一、感知系统①对应人体的五官。由具有不同功能的各种
淘宝内部优惠卷领取？淘宝内部优惠券领取平台？氧惠全网优惠
随着网络购物的普及，越来越多的消费者开始关注如何在购物过程中节省开支。淘宝作为国内最大的电商平台之一，为了给用户提供更好的购物体验，推出了内部优惠券这一优惠方式。那么，什么是淘宝内部优惠券？如何领取淘宝内部优惠券？本文将为您一一解答。氧惠APP是与以往完全不同的抖客+淘客app！2024全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（训练营导师每天出单带货几万单）。注册
深度学习篇---矩阵 Atticus-Orion 嵌入式知识篇上位机知识篇嵌入式硬件篇深度学习矩阵人工智能
在机械臂解算、深度学习网络等硬件和软件领域中，矩阵运算作为核心数学工具，承担着数据表示、变换、映射和优化的关键作用。以下从具体领域出发，详细总结涉及的矩阵运算及对应的核心知识：一、机械臂解算领域机械臂解算（运动学、动力学分析）的核心是描述“关节空间”与“操作空间”的映射关系，矩阵运算用于精准刻画坐标系转换、运动传递和力/力矩分析。1.运动学解算（正/逆运动学）核心目标：通过矩阵描述关节角度与末端执
飞算JavaAI：力臻开发之本真，破 AI 代码之繁琐，传统项目一键生成微学AI 人工智能 java javaAI
飞算JavaAI：力臻开发之本真，破AI代码之繁琐，传统项目一键生成文章目录飞算JavaAI：力臻开发之本真，破AI代码之繁琐，传统项目一键生成一、前言二、飞算JavaAI是什么？2.1背景与实力2.2飞算JavaAI的“独门绝技”三、飞算JavaAI实战体验3.1IDEA插件安装配置3.2Main中写一个简单的梯度下降算法3.3main函数搭建一个卷积神经网络网络3.4飞算JavaAI：需求分析
PyCharm 高效入门指南：从安装到进阶，解锁 Python 开发全流程
作为Python开发者的利器，PyCharm的安装与配置是开启高效编程之旅的第一步。面对Community和Professional两个版本，该如何选择呢？Community版是免费开源的，适合初学者和简单项目开发，包含基础的Python开发功能；而Professional版虽收费，但功能更强大，支持Web开发、数据库连接等高级功能，适合专业开发者和复杂项目。1.安装与配置下载与安装下载PyCha
可信数据空间：概念、架构与应用实践小赖同学啊 test Technology Precious 架构
可信数据空间：概念、架构与应用实践一、可信数据空间的核心定义可信数据空间（TrustedDataSpace）是一种基于技术架构与制度设计的安全数据共享生态，通过构建“数据可用不可见、可控可追溯”的流通环境，解决数据要素市场化过程中的隐私保护、主权确认、流通合规等核心问题。其本质是通过密码学、区块链、智能合约等技术组合，实现数据在不同主体间的可信交互，同时保障数据所有者的权益与安全。二、核心技术要素
windows下源码安装golang 616050468 golang安装 golang环境 windows
系统： 64位win7，开发环境：sublime text 2， go版本： 1.4.1 1. 安装前准备(gcc, gdb, git) golang在64位系
redis批量删除带空格的key bylijinnan redis
redis批量删除的通常做法： redis-cli keys "blacklist*" | xargs redis-cli del 上面的命令在key的前后没有空格时是可以的，但有空格就不行了： $redis-cli keys "blacklist*" 1) "blacklist:12: [email protected]
oracle正则表达式的用法 0624chenhong oracle 正则表达式
方括号表达示方括号表达式描述 [[:alnum:]] 字母和数字混合的字符 [[:alpha:]] 字母字符 [[:cntrl:]] 控制字符 [[:digit:]] 数字字符 [[:graph:]] 图像字符 [[:lower:]] 小写字母字符 [[:print:]] 打印字符 [[:punct：]] 标点符号字符 [[:space:]]
2048源码(核心算法有，缺少几个anctionbar，以后补上) 不懂事的小屁孩 2048
2048游戏基本上有四部分组成， 1：主activity，包含游戏块的16个方格，上面统计分数的模块 2：底下的gridview，监听上下左右的滑动，进行事件处理， 3：每一个卡片，里面的内容很简单，只有一个text，记录显示的数字 4：Actionbar，是游戏用重新开始，设置等功能(这个在底下可以下载的代码里面还没有实现) 写代码的流程 1：设计游戏的布局，基本是两块，上面是分
jquery内部链式调用机理换个号韩国红果果 JavaScript jquery
只需要在调用该对象合适(比如下列的setStyles)的方法后让该方法返回该对象（通过this 因为一旦一个函数称为一个对象方法的话那么在这个方法内部this（结合下面的setStyles）指向这个对象） function create(type){ var element=document.createElement(type); //this=element;
你订酒店时的每一次点击背后都是NoSQL和云计算蓝儿唯美 NoSQL
全球最大的在线旅游公司Expedia旗下的酒店预订公司，它运营着89个网站，跨越68个国家，三年前开始实验公有云，以求让客户在预订网站上查询假期酒店时得到更快的信息获取体验。云端本身是用于驱动网站的部分小功能的，如搜索框的自动推荐功能，还能保证处理Hotels.com服务的季节性需求高峰整体储能。 Hotels.com的首席技术官Thierry Bedos上个月在伦敦参加“2015 Clou
java笔记1 a-john java
1，面向对象程序设计（Object-oriented Propramming，OOP）：java就是一种面向对象程序设计。 2，对象：我们将问题空间中的元素及其在解空间中的表示称为“对象”。简单来说，对象是某个类型的实例。比如狗是一个类型，哈士奇可以是狗的一个实例，也就是对象。 3，面向对象程序设计方式的特性： 3.1 万物皆为对象。
C语言 sizeof和strlen之间的那些事 C/C++软件开发求职面试题必备考点（一） aijuans C/C++求职面试必备考点
找工作在即，以后决定每天至少写一个知识点，主要是记录，逼迫自己动手、总结加深印象。当然如果能有一言半语让他人收益，后学幸运之至也。如有错误，还希望大家帮忙指出来。感激不尽。后学保证每个写出来的结果都是自己在电脑上亲自跑过的，咱人笨，以前学的也半吊子。很多时候只能靠运行出来的结果再反过来
程序员写代码时就不要管需求了吗？ asia007 程序员不能一味跟需求走
编程也有2年了，刚开始不懂的什么都跟需求走，需求是怎样就用代码实现就行，也不管这个需求是否合理，是否为较好的用户体验。当然刚开始编程都会这样，但是如果有了2年以上的工作经验的程序员只知道一味写代码，而不在写的过程中思考一下这个需求是否合理，那么，我想这个程序员就只能一辈写敲敲代码了。我的技术不是很好，但是就不代
Activity的四种启动模式百合不是茶 android 栈模式启动 Activity的标准模式启动栈顶模式启动单例模式启动
android界面的操作就是很多个activity之间的切换,启动模式决定启动的activity的生命周期 ; 启动模式xml中配置 <activity android:name=".MainActivity" android:launchMode="standard&quo
Spring中@Autowired标签与@Resource标签的区别 bijian1013 java spring @Resource @Autowired @Qualifier
Spring不但支持自己定义的@Autowired注解，还支持由JSR-250规范定义的几个注解，如：@Resource、 @PostConstruct及@PreDestroy。 1. @Autowired @Autowired是Spring 提供的，需导入 Package:org.springframewo
Changes Between SOAP 1.1 and SOAP 1.2 sunjing Changes Enable SOAP 1.1 SOAP 1.2
JAX-WS SOAP Version 1.2 Part 0: Primer (Second Edition) SOAP Version 1.2 Part 1: Messaging Framework (Second Edition) SOAP Version 1.2 Part 2: Adjuncts (Second Edition) Which style of WSDL
【Hadoop二】Hadoop常用命令 bit1129 hadoop
以Hadoop运行Hadoop自带的wordcount为例， hadoop脚本位于/home/hadoop/hadoop-2.5.2/bin/hadoop，需要说明的是，这些命令的使用必须在Hadoop已经运行的情况下才能执行 Hadoop HDFS相关命令 hadoop fs -ls 列出HDFS文件系统的第一级文件和第一级
java异常处理（初级）白糖_ java DAO spring 虚拟机 Ajax
从学习到现在从事java开发一年多了，个人觉得对java只了解皮毛，很多东西都是用到再去慢慢学习，编程真的是一项艺术，要完成一段好的代码，需要懂得很多。最近项目经理让我负责一个组件开发，框架都由自己搭建，最让我头疼的是异常处理，我看了一些网上的源码，发现他们对异常的处理不是很重视，研究了很久都没有找到很好的解决方案。后来有幸看到一个200W美元的项目部分源码，通过他们对异常处理的解决方案，我终
记录整理-工作问题 braveCS 工作
1）那位同学还是CSV文件默认Excel打开看不到全部结果。以为是没写进去。同学甲说文件应该不分大小。后来log一下原来是有写进去。只是Excel有行数限制。那位同学进步好快啊。 2）今天同学说写文件的时候提示jvm的内存溢出。我马上反应说那就改一下jvm的内存大小。同学说改用分批处理了。果然想问题还是有局限性。改jvm内存大小只能暂时地解决问题，以后要是写更大的文件还是得改内存。想问题要长远啊
org.apache.tools.zip实现文件的压缩和解压，支持中文 bylijinnan apache
刚开始用java.util.Zip，发现不支持中文（网上有修改的方法，但比较麻烦）后改用org.apache.tools.zip org.apache.tools.zip的使用网上有更简单的例子下面的程序根据实际需求，实现了压缩指定目录下指定文件的方法 import java.io.BufferedReader; import java.io.BufferedWrit
读书笔记-4 chengxuyuancsdn 读书笔记
1、JSTL 核心标签库标签 2、避免SQL注入 3、字符串逆转方法 4、字符串比较compareTo 5、字符串替换replace 6、分拆字符串 1、JSTL 核心标签库标签共有13个，学习资料：http://www.cnblogs.com/lihuiyy/archive/2012/02/24/2366806.html 功能上分为4类： (1)表达式控制标签：out
[物理与电子]半导体教材的一个小问题 comsci 问题
各种模拟电子和数字电子教材中都有这个词汇-空穴书中对这个词汇的解释是; 当电子脱离共价键的束缚成为自由电子之后,共价键中就留下一个空位,这个空位叫做空穴我现在回过头翻大学时候的教材,觉得这个
Flashback Database --闪回数据库 daizj oracle 闪回数据库
Flashback 技术是以Undo segment中的内容为基础的，因此受限于UNDO_RETENTON参数。要使用flashback 的特性，必须启用自动撤销管理表空间。在Oracle 10g中， Flash back家族分为以下成员： Flashback Database， Flashback Drop，Flashback Query(分Flashback Query,Flashbac
简单排序:插入排序 dieslrae 插入排序
public void insertSort(int[] array){ int temp; for(int i=1;i<array.length;i++){ temp = array[i]; for(int k=i-1;k>=0;k--)
C语言学习六指针小示例、一维数组名含义，定义一个函数输出数组的内容 dcj3sjt126com c
# include <stdio.h> int main(void) { int * p; //等价于 int *p 也等价于 int* p; int i = 5; char ch = 'A'; //p = 5; //error //p = &ch; //error //p = ch; //error p = &i; //
centos下php redis扩展的安装配置3种方法 dcj3sjt126com redis
方法一 1.下载php redis扩展包代码如下复制代码 #wget http://redis.googlecode.com/files/redis-2.4.4.tar.gz 2 tar -zxvf 解压压缩包，cd /扩展包（进入扩展包然后运行phpize 一下是我环境中phpize的目录，/usr/local/php/bin/phpize (一定要
线程池(Executors) shuizhaosi888 线程池
在java类库中，任务执行的主要抽象不是Thread，而是Executor，将任务的提交过程和执行过程解耦 public interface Executor { void execute(Runnable command); } public class RunMain implements Executor{ @Override pub
openstack 快速安装笔记 haoningabc openstack
前提是要配置好yum源版本icehouse，操作系统redhat6.5 最简化安装，不要cinder和swift 三个节点 172 control节点keystone glance horizon 173 compute节点nova 173 network节点neutron control /etc/sysctl.conf net.ipv4.ip_forward =
从c面向对象的实现理解c++的对象（二） jimmee C++面向对象虚函数
1. 类就可以看作一个struct，类的方法，可以理解为通过函数指针的方式实现的，类对象分配内存时，只分配成员变量的，函数指针并不需要分配额外的内存保存地址。 2. c++中类的构造函数，就是进行内存分配(malloc)，调用构造函数 3. c++中类的析构函数，就时回收内存(free) 4. c++是基于栈和全局数据分配内存的，如果是一个方法内创建的对象，就直接在栈上分配内存了。专门在
如何让那个一个div可以拖动 lingfeng520240 html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml
第10章高级事件（中） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
计算两个经纬度之间的距离 roadrunners 计算纬度 LBS 经度距离
要解决这个问题的时候，到网上查了很多方案，最后计算出来的都与百度计算出来的有出入。下面这个公式计算出来的距离和百度计算出来的距离是一致的。 /** * * @param longitudeA * 经度A点 * @param latitudeA * 纬度A点 * @param longitudeB *
最具争议的10个Java话题 tomcat_oracle java
1、Java8已经到来。什么！？ Java8 支持lambda。哇哦，RIP Scala！　　随着Java8 的发布，出现很多关于新发布的Java8是否有潜力干掉Scala的争论，最终的结论是远远没有那么简单。Java8可能已经在Scala的lambda的包围中突围，但Java并非是函数式编程王位的真正觊觎者。　　2、Java 9 即将到来　　 Oracle早在8月份就发布
zoj 3826 Hierarchical Notation(模拟) 阿尔萨斯 rar
题目链接：zoj 3826 Hierarchical Notation 题目大意：给定一些结构体，结构体有value值和key值，Q次询问，输出每个key值对应的value值。解题思路：思路很简单，写个类词法的递归函数，每次将key值映射成一个hash值，用map映射每个key的value起始终止位置，预处理完了查询就很简单了。这题是最后10分钟出的，因为没有考虑value为{}的情