纯氧゜

Faster R-CNN论文翻译

摘要最先进的目标检测网络依赖于区域建议算法来假设目标位置。像SPPnet[1]和Fast R-CNN[2]这样的进步已经减少了这些检测网络的运行时间，暴露了区域提议计算作为一个瓶颈。在本工作中，我们引入了一个区域建议网络(RPN)，它与检测网络共享全图像卷积特征，从而实现几乎免费的区域建议。RPN是一个完全卷积的网络，它可以同时预测每个位置上的对象界限和对象评分。对RPN进行端到端训练以生成高质量的区域建议，Fast R-CNN使用这些区域建议进行检测。通过共享它们的卷积特征，我们进一步将RPN和Fast R-CNN合并成一个单独的网络——使用最近流行的带有“注意”机制的神经网络术语，RPN组件告诉统一的网络去哪里寻找。对于非常深的vg -16模型[3]，我们的检测系统在GPU上的帧率为5fps(包括所有步骤)，同时在P ASCAL VOC 2007、2012和MS COCO数据集上实现了最先进的目标检测精度，每张图像只有300个建议。在ILSVRC和COCO 2015比赛中，Faster R-CNN和RPN是在几条赛道上获得第一名的参赛作品的基础。代码已经公开。

1介绍

区域建议方法(例如[4])和基于区域的卷积神经网络(RCNNs)[5]的成功推动了目标检测的最新进展。虽然在[5]中开发的基于区域的cnn在计算上很昂贵，但由于在提案[1]和[2]中共享卷积，它们的成本已经大大降低。最新的版本，Fast R-CNN[2]，在忽略花费在区域提议上的时间时，使用非常深的网络[3]实现了接近实时的速率。现在，建议是最先进的检测系统的测试时间计算瓶颈。

区域建议方法通常依赖于廉价的特性和经济的推理方案。选择性搜索[4]是目前最流行的一种基于设计低级特征的超像素融合方法。然而，与高效的检测网络[2]相比，选择性搜索速度要慢一个数量级，在CPU实现中每幅图像只需要2秒。EdgeBoxes[6]目前提供了建议质量和速度之间的最佳权衡，每幅图像0.2秒。然而，区域提议步骤仍然消耗与检测网络相同的运行时间。

人们可能会注意到，快速的基于区域的cnn利用gpu，而研究中使用的区域建议方法是在CPU上实现的，这使得这种运行时比较不公平。加速提议计算的一个显而易见的方法是为GPU重新实现它。这可能是一个有效的工程解决方案，但重新实现忽略了下游检测网络，因此错过了共享计算的重要机会。

在这篇论文中，我们证明了一种算法的改变-使用深度卷积神经网络计算建议-导致了一种优雅和有效的解决方案，在给定检测网络的计算的情况下，建议计算几乎是免费的。为此，我们引入了新的区域提议网络(RPNs)，它与最先进的目标检测网络[1]，[2]共享卷积层。通过在测试时共享卷积，计算方案的边际成本很小(例如，每幅图像10毫秒)。

我们的观察是，基于区域的检测器使用的卷积特征地图，如Fast RCNN，也可以用于生成区域建议。在这些卷积特征的基础上，我们通过添加几个额外的卷积层来构建RPN，这些卷积层同时回归正则网格上每个位置的区域边界和目标度得分。因此，RPN是一种完全卷积网络(FCN)[7]，可以针对生成检测方案的任务进行端到端训练。

rpn被设计用来有效地预测具有广泛尺度和宽高比的区域提案。与流行的[8]、[9]、[1]、[2]方法相比图像金字塔(图1,a)或过滤器金字塔(图1,b)，我们引入了新颖的“锚”框，在多个尺度和宽高比下作为参考。我们的方案可以看作是一个回归参考的金字塔(图1,c)，它避免了枚举多个尺度或长宽比的图像或过滤器。该模型在使用单尺度图像进行训练和测试时表现良好，因此有利于提高运行速度。

图1:针对多个规模和规模的不同方案。(a)建立图像和地形图的金字塔，分类器在所有比例尺上运行。(b)在地形图上运行多比例尺/大小的滤波器金字塔。(c)我们在回归函数中使用参考框金字塔。

为了将rpn与Fast R-CNN[2]目标检测网络相结合，我们提出了一种交替进行区域建议任务微调和目标检测微调的训练方案，同时保持建议固定。该方案快速收敛，并产生一个统一的具有卷积特征的网络，在两个任务之间共享

我们在PASCAL VOC检测基准[11]上综合评估了我们的方法，其中带有Fast r - cnn的RPNs产生的检测精度优于带有Fast r - cnn的强基线选择性搜索。同时，我们的方法在测试时几乎免除了选择性搜索的所有计算负担——提案的有效运行时间仅为10毫秒。使用昂贵的非常深入的模型[3]，我们的检测方法在GPU上的帧率仍然是5fps(包括所有步骤)，因此在速度和精度方面都是一个实用的对象检测系统。我们还报告了MS COCO数据集[12]的结果，并研究了利用COCO数据对PASCAL VOC的改进。代码已在https://github.com/shaoqingren/faster_ rcnn (MATLAB版本)和https://github.com/ rbgirshick/py-faster-rcnn (Python版本)上公开。

这篇手稿的初步版本在[10]之前出版过。从那时起，RPN和Faster R-CNN框架被采用并推广到其他方法，如3D物体检测[13]，基于部分的检测[14]，实例分割[15]，图像字幕[16]。我们的快速有效的目标检测系统也已经建成比如pinterest[17]的商业系统，据报道用户参与度有所提高。

在ILSVRC和COCO 2015比赛中，Faster R-CNN和RPN是[18]在ImageNet检测、ImageNet定位、COCO检测和COCO分割方面获得的几项第一名的基础。rpn完全学会从数据中提出区域，因此可以很容易地受益于更深层次和更有表现力的特征(如[18]中采用的101层残余网)。更快的R-CNN和RPN在这些比赛中也被其他几个领先的参赛者使用。这些结果表明，我们的方法不仅是一种性价比高的解决方案，而且是一种提高目标检测精度的有效方法。

2相关工作

对象的建议。有大量关于对象提议方法的文献。对象提议方法的全面调查和比较可以在[19]，[20]，[21]中找到。广泛使用的对象建议方法包括基于分组超像素的方法(如Selective Search[4]、CPMC[22]、MCG[23])和基于滑动窗口的方法(如windows[24]、EdgeBoxes[6]中的objectness)。对象建议方法作为独立于检测器的外部模块(如Selective Search [4] Object detector, RCNN [5]， Fast R-CNN[2])。

面向对象检测的深度网络。R-CNN方法[5]对cnn进行端到端的训练，将提议区域分类为对象类别或背景。R-CNN主要作为分类器，不预测对象边界(除了通过边界盒回归细化)。它的准确性取决于区域提议模块的性能(参见[20]中的比较)。有几篇论文提出了使用深度网络预测对象边界框[25]，[9]，[26]，[27]的方法。在OverFeat方法[9]中，训练一个完全连接的层来预测假设为单个对象的定位任务的盒子坐标。然后将完全连接的层翻转进入一个卷积层，用于检测多个特定类的对象。MultiBox方法[26]，[27]从网络中生成区域建议，该网络的最后一个全连接层同时预测多个类不可知的盒子，概括了OverFeat的“单盒子”方式。R-CNN[5]的提案中使用了这些与阶级无关的盒子。MultiBox提议网络应用于单个图像收割或多个大型图像收割(例如，224×224)，与我们的完全卷积方案相反。MultiBox在提议和检测网络之间不具有共享特性。我们将在后面的上下文中更深入地讨论OverFeat和MultiBox。与我们的工作同时，DeepMask方法[28]被开发用于学习分割建议。

卷积[9]，[1]，[29]，[7]，[2]的共享计算因为高效而准确的视觉识别而受到越来越多的关注。OverFeat论文[9]计算来自图像金字塔的卷积特征，用于分类、定位和检测。针对基于区域的目标检测[1]、[30]和语义分割[29]，在共享卷积特征地图上开发了自适应大小的池化(SPP)[1]。快速R-CNN[2]使端到端检测器训练共享卷积特征，并显示引人注目的准确性和速度。

3 FASTER R-CNN

我们的目标检测系统叫做Faster R-CNN，由两个模块组成。第一个模块是提出区域的深度全卷积网络，第二个模块是使用提出的区域的Fast R-CNN检测器[2]。整个系统是一个用于目标检测的单一、统一的网络(图2)。RPN模块使用了最近流行的神经网络术语“注意”[31]机制，告诉Fast R-CNN模块去哪里寻找。在3.1节中，我们介绍了区域方案的网络设计和特性。在第3.2节中，我们开发了用于训练具有共享特性的两个模块的算法。

图2;R-CNN是一个单一的、统一的目标检测网络。RPN模块作为这个统一网络的“注意力”。

3.1区域提议网络

一个区域建议网络(RPN)以一幅(任何大小)的图像作为输入，并输出一组矩形对象建议，每个建议都有一个对象性评分。3我们用一个完全卷积网络[7]对这个过程进行建模，在本节中我们将对此进行描述。因为我们的最终目标是与Fast R-CNN对象检测网络[2]共享计算，我们假设这两个网络共享一个共同的卷积层集。在我们的实验中，我们研究了Zeiler and Fergus模型[32](ZF)，它有5个可共享的卷积层，以及Simonyan and Zisserman模型[3](vg -16)，它有13个可共享的卷积层

为了生成区域建议，我们在最后一个共享卷积层输出的卷积特征地图上滑动一个小网络。这个小网络以输入的卷积特征图的n × n空间窗口作为输入。每个滑动窗口映射到一个低维特征(ZF为256-d, VGG为512-d，下面是ReLU[33])。这个特性被输入到两个同级的完全连接的层—盒子回归层(reg)和盒子分类层(cls)。在本文中，我们使用n = 3，注意到输入图像上的有效接受场很大(ZF和VGG分别为171和228像素)。这个微型网络在图3(左)的一个位置上进行了说明。请注意，由于微型网络以滑动窗口方式运行，完全连接的层在所有空间位置上共享。这个体系结构自然是通过n×n卷积层和两个同胞的1× 1卷积层(分别用于reg和cls)来实现的

3.1.1 Anchors

在每个滑动窗口的位置,我们同时预测多个地区的提议,在最大可能的提案的数量为每个位置表示为k。所以reg层4 k输出编码k框的坐标,和cls层输出2 k分数估计为每个proposal4对象或对象的概率。k个建议是相对于k个参考框参数化的，我们称之为anchors.锚点位于滑动窗口的中心，并与比例和长宽比相关联(图3，左)。默认情况下，我们使用3个尺度和3个纵横比，在每个滑动位置产生k = 9个锚。对于大小为W × H(通常约为2400)的卷积特征图，总共有whk锚点。

图3:左:区域提议网络(RPN)。正确:在PASCAL VOC 2007测试中使用RPN方案的检测示例。我们的方法检测对象在一个广泛的尺度和长宽比。

T ranslation-Invariant Anchors

我们的方法的一个重要特性是它是平移不变的，就锚和计算相对于锚的建议的函数而言都是如此。如果一个人翻译了图像中的一个对象，建议应该翻译，并且相同的功能应该能够预测任何位置的建议。我们的方法保证了这种平移不变的特性。作为比较，MultiBox方法[27]使用k-means生成800个锚，这些锚不是平移不变的。因此，MultiBox不能保证在翻译对象时会生成相同的建议。

平移不变属性还会减小模型大小。MultiBox具有(4 + 1)×800维全连接输出层，而我们的方法在k = 9锚的情况下具有(4 + 2) × 9维卷积输出层。因此，我们的输出层具有2.8×10^4个参数(对于VGG-16为512 × (4 + 2) × 9)，比多盒的输出层具有6.1×10^6个参数(对于多盒[27]中的GoogleNet [34]为1536 × (4 + 1) × 800)少了两个数量级。如果考虑要素投影图层，我们的建议图层的参数仍然比MultiBox6少一个数量级。我们希望我们的方法在像PASCAL VOC这样的小数据集上具有较小的过度拟合风险。

作为回归参考的多尺度锚点

我们的锚的设计提出了一个解决多尺度(和长宽比)的新方案。如图1所示，多尺度预测有两种流行的方法。第一种方法基于图像/特征金字塔，例如在DPM [8]和CNNbased方法[9]，[1]，[2]中。在多个比例下调整图像的大小，并为每个比例计算特征图(HOG [8]或深度卷积特征[9]，[1]，[2])(图1(a))。这种方法通常很有用，但很耗时。第二种方法是在要素地图上使用多比例(和/或宽高比)的滑动窗口。例如，在DPM [8]中，使用不同的滤波器大小(如5×7和7×5)分别训练不同纵横比的模型。如果用这种方法来处理多个尺度，它可以被认为是一个“过滤器金字塔”(图1(b))。第二种方式通常与第一种方式联合采用[8]。

相比之下，我们基于锚的方法是建立在锚的金字塔上的，这更具成本效益。我们的方法参考多尺度和宽高比的定位框对边界框进行分类和回归。它只依赖单一比例的图像和要素图，并使用单一大小的过滤器(要素图上的滑动窗口)。我们通过实验展示了该方案对解决多种规模和大小的影响(表8)。

由于这种基于锚的多尺度设计，我们可以简单地使用在单尺度图像上计算的卷积特征，快速R-CNN检测器也是这样做的[2]。多尺度锚的设计是共享特征的关键组成部分，而不需要额外的寻址尺度成本。

3.1.2 Loss Function

对于训练rpn，我们给每个锚点分配一个二进制类标签(是否是对象)。我们为两种锚指定了一个正标签:(I)具有最高交叉-重叠(IoU)的锚与一个地面真值框重叠，或者(ii)具有高于0.7的IoU的锚与5个地面真值框重叠。请注意，单个地面真相框可能会为多个锚点分配正标签。通常第二个条件足以确定阳性样本；但是我们仍然采用第一个条件，因为在一些罕见的情况下，第二个条件可能找不到阳性样本。如果所有基本事实框的IoU比都低于0.3，我们会将负标签分配给非正锚点。既不积极也不消极的主播对培训目标没有贡献。

有了这些定义，我们最小化了一个目标 Fast R-CNN 中的多任务损失函数 [2]。我们对图像的损失函数定义为：

其中， ii是一个小批量数据中锚点的索引，pipi是锚点 ii作为目标的预测概率。如果锚点为正，真实标签p\*ipi\*为1，如果锚点为负，则为0。 titi是表示预测边界框4个参数化坐标的向量，而 t\*iti\*是与正锚点相关的真实边界框的向量。分类损失 LclsLcls是两个类别上（目标或不是目标）的对数损失。对于回归损失，我们使用 Lreg(ti,t\*i)=R(ti−t\*i)Lreg(ti,ti\*)=R(ti−ti\*)，其中 RR是在[2]中定义的鲁棒损失函数（平滑L1L1）。项 p\*iLregpi\*Lreg表示回归损失仅对于正锚点激活，否则被禁用（ p\*i=0pi\*=0）。 cls和 reg层的输出分别由 {pi}{pi}和 {ti}{ti}组成。

这两个项用NclsNcls和NregNreg进行标准化，并由一个平衡参数λλ加权。在我们目前的实现中（如在发布的代码中），方程（1）中的clscls项通过小批量数据的大小（即Ncls=256Ncls=256）进行归一化，regreg项根据锚点位置的数量（即，Nreg∼24000Nreg∼24000）进行归一化。默认情况下，我们设置λ=10λ=10，因此cls和reg项的权重大致相等。我们通过实验显示，结果对宽范围的λλ值不敏感(表9)。我们还注意到，上面的归一化不是必需的，可以简化。

表9：Faster R-CNN使用方程(1)中不同的λλ值在PASCAL VOC 2007测试集上的检测结果。网络是VGG-16。训练数据是VOC 2007训练集。使用λ=10λ=10（69.9%69.9%）的默认设置与表3中的相同。

对于边界框回归，我们采用[5]中的4个坐标参数化：

其中， xx，yy， ww和hh表示边界框的中心坐标及其宽和高。变量 xx，xaxa和 x\*x\*分别表示预测边界框，锚盒和实际边界框（类似于 y,w,hy,w,h）。这可以被认为是从锚盒到邻近的实际边界框的回归。

然而，我们的方法通过与之前的基于RoI（感兴趣区域）方法[1]，[2]不同的方式来实现边界框回归。在[1]，[2]中，对任意大小的RoI池化的特征执行边界框回归，并且回归权重由所有区域大小共享。在我们的公式中，用于回归的特征在特征映射上具有相同的空间大小（3×3）。为了说明不同的大小，学习一组kk个边界框回归器。每个回归器负责一个尺度和一个长宽比，而kk个回归器不共享权重。因此，由于锚点的设计，即使特征具有固定的尺度/比例，仍然可以预测各种尺寸的边界框。

3.1.3 训练RPN

RPN可以通过反向传播和随机梯度下降（SGD）进行端对端训练[35]。我们遵循[2]的“以图像为中心”的采样策略来训练这个网络。每个小批量数据都从包含许多正面和负面示例锚点的单张图像中产生。对所有锚点的损失函数进行优化是可能的，但是这样会偏向于负样本，因为它们是占主导地位的。取而代之的是，我们在图像中随机采样256个锚点，计算一个小批量数据的损失函数，其中采样的正锚点和负锚点的比率可达1:1。如果图像中的正样本少于128个，我们使用负样本填充小批量数据。

我们通过从标准方差为0.01的零均值高斯分布中提取权重来随机初始化所有新层。所有其他层（即共享卷积层）通过预训练的ImageNet分类模型[36]来初始化，如同标准实践[5]。我们调整ZF网络的所有层，以及VGG网络的conv3_1及其之上的层以节省内存[2]。对于60k的小批量数据，我们使用0.001的学习率，对于PASCAL VOC数据集中的下一个20k小批量数据，使用0.0001。我们使用0.9的动量和0.0005的重量衰减[37]。我们的实现使用Caffe[38]。

3.2 RPN和Fast R-CNN共享特征

到目前为止，我们已经描述了如何训练用于区域提议生成的网络，没有考虑将利用这些提议的基于区域的目标检测CNN。对于检测网络，我们采用Fast R-CNN[2]。接下来我们介绍一些算法，学习由RPN和Fast R-CNN组成的具有共享卷积层的统一网络（图2）。

独立训练的RPN和Fast R-CNN将以不同的方式修改卷积层。因此，我们需要开发一种允许在两个网络之间共享卷积层的技术，而不是学习两个独立的网络。我们讨论三个方法来训练具有共享特征的网络：

一、交替训练。在这个解决方案中，我们首先训练RPN，并使用这些提议来训练Fast R-CNN。由Fast R-CNN微调的网络然后被用于初始化RPN，并且重复这个过程。这是本文所有实验中使用的解决方案。

二、近似联合训练。在这个解决方案中，RPN和Fast R-CNN网络在训练期间合并成一个网络，如图2所示。在每次SGD迭代中，前向传递生成区域提议，在训练Fast R-CNN检测器将这看作是固定的、预计算的提议。反向传播像往常一样进行，其中对于共享层，组合来自RPN损失和Fast R-CNN损失的反向传播信号。这个解决方案很容易实现。但是这个解决方案忽略了关于提议边界框的坐标（也是网络响应）的导数，因此是近似的。在我们的实验中，我们实验发现这个求解器产生了相当的结果，与交替训练相比，训练时间减少了大约25−50%25−50%。这个求解器包含在我们发布的Python代码中。

三、非近似的联合训练。如上所述，由RPN预测的边界框也是输入的函数。Fast R-CNN中的RoI池化层[2]接受卷积特征以及预测的边界框作为输入，所以理论上有效的反向传播求解器也应该包括关于边界框坐标的梯度。在上述近似联合训练中，这些梯度被忽略。在一个非近似的联合训练解决方案中，我们需要一个关于边界框坐标可微分的RoI池化层。这是一个重要的问题，可以通过[15]中提出的“RoI扭曲”层给出解决方案，这超出了本文的范围。

四步交替训练。在本文中，我们采用实用的四步训练算法，通过交替优化学习共享特征。在第一步中，我们按照3.1.3节的描述训练RPN。该网络使用ImageNet的预训练模型进行初始化，并针对区域提议任务进行了端到端的微调。在第二步中，我们使用由第一步RPN生成的提议，由Fast R-CNN训练单独的检测网络。该检测网络也由ImageNet的预训练模型进行初始化。此时两个网络不共享卷积层。在第三步中，我们使用检测器网络来初始化RPN训练，但是我们修正共享的卷积层，并且只对RPN特有的层进行微调。现在这两个网络共享卷积层。最后，保持共享卷积层的固定，我们对Fast R-CNN的独有层进行微调。因此，两个网络共享相同的卷积层并形成统一的网络。类似的交替训练可以运行更多的迭代，但是我们只观察到可以忽略的改进。

3.3 实现细节

我们在单尺度图像上训练和测试区域提议和目标检测网络[1]，[2]。我们重新缩放图像，使得它们的短边是s=600s=600像素[2]。多尺度特征提取（使用图像金字塔）可能会提高精度，但不会表现出速度与精度的良好折衷[2]。在重新缩放的图像上，最后卷积层上的ZF和VGG网络的总步长为16个像素，因此在调整大小（〜500×375）之前，典型的PASCAL图像上的总步长为〜10个像素。即使如此大的步长也能提供良好的效果，尽管步幅更小，精度可能会进一步提高。

对于锚点，我们使用了3个尺度，边界框面积分别为128^2，256^2和512^2个像素，以及1:1，1:2和2:1的长宽比。这些超参数不是针对特定数据集仔细选择的，我们将在下一节中提供有关其作用的消融实验。如上所述，我们的解决方案不需要图像金字塔或滤波器金字塔来预测多个尺度的区域，节省了大量的运行时间。图3（右）显示了我们的方法在广泛的尺度和长宽比方面的能力。表1显示了使用ZF网络的每个锚点学习到的平均提议大小。我们注意到，我们的算法允许预测比基础感受野更大。这样的预测不是不可能的——如果只有目标的中间部分是可见的，那么仍然可以粗略地推断出目标的范围。

表1：使用ZF网络的每个锚点学习到的平均提议大小（s=600s=600的数字）。

跨越图像边界的锚盒需要小心处理。在训练过程中，我们忽略了所有的跨界锚点，所以不会造成损失。对于一个典型的1000×6001000×600的图片，总共将会有大约20000（≈60×40×9≈60×40×9）个锚点。跨界锚点被忽略，每张图像约有6000个锚点用于训练。如果跨界异常值在训练中不被忽略，则会在目标函数中引入大的，难以纠正的误差项，且训练不会收敛。但在测试过程中，我们仍然将全卷积RPN应用于整张图像。这可能会产生跨边界的提议边界框，我们剪切到图像边界。

一些RPN建议彼此高度重叠。为了减少冗余，我们基于CLS分数在提案区域上采用非最大抑制（NMS）。我们将IOO阈值固定为0.7的NMS，这使我们每张图片留下了大约2000个提案区域。正如我们将展示的那样，NMS不会损害最终的检测准确性，但大大减少了提案的数量。在NMS之后，我们使用TOP-N排名的提案区域进行检测。在下文中，我们使用2000 RPN提案培训Fast R-CNN，但在测试时间评估不同数量的提案。

4实验

4.1对P VOC的实验

我们全面评估我们在Pascal VOC 2007检测基准测试中的方法[11]。此数据集包含约5K的TrainVal图像和5K测试图像超过20个对象类别。我们还为几个型号提供了Pascal VOC 2012年基准的结果。对于ImageNet预训练的网络，我们使用具有5个卷积层和3个全连接层的“快速”版本，以及具有13层卷积层和3的公共VGG-16 Model7 [3]完全连接的图层。我们主要评估检测平均平均精度（MAP），因为这是对象检测的实际度量（而不是关注对象提案代理度量）。

表2：Pascal VOC 2007测试集的检测结果（在VOC 2007 TrainVal上培训）。探测器具有ZF的快速R-CNN，但使用各种提案方法进行培训和测试。

表2（顶部）在使用各种区域提案方法训练和测试时，显示快速R-CNN结果。这些结果使用ZF网。对于选择性搜索（SS）[4]，我们通过“快速”模式生成大约2000个提案。对于EdgeBoxes（EB）[6]，我们通过调整的默认EB设置生成0.7 7的提案。www.robots.ox.ac.uk/~vgg/research/very deep / iou。 SS的地图为58.7％，EB在快速R-CNN框架下有58.6％的地图。 RPN与Fast R-CNN实现了竞争力的结果，地图为59.9％，同时使用多达300个提案8。使用RPN的检测系统比使用SS或EB产生更快的速度计算;较少的建议也降低了区域明智的完全连接层的成本（表5）。

表5：在CPU中评估了K40 GPU上的定时（MS），除了SS提案。 “Region-Wise”包括NMS，汇集，完全连接和软MAX层。有关运行时间的分析，请参阅我们发布的代码。

rpn的消融实验。为了调查RPN作为提案方法的行为，我们进行了几项消融研究。首先，我们展示了在RPN和FAST R-CNN检测网络之间共享卷积层的效果。为此，我们在4步培训过程中第二步后停止。使用单独的网络将结果略微降低至58.7％（RPN + ZF，不共享，表2）。我们观察到这是因为在第三步骤时，检热特征用于微调RPN，提高提案质量。

接下来，我们解开RPN对训练快速R-CNN检测网络的影响。为此目的，我们通过使用2000年SS提案和ZF网培训快速R-CNN模型。我们修复了该检测器，并通过更改测试时间使用的提案区域来评估检测映射。在这些消融实验中，RPN不会与探测器共享特征。

在测试时间内用300 RPN建议替换SS，导致映射为56.8％。地图中的损失是因为培训/测试建议之间的不一致。该结果用作以下比较的基线。

有点令人惊讶的是，RPN仍然导致使用排名级别的竞争结果（55.1％）测试时间100个提案，表明顶部RPN提案是准确的。另一个极端，使用排名级别的6000 RPN提案（没有NMS）具有可比地图（55.2％），表明NMS不会损害检测映射，并可能减少误报。

接下来，我们通过在测试时间内关闭它们中的任何一个来分别调查RPN CLS和REG输出的角色。当在测试时间被移除CLS层（因此不使用NMS /排名）时，我们从未频繁的区域随机地采样N个提案。当n = 100时，地图几乎不变，但n = 1000（55.8％），但在n = 100时降低了44.6％。这表明CLS分数占最高排名提案的准确性。

另一方面，当在试验时间被移除REG层时（因此提出建议成为锚箱），地图下降到52.1％。这表明高度建议主要是由于回归的框限制。锚箱，但具有多种尺度和宽高比，不足以准确检测。

我们还评估了更强大的网络对单独RPN提案质量的影响。我们使用VGG-16训练RPN，仍然使用上面的SS + ZF检测器。地图从56.8％（使用RPN + ZF）改善为59.2％（使用RPN + VGG）。这是一个有前途的结果，因为它表明RPN + VGG的提议质量优于RPN + ZF的提出质量。因为RPN + ZF的建议与SS竞争（两者在持续用于培训和测试时为58.7％），我们可能会期望RPN + VGG比SS更好。以下实验证明了这一假设。

vgg-16的性能。表3显示了vgg-16的结果，用于两个提议和检测。使用RPN + vgg，对于未共享的功能，结果为68.5％，略高于SS基线。如上所示，这是因为RPN + VGG产生的提议比SS更准确。与预定义的SS不同，RPN被主动培训并从更好的网络中受益。对于特征共享变体，结果比强大的SS基线为69.9％，但具有近乎不成本的建议。我们进一步在Pascal VOC 2007 Trainval和2012 Trainval的普斯卡尔VOC套装上培训RPN和检测网络。地图是73.2％。图5显示了Pascal VOC 2007测试集的一些结果。在Pascal VOC 2012年测试集（表4）中，我们的方法有一个70.4％的地图，培训了OFF 2007 Trainval +测试和VOC 2012 Trainval的CONG组。表6和表7显示了详细的数字。

表4：Pascal VOC 2012测试集的检测结果。探测器是快速的R-CNN和VGG-16。培训数据：“07”：VOC 2007 TrainVal，“07 ++ 12”：Union of Voc 2007 TrainVal +测试和VOC 2012 TrainVal。对于RPN，FAST R-CNN的火车时间提案是2000.†：http：//host.robots.ox.ac.uk:8080/anonymous/hzjtqa.html.‡：http：//host.robots。 ox.ac.uk:8080/anonymous/ynplxb.html.§：http：//host.robots.ox.ac.uk:8080/anonymous/xedh10.html。

表6：Pascal VOC 2007测试设置的结果用FAST R-CNN探测器和VGG-16。对于RPN，FAST R-CNN的列车时间提案是2000. RPN *表示不安全的功能版本。

表7：Pascal VOC 2012年测试集的结果用FAST R-CNN探测器和VGG-16。对于RPN，FAST R-CNN的火车时间提案是2000。

图5：使用更快的R-CNN系统，所选对象检测结果的对象检测结果示例。该模型是VGG-16，训练数据是07 + 12 TrainVal（2007年测试集73.2％地图）。我们的方法检测各种尺度和宽高比的对象。每个输出框与[0,1]中的类别标签和softmax得分相关联。分数阈值为0.6用于显示这些图像。获取这些结果的运行时间是每张图像198ms，包括所有步骤。

表3：Pascal VOC 2007测试集的检测结果。探测器是快速的R-CNN和VGG-16。培训数据：“07”：VOC 2007 TrainVal，“07 + 12”：Union套VOC 2007 Trainval和VOC 2012 Trainval。对于RPN，FAST R-CNN的火车时间提案是2000.†：此数量在[2]中报告;使用本文提供的存储库，此结果更高（68.1）。

在表5中，我们总结了整个物体检测系统的运行时间。 SS需要1-2秒，具体取决于内容（平均约1.5秒），并且使用VGG-16的FAST R-CNN在2000个SS提案中需要320ms（如果在完全连接的图层上使用SVD，则需要223ms [2]）。我们具有VGG-16的系统总共需要198毫秒，适用于建议和检测。通过共享的卷积特征，仅RPN只需要10ms计算附加层。由于较少的建议（每张图片300），我们的区域计算也较低。我们的系统具有17 FPS的帧速率，具有ZF网。

对超参数的敏感性。在表8中，我们调查锚点的设置。默认情况下，我们使用3尺度和3个宽高比（表8中的69.9％地图）。如果在每个位置使用只使用一个锚，则地图下降到3-4％的相当数量。如果使用3刻度（具有1个宽高比）或3个纵横比（具有1个刻度），则映射更高，证明使用多种尺寸的锚点作为回归参考是有效的解决方案。使用具有1个宽高比（69.8％）的只使用3个刻度与在该数据集上的3个宽高量比使用3尺度，表明尺度和宽高比不是用于检测精度的尺寸。但我们仍然采用了我们设计中的这两种维度，以保持我们的系统灵活。

在表9中，我们比较了等式（1）中的λ的不同值。默认情况下，我们使用λ= 10，这使得等式（1）中的两个术语大致在归一化之后大致加权。表9表明，当λ在大约两个数量级（1到100）的等级范围内时，我们的结果刚刚略微影响（〜1％）。这表明结果在宽范围内对λ不敏感。

召回到iou分析。接下来，我们将在不同的IOU比率与地面盒计算的回忆回忆。值得注意的是，与最终检测精度有关的召回-IOU公制只是松散地[19]，[20]，[21]。使用此度量标准更合适地诊断提案方法而不是评估它。

在图4中，我们显示了使用300,1000和2000个提案的结果。我们与SS和EB进行比较，N个提案是基于这些方法产生的信心的Top-N等级。该图表明，当建议的数量从2000到300下降时，RPN方法正常。这解释了为什么RPN在使用少量提案时具有良好的最终检测映射。正如我们之前分析的那样，此属性主要归因于RPN的CLS项。当提案更少时，SS和EB的召回比RPN更快地下降。

图4：召回Pascal VOC 2007测试集的VS.IO重叠比率。

一阶段检测与两阶段提案+检测。过度纸张[9]提出了一种检测方法，它在卷积特征映射上使用在滑动窗口上的回归和分类器。过度拍摄是一阶段，类特定的检测管道，我们是一个两级级联，由类别不可知的提案和特异性检测组成。在过污垢中，区域明智的特征来自一个宽高比的一个纵横比的滑动窗口。这些功能用于同时确定对象的位置和类别。在RPN中，特征来自正方形（3×3）滑动窗口，并预测相对于具有不同尺度和宽高比的锚点的提案。虽然这两种方法都使用滑动窗口，但区域提案任务只有更快的RCNN - 下游FAST R-CNN探测器的第一阶段参加提案以改进它们。在我们的级联的第二阶段，区域明智的特征是自适应地汇集的[1]，[2]，从提案盒中更忠实地覆盖区域的特征。我们认为这些功能导致更准确的检测。

为了比较单阶段和两级系统，我们通过单级快速R-CNN模拟过污染系统（因此也绕过了实施细节的其他差异）。在该系统中，“提议”是3刻度的致密滑动窗口（128,256,512）和3个纵横比（1：1,1：2,2：1）。快速R-CNN培训，以预测来自这些滑动窗口的类别特定的分数和回归框位置。由于过度污垢系统采用图像金字塔，因此我们还使用从5尺度提取的卷积特征进行评估。我们使用如[1]，[2]中的5个尺度。

表10比较了两级系统和一级系统的两个变体。使用ZF模型，一级系统的地图为53.9％。这低于两阶段系统（58.7％）4.8％。该实验证明了级联区域提案和物体检测的有效性。在[2]，[39]中报告了类似的观察结果，其中用滑动窗口替换SS区域提案导致两篇论文中的〜6％的降解。我们还要注意的是，OneStage系统较慢，因为它有很大的过程建议。

4.2 Coco MS的实验

我们在Microsoft Coco对象检测数据集中展示更多结果[12]。此数据集涉及80个对象类别。我们在验证集中的训练集中的80k图像上进行实验，在验证集中的40K图像上以及测试开发集上的20k图像。我们评估IOU的平均地图[0.5：0.05：0.95]（Coco的标准指标，简单地表示为Map @ [。5，.95]）和[email protected]（Pascal VOC的指标）。

我们的系统为此数据集进行了一些微小的变化。我们在8 GPU实现上培训我们的模型，有效的小批量尺寸为RPN（GPU 1个）和16个用于快速R-CNN（每个GPU的2）。 RPN步骤和快速R-CNN步骤均培训240K迭代，学习率为0.003，然后用于0.0003的80K迭代。我们修改了学习率（从0.003开始而不是0.001），因为迷你批量大小发生了变化。对于锚点，我们使用3个纵横比和4刻度（添加642），主要是通过处理该数据集上的小对象来激励。此外，在我们的快速R-CNN步骤中，负样本被定义为具有在[0,0.5）的间隔中具有最大IOU的IOU的最大值的那些，而不是[1]中使用的[0.1,0.5），[2 ]。我们注意到，在SPPNet系统[1]中，[0.1,0.5）中的负样本用于网络微调，但在具有硬负挖掘的SVM步骤中仍访问[0,0.5）中的负样本。但快速的R-CNN系统[2]放弃了SVM步骤，因此从未访问过[0.0.1）中的负样本。包括这些[0.0.1）样本可改善COCO数据集的[email protected]，适用于快速R-CNN和更快的R-CNN系统（但在Pascal VOC上的影响可以忽略不计）。

其余的实现细节与Pascal VOC上的相同。特别是，我们继续使用300个提案和单尺度（S = 600）测试。在Coco数据集上，测试时间仍然是每张图像约为200ms。

在表11中，我们首先使用本文的实施方式报告FAST R-CNN系统[2]的结果。我们的FAST R-CNN基线有39.3％的[email protected]在测试开发套件上，高于[2]中报告的。我们猜想这种差距的原因主要是由于阴性样本的定义以及迷你批量尺寸的变化。我们还注意到地图@。[。5，.95]是可比的。

表11：MS Coco DataSet上的对象检测结果（％）。该模型是VGG-16。

接下来，我们评估我们更快的R-CNN系统。使用Coco R-CNN的COCO培训设定为培训，R-CNN更快地有42.1％[email protected]和21.5％地图@ [。5，.95]。对于Map @ [。5，.95]比同一协议下的FAST RCNN对应物更高，这比[email protected]和2.2％更高的2.8％。这表明RPN在较高IOU阈值下提高了本地化精度的优异。使用Coco TrainVal设置为培训，RCNN更快的RCNN有42.7％的地图@ [。5，.95]在Coco Test-Dev Set上的地图@ [。5，.95]。图6显示了MS Coco Test-DEV集的一些结果。

我们已经证明了ilsvrc和Coco 2015年竞赛中的R-CNN竞争中的竞争速度更快，因为RPN完全学会通过神经网络提出地区的促进区域，更快地获得更好的功能。即使当一个人基本上增加到超过100层[18]时，这种观察仍然是有效的。只有通过用101亚形剩余网（Reset-101）更换VGG-16 [18]，速度的R-CNN系统才会增加41.5％/ 21.2％（VGG16）至48.4％/ 27.2％（Resnet-101）的地图Coco Val集。与其他改进正交到更快的rcnn，他。 [18]获得了55.7％/ 34.9％的单模结果，可可测试开发集59.0％/ 37.4％的集合结果赢得了Coco 2015对象检测竞赛的第1位。同样的系统[18]还赢得了ILSVRC 2015对象检测竞赛中的第1位，超出了绝对的第二名8.5％。 RPN也是ILSVRC 2015本地化的第一次获胜条目的构建块，并分别在[18]和[15]中提供了详细信息

4.3从MS COCO到P ascal VOC

大规模数据对于改善深层神经网络至关重要。接下来，我们调查MS Coco DataSet如何有助于Pascal VOC上的检测性能。

作为一个简单的基线，我们直接评估Pascal VOC数据集上的Coco检测模型，而不在任何Pascal VOC数据上进行微调。这种评估是可能的，因为Coco上的类别是Pascal VOC上的类别。在该实验中忽略了CoCo独家在Coco上的类别，并且Softmax层仅在20类加上背景上执行。 Pascal VOC 2007测试集下该设置下的地图为76.1％（表12）。这种结果优于VOV07 + 12（73.2％）在良好的边缘上训练，即使没有利用Pascal VOC数据。

表12：使用不同培训数据的Pascal VOC 2007测试集和2012年测试集的R-CNN的检测映射（％）。该模型是VGG-16。 “Coco”表示Coco TrainVal Set用于培训。另见表6和表7。

然后我们微调VOC数据集的COCO检测模型。在该实验中，可以通过第3.2节所述进行微调的R-CNN系统，代替Imageenet-Pre训练模型（用于初始化网络权重的模型），如第3.2节中所述，更快的R-CNN系统进行微调。在Pascal VOC 2007测试集上导致78.8％的地图。来自Coco Set的额外数据将地图增加了5.6％。表6显示，在Pascal VOC 2007上的每个单独类别培训的模型都有最好的AP。在Pascal VOC 2012测试集上观察到类似的改进（表12和表7）。我们注意到获得这些强度的测试时间速度仍然是每张图像约为200ms。

5结论

我们为RPN提供了高效和准确的区域提案生成。通过分享卷积具有下游检测网络的特点，该区域提案步骤几乎没有成本。我们的方法使基于深度学习的对象检测系统能够在近实时帧速率下运行。学习的RPN还提高了区域提案质量，从而提高了整体对象检测精度。

你可能感兴趣的:(R-CNN系列文章,深度学习,神经网络,机器学习)

Debezium系列之：使用Debezium采集oceanbase数据库快乐骑行^_^ debezium Debezium系列采集oceanbase数据库
Debezium系列之：使用Debezium采集oceanbase数据库一、oceanbase数据库二、安装OceanBase三、安装oblogproxy四、基于Docker的简单采集案例五、生产实际应用案例Debezium是一个开源的分布式平台，用于监控数据库变化和捕捉数据变动事件，并以事件流的形式导出到各种消费者。Debezium基于ApacheKafka实现，并支持多种数据库系统。一、oce
还在为找图发愁？图生生AI以图生图，一键生成专属风格！图生生人工智能 ai AI作画图生生
你是否也遇到过这样的烦恼：想为文章配图，却找不到风格合适的图片？设计海报时，灵感枯竭，不知从何下手？看到喜欢的图片风格，却无法应用到自己的作品中？别担心，图生生AI生图来帮你！只需上传一张图片，AI就能自动生成相似风格的图片，让你轻松拥有专属图库！图生生AI生图是一款基于人工智能技术的图片生成工具，它能够深度学习和理解图片的风格、色彩、构图等元素，并以此为基础生成全新的图片。无论你是设计师、自媒体
【Spring Boot 中 `@Value` 注解的使用】武帝为此前后端 spring boot python 后端
文章目录一、前言二、@Value注解简介三、@Value注解的常见用法1.读取`application.properties`或`application.yml`配置值（1）配置文件示例（2）Java代码示例（3）测试输出2.使用`@Value`设置默认值3.读取系统环境变量和Java运行时参数4.结合SpringExpressionLanguage(SpEL)（1）基本SpEL表达式（2）引用B
【数据结构之树】武帝为此数据结构数据结构
文章目录一、前言二、树的基本概念1.什么是树？2.树的常见分类（1）普通树（2）二叉树（BinaryTree）（3）满二叉树（FullBinaryTree）（4）完全二叉树（CompleteBinaryTree）（5）二叉搜索树（BinarySearchTree,BST）（6）平衡二叉树（AVL树）（7）红黑树（Red-BlackTree）三、树的基本操作及代码示例1.二叉树的基本实现（C++）运
【Vuex：在带命名空间的模块内访问全局内容】武帝为此前后端 vue.js javascript 前端
文章目录一、命名空间与全局内容的关系1.什么是命名空间？✅开启命名空间二、在命名空间模块内访问全局内容1.访问全局state2.访问全局getters3.调用全局mutations4.调用全局actions三、示例：模块间访问与全局状态共享1.定义模块2.注册模块3.测试调用四、常见问题与注意事项1.如何在组件中访问其他模块的state？2.模块命名冲突问题五、总结一、命名空间与全局内容的关系1.
Redis系列：深入理解缓存穿透、缓存击穿、缓存雪崩及其解决方案菜就多练少说 Redis 缓存 redis 数据库
在使用Redis作为缓存系统时，我们经常会遇到“缓存穿透”、“缓存击穿”和“缓存雪崩”等问题，这些问题一旦出现，会严重影响应用性能甚至造成服务不可用。因此，理解这些问题的产生原因和解决方案非常重要。本文将全面讲解缓存穿透、缓存击穿、缓存雪崩的具体概念、产生原因、以及对应的解决策略，帮助开发人员高效、安全地使用Redis。一、缓存穿透（CachePenetration）（一）什么是缓存穿透？缓存穿透
5. MYSQL_存储引擎二多实例安装 q375923078 MYSQL 存储引擎 slow_log generic_log audit
文章目录一.MyISAM存储引擎(下)1.MyISAM还在使用的原因2.MyISAM文件组成3.myisamchk二.Memory存储引擎1.Memory介绍2.Memory特性3.Memory的物理特性三.CSV存储引擎1.CSV介绍2.CSV文件组成2.CSV特性四.Federated存储引擎1.Federated介绍2.Federated语法五.多实例安装1.多实例介绍2.安装要求3.安装操
深度学习中的Channel，通道数是什么？ %KT% 深度学习深度学习人工智能
参考文章：直观理解深度学习的卷积操作，超赞！-CSDN博客如何理解卷积神经网络中的通道（channel）_神经网络通道数-CSDN博客深度学习-卷积神经网络—卷积操作详细介绍_深度卷积的作用-CSDN博客正文：在跑深度学习代码的过程中，经常遇到的一个报错是：模型尺寸不匹配的问题。一般pytorch中尺寸/张量的表现方式是：torch.size([16,3,24,24])。这四个参数的含义如下：16
C语言：哈希表 %KT% C/C++算法数据结构 c语言散列表开发语言
1、文章声明：本文是基于链地址法建立的哈希表。文章中若存在错误，欢迎各路大佬指正。本文涉及二级指针，链表等内容。该方面的知识点，可以参考文章：数据结构：单链表的相关操作-CSDN博客C语言：利用二级指针动态创建二维矩阵-CSDN博客2、哈希表的介绍：哈希表其实可以理解成一种映射，通过映射关系来存储数据，有点类似于Python中的字典。常见的如数组，链表等存储结构，他们查询数据都有一个特点，往往需要
桥接模式：解耦抽象与实现，实现灵活多变的扩展结构码进未来设计模式桥接模式 java 设计模式
文章目录一、引言二、应用场景与技术背景三、模式定义与实现四、实例详解五、优缺点分析总结：一、引言桥接模式是一种结构型设计模式，它将抽象部分与它的实现部分分离，使它们可以独立变化。这种模式通过创建一个抽象层和实现层的结构，并使用组合而非继承来关联这两层，从而使得系统在面对多维度变化时，能够保持较低的耦合度，支持灵活扩展。二、应用场景与技术背景桥接模式适用于以下场景：系统需要在多个维度上进行扩展，而这
AI人工智能深度学习算法：搭建可拓展的深度学习模型架构 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据 java python javascript kotlin golang 架构人工智能
深度学习、模型架构、可拓展性、神经网络、机器学习1.背景介绍深度学习作为人工智能领域最前沿的技术之一，在图像识别、自然语言处理、语音识别等领域取得了突破性的进展。深度学习模型的成功离不开其强大的学习能力和可拓展性。本文将深入探讨深度学习算法的原理、模型架构设计以及可拓展性的关键要素，并通过代码实例和实际应用场景，帮助读者理解如何搭建可拓展的深度学习模型架构。2.核心概念与联系深度学习的核心概念是人
C/C++高效编译工具ccache 工头阿乐 C/C++c语言 c++java
C/C++文章目录C/C++前言一、引入ccache二、ccache基本原理三、安装前言在处理一些规模相对较大的工程时，编译花费的时间可能会很长。有时候我们会经常一遍一遍地编译相同的程序，此时，有了ccache情况就好多了。它将在第一遍编译时多花几秒钟，但接下来就会使编译成倍（5-10倍）的提速。ccache的基本原理是通过将头文件高速缓存到源文件之中而改进了构建性能，因而通过减少每一步编译时添加
远程调试Python脚本之ptvsd 工头阿乐 PyTorch 深度学习 python 开发语言
深度学习文章目录深度学习前言前言有时候需要远程调试Python脚本，怎么办呢…以下这段代码用于远程调试Python脚本，特别是通过VisualStudioCode（VSCode）的远程调试功能。它会在指定的服务器IP和端口上等待调试器的连接。#检查是否提供了服务器IP和端口ifargs.server_ipandargs.server_port:#远程调试-参见https://code.visual
yolo模型coco数据集详解工头阿乐深度学习 YOLO
深度学习文章目录深度学习前言前言instances_train2017.json和instances_val2017.json文件均分为五大部分，这五部分对应的关键字分别为info、licenses、images、annotations、categories。{"info":info,"licenses":[license1,license2,license3,...],"images":[ima
机器学习之向量化珠峰日记 AI理论与实践机器学习人工智能
文章目录向量化是什么为什么要向量化提升计算效率简化代码与增强可读性适配模型需求怎么做向量化数据预处理特征提取特征选择向量构建机器学习与深度学习中向量化的区别数据特征提取方式机器学习深度学习模型结构与复杂度机器学习深度学习计算资源需求机器学习深度学习数据规模适应性机器学习深度学习向量化是什么向量化是把数据转化为向量形式进行表示与处理的过程。在机器学习与深度学习的范畴内，现实中的各类数据，像文本、图像
【重回基础】理解CPU Cache及缓存一致性MESI Patrick_Lam 重回基础 CPU Cache MESI 缓存一致性
文章目录一、前言二、为何需要CPUCache三、L1、L2、L3Cache三级缓存结构四、CacheLine：与内存数据交换的最小单位五、MEIS：缓存一致性5.1底层操作5.2MESI协议参考一、前言原打算重新学习一下volatile的实现原理，其中涉及到指令调度重排和数据可见性保证，这两者的理解离不开对CPUCache的掌握，因此，先重温一下CPUCache，便有了本文。二、为何需要CPUCa
前端大文件上传（分片上传）与下载束尘前端
文章目录一、问题二、思路1、选择文件2、校验文件是否符合规范3、文件切片上传4、分片上传注意点5、大文件下载一、问题日常业务中难免出现前端需要向后端传输大型文件的情况，这时单次的请求不能满足传输大文件的需求，就需要用到分片上传业务需求为：用户可以上传小于20G的镜像文件，并进显示当前上传进度前端：vue3.x+ElementPlus组件+axios二、思路解决思路简单为前端选择文件后读取到文件的基
html重点知识总结 *goliter * html 前端
html重点知识一直在网上看过许多不同的前端资料，但是总觉的只是单单的阅读和记忆不能够真正的加深自己的知识理解，所以开始尝试自己在不查看其他一切资料的情况下对自己了解的知识做一个总结（顺序或许有点乱），如果之后发现有不足再来补充，我相信输出才是最好的输入！！！H5新增内容语义化标签：h5新增了一系列语义化标签，他们本质上和一般的div标签没有区别，但是在语义上有不同。header：专门指页面的顶部
从零精通机器学习：线性回归入门吴师兄大模型 0基础实现机器学习入门到精通机器学习线性回归人工智能 python 算法回归开发语言
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
一份Python面试宝典小夕Coding Python大学作业汇总 python 面试开发语言
Python面试宝典文章目录Python面试宝典题目001:在Python中如何实现单例模式。题目002：不使用中间变量，交换两个变量`a`和`b`的值。题目003：写一个删除列表中重复元素的函数，要求去重后元素相对位置保持不变。题目004：假设你使用的是官方的CPython，说出下面代码的运行结果。题目005：Lambda函数是什么，举例说明的它的应用场景。题目006：说说Python中的浅拷贝
python技巧之下划线老虎也淘气 Python编程掌握指南 python django 开发语言
‍♂️个人主页@老虎也淘气个人主页✍作者简介：Python学习者希望大家多多支持我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注python技巧之下划线1、python的moudles文件中__all__作用2、__slots__用于限定类属性，如：3、下面的小技巧可以获取私有变量：4、下划线种类单个下划线（_）单下划线前缀的名称（例如_shahriar）双下划线前缀的名称（例如__s
聊聊Python都能做些什么 ·零落· Python入门到掌握 python 开发语言
文章目录一、Python简介二、Python都能做些什么1.Web开发2.数据分析和人工智能3.自动化运维和测试4.网络爬虫5.金融科技三、Python开源库都有哪些1.Web开发2.数据分析和科学计算3.机器学习和深度学习4.网络爬虫5.自动化和测试6.其他常用库四、相关链接一、Python简介Python是一种解释型、面向对象、动态数据类型的高级程序设计语言。它最初由GuidovanRossu
基于改进ISODATA算法的负荷场景曲线聚类（matlab代码）电力程序小学童聚类 matlab ISODATA算法风电光伏
目录1主要内容聚类中心选取步骤核方法2部分代码3程序结果4程序链接1主要内容程序复现文献《基于机器学习的短期电力负荷预测和负荷曲线聚类研究》第三章《基于改进ISODATA算法的负荷场景曲线聚类》模型，该方法不止适用于负荷聚类，同样适用于风光等可再生能源聚类，只需要改变聚类的数据即可，该方法的通用性和可创新性强。该代码实现一种基于改进ISODATA算法的负荷场景曲线聚类方法，代码中，主要做了四种聚类
NLP高频面试题（四）——BN和LN的区别与联系，为什么attention要用LN Chaos_Wang_ NLP常见面试题自然语言处理人工智能
在深度学习模型中，Normalization是一种极为重要的技巧，BatchNormalization（BN）和LayerNormalization（LN）是其中最为常用的两种方法。然而，二者在实际应用中有着明显的区别与联系，尤其在Transformer的Attention机制中，LN有着独特的优势。一、BN与LN的核心区别与联系1.BatchNormalization(BN)BN的思想源于一个叫
Vue 过滤器深度解析与应用实践二川bro 前端 vue.js 前端 javascript
文章目录1.过滤器概述1.1核心概念1.2过滤器生命周期2.过滤器基础2.1过滤器定义2.2过滤器使用3.过滤器高级用法3.1链式调用3.2参数传递3.3动态过滤器4.过滤器应用场景4.1文本格式化4.2数字处理4.3数据过滤5.性能优化与调试5.1性能优化策略5.2调试技巧6.最佳实践建议6.1命名规范6.2代码组织7.常见问题与解决方案7.1问题列表7.2调试技巧8.扩展阅读1.过滤器概述1.
【H2O2 | 软件开发】什么是Promise？过期的H2O2 【H2O2】全栈面试题前端 javascript ecmascript6
目录前言开篇语准备工作正文概述三种状态创建和使用链式操作多对象处理语法糖回调地狱和优化结束语前言开篇语本系列为短篇，每次讲述少量知识点，无需一次性灌输太多的新知识点。该主题文章主要是围绕前端、全栈开发相关面试常见问题撰写的，希望对诸位有所帮助。如果您需要为面试八股文做准备，笔者建议重点关注加粗强调部分，它们是概念中的关键词。准备工作软件：【参考版本】VisualStudioCode系统版本：Win
《基于机器学习的负荷曲线聚类算法对比与改进：K-L-isodata的创新性研究》 TWHiwhjig 机器学习算法聚类
基于机器学习的负荷曲线聚类包括kmeansisodata和改进的L-isodata以及在其基础上再次进行改进的K-L-isodata(有创新性)，四者通过评价指标进行了对比精品代码可修改性极高有参考文献ID:93150688324967700自律的电气人基于机器学习的负荷曲线聚类是一种基于数据分析和模式识别的技术，它可以帮助我们对系统的负荷变化进行分类和理解。在负荷曲线聚类的研究中，K-means
快速部署一个k8s集群懒人P Kubernetes 云原生 kubernetes 容器运维
部署单Master的K8s集群kubeadm方式文章目录部署单Master的K8s集群一，前置知识点1.1生产环境可部署Kubernetes集群的两种方式1.2准备环境1.3操作系统初始化配置【所有节点】二，安装Docker/kubeadm/kubelet（所有节点）2.1安装Docker。2.2添加阿里云YUM软件源。2.3安装kubeadm，kubelet和kubectl.三，部署Kubern
【C++经典例题】反转字符串中单词的字符顺序：两种实现方法详解倔强的石头_ C++经典例题 c++java 算法
博客主页：倔强的石头的CSDN主页Gitee主页：倔强的石头的gitee主页⏩文章专栏：C++经典例题期待您的关注目录问题描述基于快慢指针的解法基于索引的解法两种方法的比较问题描述在处理字符串相关的问题时，反转字符串中每个单词的字符顺序是一个常见的任务，同时要保证空格和单词的初始顺序不变。给定一个字符串s，你需要反转字符串中每个单词的字符顺序，同时仍保留空格和单词的初始顺序。s包含可打印的ASCI
PostgreSQL vs MySQL——哪种关系数据库更好? 全能资料库 postgresql mysql 数据库
PostgreSQL和MySQL是世界上最流行的两种关系数据库管理系统(RDMS)。包括商业企业和开源基金会在内的所有市场人口都在使用它们。它们的共同点是强大的网络容错能力和对数据聚类的支持。这篇文章的主题是将它们区分开来。RDMS起源和历史1973年,加州大学伯克利分校启动了一个名为“Ingres”的项目,为关系数据库管理系统制定新标准。该项目是用C编写的,并根据开源许可证向公众发布。根据[Wi
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修