FlyDremever

论文翻译学习-Feature Pyramid Networks for Object Detection

Feature Pyramid Networks for Object Detection

注：为了方便自己学习读论文，机翻+自己修改
论文地址：https://arxiv.org/pdf/1612.03144.pdf

摘要

特征金字塔是识别系统中用于检测不同尺度目标的基本组件。但最近的深度学习目标检测器已经避免使用金字塔表示，一部分原因是它们是计算和内存密集型的。在本文中，我们利用深度卷积网络内在的多尺度、金字塔分级来构造具有很少额外成本的特征金字塔。开发了一种具有横向连接的自顶向下的架构，用于在所有尺度上构建高级语义特征映射。这种称为特征金字塔网络（FPN）的架构在几个应用程序中作为通用特征提取器，表现出了显著的改进。在一个基本的Faster R-CNN系统中使用FPN，没有任何不必要的东西，我们的方法可以在COCO检测基准数据集上取得最先进的单模型结果，结果超过了所有现有的单模型输入，包括COCO 2016挑战赛的获奖者。此外，我们的方法可以在GPU上以6FPS运行，因此是多尺度目标检测的实用和准确的解决方案。代码将公开发布。

1. Introduction

识别不同尺度的目标是计算机视觉中的一个基本挑战。建立在图像金字塔之上的特征金字塔（我们简称为特征化图像金字塔）构成了标准解决方案的基础（Pyramid methods in image processing. RCA engineer, 1984）图1(a)这些金字塔是尺度不变的，因为目标的尺度变化是通过在金字塔中移动它的层级来抵消的。直观地说，该属性使模型能够通过在位置和金字塔层级上扫描模型来检测大范围尺度内的目标。

（a）使用图像金字塔构建特征金字塔。每个图像尺度上的特征都是独立计算的，速度很慢。
（b）最近的检测系统选择只使用单一尺度特征进行更快的检测。
（c）另一种方法是重用ConvNet计算的金字塔特征层次结构，就好像它是一个特征化的图像金字塔。
（d）我们提出的特征金字塔网络（FPN）与（b）和（c）类似，但更准确。在该图中，特征映射用蓝色轮廓表示，较粗的轮廓表示语义上较强的特征。

特征化图像金字塔在手工设计的时代被大量使用（5 Histograms of oriented gradients for human detection）（25 Distinctive image features from scale-invariant keypoints）。它们非常关键，以至于像DPM这样的目标检测器需要密集的尺度采样才能获得好的结果（例如每组10个尺度，octave含义参考SIFT特征）。对于识别任务，工程特征大部分已经被深度卷积网络（ConvNets）[19，20]计算的特征所取代。除了能够表示更高级别的语义，ConvNets对于尺度变化也更加鲁棒，从而有助于从单一输入尺度上计算的特征进行识别[15，11，29]（图1（b））。但即使有这种鲁棒性，金字塔仍然需要得到最准确的结果。在ImageNet[33]和COCO[21]检测挑战中，最近的所有排名靠前的输入都使用了针对特征化图像金字塔的多尺度测试（例如[16，35]）。对图像金字塔的每个层次进行特征化的主要优势在于它产生了多尺度的特征表示，其中所有层次上在语义上都很强，包括高分辨率层。

尽管如此，特征化图像金字塔的每个层次都具有明显的局限性。推断时间显著增加（例如，四倍[11]），使得这种方法在实际应用中不切实际。此外，利用图像金字塔训练端到端的深度网络，在内存方面也是不可行的，所以如果被采用，图像金字塔仅在测试时被使用[15，11，16，35]，这造成了训练/测试时推断的不一致性。出于这些原因，Fast和Faster R-CNN[11，29]选择在默认设置下不使用特征化图像金字塔。
但是，图像金字塔并不是计算多尺度特征表示的唯一方法。深层ConvNet逐层计算特征层级，而对于下采样层，特征层级具有内在的多尺度金字塔形状。这种内在的网络特征层级产生不同空间分辨率的特征映射，但引入了由不同深度引起的较大的语义差异。高分辨率映射具有损害其目标识别表示能力的低级特征。

单次检测器（SSD）[22]是首先尝试使用ConvNet的金字塔特征层级中的一个，好像它是一个特征化的图像金字塔（图1（c））。理想情况下，SSD风格的金字塔将重用正向传递中从不同层中计算的多尺度特征映射，因此是零成本的。但为了避免使用低级特征，SSD放弃重用已经计算好的图层，而从网络中的最高层开始构建金字塔（例如，VGG网络的conv4_3[36]），然后添加几个新层。因此它错过了重用特征层级的更高分辨率映射的机会。我们证明这些对于检测小目标很重要。

本文的目标是自然地利用ConvNet特征层级的金字塔形状，同时创建一个在所有尺度上都具有强大语义的特征金字塔。为了实现这个目标，我们所依赖的架构将低分辨率、强语义的特征与高分辨率、弱语义的特征通过自顶向下的路径和横向连接相结合。（图1（d））。其结果是一个特征金字塔，在所有级别都具有丰富的语义，并且可以从单个输入图像尺度上进行快速构建。换句话说，我们展示了如何创建网络中的特征金字塔，可以用来代替特征化的图像金字塔，而不牺牲表示能力，速度或内存。

图2。顶部：带有跳跃连接的自顶向下的架构，在最好的级别上进行预测（例如，[28]）。底部：我们的模型具有类似的结构，但将其用作特征金字塔，并在各个层级上独立进行预测。
最近的研究[28，17，8，26]中流行采用自顶向下和跳跃连接的类似架构。他们的目标是生成具有高分辨率的单个高级特征映射，并在其上进行预测（图2顶部）。相反，我们的方法利用这个架构作为特征金字塔，其中预测（例如目标检测）在每个级别上独立进行（图2底部）。我们的模型反映了一个特征化的图像金字塔，这在这些研究中还没有探索过。
我们评估了我们称为特征金字塔网络（FPN）的方法，其在各种系统中用于检测和分割[11，29，27]。没有任何不必要的东西，我们在具有挑战性的COCO检测基准数据集上报告了最新的单模型结果，仅仅基于FPN和基本的Faster R-CNN检测器[29]，就超过了其他单模型结构的效果。在消融实验中，我们发现对于边界框提议，FPN将平均召回率（AR）显著增加了8个百分点；对于目标检测，它将COCO型的平均精度（AP）提高了2.3个百分点，PASCAL型AP提高了3.8个百分点，超过了ResNet[16]上Faster R-CNN强大的单尺度基准线。我们的方法也很容易扩展掩模提议，改进实例分隔 AR，并且速度超过了依赖图像金字塔的最先进方法。
另外，我们的金字塔结构可以通过所有尺度进行端到端训练，并且在训练/测试时使用一致，这在使用图像金字塔时是内存不可行的。因此，FPN能够比所有现有的最先进方法获得更高的准确度。此外，这种改进是在不增加单尺度基准测试时间的情况下实现的。我们相信这些进展将有助于未来的研究和应用。我们的代码将公开发布。

2.Related Works

手工设计特征和早期神经网络。SIFT特征[25]最初是从尺度空间极值中提取的，用于特征点匹配。HOG特征[5]，以及后来的SIFT特征，都是在整个图像金字塔上密集计算的。这些HOG和SIFT金字塔已在许多工作中得到了应用，用于图像分类，目标检测，人体姿势估计等。这对快速计算特征化图像金字塔也很有意义。Dollar等人[6]通过先计算一个稀疏采样（尺度）金字塔，然后插入缺失的层级，从而演示了快速金字塔计算。在HOG和SIFT之前，使用ConvNet[38，32]的早期人脸检测工作计算了图像金字塔上的浅网络，以检测跨尺度的人脸。
Deep ConvNet目标检测器。随着现代深度卷积网络[19]的发展，像OverFeat[34]和R-CNN[12]这样的目标检测器在精度上显示出了显著的提高。OverFeat采用了一种类似于早期神经网络人脸检测器的策略，通过在图像金字塔上应用ConvNet作为滑动窗口检测器。R-CNN采用了基于区域提议的策略[37]，其中每个提议在用ConvNet进行分类之前都进行了尺度归一化。SPPnet[15]表明，这种基于区域的检测器可以更有效地应用于在单个图像尺度上提取的特征映射。最近更准确的检测方法，如Fast R-CNN[11]和Faster R-CNN[29]提倡使用从单一尺度计算出的特征，因为它提供了精确度和速度之间的良好折衷。然而，多尺度检测性能更好，特别是对于小目标的检测。
使用多层的方法。一些最近的方法通过使用ConvNet中的不同层来改进检测和分割。FCN[24]将多个尺度上的每个类别的部分分数相加以计算语义分割。Hypercolumns[13]使用类似的方法进行目标实例分割。在计算预测之前，其他几种方法（HyperNet[18]，ParseNet[23]和ION[2]）将多个层的特征连接起来，这相当于累加转换后的特征。SSD[22]和MS-CNN[3]可预测特征层级中多个层的目标，而不需要组合特征或分数。
最近有一些方法利用横向/跳跃连接将跨分辨率和语义层次的低级特征映射关联起来，包括用于分割的U-Net[31]和SharpMask[28]，Recombinator网络[17]用于人脸检测以及Stacked Hourglass网络[26]用于关键点估计。Ghiasi等人[8]为FCN提出拉普拉斯金字塔表示，以逐步细化分割。尽管这些方法采用的是金字塔形状的架构，但它们不同于特征化的图像金字塔[5，7，34]，其中所有层次上的预测都是独立进行的，参见图2。事实上，对于图2（顶部）中的金字塔结构，图像金字塔仍然需要跨多个尺度上识别目标[28]

3. Feature Pyramid Networks

我们的目标是利用卷积网络的金字塔层级特征，该层次结构具有从低到高的语义，并在整个过程中构建具有高级语义的特征金字塔。由此产生的特征金字塔网络是通用的，在本文中，我们侧重于滑动窗口提议（Region Proposal Network，简称RPN）[29]和基于区域的检测器（Fast R-CNN）[11]。在第6节中我们还将FPN泛化到实例分割。
我们的方法以任意大小的单尺度图像作为输入，并以全卷积的方式输出多层适当大小的特征映射。这个过程独立于主卷积体系结构（例如[19，36，16]），在本文中，我们呈现了使用ResNets[16]的结果。如下所述，我们的金字塔结构包括自下而上的路径，自上而下的路径和横向连接。
自下而上的路径。自下向上的路径是主卷积网络的前馈计算，其计算由尺度步长为2的多尺度特征映射组成的特征层级。通常有许多层产生相同大小的输出映射，并且我们认为这些层位于相同的网络阶段。对于我们的特征金字塔，我们为每个阶段定义一个金字塔层。我们选择每个阶段的最后一层的输出作为我们的特征映射参考集，我们将丰富它来创建我们的金字塔。这种选择是自然的，因为每个阶段的最深层应具有最强大的语义特征。
具体而言，对于ResNets[16]，我们使用每个阶段的最后一个残差块输出的特征激活。对于conv2，conv3，conv4和conv5输出，我们将这些最后残差块的输出表示为，并注意相对于输入图像它们的步长为{4，8，16，32}个像素。由于其庞大的内存占用，我们不会将conv1纳入金字塔。
自顶向下的路径和横向连接。是如何去结合低层高分辨率的特征呢？方法就是，把更抽象，语义更强的高层特征图进行上取样，然后把该特征横向连接（lateral connections ）至前一层特征，因此高层特征得到加强。每个横向连接合并来自自下而上路径和自顶向下路径的具有相同空间大小的特征映射。自下而上的特征映射具有较低级别的语义，但其激活可以更精确地定位，因为它被下采样的次数更少。
图3。构建模块说明了横向连接和自顶向下路径，通过加法合并。

图3显示了建造我们的自顶向下特征映射的构建块。使用特征粗糙，分辨率高的特征映射，我们将空间分辨率上采样为2倍（为了简单起见，使用最邻近上采样）。然后通过按元素相加，将上采样映射与相应的自下而上映射（其经过1×1卷积层来减少通道维度）合并。迭代这个过程，直到生成最佳分辨率映射。为了开始迭代，我们只需在上添加一个1×1卷积层来生成最粗糙分辨率映射。最后，我们在每个合并的映射上添加一个3×3卷积来生成最终的特征映射，这是为了减少上采样的混叠效应。这个最终的特征映射集称为{ $P_2,P_3,P_4,P_5$ }，对应于{ $C_2,C_3,C_4,C_5$ }，分别具有相同的空间大小。
由于金字塔的所有层都像传统的特征图像金字塔一样使用共享分类器/回归器，因此我们在所有特征映射中固定特征维度（通道数记为）。我们在本文中设置d = 256，因此所有额外的卷积层都有256个通道的输出。在这些额外的层中没有非线性，我们在实验中发现这些影响很小。
简洁性是我们设计的核心，我们发现我们的模型对许多设计选择都很鲁棒。我们已经尝试了更复杂的块（例如，使用多层残差块[16]作为连接）并观察到稍微更好的结果。设计更好的连接模块并不是本文的重点，所以我们选择上述的简单设计。

Application

我们的方法是在深度卷积网络内部构建特征金字塔的通用解决方案。在下面，我们采用我们的方法在RPN[29]中进行边界框提议生成，并在Fast R-CNN[11]中进行目标检测。为了证明我们方法的简洁性和有效性，我们对[29，11]的原始系统进行最小修改，使其适应我们的特征金字塔。

4.1. Feature Pyramid Networks for RPN

RPN[29]是一个滑动窗口类不可知的目标检测器。在原始的RPN设计中，一个小型子网络在密集的3×3滑动窗口，单尺度卷积特征映射上进行评估，执行目标/非目标的二分类和边界框回归。这是通过一个3×3的卷积层实现的，后面跟着两个用于分类和回归的1×1兄弟卷积，我们称之为网络头部。目标/非目标标准和边界框回归目标的定义是关于一组称为锚点的参考框的[29]。这些锚点具有多个预定义的尺度和长宽比，以覆盖不同形状的目标。
我们通过用我们的FPN替换单尺度特征映射来适应RPN。我们在我们的特征金字塔的每个层级上附加一个相同设计的头部（3x3 conv和两个1x1兄弟convs）。由于头部在所有金字塔等级上的所有位置密集滑动，所以不需要在特定层级上具有多尺度锚点。相反，我们为每个层级分配单尺度的锚点。在形式上，我们定义锚点 { $P_2,P_3,P_4,P_5$ },分别具有 { $32^2,64^2,128^2,256^2,512^2$ }个像素的面积。正如在[29]中，我们在每个层级上也使用了{$ 1:2,1:1,2:1$}多个长宽比的锚点。所以在金字塔上总共有十五个锚点。
如[29]，我们根据锚点和实际边界框的交并比（IoU）比例将训练标签分配给锚点。形式上，如果一个锚点对于一个给定的实际边界框具有最高的IoU或者与任何实际边界框的IoU超过0.7，则给其分配一个正标签，如果其与所有实际边界框的IoU都低于0.3，则为其分配一个负标签。请注意，实际边界框的尺度并未明确用于将它们分配到金字塔的层级；相反，实际边界框与已经分配给金字塔等级的锚点相关联。因此，除了[29]中的内容外，我们不引入额外的规则。
我们注意到头部的参数在所有特征金字塔层级上共享；我们也评估了替代方案，没有共享参数并且观察到相似的准确性。共享参数的良好性能表明我们的金字塔的所有层级共享相似的语义级别。这个优点类似于使用特征图像金字塔的优点，其中可以将常见头部分类器应用于在任何图像尺度下计算的特征。
通过上述改编，RPN可以自然地通过我们的FPN进行训练和测试，与[29]中的方式相同。我们在实验中详细说明实施细节。

4.2. Feature Pyramid Networks for Fast R-CNN

Fast R-CNN[11]是一个基于区域的目标检测器，利用感兴趣区域（RoI）池化来提取特征。Fast R-CNN通常在单尺度特征映射上执行。要将其与我们的FPN一起使用，我们需要为金字塔等级分配不同尺度的RoI。
我们将我们的特征金字塔看作是从图像金字塔生成的。因此，当它们在图像金字塔上运行时，我们可以适应基于区域的检测器的分配策略[15，11]。在形式上，我们通过以下公式将宽度为 $w$ 和高度为 $h$ （在网络上的输入图像上）的RoI分配到特征金字塔的级别 $P_k$ 上：

这里224是规范的ImageNet预训练大小，而K_0是大小为 $w x h = 224^2$ 的RoI应该映射到的目标级别。类似于基于ResNet的Faster R-CNN系统[16]使用 $C_4$ 作为单尺度特征映射，我们将 $K_0$ 设置为4。直觉上，方程（1）意味着如果RoI的尺寸变小了（比如224的1/2），它应该被映射到一个更精细的分辨率级别（比如k = 3）。
我们在所有级别的所有RoI中附加预测器头部（在Fast R-CNN中，预测器头部是特定类别的分类器和边界框回归器）。再次，预测器头部都共享参数，不管他们在什么层级。在[16]中，ResNet的conv5层（9层深的子网络）被用作conv4特征之上的头部，但我们的方法已经利用了conv5来构建特征金字塔。因此，与[16]不同，我们只是采用RoI池化提取7×7特征，并在最终的分类层和边界框回归层之前附加两个隐藏单元为1024维的全连接（ $f c$ ）层（每层后都接ReLU层）。这些层是随机初始化的，因为ResNets中没有预先训练好的 $f c$ 层。请注意，与标准的conv5头部相比，我们的 $2 - f c$ MLP头部更轻更快。
基于这些改编，我们可以在特征金字塔之上训练和测试Fast R-CNN。实现细节在实验部分给出。

5. Experiments on Object Detection

我们在80类的COCO检测数据集[21]上进行实验。我们训练使用80k张训练图像和35k大小的验证图像子集（trainval35k[2]）的联合，并报告了在5k大小的验证图像子集（minival）上的消融实验。我们还报告了在没有公开标签的标准测试集（test-std）[21]上的最终结果。
正如通常的做法[12]，所有的网络骨干都是在ImageNet1k分类集[33]上预先训练好的，然后在检测数据集上进行微调。我们使用公开可用的预训练的ResNet-50和ResNet-101模型。我们的代码是使用Caffe2重新实现py-faster-rcnn。

5.1. Region Proposal with RPN

根据[21]中的定义，我们评估了COCO类型的平均召回率（AR）和在小型，中型和大型目标( $AR_s, AR_m, and AR_l$ )上的AR。我们报告了每张图像使用100个提议和1000个提议的结果( $AR^{100}and AR^{1k}$ )。
实施细节。表1中的所有架构都是端对端训练。输入图像的大小调整为其较短边有800像素。我们采用8个GPU进行同步SGD训练。小批量数据包括每个GPU上2张图像和每张图像上256个锚点。我们使用0.0001的权重衰减和0.9的动量。前30k次小批量数据的学习率为0.02，而下一个10k次的学习率为0.002。对于所有的RPN实验（包括基准数据集），我们都包含了图像外部的锚盒来进行训练，这不同于[29]中的忽略这些锚盒。其它实现细节如[29]中所述。使用具有FPN的RPN在8个GPU上训练COCO数据集需要约8小时。

表1。使用RPN[29]的边界框提议结果，在COCO的minival数据集上进行评估。所有模型都是通过trainval35k训练的。列“lateral”和“top-down”分别表示横向连接和自上而下连接的存在。列“feature”表示附着头部的特征映射。所有结果都是基于ResNet-50的并共享相同的超参数。

5.1.1 Ablation Experiments(消融实验)

与baseline的比较。为了与原始RPN[29]进行公平比较，我们使用C4(与[16]相同)或C5的单比例地图运行两条基线(表1(a，b))，两者都使用与我们相同的超参数，包括使用5个比例锚{ $32^2,64^2,128^2,256^2,512^2$ }。表1(B)没有显示出与(A)相比的优势，表明单一的较高级别的特征地图是不够的，因为在较粗的分辨率和较强的语义之间存在权衡。
在RPN中放置FPN可以将 $AR^{1k}$ 提高到56.3(表1©)，这比单尺度RPNbaseline增加了8.0个点(表1(a))。此外，在小对象( $AR^{1k}_S$ )上的性能提高了12.9个点的较大幅度。我们的金字塔表示极大地提高了RPN对目标尺度变化的鲁棒性。
**自上而下的语义丰富有多重要？**表1(d)显示了没有自上而下路径的特征金字塔的结果。通过这种修改，1×1横向连接，然后是3×3卷积连接被附加到自下而上的金字塔上。该体系结构模拟重用金字塔特征层次的效果(图1(b))。
表1(d)中的结果与RPN baseline持平，远远落后于我们的。我们猜测，这是因为自下而上金字塔(图1(b))上的不同级别之间存在很大的语义差距，特别是对于非常深的ResNet。我们还评估表1(d)的一个变体，但网络头没有共享参数，但观察到类似的性能降级。这个问题不能简单地由特定级别的网络头来解决。
**横向连接有多重要？**表1(e)显示了没有1×1横向连接的自上而下特征金字塔的消融结果。这种自上而下的金字塔具有较强的语义特征和较好的分辨率。但我们认为，这些特征的位置并不准确，因为这些特征已经行向下采样和向上采样好几次了。通过横向连接可以把定位准确的自下而上层的特征与自上而下层的特征相连接。因此，FPN的 $AR^{1k}$ 得分比表1(e)高10个点。
**金字塔表示法有多重要？**人们可以将头部附加到 $P_2$ 的最高分辨率、强语义的特征地图上，而不是求助于金字塔表示法(即金字塔中最精细的级别)。与单比例尺基线类似，我们将所有锚点分配给 $P_2$ feature map。这个变种(表1(f))比基线好，但比我们的方法差。RPN是一种具有固定窗口大小的滑动窗口检测器，因此在金字塔级别上进行扫描可以增强其对尺度变化的鲁棒性。
此外，我们注意到，单独使用 $P_2$ 时由于其较大的空间分辨率而导致更多的锚点(750k，表1(f))。这一结果表明，较大数量的锚本身并不足以提高准确性。

5.2. Object Detection with Fast/Faster R-CNN

接下来，我们研究基于区域（非滑动窗口）检测器的FPN。我们通过COCO风格的平均精度（AP）和PASCAL风格的AP（在单个IoU阈值为0.5时）评估对象检测。我们还按照[21]中的定义报告了小，中和大尺寸对象（即AP，APm和AP1）的COCO AP。
实施细节。调整输入图像的大小，使其较短的一面具有800像素。同步SGD用于在8个GPU上训练模型。每个迷你批处理涉及每个GPU 2个图像和每个图像512个RoI。我们使用0.0001的权重衰减和0.9的动量。前60k迷你批次的学习率是0.02，接下来20k的学习率是0.002。我们为每个图像使用2000 RoIs进行培训，并为测试使用1000 RoI。使用FPN训练快速R-CNN在COCO数据集上大约需要10个小时。

5.2.1 Fast R-CNN (on fixed proposals)

为了更好地研究FPN仅对基于区域的检测器的影响，我们对固定的一组建议进行了Fast R-CNN的消融。我们选择冻结RPN在FPN（表1（c））上计算出的建议，因为它在检测器要识别的小物体上具有良好的性能。为简单起见，除非另有说明，否则我们在Fast R-CNN和RPN之间不共享功能。
作为基于ResNet 的 Fast R-CNN 的baseline，在[16]之后，我们采用输出大小为14×14的RoI池，并将所有conv5层附加为头部的隐藏层。在表2（a）中得出的AP为31.9。表2（b）是使用具有2个隐藏fc层的MLP头的baseline，类似于我们架构中的头。 AP的AP为28.8，表明2-fc头没有给我们任何超过表2（a）中baseline的正交优势。
表2（c）显示了FPN在Fast R-CNN中的结果。与表2（a）中的baseline相比，我们的方法将AP提高了2.0点，将小对象AP提高了2.1点。与也采用2fc头的基线（表2（b））相比，我们的方法将AP提高了5.1点。5这些比较表明，对于基于区域的对象检测器，我们的特征金字塔优于单尺度特征。

表2（d）和（e）显示，删除自上而下的连接或删除横向的连接会导致较差的结果，类似于我们在上述小节中对RPN的观察。值得注意的是，删除自上而下的连接（表2（d））会大大降低准确性，这表明Fast R-CNN会在高分辨率特征图上使用低级功能。
在表2（f）中，我们在P2的单个最佳比例尺特征图上采用Fast R-CNN。其结果（33.4 AP）比使用所有金字塔等级（33.9 AP，表2（c））的结果稍差。我们认为，这是因为投资回报率池化是一种类似翘曲的操作，因此对区域规模不那么敏感。尽管此变体的准确性很高，但它基于{P_k}的RPN建议，因此已经从金字塔表示中受益。

5.2.2 Faster R-CNN (on consistent proposals)

在上面，我们使用了一组固定的建议来研究探测器。但是在Faster R-CNN系统[29]中，RPN和Fast R-CNN必须使用相同的网络主干才能使功能共享成为可能。表3显示了我们的方法与两个基线之间的比较，所有基线均使用RPN和Fast R-CNN的一致主干架构。表3（a）显示了我们对[Faster R-CNN]基线系统的再现，如[16]中所述。在受控设置下，我们的FPN（表3（c））比该强基准要好2.3点AP和3.8点AP@0.5。
请注意，表3（a）和（b）是比He等人提供的基线强得多的基线。表3* 中的[16]我们发现以下实现方式对这一差距有所贡献：（i）我们使用800像素的图像比例代替[11，16]中的600；（ii）与[11，16]中的64个RoI相比，我们以每个图像训练512个RoI来加速收敛；（iii）我们使用5个比例锚，而不是[16]中的4个（增加322个）；（iv）在测试时，每张图片我们使用1000个提案，而不是[16]中的300个提案。因此，与表3 * 中He等人的ResNet50 Faster R-CNN基线相比，我们的方法将AP提高了7.6点，将AP@0.5提高了9.6点。
特征共享。在上面，为简单起见，我们不共享RPN和Fast R-CNN之间的特征。表5，我们按照[29]中所述的4步训练评估共享特征。与[29]相似，我们发现共享特征可以提高准确性。特征共享还可以减少测试时间。
运行时间。通过功能共享，我们基于FPN的Faster R-CNN系统在ResNet-50的单个NVIDIA M40 GPU上每个图像的推理时间为0.148秒，而ResNet-101.6的推理时间为0.172秒。表3（a）中的基准运行时间为0.32秒。我们的方法通过FPN中的额外层引入了少量的额外成本，但重量却较轻。总体而言，我们的系统比基于ResNet的Faster R-CNN更快。我们相信我们方法的效率和简便性将使未来的研究和应用受益。

5.2.3 Comparing with COCO Competition Winners

我们发现，表5中的ResNet-101模型没有使用默认的学习率时间表进行充分的训练。因此，在训练Fast R-CNN步骤时，在每个学习速率下，迷你批次的数量增加2倍。这样就可以将AP的最小级别提高到35.6，而无需共享功能。该模型是我们提交给COCO检测排行榜的模型，如表4所示。由于时间有限，我们尚未评估其功能共享版本，如表5所示，它应该稍好一些。

图4.目标分割Proposals的FPN。特征金字塔的构造与目标检测的构造相同。我们在5×5的窗口上应用一个小的MLP，以生成输出尺寸为14×14的密集对象段。用橙色显示的是每个金字塔级别（此级别为 $P_{3-5}$ 的级别）所对应的mask所对应图像区域的大小。同时显示了相应的图像区域大小（浅橙色）和规范的对象大小（深橙色）。半个八度由MLP在7x7窗口（7≈5√2）上处理，此处未显示。细节在附录中。

表4将我们的方法与COCO竞赛获胜者（包括2016年获胜者G-RMI和2015年获胜者Faster R-CNN +++）的单模型结果进行了比较。在不增加花哨的情况下，我们的单模参赛产品已经超过了这些强大的，精心设计的竞争对手。在测试开发集上，我们的方法将现有的最佳结果提高了0.5个点（36.2对35.7）和3.4个点@ 0.5（59.1对55.7）。值得注意的是，我们的方法不依赖于图像金字塔，仅使用单个输入图像比例，但在小尺寸物体上仍具有出色的AP。这只能通过使用先前方法的高分辨率图像输入来实现。
而且，我们的方法没有利用很多流行的改进，例如迭代回归[9]，硬否定挖掘[35]，上下文建模[16]，更强大的数据增强[22]等。这些改进是对FPN的补充，应该会有所发展精度进一步提高。
最近，FPN已在COCO竞争的所有轨道上实现了新的顶级成绩，包括检测，实例分割和关键点估计。有关详细信息，请参见[14]。

6. Extensions: Segmentation Proposals

我们的方法是通用的金字塔表示，可以用于除对象检测之外的其他应用程序。在本节中，我们将遵循DeepMask / SharpMask框架[27，28]，使用FPN生成细分提议。
DeepMask / SharpMask经过图像裁剪训练，可预测实例片段和对象/非对象得分。在推论时，这些模型被卷积运行以在图像中生成密集的提议。为了产生多个尺度的分段，图像金字塔是必要的[27，28]。
调整FPN以生成掩膜方案很容易。我们使用完全卷积的设置进行训练和推理。我们像在Sec中一样构造要素金字塔。 5.1并设置d =128。在要素金字塔的每个级别之上，我们应用一个小的5×5 MLP以完全卷积的方式预测14×14掩膜和对象分数，请参见图4。在[27,28]的图像金字塔中，每个八度使用2个音阶，我们使用第二个输入大小为7×7的MLP处理半个八度。这两个MLP在RPN中起着锚的作用。该架构经过端到端的培训；完整的实现细节在附录中给出。

https://github.com/facebookresearch/deepmask

6.1. Segmentation Proposal Results

结果显示在表6中。我们报告的AR区段和AR区段在小型，中型和大型对象上的总和为1000个提案。我们的具有单个5×5 MLP的基准FPN模型实现了43.4的AR。切换到稍大的7×7 MLP会使精度基本保持不变。同时使用两个MLP可以将精度提高到45.7 AR。掩码输出大小从14×14增加到28×28，AR会增加另一点（较大的大小会开始降低精度）。最后，将训练迭代次数加倍，AR就会增加到48.1。
我们还报告了与DeepMask [27]，SharpMask [28]和InstanceFCN [4]（掩膜方案生成中的最新技术方法）的比较。我们比这些方法的精度高出8.3分AR。特别是，我们在小物体上的精度几乎翻了一番。
现有的掩模提议方法[27、28、4]基于密集采样的图像金字塔（例如，在[27、28]中按2 {-2：0.5：1}缩放），使得它们在计算上昂贵。我们基于FPN的方法要快得多（我们的模型以6到7 FPS运行）。这些结果表明，我们的模型是通用的特征提取器，可以代替其他多个尺度检测问题的图像金字塔。

7. Conclusion

我们提供了一个简洁的框架，用于在ConvNets中构建要素金字塔。我们的方法在几个稳固的基准和竞赛获胜者上均显示出显着改进。因此，它为特征金字塔的研究和应用提供了一种实用的解决方案，而无需计算图像金字塔。最后，我们的研究表明，尽管深层ConvNets具有强大的表示能力，并且隐含了对尺度变化的鲁棒性，但是使用金字塔表示法明确解决多尺度问题仍然至关重要。

你可能感兴趣的:(论文翻译,计算机视觉,神经网络,机器学习,人工智能)

gemini 2.0 国内怎么使用？请收下这份最新使用攻略！ gemini-pro
好的，这是对原文的重写，力求在保持核心信息的同时，使用不同的表达方式和结构：AI新篇章：Gemini2.0如何触手可及？国内用户全攻略人工智能的浪潮再次汹涌而来，谷歌凭借其持续的创新，推出了备受瞩目的GeminiAI模型的升级版——Gemini2.0。这款新一代AI模型以其卓越的性能、广泛的应用场景和对多模态交互的深度支持，预示着一个全新AI时代的开启。2024年末，Gemini2.0Flash率
claude 3.5 官网国内怎么使用！1分钟教你在国内轻松驾驭claude 3.5 claude
ClaudeAI：开启智能助理新纪元——更安全、更亲和、更强大在人工智能领域日新月异的今天，由Anthropic公司倾力打造的ClaudeAI，正以其卓越的性能和独特的理念，迅速在全球范围内吸引了AI爱好者和专业人士的目光。Claude不仅仅是一款功能强大的智能助手，更是一款以安全性和符合人类价值观为核心设计原则的产品，致力于为用户带来更安全、更友善、更高效的AI体验。Claude采用了一种名为“
避坑指南：chatgpt账号购买成品号- chatgpt 4.0 plus成品号购买手册！ openai
购买ChatGPT账号的注意事项及指南✨在当前人工智能技术快速发展的背景下，ChatGPT作为一种强大的语言模型工具️，受到了广泛关注。然而，在获取ChatGPT账号的过程中，用户需审慎考虑多项关键因素，以确保所购账号的安全、可靠及合法性✅，规避潜在风险⚠️。本文将深入探讨购买ChatGPT账号时需重点关注的几个方面，并提供相关建议。1.账号来源审查️‍♂️账号来源是决定其安全性和可靠性的首要因素
2025年大模型AI产品经理学习路线图：零基础到精通，一篇收藏，开启学习之旅！悄悄努力然后惊艳所有人 AGI大模型老王人工智能产品经理学习 AI大模型大模型学习大模型 AI产品经理
随着人工智能技术的发展，尤其是大模型（LargeModel）的兴起，越来越多的企业开始重视这一领域的投入。作为大模型产品经理，你需要具备一系列跨学科的知识和技能，以便有效地推动产品的开发、优化和市场化。以下是一份详细的大模型产品经理学习路线，旨在帮助你构建所需的知识体系，从零基础到精通。一、基础知识阶段1.计算机科学基础数据结构与算法：理解基本的数据结构（如数组、链表、树、图等）和常用算法（如排序
【大模型】DeepSeek-R1-Distill-Qwen部署及API调用油泼辣子多加大模型实战算法 gpt langchain 人工智能
DeepSeek-R1-Distill-Qwen是由中国人工智能公司深度求索（DeepSeek）开发的轻量化大语言模型，基于阿里巴巴的Qwen系列模型通过知识蒸馏技术优化而来。当前模型开源后，我们可以将其部署，使用API方式进行本地调用1.部署环境本文中的部署基础环境如下所示：PyTorch2.5.1Python3.12(ubuntu22.04)Cuda12.4GPURTX3090(24GB)*1
深度学习和机器学习的差异 The god of big data 教程深度学习机器学习人工智能
一、技术架构的本质差异传统机器学习（MachineLearning）建立在统计学和数学优化基础之上，其核心技术是通过人工设计的特征工程（FeatureEngineering）构建模型。以支持向量机（SVM）为例，算法通过核函数将数据映射到高维空间，但特征提取完全依赖工程师的领域知识。这种"人工特征+浅层模型"的结构在面对复杂非线性关系时容易遭遇性能瓶颈。深度学习（DeepLearning）作为机器
Linux虚拟化技术：Docker与KVM的原理与应用鸽芷咕 linux docker 运维
鸽芷咕：个人主页个人专栏:《C++干货基地》《粉丝福利》⛺️生活的理想，就是为了理想的生活!博主简介博主致力于嵌入式、Python、人工智能、C/C++领域和各种前沿技术的优质博客分享，用最优质的内容带来最舒适的阅读体验！在博客领域获得C/C++领域优质、CSDN年度征文第一、掘金2023年人气作者、华为云享专家、支付宝开放社区优质博主等头衔。个人社区&个人社群加入点击即可介绍加入链接个人社群社群
利用CUDA与OpenCV实现高效图像处理：全面指南快撑死的鱼 C++（C语言）算法大揭秘 opencv 图像处理人工智能
利用CUDA与OpenCV实现高效图像处理：全面指南前言在现代计算机视觉领域，图像处理的需求日益增加。无论是自动驾驶、安防监控，还是医疗影像分析，图像处理技术都扮演着至关重要的角色。然而，图像处理的计算量非常大，往往需要强大的计算能力来保证实时性和高效性。幸运的是，CUDA和OpenCV为我们提供了一种高效的图像处理解决方案。本篇文章将详细介绍如何结合CUDA与OpenCV，利用GPU的强大计算能
【无标题】东东就是我 opencv 计算机视觉人工智能
1.计算机视觉与图像处理计算机视觉技术涵盖从图像预处理到目标检测的全流程，是工业视觉系统的核心部分。知识点扩展OpenCV基础cv2.imread()、cv2.imshow()、cv2.imwrite()进行基本图像读取、显示、保存cv2.cvtColor()进行颜色空间转换（RGB↔GRAY，RGB↔HSV）cv2.resize()进行图像缩放cv2.flip()进行图像翻转（水平/垂直）imp
计算机学习的五大避坑指南新手必藏编程诗人华仔架构设计学习 java 软件工程 golang 开发语言 c语言 python
避坑一：盲目跟风学习编程语言技术性深化：在选择编程语言时，要考虑语言的特点、适用场景以及未来发展趋势。例如，Java适合企业级应用开发，Python在数据分析和人工智能领域有广泛应用，而JavaScript则是前端开发的基础。明确自己的职业发展方向，选择与之匹配的语言进行深入学习。避坑二：忽视基础知识的掌握技术性深化：深入理解算法如排序、搜索等，熟悉常见的数据结构如链表、栈、队列、树等，并掌握设计
清华大学：人工智能之知识图谱.pdf 黄晗昂Aileen
清华大学：人工智能之知识图谱.pdf【下载地址】清华大学人工智能之知识图谱.pdf分享本资源文件来自于清华大学，聚焦于“人工智能之知识图谱”，是一份深入浅出地探讨知识图谱这一人工智能领域重要分支的文献。知识图谱作为连接数据的骨架，不仅在信息检索、推理决策等方面发挥着关键作用，还成为了现代智能系统的核心组成部分。此文档旨在为读者提供一个全面的理解框架，从基础知识入手，逐步展开至知识图谱的应用实例、技
PyBroker: 使用Python进行机器学习驱动的算法交易指南任铃冰Flourishing
PyBroker:使用Python进行机器学习驱动的算法交易指南pybrokerAlgorithmicTradinginPythonwithMachineLearning项目地址:https://gitcode.com/gh_mirrors/py/pybroker一、项目目录结构及介绍PyBroker项目遵循了清晰的组织结构来简化其源码管理和维护。以下是该仓库的主要目录及其简介：├──docs#文
利用神经网络来解决鸢尾花分类任务(附实验结果和代码) 侠之大者231 深度学习实战机器学习深度学习人工智能分类神经网络
前言本篇文章使用自己亲手搭建的神经网络模型来解决鸢尾花数据集的分类任务，读者们可以通过该简单的任务进一步理解神经网络，并且可以自己动手去搭建神经网络。鸢尾花数据集的介绍https://archive.ics.uci.edu/ml/index.php大家可以通过这个网站下载鸢尾花数据集，里面有各种经典数据集供大家使用。附：本来想给大家具体讲一讲的，但发现网站里面讲的已经很详细了，大家想用的自己去了解
从前端程序员到大模型工程师的转型攻略七七Seven～前端语言模型人工智能学习 chatgpt 算法
在科技日新月异的今天，人工智能（AI）特别是大规模预训练模型（大模型）的发展正引领着新一轮的技术革命。对于一位有志于从专注于用户界面设计和开发的前端程序员转向这个充满潜力领域的专业人士来说，这不仅是一次技术栈的转换，更是一个思维方式和个人职业发展的重大转变。本文将提供一个详尽的指南，帮助你顺利地完成这一过渡。第一阶段：打牢基础（第1-4周）深入了解AI与机器学习概念理解：阅读相关书籍、在线课程或观
PyBroker：利用 Python 和机器学习助力算法交易 skywalk8163 人工智能编程语言量化分析 python 机器学习算法
PyBroker：利用Python和机器学习助力算法交易你是否希望借助Python和机器学习的力量来优化你的交易策略？那么你需要了解一下PyBroker！这个Python框架专为开发算法交易策略而设计，尤其关注使用机器学习的策略。借助PyBroker，你可以轻松创建和微调交易规则，构建强大的模型，并深入了解你的策略表现。PyBroker介绍官方说明文档：利用PyBroker进行量化投资官方说明文档
Java 中操作 R：深度整合与高效应用 froginwe11 开发语言
Java中操作R：深度整合与高效应用引言随着大数据和机器学习的快速发展，R语言在数据分析和可视化方面扮演着越来越重要的角色。而Java作为一种广泛应用于企业级应用开发的语言，其强大的功能和稳定性使其成为构建高性能应用的首选。本文将探讨Java如何操作R语言，实现高效的数据分析应用。一、Java操作R的背景R语言优势：R语言拥有丰富的统计分析、数据可视化工具和机器学习算法库，是数据分析领域的首选语言
深度学习笔记——Resnet和迁移学习肆—— 深度学习深度学习笔记迁移学习
1.ResNet的提出深度学习与网络深度的挑战：在深度学习中，网络的“深度”(即层数)通常与模型的能力成正比。然而，随着网络深度的增加，一些问题也随之出现，最突出的是梯度消失/爆炸问题。这使得深层网络难以训练。梯度消失：梯度消失是指在训练深度神经网络时，通过多层传递的梯度(误差)变得非常小，接近于零。这导致网络中较早层的权重更新非常缓慢，甚至几乎不更新。梯度爆炸：梯度爆炸是指在训练深度神经网络时，
大话机器学习三大门派：监督、无监督与强化学习安意诚Matrix 机器学习笔记机器学习人工智能
以武侠江湖为隐喻，系统阐述了机器学习的三大范式：监督学习（少林派）凭借标注数据精准建模，擅长图像分类等预测任务；无监督学习（逍遥派）通过数据自组织发现隐藏规律，在生成对抗网络（GAN）等场景大放异彩；强化学习（明教）依托动态环境交互优化策略，驱动AlphaGo、自动驾驶等突破性应用。文章融合技术深度与江湖趣味，既解析了CNN、PCA、Q-learning等核心算法的"武功心法"（数学公式与代码实现
从零开始学机器学习——什么是机器学习努力的小雨机器学习机器学习人工智能
这个系列的文章旨在为初学者提供机器学习知识，避免使用专业术语和复杂的概念，以便更好地理解和应用。首先给大家介绍一个很好用的学习地址：https://cloudstudio.net/columns机器学习在这里简要介绍机器学习：它利用真实世界或生成的数据，自动发现其中的规律和模式，从而实现对未来情况的预测。机器学习（ML）作为人工智能的重要子领域，专注于运用特定的算法发现有意义的信息，并从感知数据中
《基于机器学习的DDoS攻击检测与防御系统设计与实现》开题报告大数据蟒行探索者毕业论文/研究报告机器学习 ddos 人工智能安全网络 web安全
目录一、课题的研究目的和意义1.1课题背景1.2课题目的（1）提高DDoS攻击检测的准确性（2）加强DDoS攻击的防御能力（3）提升网络安全防护的技术水平1.3课题意义（1）理论意义（2）实践意义二、国内(外)研究现状及分析2.1国内研究现状2.2国外研究现状2.3总结回顾三、课题主要研究内容及可行性分析3.1课题主要内容3.2可行性分析（1）技术成熟度与应用前景（2）数据处理能力四、研究方案和技
手机租赁平台开发核心技术解析红点聊租赁其他
内容概要在开发手机租赁平台这件事上，技术团队就像在组装一台精密仪器——每个齿轮的咬合都关乎整台机器的运转效率。信用免押系统是这台仪器的核心动力舱，它需要区块链存证技术扮演"数字保镖"，用分布式账本给每笔交易打上防伪钢印；而智能风控模型则化身"AI侦探"，通过机器学习在用户行为数据里嗅出潜在风险。不过千万别以为技术堆砌就能高枕无忧，关键是如何让这些模块像交响乐团般默契配合：建议企业先绘制清晰的业务流
震撼揭秘！打造吸引招聘者的机器学习作品集终极指南！真智AI 机器学习人工智能 python 后端 java
如何创建一个脱颖而出的机器学习作品集在当今竞争激烈的就业市场中，打造一个强大的机器学习作品集比以往任何时候都更重要。这不仅仅是列出你的技能，更是要展示你的实际能力。一个精心制作的作品集可以让雇主清楚地了解你的技术专长、解决问题的能力以及你对该领域的热情。无论你是初学者还是经验丰富的专业人士，作品集都是你脱颖而出并留下深刻印象的关键。在本指南中，我们将带你深入了解如何打造一个既能展示技能，又能助你获
AI浪潮下的数据保卫战：SSL证书为何成为企业刚需？ ssl证书
随着人工智能（AI）技术的迅猛发展，数据已成为企业最核心的资产之一。无论是训练AI模型、优化算法，还是提供个性化服务，数据的安全性和隐私保护都至关重要。然而，AI的广泛应用也带来了前所未有的安全挑战，尤其是在数据传输和存储过程中，如何防止数据泄露、篡改和窃取成为企业必须面对的问题。在这样的背景下，SSL证书作为网络安全的基础设施，正逐渐成为企业的“刚需”。1.AI时代的数据安全挑战数据量激增：AI
python 支持向量机回归_深入浅出python机器学习---支持向量机SVM 笔记0114-2020 weixin_39864387 python 支持向量机回归
题前故事：小D最近也交了一个女朋友，但是这个女孩好像非常情绪化，喜怒无常，让小D捉摸不透，小D女朋友的情绪完全不是“线性可分”的，于是小D想到了SVM算法，也就是大名鼎鼎的一一支持向量机。支持向量机理解引入首先需要知道线性可分和线性不可分的概念我们提取样本特征是“是否有妹子”和“是否有好吃的”这两项的时候，能够很容易用图中的直线把男生的情绪分成“开心”和“不开心”两类，这种情况下我们说样本是线性可
【人工智能】随机森林的智慧：集成学习的理论与实践蒙娜丽宁人工智能人工智能随机森林集成学习
随机森林（RandomForest）是一种强大的集成学习算法，通过构建多棵决策树并结合投票或平均预测提升模型性能。本文深入探讨了随机森林的理论基础，包括决策树的构建、Bagging方法和特征随机选择机制，并通过LaTeX公式推导其偏差-方差分解和误差分析。接着，我们详细描述了随机森林的算法流程，分析其在分类和回归任务中的适用性。文章还通过实验对比随机森林与单一决策树及其他算法（如SVM）的性能，探
大模型——Spring Boot 整合 Spring AI 实现项目接入ChatGPT 不二人生大模型人工智能大模型
大模型——SpringBoot整合SpringAI实现项目接入ChatGPT随着人工智能技术的快速发展，越来越多的应用程序开始集成人工智能功能，以提供更智能、更个性化的体验。诸如ChatGPT等开放性大型语言模型的出现，使得自然语言处理和对话系统的开发变得更加容易和普及。这些技术已经在社交媒体、客户服务、教育等领域展现出巨大潜力，对于提升用户体验和提高工作效率至关重要。优势在之前，openai已经
深度学习在SSVEP信号分类中的应用分析自由的晚风深度学习分类人工智能
目录前言1.SSVEP信号分类的处理流程2.模型输入和数据预处理3.模型结构设计3.1卷积神经网络（CNN）3.2长短期记忆网络（LSTM）4.训练方法与激活函数5.性能评估与挑战6.未来方向前言随着脑机接口（BCI）技术的发展，SSVEP（稳态视觉诱发电位）因其高信息传输速率和短训练时间而成为最受欢迎的BCI范式之一。近年来，深度学习方法在SSVEP信号分类中取得了显著的成果。本文通过对31个深
大语言模型引擎全解析：Transformers、vLLM、Llama.cpp等，最佳选择全攻略！大模型入门教程语言模型 llama 人工智能 DeepSeek prompt AI大模型大模型
近年来，大语言模型（LLMs）如GPT、LLaMA、BERT等已经成为人工智能领域的核心驱动力。然而，如何高效地运行和优化这些模型，成为了开发者和研究者面临的重要挑战。为此，一系列专为大语言模型设计的引擎应运而生。本文将带你深入了解Transformers、vLLM、Llama.cpp、SGLang、MLX和Ollama这些引擎，帮助你找到最适合的工具，释放大语言模型的全部潜力！作为技术人员，不仅
PSPNet在图像超分辨率中的应用 AI天才研究院 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
PSPNet在图像超分辨率中的应用1.背景介绍图像超分辨率(ImageSuper-Resolution,ISR)是计算机视觉领域的一个重要研究方向,旨在从低分辨率图像中重建高分辨率图像。传统的ISR方法主要基于插值算法,如双线性插值、双三次插值等,但这些方法往往无法恢复图像的高频细节信息。近年来,随着深度学习的发展,基于卷积神经网络(ConvolutionalNeuralNetwork,CNN)的
基于文本特征的微博谣言检测机器懒得学习人工智能大数据图像处理计算机视觉
随着社交媒体的普及，微博等平台成为了信息传播的重要渠道。然而，虚假信息和谣言的传播也带来了严重的社会问题。因此，自动化的谣言检测技术变得尤为重要。本文将介绍如何基于文本特征，使用深度学习模型（如LSTM、CNN）和传统机器学习模型（如SVM）来实现微博谣言检测，并对这些模型的性能进行比较。完整项目地址：基于文本特征的微博谣言检测1.项目概述本项目旨在通过分析微博文本内容，自动检测其中的谣言。系统通
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 fred@myhost.com # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla