异想天开的长颈鹿

【翻译】FCOS：Fully Convolutional One-Stage Object Detection

摘要
1.介绍
2. 相关工作
3. 我们的方法
- 3.1. 全卷积一阶段目标检测器
- 3.2. FCOS的FPN多级预测
- 3.3. FCOS的中心度
4. 实验
- 4.1. 消融实验
- - 4.1.1 FPN多级预测
  - 4.1.2 有/没有中心度
  - 4.1.3 FCOS与anchor-based检测器的对比
- 4.2. 与现有主流检测器对比
5. RPN的扩展
6. 结论

论文：FCOS: Fully Convolutional One-Stage Object Detection

摘要

我们提出了一种全卷积的一阶段目标检测器(FCOS)，以类似于语义分割的逐像素预测方式解决目标检测问题。几乎所有最先进的物体检测器，如RetinaNet、SSD、YOLOv3和Faster R-CNN都依赖于预定义的anchor boxes。相比之下，我们提出的检测器FCOS没有anchor boxes，也没proposal。通过消除预定义的anchor boxes集合，FCOS完全避免了与anchor boxes相关的复杂计算，例如在训练过程中计算重叠。更重要的是，我们还避免了与anchor boxes相关的所有超参数，这些超参数通常对最终检测性能非常敏感。凭借唯一的后处理非极大值抑制（NMS），具有ResNeXt-64x4d-101的FCOS在单模型和单尺度测试的中实现了44.7%的AP，以具有更简单的优势超越了以前的一阶段检测器。我们首次展示了一个更简单和灵活的检测框架，可以提高检测精度。我们希望提出的FCOS框架可以作为许多其他实例级任务的简单而强大的替代方案。代码可在：tinyurl.com/FCOSv1.
　　【根据论文所示，具有ResNeXt-101-FPN的 RetinaNet在COCO test-dev有40.8%的AP，不知道主干网络是不是一样的？】

1.介绍

目标检测是计算机视觉中一项基本但具有挑战性的任务，它需要算法为图像中的每个感兴趣的实例预测带有类别标签的边界框。目前所有主流检测器如Faster R-CNN[24]、SSD[18]和YOLOv2、v3[23]都依赖于一组预定义的anchor boxes，长期以来一直认为使用anchor boxes是检测器成功的关键。尽管取得了巨大成功，但值得注意的是基于anchor的检测器存在一些缺点：1）如[15, 24]所示，检测性能对anchor boxes的大小、纵横比和数量很敏感。例如，在RetinaNet[15]中，在COCO基准测试[16]上，改变这些超参数会影响AP中高达4%的性能。因此，需要在基于anchor的检测器中仔细调整这些超参数。2）即使经过精心设计，由于anchor boxes的尺度和纵横比保持固定，检测器难以处理具有较大形状变化的候选目标时，特别是对于小目标。预定义的anchor boxes也阻碍了检测器的泛化能力，因为它们需要在具有不同目标大小或纵横比的新检测任务上重新设计。3）为了实现高召回率，需要一个基于anchor的检测器在输入图像上密集放置anchor boxes（例如，对于短边为800的特征图像，特征金字塔网络（FPN）[14]中超过180K的anchor boxes）。大多数这些anchor boxes在训练期间被标记为负样本。过多的负样本加剧了训练中正负样本的不平衡。4)anchor boxes还涉及复杂的计算，例如与真实边界框计算交并集(IoU)分数。
　　【anchor boxes计算的标准是短边为800，长边1333?】
　　最近，全卷积网络(FCN)[20]在语义分割[20、28、9、19]、深度估计[17、31]、关键点检测[3]和计数[2]等密集预测任务中取得了巨大成功。作为高级视觉任务之一，目标检测可能是唯一一个偏离纯全卷积逐像素预测框架的任务，主要是由于使用了anchor boxes。很自然的提出一个问题：例如，我们能否以简洁的逐像素预测方式解决目标检测，类似于FCN进行语义分割？因此，这些基本的视觉任务可以（几乎）统一在一个框架中。我们证明答案是肯定的。此外，我们首次证明，更简单的基于FCN的检测器比基于anchor的检测器实现了更好的性能。
　　在参考文献中，一些工作试图利用基于FCN的框架进行目标检测，例如DenseBox[12]。具体来说，这些基于FCN的框架直接预测4D向量和特征图级别上每个空间位置的类类别。如图1（左）所示，4D向量描绘了从边界框的四个边到该位置的相对偏移量。这些框架类似于用于语义分割的FCN，不同之处在于每个位置都需要回归4D连续向量。然而，为了处理不同大小的边界框，DenseBox[12]将训练图像裁剪和调整到固定比例。因此DenseBox必须对图像金字塔进行检测，这违背了FCN一次计算所有卷积的理念。此外，更重要的是，这些方法主要用于特殊领域的物体检测，例如场景文本检测[33,10]或人脸检测[32,12]，因为人们认为这些方法不适用于具有高度重叠边界框的一般目标检测。如图1（右）所示，高度重叠的边界框导致难以处理的歧义：不清楚对于重叠区域中的像素要为哪个边界框回归。

【翻译】FCOS：Fully Convolutional One-Stage Object Detection_第1张图片

图1 – 如左图所示，FCOS通过预测4D向量(l, t, r, b)对每个前景像素的边界框位置进行编码（在训练期间由真实边界框信息监督）。右图显示，当一个位置位于多个边界框时，该位置应该回归哪个边界框可能不明确。

后来，我们仔细研究了这个问题，并表明使用FPN可以在很大程度上消除这种歧义。因此，我们的方法已经可以与那些传统的基于anchor的检测器具有相当的检测精度。此外，我们观察到我们的方法可能会在远离目标中心的位置产生许多低质量的预测边界框。为了抑制这些低质量的检测，我们引入了一个新的“center-ness”分支（只有一层）来预测像素与其相应边界框中心的偏差，如方程3中所定义。然后使用该分数降低检测到的低质量边界框的权重，并在NMS中合并检测结果。简单而有效的Center-ness分支允许基于FCN的检测器在完全相同的训练和测试设置下优于anchor-based的检测器。
　　这种新的检测框架具有以下优点。
　　（1）现在的检测与许多其他FCN-solvable任务（例如语义分割）统一起来，从而更容易重用这些任务中的想法。
　　（2）检测变成了proposal free和anchor free，这显着减少了设计参数的数量。设计参数通常需要启发式调整，并涉及许多技巧以实现良好的性能。因此，我们新的检测框架使检测器，尤其是其训练变得更加简单。
　　（3）通过消除anchor boxes，我们的新检测器完全避免了与anchor boxes相关的复杂计算，例如训练期间anchor boxes与真实框之间的IOU计算和匹配，从而实现对比于anchor-based的检测器，更快的训练和测试以及更少的训练内存占用。
　　（4）没有花里胡哨，我们在一阶段检测器中实现了最先进的结果。我们还表明所提出的FCOS可以用作两阶段检测器中的区域提议网络(RPN)，并且可以实现比基于anchor的RPN的检测器明显有更好的性能。鉴于更简单的anchor-free检测器的性能甚至更好，我们鼓励社区重新考虑anchor boxes（这个目前被认为是事实上的检测标准）在目标检测中的必要性。
　　（5）所提出的检测器可以立即扩展到以最少的修改解决其他视觉任务，包括实例分割和关键点检测。我们相信这种新方法可以成为许多实例预测问题的新基线。

2. 相关工作

Anchor-based检测器. Anchor-based检测器继承了传统的基于滑动窗口和提议的检测器的思想，例如 Fast R-CNN[6]。在anchor-based的检测器中，anchor boxes可以被视为预定义的滑动窗口或提议，它们被分类为正或负样本，并带有额外的偏移回归以细化边界框位置的预测。因此，这些检测器中的anchor boxes可以被视为训练样本。与以前的检测器（如Fast R-CNN）重复计算每个滑动窗口/建议的图像特征不同，anchor boxes利用CNN的特征图并避免重复特征计算，从而显着加快检测过程。anchor boxes的设计由Faster R-CNN在其RPNs[24]、SSD[18]和YOLOv2[22]中推广，并已成为现代检测器的惯例。
　　然而，如上所述，anchor boxes会导致过多的超参数，通常需要仔细调整以获得良好的性能。除了上述描述anchor形状的超参数外，基于anchor的检测器还需要其他超参数来将每个anchor boxes标记为正样本、忽略样本或负样本。在以前的工作中，他们经常使用anchor boxes和真实框之间的交并比（IOU）来确定anchor boxes的标签（例如，如果其IOU在[0.5, 1]中，则为正anchor）。这些超参数对最终准确率的影响很大，需要启发式调优。同时，这些超参数特定于检测任务，使检测任务偏离了其他密集预测任务（如语义分割）中使用的纯全卷积网络架构。
Anchor-free检测器. 最受欢迎的anchor-free检测器可能是YOLOv1[21]。YOLOv1没有使用anchor boxes，而是在靠近目标中心的点处预测边界框。仅使用靠近中心的点，因为它们被认为能够产生更高质量的检测。然而，由于仅使用靠近中心的点来预测边界框，因此YOLOv1的召回率较低，如YOLOv2[22]中所述。因此，YOLOv2[22]也使用了anchor boxes。与YOLOv1相比，FCOS利用真实边界框中的所有点来预测边界框，并且所提出的“center-ness”分支抑制了检测到的低质量边界框。因此，如我们的实验所示，FCOS能够提供与anchor-based的检测器相当的召回率。
　　CornerNet[13]是最近提出的单阶段anchor-free检测器，它检测边界框的一对角并将它们分组以形成最终检测到的边界框。CornerNet需要更复杂的后处理来分组属于同一实例的角对。为了分组的目的，学习了额外的距离度量。
　　另一类anchor-free检测器（例如[32]）基于DenseBox[12]。由于难以处理重叠的边界框并且召回率相对较低，因此该系列检测器被认为不适合通用目标检测。在这项工作中，我们表明通过多级FPN预测可以在很大程度上缓解这两个问题。此外，我们还与我们提出的center-ness分支一起表明，更简单的检测器可以实现比anchor-based的检测器更好的检测性能。

3. 我们的方法

在本节中，我们首先以每像素预测的方式重新制定目标检测。接下来，我们将展示我们如何利用多级预测来提高召回率并解决重叠边界框导致的歧义。最后，我们提出了我们提出的“center-ness”分支，它有助于抑制检测到的低质量边界框并大幅提高整体性能。

3.1. 全卷积一阶段目标检测器

令 $F_i∈R^{H×W×H}$ 是主干CNN 第 i 层的特征图，s 是直到该层的总步长。输入图像的真实边界框定义为{ $B_i$ }，其中 $B_i=(x_0^{(i)}, y_0^{(i)}, x_1^{(i)}, y_1^{(i)}, c^{(i)})$ 。这里 $x_0^{(i)}, y_0^{(i)})$ 和 $x_1^{(i)}, y_1^{(i)})$ 表示边界框的左上角和右下角的坐标。 $c^{(i)}$ 是边界框中的目标所属的类。C 是类的数量，对于 MS-COCO 数据集是 80。

【翻译】FCOS：Fully Convolutional One-Stage Object Detection_第2张图片

图 2 – FCOS 的网络架构，其中C3、C4 和C5 表示骨干网络的特征图，P3 到 P7 是用于最终预测的特征级别。 H × W 是特征图的高度和宽度。 ‘/s’ (s = 8, 16, ..., 128) 是输入图像层级特征图的下采样率。例如，所有数字都是使用 800 × 1024 输入计算的。

对于特征图上的每个位置 (x, y)，我们可以将其映射回输入图像作为 $(\lfloor s/2 \rfloor + xs, \lfloor s/2 \rfloor + ys)$ ，它靠近位置(x, y)的感受野中心。与anchor-based的检测器不同，它们将输入图像上的位置视为（多个）锚框的中心，并以这些anchor boxes为参考回归目标边界框，我们直接在该位置回归目标边界框。换句话说，我们的检测器直接将位置视为训练样本而不是anchor-based的检测器中的anchor boxes，这与语义分割的FCN相同[20]。
　　具体来说，如果位置 (x, y) 落入任何真实值框并且该位置的类标签C* 是真实值框的类标签，则将其视为正样本。否则它是一个负样本并且C*= 0（背景类）。除了用于分类的标签，我们还有一个 4D 实向量 $t^*=(l^*, t^*, r^*, b^*)$ 作为该位置的回归目标。这里 $l^*, t^*, r^*, b^*$ 是该位置到边界框四个边的距离，如图 1（左）所示。如果一个位置落入多个边界框，它被认为是一个不明确的样本。我们简单地选择面积最小的边界框作为其回归目标。在下一节中，我们将展示通过多级预测，可以显着减少模糊样本的数量，因此它们几乎不会影响检测性能。形式上，如果位置 (x, y) 与边界框相关联，则该位置的训练回归目标可以表示为：

值得注意的是，FCOS 可以利用尽可能多的前景样本来训练回归器。它不同于anchor-based的检测器，后者只将与真实框具有足够高 IOU 的anchor boxes作为正样本。我们认为这可能是 FCOS 优于其anchor-based的检测器的原因之一。
Network Outputs. 对应于训练目标，我们网络的最后一层预测了一个 80D 的分类标签向量 p 和一个 4D 向量 t = (l, t, r, b) 边界框坐标。按照[15]，我们训练C 个二元分类器，而不是训练多类分类器。与[15]类似，我们在主干网络的特征图之后分别添加了四个卷积层用于分类和回归分支。此外，由于回归目标始终为正，因此我们使用 exp(x) 将任何实数映射到回归分支顶部的 (0, ∞)。值得注意的是，FCOS 的网络输出变量比流行的每个位置有 9 个anchor boxes的anchor-based的检测器[15, 24]少 9 倍，。
Loss Function. 我们定义我们的训练损失函数如下：

【翻译】FCOS：Fully Convolutional One-Stage Object Detection_第3张图片

其中 $L_{cls}$ 是[15]中的focal loss， $L_{reg}$ 是 UnitBox[32]中的 IOU 损失。 $N_{pos}$ 表示正样本的数量，本文中λ为1是的平衡权重。总和是在特征图 $F_i$ 上的所有位置上计算的。 $1_{\{c_{x,y}^*>0\}}$ 是指示函数，如果 $c_i^*>0$ 则为 1，否则为 0。
Inference. FCOS 的推论很简单。给定输入图像，我们通过网络将其前向传播并获得特征图 $F_i$ 上每个位置的分类分数 $p_{x,y}$ 和回归预测 $t_{x,y}$ 。按照[15]，我们选择 $p_{x,y}$ >0.05的位置作为正样本并反转公式1获得预测的边界框。

3.2. FCOS的FPN多级预测

在这里，我们展示了如何通过 FPN[14]的多级预测来解决所提出的 FCOS 的两个可能问题。1)CNN 中最终特征图的大步长（例如 16×）会导致相对较低的最佳召回率 (BPR)。对于anchor-based的检测器，由于大步长导致的低召回率可以通过降低正锚框所需的 IOU 分数在一定程度上得到补偿。对于 FCOS，乍一看，人们可能会认为 BPR 可能比anchor-based的检测器低得多，因为由于步长较大，无法召回最终特征图上没有位置编码的目标。在这里，我们凭经验证明，即使有很大的 stride，基于FCN的 FCOS 仍然能够产生很好的 BPR，甚至可以在官方实现的 Detectron[7]中比anchor-based的检测器 RetinaNet[15]的 BPR 更好（参见表 1）。所以BPR其实不是FCOS的问题。此外，通过多级 FPN 预测[14]，可以进一步改进 BPR，以匹配anchor-based的 RetinaNet 可以实现的最佳 BPR。2) 真实值框的重叠会导致难以处理的歧义，即重叠中的某个位置应该回归哪个边界框？这种模糊性导致基于FCN的检测器性能下降。在这项工作中，我们表明可以通过多级预测极大地解决歧义，并且与anchor-based的检测器相比，基于FCN的检测器可以获得同等甚至更好的性能。

表 1 – anchor-based的 RetinaNet 在各种匹配规则下的 BPR 和基于FCN的 FCOS 的 BPR。基于FCN的 FCOS 与最好的anchor-based的 FCOS 具有非常相似的召回率，并且比 Detectron[7]中的官方实现具有更高的召回率，其中仅考虑 IOU ≥ 0.4 的低质量匹配。

遵循 FPN[14]，我们在不同级别的特征图上检测不同大小的目标。具体来说，我们使用定义为{ $P_3, P_4, P_5, P_6, P_7$ }的五个级别的特征图。 $P_3, P_4$ 和 $P_5$ 由主干CNN 的特征图 $C_3$ 、 $C_4$ 和 $C_5$ 生成，然后是一个 1×1 卷积层，在[14]中具有自顶向下的连接，如图 2 所示。 $P_6$ 和 $P_7$ 分别在 $P_5$ 和 $P_6$ 上应用一个步幅为 2 的卷积层生成。因此，特征级别 $P_3$ 、 $P_4$ 、 $P_5$ 、 $P_6$ 和 $P_7$ 的步幅分别为 8、16、32、64 和 128。
　　与anchor-based的检测器将不同大小的anchor boxes分配给不同的特征级别不同，我们直接限制了每个级别的边界框回归的范围。更具体地说，我们首先计算所有特征级别上每个位置的回归目标 $l^*, t^*, r^*, b^*$ 。接下来，如果某个位置满足 max( $l^*, t^*, r^*, b^*$ ) > $m_i$ 或 max( $l^*, t^*, r^*, b^*$ ) < $m_{i-1}$ ，则将其设置为负样本并且因此不再需要回归边界框。这里 $m_i$ 是特征级别 i 需要回归的最大距离。在这项工作中， $m_2$ 、 $m_3$ 、 $m_4$ 、 $m_5$ 、 $m_6$ 和 $m_7$ 分别设置为 0、64、128、256、512 和 ∞。由于具有不同大小的目标被分配到不同的特征级别，并且大多数重叠发生在具有显着不同大小的目标之间。如果一个位置，即使使用了多级预测，仍然分配给多个真实值框，我们只需选择面积最小的真实值框作为其目标。正如我们的实验所示，多级预测可以在很大程度上缓解上述歧义，并将基于FCN的检测器提高到与基于锚的检测器相同的水平。
　　最后，按照[14, 15]，我们在不同特征级别之间共享头部，不仅使检测器参数高效，而且还提高了检测性能。然而，我们观察到需要不同的特征级别来回归不同的大小范围（例如，大小范围为 $P_3$ 的[0, 64]和 $P_4$ 的[64, 128]），因此使用相同的针对不同的功能级别。因此，我们没有使用标准的 exp(x)，而是使用带有可训练标量 $S_i$ 的 exp(x) 来自动调整特征级别 $P_i$ 的指数函数的基数，这略微提高了检测性能。

3.3. FCOS的中心度

在 FCOS 中使用多级预测后，FCOS 和anchor-based的检测器之间仍然存在性能差距。我们观察到这是由于远离目标中心的位置产生了许多低质量的预测边界框。

图 3 – 中心性。红色、蓝色和其他颜色分别表示 1、0 和它们之间的值。中心度由等式 (3) 计算，并随着位置偏离目标的中心而从 1 衰减到 0。在测试时，网络预测的中心度与分类分数相乘，从而可以降低由远离目标中心的位置预测的低质量边界框的权重。

我们提出了一种简单而有效的策略来抑制这些检测到的低质量边界框而不引入任何超参数。具体来说，我们添加了一个与分类分支并行的单层分支（如图 2 所示）来预测位置的“center-ness”。center-ness描述了从位置到该位置负责的目标中心的归一化距离，如图 3 所示。给定一个位置的回归目标 $l^*, t^*, r^*和b^*$ ，Center-ness目标定义为，
　　我们在这里使用根号来减缓中心性的衰减。center-ness的范围从 0 到 1，因此使用二元交叉熵 (BCE) 损失进行训练。损失被添加到损失函数方程(2)。测试时，最终分数（用于对检测到的边界框进行排序）是通过将预测的中心度(center-ness)与相应的分类分数相乘来计算的。因此，中心度(center-ness)可以降低远离目标中心的边界框的分数。因此，这些低质量的边界框很可能会被最终的非最大抑制（NMS）过程过滤掉，从而显着提高检测性能。
　　中心度(center-ness)的另一种选择是仅使用真实边界框的中心部分作为正样本，代价是一个额外的超参数，如[12, 33]的工作所示。在我们提交之后，[1]中已经表明，两种方法的结合可以实现更好的性能。实验结果见表 3。

表 3 – FCOS 与 RetinaNet 在以 ResNet-50-FPN 作为主干的 minival split上。直接使用 RetinaNet 的训练和测试设置，我们的无锚 FCOS 在 AP 和 AR 中都实现了比基于锚的 RetinaNet 更好的性能。在头部的组归一化（GN）和 NMS 阈值为 0.6 的情况下，FCOS 在 AP 中可以达到 37.1。在我们提交之后，对 FCOS 进行了一些几乎免费的改进，性能有了很大的改进，如“改进”下面的行所示。 “ct. on reg.”：将Center-ness 分支移动到回归分支。 “ct. sample”：仅将真实值框的中心部分采样为正样本。 “GIoU”：在 IoU 损失中惩罚外接矩形区域上的联合区域。 “归一化”：归一化方程(1) 中的回归目标随着 FPN 级别的步幅。有关详细信息，请参阅我们的代码。

4. 实验

我们的实验是在大规模检测基准COCO[16]上进行的。按照惯例[15, 14, 24]，我们使用COCO trainval35k split（115K 图像）进行训练，使用minival split（5K 图像）作为消融研究的验证。我们通过将检测结果上传到评估服务器来报告我们在test-dev spli（20K 图像）的主要结果。
Training Details. 除非特别说明，ResNet-50[8]用作我们的骨干网络，并且使用与 RetinaNet[15]相同的超参数。具体来说，我们的网络使用随机梯度下降 (SGD) 进行 90K 次迭代训练，初始学习率为 0.01，小批量 16 张图像。在迭代 60K 和 80K 时，学习率分别降低了 10 倍。权重衰减和动量分别设置为 0.0001 和 0.9。我们使用在 ImageNet[4]上预训练的权重初始化我们的主干网络。对于新添加的层，我们按照[15]中的方法初始化它们。除非指定，否则输入图像的大小将调整为短边为 800，长边小于或等于 1333。
Inference Details. 我们首先通过网络转发输入图像并获得具有预测类别的预测边界框。除非特别说明，以下后处理与 RetinaNet[15]完全相同，我们直接使用与 RetinaNet 相同的后处理超参数。我们使用与训练中相同大小的输入图像。我们假设如果我们仔细调整超参数，我们的检测器的性能可能会得到进一步提高。

4.1. 消融实验

4.1.1 FPN多级预测

如前所述，基于FCN的检测器的主要问题是低召回率和由真实边界框重叠导致的模糊样本。在本节中，我们展示了这两个问题可以通过多级预测在很大程度上得到解决。
Best Possible Recalls. 关于基于FCN的检测器的第一个问题是它可能无法提供良好的最佳召回率 (BPR)。在本节中，我们表明该关注是不必要的。这里 BPR 被定义为检测器最多可以召回的真实值框数量除以所有真实值框的比率。如果在训练期间将框分配给至少一个样本（即 FCOS 中的一个位置或anchor-based的检测器中的anchor boxes），则认为该真实框被召回。如表1所示，只有步长为16的特征级别P4（即没有FPN），FCOS已经可以获得95.55%的BPR。BPR远高于官方实现Detectron中基于anchor的检测器RetinaNet的90.92%的BPR，其中只使用IOU≥0.4的低质量匹配。在 FPN 的帮助下，FCOS 可以实现 98.40% 的 BPR，这非常接近基于锚的检测器使用所有低质量匹配所能达到的最佳 BPR。由于当前检测器的最佳召回率远低于 90%，因此 FCOS 和基于锚的检测器之间的小 BPR 差距（小于 1%）实际上不会影响检测器的性能。表 3 也证实了这一点，在相同的训练和测试设置下，FCOS 比基于锚的对应物实现了更好的 AR。因此，可能没有必要担心低 BPR。

表 1 – anchor-based的 RetinaNet 在各种匹配规则下的 BPR 和基于FCN的 FCOS 的 BPR。基于FCN的 FCOS 与最好的anchor-based的 FCOS 具有非常相似的召回率，并且比 Detectron[7]中的官方实现具有更高的召回率，其中仅考虑 IOU ≥ 0.4 的低质量匹配。

Ambiguous Samples. 基于FCN的检测器的另一个问题是，由于真实边界框的重叠，它可能有大量模糊样本，如图 1（右）所示。在表 2 中，我们显示了在最小分割上模糊样本与所有正样本的比率。如表所示，如果不使用FPN而只使用特征级别P4，确实存在大量的模糊样本（23.16%）。但是，使用 FPN，由于大多数重叠目标被分配到不同的特征级别，因此该比率可以显着降低至仅 7.14%。此外，我们认为由同一类别的目标之间重叠导致的模糊样本无关紧要。例如，如果具有相同类别的目标 A 和 B 有重叠，则无论重叠中的位置预测哪个目标，预测都是正确的，因为它总是与相同的类别匹配。错过的目标可以通过只属于它的位置来预测。因此，我们只计算不同类别的边界框之间重叠的模糊样本。如表 2 所示，多级预测将模糊样本的比率从 17.84% 降低到 3.75%。为了进一步表明ground truth box的重叠不是我们基于FCN的FCOS的问题，我们在推断有多少检测到的边界框来自模糊位置时计算。我们发现只有 2.3% 的检测到的边界框是由模糊位置产生的。通过进一步仅考虑不同类别之间的重叠，该比例降低到1.5%。请注意，这并不意味着 FCOS 无法工作的位置有 1.5%。如前所述，这些位置与具有最小面积的真实值框相关联。因此，这些位置只会冒遗漏一些较大物体的风险。如以下实验所示，它们不会使我们的 FCOS 劣于基于锚的检测器。

表 2 – Amb. samples表示模糊样本与所有正样本的比率。 Amb. samples (diff.) 与前面相似，但排除了重叠区域中的那些歧义样本，但属于同一类别，因为推理时歧义的种类无关紧要。我们可以看到，使用 FPN，这个模糊样本的百分比很小（3.75%）。

4.1.2 有/没有中心度

如前所述，我们提出了“center-ness”来抑制由远离目标中心的位置产生的低质量检测边界框。如表 4 所示，center-ness 分支可以将 AP 从 33.5% 提升到 37.1%，使得anchor-free FCOS 优于anchor-based的 RetinaNet（35.9%）。请注意，anchor-based的 RetinaNet 使用两个 IoU 阈值将anchor boxes标记为正/负样本，这也有助于抑制低质量预测。提出的中心度可以消除两个超参数。然而，在我们最初提交之后，它表明同时使用中心度和阈值可以产生更好的性能，如行“+ctr. sampling”在表 3 中。人们可能会注意到，中心度也可以用预测的回归向量计算，而无需引入额外的中心度分支。然而，如表 4 所示，从回归向量计算的中心度并不能提高性能，因此单独的中心度是必要的。

表 4 – 对 minival split 提出的Center-ness 分支的消融研究。 “None”表示不使用中心度。 “center-ness†”表示使用从预测的回归向量计算的中心度。 “中心度”是使用从提议的中心度分支预测的中心度。Center-ness 分支提高了所有指标下的检测性能。

4.1.3 FCOS与anchor-based检测器的对比

上述 FCOS 与标准 RetinaNet 有两个细微差别。1）我们在除最后一个预测层之外的新添加的卷积层中使用组归一化（GN）[29]，这使我们的训练更加稳定。2) 我们使用 P5 来生成 P6 和 P7，而不是标准 RetinaNet 中的C5。我们观察到使用 P5 可以稍微提高性能。
为了表明我们的 FCOS 可以作为anchor-based的检测器的简单而强大的替代方案，并且为了公平比较，我们删除了 GN（梯度被裁剪以防止它们爆炸）并在我们的检测器中使用C5。如表 3 所示，在完全相同的设置下，我们的 FCOS 仍然优于基于锚的检测器（36.3% 对 35.9%）。此外，值得注意的是，我们直接使用了 RetinaNet 的所有超参数（例如，学习率、NMS 阈值等），这些超参数已针对anchor-based的检测器进行了优化。我们认为，如果针对 FCOS 调整超参数，可以进一步提高 FCOS 的性能。
　　值得注意的是，通过一些几乎没有代价的改进，如表 3 所示，我们的anchor-free检测器的性能可以大幅提高。鉴于anchor-free检测器的卓越性能和优点（例如，比anchor-based的检测器更简单和更少的超参数），我们鼓励社区重新考虑anchor boxes在目标检测中的必要性。

表 5 – FCOS 与其他最先进的两级或一级探测器（单模型和单尺度结果）。在具有相同主干的 AP 中，FCOS 的性能比anchor-based的对应 RetinaNet 高 2.4%。 FCOS 还以更低的设计复杂性优于最近的anchor-free 一阶段检测器CornerNet。有关“改进”的详细信息，请参阅表 3。

4.2. 与现有主流检测器对比

我们将 FCOS 与其他最先进的物体检测器在MS-COCO test-dev split基准上进行比较。对于这些实验，我们在训练期间在 640 到 800 的范围内随机缩放图像的较短边，并将迭代次数加倍到 180K（学习率变化点按比例缩放）。其他设置与表 3 中 AP 为 37.1% 的模型完全相同。如表 5 所示，使用 ResNet-101-FPN，我们的 FCOS 在 AP 中比具有相同主干 ResNet-101-FPN 的 RetinaNet 性能高 2.4%。据我们所知，这是第一次没有任何花里胡哨的anchor-free检测器在很大程度上优于anchor-based的检测器。FCOS 还大大优于其他经典的基于两阶段anchor的检测器，例如 Faster R-CNN。以 ResNeXt-64x4d-101-FPN[30]作为主干，FCOS 在 AP 中达到了 43.2%。它大大优于最近最先进的anchor-free检测器CornerNet[13]，同时更简单。请注意，CornerNet 需要使用嵌入向量对角点进行分组，这需要对检测器进行特殊设计。因此，我们认为 FCOS 更有可能成为当前主流anchor-based的检测器的强大而简单的替代品。此外，表 3 中改进的 FCOS 在单模型和单尺度测试的 AP 中达到了 44.7%，大大超过了以前的检测器。

5. RPN的扩展

到目前为止，我们已经表明，在一阶段检测器中，我们的 FCOS 可以实现比anchor-based的检测器更好的性能。直观上，FCOS 也应该能够在两阶段检测器 Faster RCNN 中用 FPN[14]替换区域提议网络 (RPN) 中的anchor boxes。在这里，我们通过实验证实了这一点。
与带有 FPN[14]的 RPN 相比，我们用 FCOS 中的方法替换了anchor boxes。此外，我们将 GN 添加到 FPN Heads 的层中，这可以使我们的训练更加稳定。所有其他设置与官方代码[7]中带有FPN的RPN完全相同。如表 6 所示，即使没有提出的中心度分支，我们的 FCOS 也已经显着提高了 AR100 和 AR1k。使用提议的中心度分支，FCOS 进一步将 AR100 和 AR1k 分别提升到 52.8% 和 60.3%，与具有 FPN 的 RPN 相比，AR100 的相对改进为 18%，AR1k 的绝对改进为 3.4%。

6. 结论

我们提出了一种anchor-free和proposal-free的单级检测器 FCOS。如实验所示，FCOS 与流行的anchor-based的 one-stage 检测器相比具有优势，包括 RetinaNet、YOLO 和 SSD，但设计复杂性要低得多。FCOS 完全避免了与anchor boxes相关的所有计算和超参数，并以逐像素预测的方式解决目标检测，类似于语义分割等其他密集预测任务。FCOS 还在一级检测器中实现了最先进的性能。我们还表明 FCOS 可以用作两阶段检测器 Faster R-CNN 中的 RPN，并且在很大程度上优于其 RPN。鉴于其有效性和效率，我们希望 FCOS 可以作为当前主流anchor-based的检测器的强大而简单的替代品。我们也相信 FCOS 可以扩展到解决许多其他实例级别的识别任务。

你可能感兴趣的:(翻译,计算机视觉,深度学习)

12个零成本靠谱副业！声优配音圈
工资太少，生活费不高，不想再花父母的钱，今天这期视频就来跟大家盘点那些既能提升自己又能赚钱的好方法，兼职副业推荐公众号，配音新手圈，声优配音圈，新配音兼职圈，配音就业圈，鼎音副业，有声新手圈，每天更新各种远程工作与在线兼职，职位包括：写手、程序开发、剪辑、设计、翻译、配音、无门槛、插画、翻译、等等。。。每日更新兼职。只要够努力，副业实现月入过万真的不是梦。今天这期我会把那些靠谱副业分为两类，不需要
小说配音兼职平台，小说配音挣钱是真的么配音新手圈
一、小说配音兼职平台的好处小说配音兼职平台是一种可以让人们在业余时间赚钱的途径。兼职副业推荐公众号，配音新手圈，声优配音圈，新配音兼职圈，配音就业圈，鼎音副业，有声新手圈，每天更新各种远程工作与在线兼职，职位包括：写手、程序开发、剪辑、设计、翻译、配音、无门槛、插画、翻译、等等。。。每日更新兼职。通过在兼职平台上进行小说配音，不仅可以提升自己的声音技巧和语言表达能力，还可以获得一定的报酬。同时，兼
2022-06-02 你的常识，是别人的知识 Sarah写着玩
你的常识，是别人的知识Day87S解读论语之Day71【原文】7.34子曰：“若圣与仁，则吾岂敢！抑为之不厌，诲人不倦，则可谓云尔已矣。''公西华曰：“正唯弟子不能学也。”【翻译】孔子说：“如果说到圣和仁，那我怎么敢当！不过是朝着圣与仁的方向去努力做而不厌倦，教导别人不知疲倦，那是可以这样说的。”公西华说：“这正是我们弟子学不到的。”【解读】1，有时，你的追求只是别人的起点。孔子并没有刻意追求所谓
英伟达Triton 推理服务详解 leo0308 基础知识机器人 Triton 人工智能
1.TritonInferenceServer简介TritonInferenceServer（简称Triton，原名NVIDIATensorRTInferenceServer）是英伟达推出的一个开源、高性能的推理服务器，专为AI模型的部署和推理服务而设计。它支持多种深度学习框架和硬件平台，能够帮助开发者和企业高效地将AI模型部署到生产环境中。Triton主要用于模型推理服务化，即将训练好的模型通过
Java NLP炼金术：从词袋到深度学习，构建AI时代的语言魔方墨夶 Java学习资料人工智能 java 自然语言处理
一、JavaNLP的“三剑客”：框架与工具链1.1ApacheOpenNLP：传统NLP的“瑞士军刀”目标：用词袋模型实现文本分类与实体识别代码实战：文档分类器的“炼成术”//OpenNLP文档分类器（基于词袋模型）importopennlp.tools.doccat.*;importopennlp.tools.util.*;publicclassDocumentClassifier{//训练模型
存在主义是一种人道主义还是人本主义？ jAhAtA
读萨特《存在主义是一种人道主义》。这几年看这种入门级的哲学翻译不少，尤其以加缪的《西西弗斯神话》最典型，看了四个译本，渴望靠着不同人给我讲课明白的更多，自然也有意无意的经历着翻译用词的区别。这本书，书名用的人道主义，但是从我对存在主义的理解，总觉得该是人本主义。我以为，同样以A为出发点，受众是B。人道主义的受众B应该是A以外的人。人本主义的受众B应该是包括A的人、物、环境。都是起源于文艺复兴时期，
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
NumPy-@运算符详解 GG不是gg numpy numpy
NumPy-@运算符详解一、@运算符的起源与设计目标1.从数学到代码：符号的统一2.设计目标二、@运算符的核心语法与运算规则1.基础用法：二维矩阵乘法2.一维向量的矩阵语义3.高维数组：批次矩阵运算4.广播机制：灵活的形状匹配三、@运算符与其他乘法方式的核心区别1.对比`np.dot()`2.对比元素级乘法`*`3.对比`np.matrix`的`*`运算符四、典型应用场景：从基础到高阶1.深度学习
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
解决 Python 包安装失败问题：以 accelerate 为例
在使用Python开发项目时，我们经常会遇到依赖包安装失败的问题。今天，我们就以accelerate包为例，详细探讨一下可能的原因以及解决方法。通过这篇文章，你将了解到Python包安装失败的常见原因、如何切换镜像源、如何手动安装包，以及一些实用的注意事项。一、问题背景在开发一个深度学习项目时，我需要安装accelerate包来优化模型的训练过程。然而，当我运行以下命令时：bash复制pipins
App Store上架：Guideline 4.3(a) - Design - Spam 申述过审九月紫 App Store上架 Apple Store 上架 4.3
从六月苹果开展了全球开发大会后，苹果内部对于新系统的生成进行了多次会议，针对新系统和商店app管理进行的升级和管控，导致近期许多开发者遇到过不了审、难过审的问题，今天来讲一下关于4.3垃圾邮件怎么去申述与修改。标题拒审邮件Guideline4.3(a)-Design-Spam排查方向修改申述拒审邮件Guideline4.3(a)-Design-Spam如下：翻译过来是：准则4.3（a）-设计-垃圾
从RNN循环神经网络到Transformer注意力机制：解析神经网络架构的华丽蜕变熊猫钓鱼>_> 神经网络 rnn transformer
1.引言在自然语言处理和序列建模领域，神经网络架构经历了显著的演变。从早期的循环神经网络（RNN）到现代的Transformer架构，这一演变代表了深度学习方法在处理序列数据方面的重大进步。本文将深入比较这两种架构，分析它们的工作原理、优缺点，并通过实验结果展示它们在实际应用中的性能差异。2.循环神经网络（RNN）2.1基本原理循环神经网络是专门为处理序列数据而设计的神经网络架构。RNN的核心思想
【译】2018 前端性能优化清单 —— 第一部分 qq_36320160 前端前端
原文地址：Front-EndPerformanceChecklist2018-Part1原文作者：VitalyFriedman译文出自：掘金翻译计划本文永久链接：https://github.com/xitu/gold-miner/blob/master/TODO/front-end-performance-checklist-2018-1.md译者：tvChan校对者：mysterytonyry
ARM 和 x86_64是什么关系 riverz1227 linux
什么是ARM和x86_64？它们都是CPU指令集架构（ISA）指令集架构（InstructionSetArchitecture）就是：CPU能够理解和执行的“语言”和“命令格式”。类比解释：指令集就像“语言”类比对象ARMCPUx86_64CPU（Intel/AMD）语言西班牙语英语编译器翻译成西班牙语的代码翻译成英语的代码执行者会西班牙语的CPU会英语的CPUARM架构是一种低功耗、高能效的CP
如何使用Python实现交通工具识别
如何使用Python实现交通工具识别文章目录技术架构功能流程识别逻辑用户界面增强特性依赖项主要类别内容展示该系统是一个基于深度学习的交通工具识别工具，具备以下核心功能与特点：技术架构使用预训练的ResNet50卷积神经网络模型（来自ImageNet数据集）集成图像增强预处理技术（随机裁剪、旋转、翻转等）采用多数投票机制提升预测稳定性基于置信度评分的结果筛选策略功能流程用户通过GUI界面选择待识别图
OpenCV图片操作100例：从入门到精通指南（1）总有刁民想爱朕ha opencv 计算机视觉人工智能
OpenCV图片操作100例：从入门到精通指南本文整理了100个OpenCV实用技巧，涵盖图像处理各个领域，助你轻松掌握计算机视觉核心技能！一、入门必备：基础操作1.图像读写与显示importcv2#读取图像（BGR格式）img=cv2.imread('image.jpg')#显示图像cv2.imshow('示例图片',img)cv2.waitKey(0)#按任意键退出cv2.destroyAll
OpenCV图片操作100例：从入门到精通指南（3）总有刁民想爱朕ha opencv 人工智能计算机视觉
高效学习路径：1️⃣分阶段学习：入门：1-20例（基础操作）进阶：21-50例（图像处理）高级：51-100例（计算机视觉）2️⃣项目驱动学习：证件照背景替换（1-15例）停车场车位检测（30-45例）视频运动追踪（70-85例）3️⃣性能优化技巧：#使用UMat加速图像处理umat_img=cv2.UMat(img)processed=cv2.GaussianBlur(umat_img,(5,5
Python OpenCV教程从入门到精通的全面指南【文末送书】一键难忘 python opencv 开发语言
文章目录PythonOpenCV从入门到精通1.安装OpenCV2.基本操作2.1读取和显示图像2.2图像基本操作3.图像处理3.1图像转换3.2图像阈值处理3.3图像平滑4.边缘检测和轮廓4.1Canny边缘检测4.2轮廓检测5.高级操作5.1特征检测5.2目标跟踪5.3深度学习与OpenCVPythonOpenCV从入门到精通【文末送书】PythonOpenCV从入门到精通OpenCV(Ope
OpenCV入门到精通：AI视觉处理的完整指南 AI云原生与云计算技术学院人工智能 opencv 计算机视觉 ai
OpenCV入门到精通：AI视觉处理的完整指南关键词：OpenCV、计算机视觉、图像预处理、目标检测、AI视觉应用摘要：本文是一份面向AI视觉爱好者的OpenCV完整学习指南。从OpenCV的核心概念讲起，结合生活案例、代码示例和项目实战，逐步拆解图像读取/显示、灰度化、边缘检测、目标检测等关键技术。无论你是想入门计算机视觉的新手，还是希望用OpenCV解决实际问题的开发者，都能通过本文掌握从理论
CNN 猫狗识别：从理论到实战的深度解析爱熬夜的小古 cnn 深度学习人工智能
在计算机视觉领域，卷积神经网络（ConvolutionalNeuralNetwork，CNN）凭借其强大的特征提取和模式识别能力，成为图像分类任务的主流技术。猫狗识别作为经典的图像分类问题，不仅能帮助我们理解CNN的工作原理，还能为实际应用提供技术支持。本文将深入探讨CNN在猫狗识别中的应用，从理论基础到实战代码，带你全面掌握这项技术。一、CNN基础理论概述（一）CNN的核心组件卷积层：是CNN的
OpenCV入门到精通：从基础到实战的全面指南
摘要：本文旨在为初学者和有一定经验的开发者提供OpenCV从入门到精通的全面指南。文章首先介绍了OpenCV的基本概念和安装方法，然后深入讲解了图像处理基础、特征检测与匹配、视频处理与分析等核心内容，最后通过实战案例展示了OpenCV在计算机视觉任务中的应用。关键词：OpenCV；图像处理；特征检测；视频分析；实战案例引言OpenCV（OpenSourceComputerVisionLibrary
第八周 tensorflow实现猫狗识别降花绘 365天深度学习 tensorflow系列 tensorflow 深度学习人工智能
本文为365天深度学习训练营内部限免文章（版权归K同学啊所有）**参考文章地址：[TensorFlow入门实战｜365天深度学习训练营-第8周：猫狗识别（训练营内部成员可读）]**作者：K同学啊文章目录一、本周学习内容:1、自己搭建VGG16网络2、了解model.train_on_batch（）3、了解tqdm，并使用tqdm实现可视化进度条二、前言三、电脑环境四、前期准备1、导入相关依赖项2、
html 周华华 html
js 1，数组的排列 var arr=[1,4,234,43,52,]; for(var x=0;x<arr.length;x++){ for(var y=x-1;y<arr.length;y++){ if(arr[x]<arr[y]){ &
【Struts2 四】Struts2拦截器 bit1129 struts2拦截器
Struts2框架是基于拦截器实现的，可以对某个Action进行拦截，然后某些逻辑处理，拦截器相当于AOP里面的环绕通知，即在Action方法的执行之前和之后根据需要添加相应的逻辑。事实上，即使struts.xml没有任何关于拦截器的配置，Struts2也会为我们添加一组默认的拦截器，最常见的是，请求参数自动绑定到Action对应的字段上。 Struts2中自定义拦截器的步骤是：
make:cc 命令未找到解决方法 daizj linux 命令未知 make cc
安装rz sz程序时，报下面错误： [root@slave2 src]# make posix cc -O -DPOSIX -DMD=2 rz.c -o rz make: cc：命令未找到 make: *** [posix] 错误 127 系统：centos 6.6 环境：虚拟机错误原因：系统未安装gcc，这个是由于在安
Oracle之Job应用周凡杨 oracle job
最近写服务，服务上线后，需要写一个定时执行的SQL脚本，清理并更新数据库表里的数据，应用到了Oracle 的 Job的相关知识。在此总结一下。一：查看相关job信息 1、相关视图 dba_jobs all_jobs user_jobs dba_jobs_running 包含正在运行
多线程机制朱辉辉33 多线程
转至http://blog.csdn.net/lj70024/archive/2010/04/06/5455790.aspx 程序、进程和线程：程序是一段静态的代码，它是应用程序执行的蓝本。进程是程序的一次动态执行过程，它对应了从代码加载、执行至执行完毕的一个完整过程，这个过程也是进程本身从产生、发展至消亡的过程。线程是比进程更小的单位，一个进程执行过程中可以产生多个线程，每个线程有自身的
web报表工具FineReport使用中遇到的常见报错及解决办法（一）老A不折腾 web报表 finereport java报表报表工具
FineReport使用中遇到的常见报错及解决办法（一）这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、address pool is full：含义：地址池满，连接数超过并发数上
mysql rpm安装后没有my.cnf 林鹤霄没有my.cnf
Linux下用rpm包安装的MySQL是不会安装/etc/my.cnf文件的，至于为什么没有这个文件而MySQL却也能正常启动和作用，在这儿有两个说法，第一种说法，my.cnf只是MySQL启动时的一个参数文件，可以没有它，这时MySQL会用内置的默认参数启动，第二种说法，MySQL在启动时自动使用/usr/share/mysql目录下的my-medium.cnf文件，这种说法仅限于r
Kindle Fire HDX root并安装谷歌服务框架之后仍无法登陆谷歌账号的问题 aigo root
原文：http://kindlefireforkid.com/how-to-setup-a-google-account-on-amazon-fire-tablet/ Step 4: Run ADB command from your PC On the PC, you need install Amazon Fire ADB driver and instal
javascript 中var提升的典型实例 alxw4616 JavaScript
// 刚刚在书上看到的一个小问题,很有意思.大家一起思考下吧 myname = 'global'; var fn = function () { console.log(myname); // undefined var myname = 'local'; console.log(myname); // local }; fn() // 上述代码实际上等同于以下代码 m
定时器和获取时间的使用百合不是茶时间的转换定时器
定时器:定时创建任务在游戏设计的时候用的比较多 Timer();定时器 TImerTask();Timer的子类由 Timer 安排为一次执行或重复执行的任务。定时器类Timer在java.util包中。使用时，先实例化，然后使用实例的schedule(TimerTask task, long delay)方法，设定
JDK1.5 Queue bijian1013 java thread java多线程 Queue
JDK1.5 Queue LinkedList： LinkedList不是同步的。如果多个线程同时访问列表，而其中至少一个线程从结构上修改了该列表，则它必须保持外部同步。（结构修改指添加或删除一个或多个元素的任何操作；仅设置元素的值不是结构修改。）这一般通过对自然封装该列表的对象进行同步操作来完成。如果不存在这样的对象，则应该使用 Collections.synchronizedList 方
http认证原理和https bijian1013 http https
一.基础介绍在URL前加https://前缀表明是用SSL加密的。你的电脑与服务器之间收发的信息传输将更加安全。 Web服务器启用SSL需要获得一个服务器证书并将该证书与要使用SSL的服务器绑定。 http和https使用的是完全不同的连接方式，用的端口也不一样,前者是80，后
【Java范型五】范型继承 bit1129 java
定义如下一个抽象的范型类，其中定义了两个范型参数，T1，T2 package com.tom.lang.generics; public abstract class SuperGenerics<T1, T2> { private T1 t1; private T2 t2; public abstract void doIt(T
【Nginx六】nginx.conf常用指令(Directive) bit1129 Directive
1. worker_processes 8; 表示Nginx将启动8个工作者进程，通过ps -ef|grep nginx,会发现有8个Nginx Worker Process在运行 nobody 53879 118449 0 Apr22 ? 00:26:15 nginx: worker process
lua 遍历Header头部 ronin47 lua header 遍历　
local headers = ngx.req.get_headers() ngx.say("headers begin", "<br/>") ngx.say("Host : ", he
java-32.通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小(两数组的差最小)。 bylijinnan java
import java.util.Arrays; public class MinSumASumB { /** * Q32.有两个序列a,b，大小都为n,序列元素的值任意整数，无序. * * 要求：通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小。 * 例如: * int[] a = {100,99,98,1,2,3
redis 开窍的石头 redis
在redis的redis.conf配置文件中找到# requirepass foobared 把它替换成requirepass 12356789 后边的12356789就是你的密码打开redis客户端输入config get requirepass 返回 redis 127.0.0.1:6379> config get requirepass 1) "require
[JAVA图像与图形]现有的GPU架构支持JAVA语言吗？ comsci java语言
无论是opengl还是cuda，都是建立在C语言体系架构基础上的，在未来，图像图形处理业务快速发展，相关领域市场不断扩大的情况下，我们JAVA语言系统怎么从这么庞大，且还在不断扩大的市场上分到一块蛋糕，是值得每个JAVAER认真思考和行动的事情
安装ubuntu14.04登录后花屏了怎么办 cuiyadll ubuntu
这个情况，一般属于显卡驱动问题。可以先尝试安装显卡的官方闭源驱动。按键盘三个键：CTRL + ALT + F1 进入终端，输入用户名和密码登录终端：安装amd的显卡驱动 sudo apt-get install fglrx 安装nvidia显卡驱动 sudo ap
SSL 与数字证书的基本概念和工作原理 darrenzhu 加密 ssl 证书密钥签名
SSL 与数字证书的基本概念和工作原理 http://www.linuxde.net/2012/03/8301.html SSL握手协议的目的是或最终结果是让客户端和服务器拥有一个共同的密钥，握手协议本身是基于非对称加密机制的，之后就使用共同的密钥基于对称加密机制进行信息交换。 http://www.ibm.com/developerworks/cn/webspher
Ubuntu设置ip的步骤 dcj3sjt126com ubuntu
在单位的一台机器完全装了Ubuntu Server，但回家只能在XP上VM一个，装的时候网卡是DHCP的，用ifconfig查了一下ip是192.168.92.128,可以ping通。转载不是错： Ubuntu命令行修改网络配置方法 /etc/network/interfaces打开后里面可设置DHCP或手动设置静态ip。前面auto eth0，让网卡开机自动挂载. 1. 以D
php包管理工具推荐 dcj3sjt126com PHP Composer
http://www.phpcomposer.com/ Composer是 PHP 用来管理依赖（dependency）关系的工具。你可以在自己的项目中声明所依赖的外部工具库（libraries），Composer 会帮你安装这些依赖的库文件。中文文档入门指南下载安装包列表 Composer 中国镜像
Gson使用四（TypeAdapter） eksliang json gson Gson自定义转换器 gsonTypeAdapter
转载请出自出处：http://eksliang.iteye.com/blog/2175595 一.概述 Gson的TypeAapter可以理解成自定义序列化和返序列化二、应用场景举例例如我们通常去注册时（那些外国网站），会让我们输入firstName，lastName,但是转到我们都
JQM控件之Navbar和Tabs gundumw100 html xml css
在JQM中使用导航栏Navbar是简单的。只需要将data-role="navbar"赋给div即可： <div data-role="navbar"> <ul> <li><a href="#" class="ui-btn-active&qu
利用归并排序算法对大文件进行排序 iwindyforest java 归并排序大文件分治法 Merge sort
归并排序算法介绍，请参照Wikipeida zh.wikipedia.org/wiki/%E5%BD%92%E5%B9%B6%E6%8E%92%E5%BA%8F 基本思想：大文件分割成行数相等的两个子文件，递归（归并排序）两个子文件，直到递归到分割成的子文件低于限制行数低于限制行数的子文件直接排序两个排序好的子文件归并到父文件直到最后所有排序好的父文件归并到输入
iOS UIWebView URL拦截啸笑天 UIWebView
本文译者：candeladiao，原文：URL filtering for UIWebView on the iPhone说明：译者在做app开发时，因为页面的javascript文件比较大导致加载速度很慢，所以想把javascript文件打包在app里，当UIWebView需要加载该脚本时就从app本地读取，但UIWebView并不支持加载本地资源。最后从下文中找到了解决方法，第一次翻译，难免有
索引的碎片整理SQL语句 macroli sql
SET NOCOUNT ON DECLARE @tablename VARCHAR (128) DECLARE @execstr VARCHAR (255) DECLARE @objectid INT DECLARE @indexid INT DECLARE @frag DECIMAL DECLARE @maxfrag DECIMAL --设置最大允许的碎片数量,超过则对索引进行碎片
Angularjs同步操作http请求with $promise qiaolevip 每天进步一点点学习永无止境 AngularJS 纵观千象
// Define a factory app.factory('profilePromise', ['$q', 'AccountService', function($q, AccountService) { var deferred = $q.defer(); AccountService.getProfile().then(function(res) {
hibernate联合查询问题 sxj19881213 sql Hibernate HQL 联合查询
最近在用hibernate做项目，遇到了联合查询的问题，以及联合查询中的N+1问题。针对无外键关联的联合查询，我做了HQL和SQL的实验，希望能帮助到大家。（我使用的版本是hibernate3.3.2） 1 几个常识：（1）hql中的几种join查询，只有在外键关联、并且作了相应配置时才能使用。（2）hql的默认查询策略，在进行联合查询时，会产
struts2.xml wuai struts
<?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache