alex1801

yolov4论文翻译

YOLOv4 Optimal Speed and Accuracy of Object Detection

论文下载：https://arxiv.org/pdf/2004.10934.pdf

论文源码：GitHub - AlexeyAB/darknet: YOLOv4 / Scaled-YOLOv4 / YOLO - Neural Networks for Object Detection (Windows and Linux version of Darknet )

摘要

有大量的特性是可以提高卷积神经网络（CNN）的准确性。需要对大型数据集上此类要素的组合进行实际测试，以得到结果的理论论证。某些特性仅针对特定模型、特定问题，或仅适用于小规模数据集；而某些特性（如批处理规范化和残差连接）适用于大多数模型、任务和数据集。我们假设此类通用功能包括Weighted-Residual-Connections (WRC), Cross-Stage-Partial-connections (CSP), Cross mini-Batch Normalization (CmBN), Self-adversarial-training (SAT) and Mish-activation。我们使用新功能：WRC、CSP、CmBN、SAT、Mish 激活、Mosaic 数据扩增、CmBN、DropBlock 正化和 CIoU 损耗，并结合其中一些功能实现最先进的结果：43.5% AP （65.7% AP 50），实时速度为特斯拉 V100 上的 MS COCO 数据集 [65 FPS。源代码位于https://github.com/AlexeyAB/darknet。

1.引言

大多数基于CNN的目标检测器大多仅适用于推荐系统。例如，通过城市摄像机搜索免费停车位是通过速度较慢、准确率高的模型执行的，而汽车碰撞警告则需要又快又准的模型。提高实时目标检测器精度，不仅可以将其用于提示生成建议系统，还可用于独立的过程管理和人工输入减少。传统图形处理单元（GPU）上的实时目标检测器操作允许以可接受的价格大规模使用。最精确的现代神经网络无法实时运行，并且需要大量的 GPU 进行大型小型批处理大小的训练。我们通过创建一个在传统 GPU 上实时运行的 CNN 来解决这些问题，为此训练只需要一个常规 GPU。

图1：对拟建的YOLOv4和其他最先进的目标检测器进行比较。YOLOv4 的速度比高效德特快两倍，具有同等的性能。YOLOv3 的 AP 和 FPS 分别提高了 10% 和 12%。

这项工作的主要目标是设计在生产系统中能快速运行速度的目标检测器，并行优化，而不是低的浮点量理论指标（BFLOP）。我们希望设计的对象能够轻松训练和使用。例如，任何使用传统 GPU 进行训练和测试的人都可以获得实时、高质量和令人信服的目标检测结果，如图 1 所示的 YOLOv4 结果所示。我们的贡献总结如下：

1、我们开发一种高效、强大的物体检测模型。它使每个人都可以使用1080 Ti或2080 Ti GPU来训练超快速和准确的目标检测器；

2、在检测器训练期间，我们验证最先进的开源方法和特殊检测方法的影响；

3、我们修改最先进的方法，使其更高效，适合单次 GPU 训练，包括 CBN [89]、PAN [49]、SAM [85]等。

2、相关工作

2.1、目标检测模型

现代检测器通常由两部分组成，一个是在 ImageNet 上预先训练的骨干网，另一个是用于预测物体的类和边界框的头部。对于在 GPU 平台上运行的检测器，其主干可以是 VGG [68]、ResNet [26]、ResNeXt [86]或DenseNet [30]。对于在 CPU 平台上运行的检测器，其主干可以是SqueezeNet [31]、MobileNet[28、66、27、74]或 ShuffleNet [97， 53]。至于头部部分，通常分为两类，即一级目标检测器和两级目标检测器。最具代表性的两级目标检测器是R-CNN[19]系列，包括fast R-CNN[18]，faster R-CNN[64]，R-FCN[9]和 Libra R-CNN[58]。也可以使两级目标检测器成为anchor-free 目标检测器，如 RepPoints [87]。至于一级目标检测器，最具代表性的模型是YOLO[61、62、63]、SSD[50]和RetinaNet[45]。近年来，开发了 anchor-free 单级目标检测器。此类检测器有 CenterNet [13]、CornerNet [37、 38]、FCOS [78]等。近年来开发的目标检测器通常在骨干和头部之间插入一些层，这些层通常用于收集不同阶段的feature maps 。我们可以称它为目标检测器的neck层。通常，neck层由几个自下而上的路径和几个自上而下的路径组成。配备此机制的网络包括特征金字塔网络（FPN） [44]、路径聚合网络（PAN） [49]、BiFPN [77]和 NAS-FPN [17]。

除了上述模型外，一些研究人员还强调直接构建一个新的主干（DetNet [43]，DetNAS [7]）或新的完整模型结构（SpineNet [12]，HitDetector [20]）用于物体检测。

总之，一个标准的目标检测器由几个部分组成：

•Input: Image, Patches, Image Pyramid
• Backbones: VGG16 [68], ResNet-50 [26], SpineNet
    [12], EfficientNet-B0/B7 [75], CSPResNeXt50 [81],
    CSPDarknet53 [81]
• Neck:
    • Additional blocks: SPP [25], ASPP [5], RFB
        [47], SAM [85]
    • Path-aggregation blocks: FPN [44], PAN [49],
        NAS-FPN [17], Fully-connected FPN, BiFPN
        [77], ASFF [48], SFAM [98]
• Heads::
    • Dense Prediction (one-stage):
        ◦ RPN [64], SSD [50], YOLO [61], RetinaNet
            [45] (anchor based)
        ◦ CornerNet [37], CenterNet [13], MatrixNet
            [60], FCOS [78] (anchor free)
        • Sparse Prediction (two-stage):
            ◦ Faster R-CNN [64], R-FCN [9], Mask RCNN [23] (anchor based)
            ◦ RepPoints [87] (anchor free)

2.2、Bag of freebies

只增加训练成本就可以提高检测指标的方法。

通常，传统的目标检测器是离线训练的。因此，研究人员总是喜欢利用这一优势，开发更好的训练方法，使目标检测器在不增加推理成本的情况下获得更好的精度。我们将这些方法称为”bag of freebies”，这些方法仅改变训练策略或仅增加训练成本。目标检测方法通常采用并符合bag of freebies的定义的是数据扩充。数据扩增的目的是增加输入图像的可变性，使设计的目标检测模型对从不同环境获得的图像具有更高的鲁棒性。例如，光度失真和几何失真是两种常用的数据扩增方法，它们肯定有利于目标检测任务。在处理光度失真时，我们调整图像的亮度、对比度、色调、饱和度和噪声。对于几何失真，我们添加随机缩放、裁剪、翻转和旋转。

上面提到的数据扩充方法是所有像素调整，并保留调整后区域中的所有原始像素信息。此外，一些从事数据扩增的研究人员强调模拟物体遮挡问题。他们在图像分类和物体检测方面取得了良好的效果。例如，random erase [100] 和 CutOut [11] 可以随机选择图像中的矩形区域并填充零的随机或互补值。至于 hide-and-seek [69] 和 grid mask [6]，它们随机或均匀地选择图像中的多个矩形区域，并将其替换为所有零。类似的概念应用于feature maps，则有”DropOut “[71]、DropConnect [80]和 DropBlock [16] 方法。此外，一些研究人员提出了将多个图像结合在一起执行数据扩增的方法。例如，MixUp [92] 使用两个图像以不同的系数比率倍增和叠加，然后使用这些叠加比率调整标签。至于 CutMix [91]，它是将裁剪的图像覆盖到其他图像的矩形区域，并根据混合区域的大小调整标签。除上述方法外，风格迁移GAN[15]还用于数据扩增，这种使用可以有效地减少CNN学到的纹理偏差。

与上述各种方法不同，其他一些bag of freebies方法专门用于解决数据集中语义分布可能存在偏差的问题。在处理语义分布偏差问题时，一个很重要的问题是，不同类之间的数据不平衡问题，这个问题往往通过hard negative example mining [72]或两阶段目标检测器中的online hard example mining 67]来解决。但example mining方法不适用于一级目标检测器，因为这种检测器属于密集预测架构。因此，Lin等人[45]提出了focal loss来解决不同类别之间存在的数据不平衡问题的问题。另一个非常重要的问题是，one-hot编码很难表达不同类别之间的关系。在执行标签时，通常使用此表示方案。[73] 中建议的标签平滑是将硬标签转换为软标签进行训练，这将使模型更加鲁棒。为了获得更好的软标签，Islam等人引入了知识蒸馏的概念来设计标签细化网络。

bag of freebies 的最后一个是边界框（BBox）回归的目标函数。传统的目标检测器通常使用均值方误差（MSE）直接对 BBox 的中心点坐标和高度和宽度执行回归，即 { 中心点x 、中心点y、w、h 或左上点和右下角。至于基于锚点的方法，它是估计相应的偏移量，例如 [x 中心偏移，y 中心偏移，w偏移，h偏移量和 + x 左上偏移量，y 左上偏移量，x 右下偏移量，y 右下角偏移。但是，直接估计 BBox 的每个点的坐标值是将这些点视为独立的变量，但实际上不考虑对象本身的完整性。为了更好地处理这一问题，一些研究人员最近提出了IoU损耗[90]，将预测的BBox区域和真值BBox区域的覆盖范围考虑在内。IoU 损失计算过程将通过执行带有真值 IoU，然后将生成的结果连接到整个代码，触发 BBox 的四个坐标点的计算。由于 IoU 是一个比例不变表示形式，因此它可以解决当传统方法计算 l 1 或 l 2 损失的 x、y、w、h时，损耗会随着比例的增加而增加。最近，一些研究人员继续改善IoU损失。例如，GIoU 损失 [65] 是除覆盖区域外，还包括对象的形状和方向。他们建议找到最小区域 BBox，可以同时覆盖预测的 BBox 和真值 BBox，并使用此 BBox 作为分母来替换最初用于 IoU 损失的分母。至于DIoU损失[99]，它另外考虑物体中心的距离，另一方面，CIoU损失[99]，同时考虑重叠区域，中心点之间的距离和纵横比。CIoU 可以在 BBox 回归问题上实现更好的收敛速度和准确性。

2.3、Bag of specials

对于那些插件模块和后处理方法，它只增加少量的推理成本，但可以显著提高目标检测的准确性，我们称之为”“bag of specials”。一般来说，这些插件模块用于增强模型中的某些属性，如扩大感受野、引入关注机制、增强特征提取能力等，后处理是筛选模型预测结果的方法。

可用于增加感受野的常见模块有 SPP [25]、ASPP [5] 和 RFB [47]。SPP 模块源自空间金字塔匹配（SPM） [39]，SPM 的原始方法是将feature map拆分为多个d*d等块，其中 d 可以是 {1、2、3、……｝，从而形成空间金字塔，然后提取词袋（bag-of-word）特征。SPP 将 SPM 集成到 CNN 中，并使用最大池化操作，而不是词袋操作。由于He等人提出的SPP模块[25]将输出一维特征矢量，因此在全卷积网络（FCN）中应用是不可行的。因此，在 YOLOv3 [63] 的设计中，Redmon 和 Farhadi 改进了 SPP 模块与内核大小 k * k 的最大池输出的串联，其中 k = {1、5、9、13 } 和步长等于 1。在此设计下，相对较大的 k * k maxpool 可有效增加骨干特征的感受野。添加改进版的 SPP 模块后，YOLOv3-608 在 MS COCO 目标检测任务中将 AP 50 升级 2.7%，额外计算成本为 0.5%。ASPP [5] 模块与改进的SPP模块之间的操作不同主要是从原来的k*k内核大小，最大步幅等于1改至多个3× 3内核大小，膨胀率等于k，在扩张卷积操作中，步长等于1。RFB 模块是使 k*k 内核的多个膨胀卷积，膨胀比等于 k，步长等于 1，以获得比 ASPP 更全面的空间覆盖。RFB [47] 只需花费 7% 的额外推理时间，就将 MS COCO 上的 AP 50 SSD 增加 5.7%。

目标检测中常用的注意模块主要分为channel-wise attention和pointwise attention，这两个注意模型的代表分别是Squeeze-and-Excitation (SE) [29]和Spatial Attention Module[SAM][85]。虽然SE模块可以提高ResNet50在ImageNet图像分类任务中的top-1 准确率提高1%，而成本只增加计算工作量2%（这里指的是floats），但在GPU上通常会增加10%左右计算时间，因此在移动设备中使用更合适。但对于 SAM，它只需要额外花费0.1% 的计算，并且它可以提高 ResNet50-SE 在 ImageNet 图像分类任务中 0.5% 的前 1 精度。最重要的是，它根本不影响 GPU 上的推理速度。

在特征融合方面，早期做法是使用skip connection [51] 或hyper-column [22] 将低级物理特征与高级语义特征进行融合。由于FPN等多尺度预测方法已经普及，许多融合不同特征金字塔的轻量级模块被提出来。此类模块包括 SFAM [98]、ASFF [48] 和 BiFPN [77]。SFAM 的主要思想是使用 SE 模块在多尺度channelwise level re-weighting上执行通道级重新加权。至于ASFF，它使用softmax作为point-wise级reweighting，然后添加不同层级的特征图。在 BiFPN 中，输入多尺度权重残差连接来提取不同层的scale-wise level re-weighting，然后添加不同层的特征图。

在深度学习的研究中，有些人把精力放在寻找好的激活函数上。良好的激活函数可以使梯度更有效地传播，同时也不会造成过多的额外计算成本。2010年，Nair和Hinton[56]提出ReLU激活函数从根本上解决梯度消失问题。随后，提出了LReLU[54]，PReLU[24]，ReLU6[28]，缩放指数线性单位（SELU）[35]，Swish [59]，hard-Swish[27]，和Mish[55]等，也用于解决梯度消失问题。LReLU 和 PReLU 的主要目的是解决当输出小于零时 ReLU 梯度为零的问题。至于ReLU6和硬hard-Swish，它们是专门为量化网络设计的。为了实现神经网络的自规范化，提出了符合目标的SELU激活函数。需要注意的是，Swish 和 Mish 都是连续可微的激活函数。

在基于深度学习的目标检测中常用的后处理方法是 NMS，它用于筛选掉那些预测同一对象的不好的BBox，并且仅保留置信度较高的候选BBox。NMS 尝试改进的方式与优化目标函数的方法一致。NMS提出的原始方法不考虑上下文信息，因此Girshick等人[19]在R-CNN中添加了分类置信度分数作为参考，并根据置信度分数的顺序，以高分到低分的顺序进行贪婪的NMS。至于 soft NMS [1]，它考虑的问题，对象的遮挡可能会导致在贪婪的NMS与IoU分数的置信度分数下降的问题。DIoU NMS [99] 开发人员的思维方式是在软 NMS 的基础上将中心点距离的信息添加到 BBox 筛选过程中。值得一提的是，由于上述后处理方法没有一种直接是指捕获的图像特征，因此在后续开发无锚方法时不再需要后处理。

3、方法

基本目标是在生产系统中优化并行计算，加快神经网络的运行速度，而不是低计算量理论指标（BFLOP）。我们提出了两个实时神经网络的设置：

1）对于 GPU，我们在卷积层中减少grouped-convolution的使用（1 – 8）： CSPReSNeXt50 / CSPDarknet53。

2）对于 VPU – 我们使用grouped-convolution，但我们减少Squeeze-and-excitement (SE) blocks – 具体来说，这包括以下模型： EfﬁcientNet-lite / MixNet [76] / GhostNet [21] / MobileNetV3。

3.1、模型结构选择

我们的目标是在输入网络分辨率、卷积层数、参数量（滤波器大小： 2 * 滤波器 * 通道 / 分组）和图层输出数（筛选器）之间找到最佳平衡。例如，我们的大量研究表明，在 ILSVRC2012 （ImageNet）数据集 [10] 上，CSPResNext50比 CSPDarknet53要好得多。但是，相反，在 MS COCO检测数据集 [46] 上，CSPDarknet53 优于 CSPResNext50。

下一个目标是选择其他模块，以增加感受和不同层的backbone参数聚合的最佳方法：例如FPN、PAN、ASFF、BiFPN。

最佳分类的参考模型并不总是检测器的最佳模型。与分类器相比，检测器需要以下操作：

更高的输入网络大小（分辨率） – 用于检测多尺度小目标；
更多层 – 更高的感受野，以覆盖网络输入大小的增加；
更多参数 – 提高模型的容量，以检测单个图像中的多个不同大小的目标。

假设，我们可以假设一个感受野大小的模型（具有较多的卷积层 3 × 3）和更多的参数应作为主干。表 1 显示了 CSPReSNeXt50、CSPDarknet53 和高效网络 B3 的信息。CSPResNext50 仅包含 16 个卷积层 3 × 3、425 × 425感受野和 20.6 M 参数，CSPDarknet53 包含 29 个卷积层 3 × 3、725 × 725 接受场和 27.6 M 参数。这一理论论证，加上我们的大量实验，表明CSPDarknet53神经网络是两者作为检测器backbone 的最佳模型。

不同大小的感受野的影响总结如下：

提高目标大小 – 允许查看整个目标；
最多网络大小 – 允许查看对象周围的上下文；
增加网络尺寸 – 增加图像点和最终激活之间的连接数。

我们在 CSPDarknet53 上添加 SPP 块，因为它显著增加了感受野，分离出最重要的上下文功能，并且几乎不降低网络操作速度。我们使用 PANet 作为不同检测器级别的不同骨干级参数聚合方法，而不是 YOLOv3 中使用的 FPN。

最后，我们选择 CSPDarknet53 主干、SPP 附加模块、PANet path-aggregation 颈部和 YOLOv3（基于锚）头作为 YOLOv4 的体系结构。

今后，我们计划大幅扩展检测器BoF的数量，理论上可以解决一些问题，提高检测器的精度，并按顺序以实验方式验证每个功能的影响。

我们不使用跨 GPU 批处理规范化（CGBN 或 SyncBN）或昂贵的专用设备。这允许任何人在传统的图形处理器上重现我们最先进的结果，例如 GTX 1080Ti 或 RTX 2080Ti。

3.2、BoF 和 BoS 的选择

为了提升目标检测训练，CNN 通常使用以下内容：

激活函数: ReLU, leaky-ReLU, parametric-ReLU, ReLU6, SELU, Swish, or Mish
框回归损失: MSE, IoU, GIoU, CIoU, DIoU
数据增强: CutOut, MixUp, CutMix
正则化方法: DropOut, DropPath [36], Spatial DropOut [79], or DropBlock
归一化层: Batch Normalization (BN) [32], Cross-GPU Batch Normalization (CGBN or SyncBN) [93], Filter Response Normalization (FRN) [70], or Cross-Iteration Batch Normalization (CBN) [89]
跳跃连接: Residual connections, Weighted residual connections, Multi-input weighted residual connections, or Cross stage partial connections (CSP)

至于训练激活函数，由于 PReLU 和 SELU 更难训练，而 ReLU6 是专门为量化网络设计的，因此我们从候选列表中剔除了上述激活函数。在重量化方法中，一些人将DropBlock 的方法与其他方法进行了详细的比较，其正则化方法略好一些。因此，我们毫不犹豫地选择 DropBlock 作为我们的规范化方法。至于规范化方法的选择，由于我们专注于只使用一个 GPU 的训练策略，因此不考虑 syncBN。

3.3、其它的改进

为了使设计的检测器更适合于单 GPU 的训练，我们进行了如下其他设计和改进：

我们引入了一种新的数据扩增Mosaic和Self-Adversarial Training (SAT)方法；
应用遗传算法选择最佳的超参数。

我们修改了一些现有的方法，使我们的设计适合高效的训练和检测 – modiﬁed SAM, modiﬁed PAN, and Cross mini-Batch Normalization (CmBN)Mosaic(马赛克)是一种新的数据扩增方法，它混合了4个训练图像。因此，4个不同的上下文混合，而CutMix只混合2个输入图像。这允许检测其正常上下文之外的对象。此外，批处理规范化计算每个层上 4 个不同图像的激活统计信息。这大大减少了对大batch size的需求。

图3：Mosaic 数据增强表现

Self-Adversarial Training (SAT) 代表一种新的数据扩增技术，可在 2 个forward backward阶段运行。在第一阶段，神经网络更改原始图像而不是网络权重。通过这种方式，神经网络对自身执行对抗攻击，更改原始图像以创建映像上没有所需对象的假图。在第二阶段，神经网络被训练以正常方式检测此修改图像上的目标。

CmBN 表示 CBN 修改版本，如图 4 所示，定义为交叉小批量规范化（CmBN）。这仅在单个批处理中的微型批处理之间收集统计信息。

图4：Cross mini-Batch Normalization.

我们修改SAM，从spatial-wise attention改为pointwise attention，并将 PAN 的shortcut connection改为concatenation，如图 5 和图 6 所示。

3.4、YOLO V4

在本节中，我们将详细阐述YOLOv4的细节。

YOLOv4 包括：

主干： CSPDarknet53 [81]
颈部： SPP [25]， PAN [49]
头部： YOLOv3 [63]

YOLO v4 使用：

Bag of Freebies (BoF) for backbone: CutMix 和 Mosaic 数据增强, DropBlock regularization, Class label smoothing

Bag of Specials (BoS) for backbone: Mish 激活, Cross-stage partial connections (CSP), Multiinput weighted residual connections (MiWRC)
Bag of Freebies (BoF) for detector: CIoU 损失, CmBN, DropBlock 正则化, Mosaic数据扩增, Self-Adversarial 训练, Eliminate grid sensitivity, Using multiple anchors for a single ground truth, Cosine annealing scheduler [52], Optimal hyperparameters, Random training shapes
Bag of Specials (BoS) for detector: Mish 激, SPP-block, SAM-block, PAN path-aggregation block, DIoU-NMS

4、实验

我们测试不同训练改进技术对 ImageNet （ILSVRC 2012 val）数据集上的分类器准确性的影响，然后测试 MS COCO （test-dev 2017）数据集上的检测器的准确性。

4.1.实验设置

在 ImageNet 图像分类实验中，默认的超参数如下：训练steps 为 8,000,000； batch size和mini-batch size大小分别为128和32；采用多项式衰减学习率调度策略，初始learning rate为0.1；warm-up steps为1000；momentum 和weight decay分别设置为 0.9 和 0.005。我们所有的 BoS 实验都使用与默认设置相同的超参数，在 BoF 实验中，我们增加了 50% 的训练步骤。在 BoF 实验中，我们验证 MixUp、CutMix、Mosaic、Bluring数据扩增和label smoothing regularization方法。在BoS实验中，我们比较了LReLU、Swish和Mish激活函数的影响。所有实验都使用 1080 Ti 或 2080 Ti GPU 进行训练。

在MS COCO目标检测实验中，默认超参数如下：训练steps为500,500；采用step decay learning rate调度策略，初始学习速率0.01，在400,000步和45万步时乘以因子0.1；momentum和weight decay分别设置为 0.9 和 0.0005。所有网络结构都使用单个 GPU 执行批处理大小为 64 的多级训练，而mini-batch大小为 8 或 4 取决于网络结构和 GPU 内存限制。除了使用遗传算法进行超参数搜索实验外，所有其他实验都使用默认设置。遗传算法使用YOLOv3-SPP训练与GIoU损失和搜索300个epochs为min-val 5k验证集。采用搜索学习速率0.00261、动量0.949、分配真值IoU阈值为0.213，遗传算法实验的损失规范化器0.07。我们已经验证了大量的BoF，包括grid sensitivity elimination、mosaic数据扩增、IoU阈值、遗传算法、class label smoothing, cross mini-batch normalizationselfadversarial training, cosine annealing scheduler, dynamic mini-batch size, DropBlock, Optimized Anchors、不同类型的IoU损失。我们还对各种 BoS 进行实验，包括Mish、SPP、SAM、RFB、BiFPN 和Gaussian YOLO [8]。对于所有实验，我们只使用一个 GPU 进行训练，因此不使用syncBN 优化多个 GPU 等技术。

4.2、不同特性对分类器训练的影响

首先，研究了不同特性对分类器训练的影响；具体来说，class label smoothing，不同数据扩增技术的影响，双边模糊，MixUp，CutMix和Mosaic，如Fugure 7所示，以及不同激活的影响，如Leaky-ReLU（默认情况下），Swish和Mish。

图7：不同的数据增强方法

在我们的实验中，如表 2 所示，分类器的精度通过引入以下特性得到提高，例如：CutMix 和Mosaic 数据扩增、类标签平滑（Class label smoothing）和 Mish 激活。因此，我们的 BoF骨干用于分类器训练包括以下内容：CutMix 和Mosaic数据扩增和类标签平滑。此外，我们使用 Mish 激活作为补充选项，如表 2 和表 3 所示。

4.3、不同特性对检测器训练的影响

进一步研究涉及不同的BoF-检测器对检测器训练精度的影响，如表4所示。我们通过研究在不影响 FPS 的情况下提高检测器精度的不同特征，显著扩展了 BoF 列表：

S：消除grid sensitivity方程 bx = delta(tx ）+ cx， by = delta（ty ）+ cy ，其中 cx 和 cy 始终为整数，在 YOLOv3 中使用其用于评估目标坐标，因此，接近 cx 或 cx = 1 值的 bx 值需要极高的 tx 绝对值。我们通过将 sigmoid 乘以超过1.0 的因子来解决此问题，从而消除了网格无法检测到对象的影响；

M：Mosaic数据扩增 – 在训练期间使用 4 图像镶嵌，而不是单个图像；

IT：IoU 阈值 – 使用多个锚点进行单个接地真值 IoU（真锚）> IoU 阈值；

GA：遗传算法 – 在前 10% 的时间段的网络训练期间使用遗传算法选择最佳超参数；

LS：class label smoothing – 使用类标签平滑进行 sigmoid 激活；

CBN： CmBN – 使用交叉小批处理规范化收集整个批处理中的统计信息，而不是在单个小批处理中收集统计信息；

CA：模拟退火调节器 – 改变正弦训练中的学习速率；

DM：动态小批量尺寸– 在小分辨率训练期间使用随机训练尺度，自动增加mini-batch的大小；

OA：优化的锚点 – 使用优化的anchors 进行 512×512 网络分辨率的训练；

GIoU、CIoU、DIoU、MSE – 对边界框回归使用不同的损失函数。

进一步研究涉及不同的BoS-检测器对检测器训练精度的影响，包括PAN、RFB、SAM、Gaussian YOLO（G）和ASFF，如表5所示。在我们的实验中，检测器在使用 SPP、PAN 和 SAM 时获得最佳性能。

4.4、不同backbones 和预训练权重对检测器训练的影响

进一步研究了不同backbones 对检测器精度的影响，如表6所示。我们注意到，在检测器精度方面，具有最佳分类精度的模型并不总是最好的。

首先，虽然与CSPDarknet53模型相比，训练具有不同功能的CSPReSNeXt50模型的分类精度较高，但CSPDarknet53模型在物体检测方面表现出更高的精度。

其次，将BoF和Mish用于CSPResNeXt50分类器训练，提高了其分类精度，但进一步将这些预先训练的权重应用于检测器训练，降低了检测器的精度。但是，将 BoF 和 Mish 用于 CSPDarknet53 分类器训练可提高分类器和检测器的准确性，后者使用此分类器预先训练的权重。最终结果是，主干 CSPDarknet53 更适合检测器，而不是 CSPResNeXt50。

我们观察到，CSPDarknet53模型表明，由于各种改进，提高了检测器精度的能力。

4.5、不同mini-batch大小对检测器训练的影响

最后，分析了使用不同小批次大小的模型获得的结果，结果显示在表7中。从表7所示的结果中，我们发现，在添加了BoF和BoS训练策略后，小批量大小对检测器的性能几乎没有影响。这一结果表明，在引入BoF和BoS后，不再需要使用昂贵的 GPU 进行训练。换句话说，任何人都可以只使用传统的 GPU 来训练出色的检测器。

5、实验结果

图8显示了与其他最先进的目标检测器结果的比较。我们的 YOLOv4 位于Pareto最佳曲线上，在速度和精度方面优于最快、最精确的检测器。

图8: 不同物体检测速度和精度的比较

由于不同方法使用不同模型结构的 GPU 进行推理时间验证，因此我们在通常采用的 Maxwell、Pascal 和 Volta 体系结构的 GPU 上运行 YOLOv4，并将其与其他最先进的方法进行比较。表 8 列出了使用 Maxwell GPU 的帧速率比较结果，它可以是 GTX 泰坦 X （Maxwell）或特斯拉 M40 GPU。表 9 列出了使用 Pascal GPU 的帧速率比较结果，它可以是Titan X （Pascal）、Titan Xp、GTX 1080 Ti 或Tesla P100 GPU。至于表10，它列出了使用Volta GPU的帧速率比较结果，它可以是 Titan Volta或Tesla V100 GPU。

6、结论

我们提供最先进的检测器，它比所有可用的替代检测器更快（FPS）和更准确（MS COCO AP 50…95 和 AP 50）。所述检测器可在具有 8-16 GB-VRAM 的传统 GPU 上进行训练和使用，这使得其广泛使用成为可能。one-stage检测器的最初概念已证明其可行性。我们已经验证了大量的功能，并选择用于这些功能，以提高分类器和检测器的准确性。这些功能可用作未来研究和发展的最佳实践。

7、致谢

作者希望感谢Glenn Joche的Mosaic的数据扩增想法，选择超参数通过使用遗传算法和解决网格敏感性问题，https://github.com/ultralytics/yolov3。

参考文献

...

你可能感兴趣的:(目标检测,计算机视觉,机器学习,yolov4,yolo,cvpr2020)

YOLOv8 改进：添加 AKConv（任意采样形状和任意数目参数的卷积）鱼弦人工智能时代 YOLO
YOLOv8改进：添加AKConv（任意采样形状和任意数目参数的卷积）引言在目标检测领域中，YOLO（YouOnlyLookOnce）系列因其速度和效率而受到广泛关注。为了进一步优化模型性能，可以引入创新的卷积操作，例如AKConv，即“任意采样形状和任意数目参数的卷积”。这种卷积能够灵活地调整采样策略，以更好地适应输入特征。技术背景传统卷积运算在采样位置和参数数量上具有固定性，这限制了其对复杂几
MySQL中基于机器学习的自适应缓存热点识别优化策略——开启数据库性能新纪元墨夶数据库学习资料1 数据库 mysql 机器学习
在数据驱动的世界里，数据库的性能直接影响到整个应用系统的响应速度和用户体验。随着业务量的增长和技术的发展，传统的缓存机制逐渐暴露出局限性。如何更智能地识别并利用热点数据进行缓存优化，成为提升数据库性能的关键所在。今天，我们将深入探讨一种创新的方法——基于机器学习的自适应缓存热点识别优化策略，并分享其在MySQL中的具体实现方案。为什么选择机器学习？‍传统上，开发者们依赖于手动配置或预设规则来决定哪
目标检测领域总结：从传统方法到 Transformer 时代的革新 DoYangTan 目标检测系列目标检测 transformer 人工智能
目标检测领域总结：从传统方法到Transformer时代的革新目标检测是计算机视觉领域的一个核心任务，它的目标是从输入图像中识别并定位出目标物体。随着深度学习的兴起，目标检测方法已经取得了显著的进展。从最早的传统方法到现如今基于Transformer的先进算法，目标检测的发展经历了多个重要的阶段。本文将详细总结目标检测领域的演进，涵盖传统方法、两阶段检测方法、单阶段检测方法和基于Transform
AI人工智能软件开发方案：开启智能时代的创新钥匙广州硅基技术官方人工智能
一、引言：AI浪潮下的软件开发新机遇近年来，人工智能（AI）技术的迅猛发展如同一股汹涌澎湃的浪潮，席卷了全球各个领域。从最初的概念提出到如今的广泛应用，AI历经了漫长的发展历程，终于迎来了属于它的黄金时代。回首过去，AI的发展并非一帆风顺，早期由于计算能力和算法的限制，经历了多次起伏。但随着大数据、云计算、机器学习、深度学习等技术的不断突破，AI迎来了爆发式增长。如今，AI已经深入到人们生活和工作
YOLOV8多模态(可见光+红外光，基于Ultralytics官方代码实现） @M_J_Y@ 目标检测 YOLO 计算机视觉目标检测 python
YOLOV8多模态(可见光+红外光，基于Ultralytics官方代码实现）各位读者麻烦给个star或者fork，求求了。YOLOV8双分支模型架构图YOLOV8多模态目标检测前言：环境配置要求1.数据集DroneVehicle数据集(可见光+热红外)2.数据集文件格式(labeles:YOLO格式)3.权重文件下载4.配置模型yaml文件和数据集yaml文件5.训练6.测试7.打印模型信息8.o
【机器学习】算法分类 CH3_CH2_CHO 什么？！是机器学习！！机器学习算法有监督学习无监督学习半监督学习强化学习
1、有监督学习1.1定义使用带标签的数据训练模型。有监督学习是机器学习中最常见的一种类型，它利用已知的输入特征和对应的输出标签来训练模型，使模型能够学习到特征与标签之间的映射关系。在训练过程中，模型会不断地调整自身的参数，以最小化预测值与真实标签之间的误差，从而提高预测的准确性。1.2回归问题1.2.1目标预测连续值。回归问题的目标是预测一个连续的数值结果，模型的输出是一个实数值。1.2.2解释回
Radiance Fields from VGGSfM和Mast3r:两种先进3D重建方法的比较与分析 2401_87458718 3d
VGGSfM和Mast3r:3D场景重建的新方向在计算机视觉和3D重建领域,如何从2D图像重建3D场景一直是一个充满挑战的研究课题。近年来,随着深度学习技术的发展,一些新的方法被提出并取得了显著的进展。本文将重点介绍两种最新的基于深度学习的3D重建方法:VGGSfM和Mast3r,并通过GaussianSplatting技术对它们的性能进行全面比较和分析。VGGSfM:基于视觉几何的深度结构运动恢
使用 Baseten 部署和运行机器学习模型的指南 shuoac 机器学习人工智能 python
随着机器学习模型在各个行业中的广泛应用，如何高效地部署和运行这些模型成为一个关键问题。本文将介绍如何使用Baseten平台来部署和服务机器学习模型。Baseten是LangChain生态系统中的一个重要提供者，它提供了所需的基础设施来高效地运行模型。无论是开源模型如Llama2和Mistral，还是专有或经过微调的模型，Baseten都能在专用GPU上运行。技术背景介绍Baseten提供了一种不同
机器学习——分类、回归、聚类、LASSO回归、Ridge回归（自用）代码的建筑师模型学习模型训练机器学习机器学习分类回归正则化项 LASSO Ridge 朴素
纠正自己的误区：机器学习是一个大范围，并不是一个小的方向，比如：线性回归预测、卷积神经网络和强化学都是机器学习算法在不同场景的应用。机器学习最为关键的是要有数据，也就是数据集名词解释：数据集中的一行叫一条样本或者实例，列名称为特征或者属性。样本的数量称为数据量，特征的数量称为特征维度机器学习常用库：Numpy和sklearn朴素的意思是特征的各条件都是相互独立的机器学习（模型、策略、算法）损失函数
量化交易系统中如何处理机器学习模型的训练和部署？ openwin_top 量化交易系统开发机器学习人工智能量化交易
microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位量化交易系统中，机器学习模型的训练和部署需要遵循一套严密的流程，以确保模型的可靠性、性能和安全性。以下是详细描述以及相关的示例：1.数据收集和预处理数据收集在量化交易中，数据是最重要的资产。收集的数
【深度学习与大模型基础】第7章-特征分解与奇异值分解 lynn-66 深度学习与大模型基础算法机器学习人工智能
一、特征分解特征分解（EigenDecomposition）是线性代数中的一种重要方法，广泛应用于计算机行业的多个领域，如机器学习、图像处理和数据分析等。特征分解将一个方阵分解为特征值和特征向量的形式，帮助我们理解矩阵的结构和性质。1.特征分解的定义对于一个n×n的方阵A，如果存在一个非零向量v和一个标量λ，使得：则称λ为矩阵A的特征值，v为对应的特征向量。特征分解将矩阵A分解为：其中：Q是由特征
【论文阅读】Persistent Homology Captures the Generalization of Neural Networks Without A Validation Set 开心星人论文阅读论文阅读
将神经网络表征为加权的无环图，直接根据模型的权重矩阵构造PD。计算相邻batch的权重矩阵PD之间的距离。比较同调收敛性与神经网络的验证精度变化趋势摘要机器学习从业者通常通过监控模型的某些指标来估计其泛化误差，并在训练数值收敛之前停止训练，以防止过拟合。通常，这种误差度量或任务相关的指标是通过一个验证集（holdoutset）来计算的。因为这些数据没有直接用于更新模型参数，通常假设模型在验证集上的
【论文阅读】实时全能分割模型万里守约论文阅读论文阅读图像分割图像处理计算机视觉
文章目录导言1、论文简介2、论文主要方法3、论文针对的问题4、论文创新点总结导言在最近的计算机视觉领域，针对实时多任务分割的需求日益增长，特别是在交互式分割、全景分割和视频实例分割等多种应用场景中。为了解决这些挑战，本文介绍了一种新方法——RMP-SAM（Real-TimeMulti-PurposeSegmentAnything），旨在实现实时的多功能分割。RMP-SAM结合了动态卷积与高效的模型
震惊！ “深度学习”都在学习什么扉间798 深度学习学习人工智能
常见的机器学习分类算法俗话说三个臭皮匠胜过诸葛亮这里面集成学习就是将单一的算法弱弱结合算法融合用投票给特征值加权重AdaBoost集成学习算法通过迭代训练一系列弱分类器，给予分类错误样本更高权重，使得后续弱分类器更关注这些样本，然后将这些弱分类器线性组合成强分类器，提高整体分类性能。（一）投票机制投票是一种直观且常用的算法融合策略。在多分类问题中，假设有多个分类器对同一数据进行分类判断。每个分类器
【论文阅读】Availability Attacks Create Shortcuts 开心星人论文阅读论文阅读
还得重复读这一篇论文，有些地方理解不够透彻可用性攻击通过在训练数据中添加难以察觉的扰动，使数据无法被机器学习算法利用，从而防止数据被未经授权地使用。例如，一家私人公司未经用户同意就收集了超过30亿张人脸图像，用于构建商业人脸识别模型。为解决这些担忧，许多数据投毒攻击被提出，以防止数据被未经授权的深度模型学习。它们通过在训练数据中添加难以察觉的扰动，使模型无法从数据中学习太多信息，从而导致模型在未见
机器学习 Day01人工智能概述山北雨夜漫步机器学习人工智能
1.什么样的程序适合在gpu上运行计算密集型的程序：此类程序主要运算集中在寄存器，寄存器读写速度快，而GPU拥有强大的计算能力，能高效处理大量的寄存器运算，因此适合在GPU上运行。像科学计算中的数值模拟、密码破解等场景的程序，都属于计算密集型，在GPU上运行可大幅提升运算速度。易于并行的程序：GPU采用SIMD架构，有众多核心，同一时间每个核心适合做相同的事。易于并行的程序能充分利用GPU这一特性
机器学习：让计算机学会思考的艺术平凡而伟大. 机器学习机器学习人工智能
目录什么是机器学习？机器学习的基本步骤常见的机器学习算法机器学习的实际应用如何入门机器学习？结语在当今数字化时代，机器学习（MachineLearning,ML）已经成为一个炙手可热的话题。从推荐系统到自动驾驶汽车，再到语音助手，机器学习的应用无处不在。然而，对于许多人来说，机器学习仍然是一个神秘而复杂的领域。本文将用通俗易懂的语言，带你走进机器学习的世界，了解它的基本原理和应用。什么是机器学习？
机器学习中的 K-均值聚类算法及其优缺点平凡而伟大. 机器学习机器学习算法均值算法
K-均值聚类是一种常用的无监督学习算法，用于将数据集中的样本分成K个簇。其基本原理是将所有样本点划分到K个簇使得簇内样本点之间的距离尽可能接近，而不同簇之间的距离尽可能远。算法流程如下：随机选择K个样本点作为初始的聚类中心。将每个样本点分配到与其最近的聚类中心所在的簇。更新每个簇的聚类中心为该簇所有样本点的平均值。重复第2步和第3步，直到聚类中心不再变化或者达到最大迭代次数。优点：简单且易于实现。
一文讲清楚深度学习和机器学习平凡而伟大. 机器学习人工智能深度学习机器学习人工智能
目录1.定义机器学习（MachineLearning,ML）深度学习（DeepLearning,DL）2.工作原理机器学习深度学习3.应用场景机器学习深度学习4.主要区别5.为什么选择深度学习？6.总结深度学习和机器学习是人工智能（AI）领域中两个密切相关但有所区别的概念。要清楚地解释它们之间的关系，我们可以从定义、工作原理、应用场景以及两者的主要区别等方面进行探讨。1.定义机器学习（Machin
机器学习knnlearn1 XW-ABAP 机器学习机器学习人工智能
importmatplotlib.pyplotaspltimportnumpyasnpimportoperator#定义一个函数用于创建数据集defcreateDataSet():#定义特征矩阵，每个元素是一个二维坐标点，代表不同策略数据点的坐标group=np.array([[20,3],[15,5],[18,1],[5,17],[2,15],[3,20]])#定义每个数据点对应的标签，用于区分
基于 MySQL 和 Spring Boot 的在线论坛管理系统设计与实现城南|阿洋-计算机从小白到大神 mysql spring boot 数据库
markdownCopy✌全网粉丝20W+,csdn特邀作者、博客专家、CSDN[新星计划]导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、pyhton、机器学习技术领域和毕业项目实战✌哈喽兄弟们，好久不见哦～最近整理了一下之前写过的一些小项目/毕业设计。发现还是有很多存货的，想一想既然放在电脑里面也吃灰，那么还不如分享出去，没准还可以帮助到
零基础入门机器学习：用Scikit-learn实现鸢尾花分类藍海琴泉机器学习 scikit-learn 分类
适合人群：机器学习新手|数据分析爱好者|需快速展示案例的学生一、引言：为什么要学这个案例？目的：明确机器学习解决什么问题，建立学习信心。机器学习定义：让计算机从数据中自动学习规律（如分类鸢尾花品种）。为什么选鸢尾花数据集：数据量小、特征明确，适合教学演示。Scikit-learn优势：提供现成算法和工具，无需从头写数学公式。二、环境准备：5分钟快速上手目的：搭建可运行的代码环境，避免卡在工具安装环
机器学习--DBSCAN聚类算法详解 2201_75491841 机器学习算法聚类人工智能
目录引言1.什么是DBSCAN聚类？2.DBSCAN聚类算法的原理3.DBSCAN算法的核心概念3.1邻域（Neighborhood）3.2核心点（CorePoint）3.3直接密度可达（DirectlyDensity-Reachable）3.4密度可达（Density-Reachable）3.5密度相连（Density-Connected）4.DBSCAN算法的步骤5.DBSCAN算法的优缺点5
【机器学习】机器学习工程实战-第3章数据收集和准备腊肉芥末果机器学习工程实战机器学习人工智能
上一章：第2章项目开始前文章目录3.1关于数据的问题3.1.1数据是否可获得3.1.2数据是否相当大3.1.3数据是否可用3.1.4数据是否可理解3.1.5数据是否可靠3.2数据的常见问题3.2.1高成本3.2.2质量差3.2.3噪声（noise）3.2.4偏差（bias）3.2.5预测能力低（lowpredictivepower）3.2.6过时的样本3.2.7离群值3.2.8数据泄露/目标泄漏3
机器学习实战第一章机器学习基础 LuoY、 Machine Learning 机器学习算法人工智能
第一章机器学习1.1何谓机器学习1.2关键术语1.3机器学习的主要任务1.4如何选择合适的算法1.5开发机器学习应用程序的步骤1.6Python语言的优势1.1何谓机器学习 1、简单地说，机器学习就是把无序的数据转换成有用的信息； 2、机器学习能让我们自数据集中受启发，我们会利用计算机来彰显数据背后的真实含义； 3、机器学习横跨计算机科学、工程技术和统计学等多个学科，需要多学科的
数据挖掘实战-基于机器学习的垃圾邮件检测模型艾派森数据挖掘实战合集数据挖掘机器学习人工智能 python
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录1.项目背景2.数据集介绍
集成学习（随机森林） herry57 数学建模大数据随机森林集成学习
目录一、集成学习概念二、Bagging集成原理三、随机森林四、例子（商品分类）一、集成学习概念集成学习通过建⽴⼏个模型来解决单⼀预测问题。它的⼯作原理是⽣成多个分类器/模型，各⾃独⽴地学习和作出预测。这些预测最后结合成组合预测，因此优于任何⼀个单分类的做出预测。只要单分类器的表现不太差，集成学习的结果总是要好于单分类器的二、Bagging集成原理分类圆形和长方形三、随机森林在机器学习中，随机森林是
【机器学习】朴素贝叶斯入门：从零到垃圾邮件过滤实战吴师兄大模型 0基础实现机器学习入门到精通机器学习人工智能朴素贝叶斯深度学习 pytorch sklearn 开发语言
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
【机器学习】机器学习工程实战-第2章项目开始前腊肉芥末果机器学习工程实战机器学习人工智能
上一章：第1章概述文章目录2.1机器学习项目的优先级排序2.1.1机器学习的影响2.1.2机器学习的成本2.2估计机器学习项目的复杂度2.2.1未知因素2.2.2简化问题2.2.3非线性进展2.3确定机器学习项目的目标2.3.1模型能做什么2.3.2成功模型的属性2.4构建机器学习团队2.4.1两种文化2.4.2机器学习团队的成员2.5机器学习项目为何失败2.5.1缺乏有经验的人才2.5.2缺乏领
机器学习怎么做特征工程全栈你个大西瓜人工智能机器学习人工智能特征工程数据预处理特征变换特征降维特征构造
一、特征工程通俗解释特征工程就像厨师做菜前的食材处理：原始数据是“生肉和蔬菜”，特征工程是“切块、腌制、调料搭配”，目的是让机器学习模型（食客）更容易消化吸收，做出更好预测（品尝美味）。二、为什么要做特征工程？数据质量差：原始数据常有缺失、噪声、不一致问题（如年龄列混入“未知”）。模型限制：算法无法直接理解原始数据（如文本、日期需要数值化）。提升效果：好特征能显著提升模型性能（准确率提升10%~5
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/[email protected]:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理