Mr Ma

【论文翻译】详细翻译论文—YOLOv4: Optimal Speed and Accuracy of Object Detection

YOLOv4：目标检测的最佳速度和精度

YOLOv4: Optimal Speed and Accuracy of Object Detection

Alexey Bochkovskiy Chien-Yao Wang Hong-Yuan Mark Liao

YOLOv4：目标检测的最佳速度和精度

YOLOv4: Optimal Speed and Accuracy of Object Detection

摘要

1. 介绍

2. 相关工作

2.1. 目标检测模型

2.2. Bag of freebies

2.3. Bag of specials

3. 方法

3.1. 结构选择

3.2. BoF and BoS的选择

3.3. 其他改进

3.4. YOLOv4

4. 实验

4.1. 实验设置

4.2. 不同功能对分类器训练的影响

4.3. 不同功能对检测器训练的影响

4.4. 不同骨干和预先训练的权重对检测器训练的影响

4.5. 不同小批次对检测器训练的影响

5. 结果

6. 结论

摘要

有大量的功能可以提升卷积神经网络（Convolutional Neural Network, CNN）的准确性。需要在大型数据集上对此类功能的组合进行实际测试，以及结果的理论论证。一些功能仅针对某些模型，或仅针对某些问题，或仅适用于小规模数据集；而一些功能（如批规范化batch-normalization和残差连接residual-connections）适用于大多数的模型、任务和数据集。我们假设此类通用功能包括加权残差连接（Weighted-Residual-Connections, WRC）、跨阶段-部分连接（Cross-Stage-Partial-connections, CSP）、交叉小批量规范化（Cross mini-Batch Normalization, CmBN）、自对抗训练（Self-adversarial-training, SAT）和Mish激活。我们使用新功能：WRC、CSP、CmBN、SAT、Mish激活、Mosaic数据扩增、CmBN、DropBlock正则化和CIoU损失，并联合其中一些功能实现最先进的结果：针对MS COCO数据集，在Tesla V100上以~65 FPS的实时速度达到43.5% AP（65.7% AP50）。源代码为https://github.com/AlexeyAB/darknet。

1. 介绍

多数基于CNN的目标检测器大多仅适用于推荐系统（recommendation systems）。例如，通过城市摄像机搜索免费停车位是通过缓慢但准确的模型执行的，而汽车碰撞警告则与快速而不准确的模型有关。提高实时目标检测器精度，不仅可以将其用于提示生成建议系统，还可用于独立的过程管理和人工输入的减少。在传统图形处理单元（Graphics Processing Units , GPU）上允许了实时目标检测器操作以实惠的价格大规模使用。最精确的现代神经网络无法实时运行，并且需要大量的GPU进行大量小批次处理的训练。我们通过创建一个在传统GPU 上实时运行的CNN来解决这些问题，为此训练只需要一个常规的GPU。

这项工作的主要目标是设计一个生产系统中运行速度快速的目标检测器，并优化并行计算，而不是低计算量理论指标（BFLOP）。我们希望设计的模型能够轻松训练和使用。例如，任何使用传统GPU进行训练与测试的人都可以获得实时、高质量和令人信服的目标检测结果，如图1 的YOLOv4结果所示。我们的贡献总结如下：

1. 我们开发了一种高效、强大的目标检测模型。它使每个人都可以使用1080 Ti或2080 Ti GPU来训练超快速和准确的目标检测器。

2. 在检测器训练期间，我们验证了最先进的Bag-of-Freebies和Bag-of-Specials检测方法的影响。

3. 我们修改最先进的方法，使其更高效，适合单个GPU训练，包括CBN [89]、PAN [49]、SAM [85]等。

【论文翻译】详细翻译论文—YOLOv4: Optimal Speed and Accuracy of Object Detection_第1张图片

图1：对所提出的YOLOv4和其他最先进的目标检测器进行比较。YOLOv4与EfficientDet具有相同的性能，但速度比其快两倍。提高了YOLOv3，10%的AP和12%的FPS。

2. 相关工作

2.1. 目标检测模型

现代检测器通常由两部分组成，一个是在ImageNet上预先训练的骨干（backbone），另一个是用于预测物体的类和边界框的头部（head）。对于在GPU 平台上运行的检测器，其骨干可以是VGG [68]、ResNet [26]、ResNeXt [86]或DenseNe [30]。对于在CPU平台上运行的检测器，其骨干可以是SqueezeNet [31]、MobileNet [28、66、27、74]或ShuffleNet [97、53]。至于头部，通常分为两类，即one-stage目标检测器和two-stage目标检测器。最具代表性的two-stage目标检测器是R-CNN[19]系列，包括fast R-CNN[18]，faster R-CNN[64]，R-FCN[9]和Libra R-CNN[58]。也可以使two-stage目标检测器成为无锚（anchor-free）目标检测器，如RepPoints [87]。至于one-stage目标检测器，最具代表性的模型是YOLO[61、62、63]、SSD[50]和RetinaNet [45]。近年来，研制了无锚式one-stage目标检测器。此类检测器有CenterNet [13]、CornerNet [37、38]、FCOS [78]等。近年来开发的目标检测器通常在骨干和头部之间插入一些层，这些层通常用于收集不同阶段的特征图（feature map）。我们可以称它为目标检测器的颈部（neck）。通常，颈部由几个自下而上的路径和几个自上而下的路径组成。配备此机制的网络包括Feature Pyramid Network（FPN）[44]、Path Aggregation Network（PAN） [49]、BiFPN [77]和NAS-FPN [17]。除了上述模型外，一些研究人员还强调直接构建一个新的骨干（DetNet [43]，DetNAS [7]）或新的完整模型（SpineNet [12]，HitDetector [20]）用于目标检测。

总之，普通目标检测器由几个部分组成：

输入：图像、补丁、图像金字塔（Image Pyramid）
骨干：VGG16 [68]，ResNet-50 [26]，SpineNet [12]，EfficientNet-B0/B7 [75]，CSPResNeXt50 [81]，CSPDarknet53 [81]
颈部：
1. 附加块：SPP [25]，ASPP [5]，RFB [47]，SAM [85]
2. 路径聚合块： FPN [44]，PAN [49]，NAS-FPN [17]，全连接的FPN，BiFPN [77]，ASFF [48]，SFAM [98]
头部：
1. 密集预测（one-stage）：
  1. RPN [64]，SSD [50]，YOLO [61]，RetinaNet [45]（基于锚）
  2. CornerNet [37]，CenterNet [13]，MatrixNet [60]，FCOS [78]（无锚）
2. 稀疏预测（two-stage）：
  1. faster R-CNN [64]，R-FCN [9]，Mask R-CNN [23]（基于锚）
  2. RepPoints [87]（无锚）

【论文翻译】详细翻译论文—YOLOv4: Optimal Speed and Accuracy of Object Detection_第2张图片

图2：检测器

2.2. Bag of freebies

通常，传统的目标检测器是离线训练的。因此，研究人员总是喜欢利用这一优势，开发更好的训练方法，使目标检测器在不增加推理成本的情况下获得更好的精度。我们将这些方法称为“bag of freebies”，这些方法仅改变训练策略或仅增加训练成本。目标检测方法通常采用并符合bag of freebies定义的是数据扩增。数据扩增的目的是增加输入图像的可变性，使设计的目标检测模型对从不同环境获得的图像具有更高的鲁棒性。例如，光度失真和几何失真是两种常用的数据扩增方法，它们肯定有利于目标检测任务。在处理光度失真时，我们调整图像的亮度、对比度、色调、饱和度和噪声。对于几何失真，我们添加随机缩放、裁剪、翻转和旋转。

上面提到的数据扩增方法是所有像素的调整，并保留调整后区域中的所有原始像素信息。此外，一些从事数据扩增的研究人员强调模拟目标遮挡问题。他们在图像分类和目标检测方面取得了良好的效果。例如，随机擦除（random erase） [100]和CutOut [11]可以随机选择图像中的矩形区域并填充随机或互补的零值（a random or complementary value of zero）。至于hide-and-seek [69] 和grid mask [6]，它们随机或均匀地选择图像中的多个矩形区域，并将其替换为零。如果类似的概念应用于feature maps，则有DropOut [71]、DropConnect [80]和DropBlock [16] 方法。此外，一些研究人员提出了将多个图像结合在一起执行数据扩增的方法。例如，MixUp [92]使用的两个图像是以不同的系数比率倍增和叠加（multiply and superimpose），然后以此叠加比率调整标签。至于CutMix [91]，它是将裁剪的图像覆盖到其他图像的矩形区域，并根据混合区域的大小调整标签。除上述方法外，风格转换GAN（style transfer GAN）[15]还用于数据扩增，使用这种方法可以有效地减少CNN学到的纹理偏差。

与上述各种方法不同，其他一些bag of freebies方法专门用于解决数据集中语义分布可能存在偏差的问题。在处理语义分布偏差问题时，一个很重要的问题是，不同类之间的数据不平衡问题，这个问题往往通过hard negative example mining [72]或two-stage目标检测器中的online hard example mining [67]来解决。但example mining方法不适用于one-stage目标检测器，因为这种检测器属于密集预测架构。因此，Lin等人[45]提出了解决不同类别之间存在的数据不平衡问题的focal损失问题。另一个非常重要的问题是，很难表达不同类别与one-hot硬编码的联系程度。在执行标签时，通常使用此表示方案。[73]中提出的标签平滑是将硬标签转换为软标签进行训练，这将使模型更加鲁棒。为了获得更好的软标签，Islam等人[33]引入了知识蒸馏的概念来设计标签细化网络。

bag of freebies的最后一个是边界框（Bounding Box , BBox）回归的目标函数。传统的目标检测器通常使用均值方误差（Mean Square Error, MSE）直接对 BBox 的中心点坐标以及高度和宽度执行回归，即或左上点和右下角点，即。对于基于锚的方法，它是估计相应的偏移量，例如和。然而，直接估计BBox的每个点的坐标值是将这些点视为独立的变量，但实际上没有考虑目标本身的完整性。为了更好地处理这一问题，一些研究人员最近提出了IoU损失[90]，将预测的BBox区域和真值BBox区域的覆盖范围考虑在内。IoU 损失计算过程将通过执行带有真值的IoU，然后将生成的结果连接到整个代码，触发BBox的四个坐标点的计算。由于IoU是一种缩放不变表示形式（a scale invariant representation），因此可以解决传统方法在计算的l1或l2损失时，损失会随着比例的增加而增加的问题。最近，一些研究人员继续改善IoU损失。例如，GIoU损失[65]是除覆盖区域外，还包括目标的形状和方向。他们建议找到最小区域BBox，可以同时覆盖预测的 BBox和真值BBox，并使用此BBox作为分母来替换最初用于IoU损失的分母。至于DIoU损失[99]，它另外考虑物体中心的距离，另一方面，CIoU损失[99]同时考虑重叠区域，中心点之间的距离和纵横比。CIoU可以在BBox回归问题上实现更好的收敛速度和准确性。

2.3. Bag of specials

对于那些插件模块（plugin modules）和后处理方法，它只增加少量的推理成本，但可以显著提高目标检测的准确性，我们称之为“bag of specials”。一般来说，这些插件模块用于增强模型中的某些属性，如增强感受野、引入注意力机制、增强特征集成能力等，后处理是筛选模型预测结果的方法。

可用于增强感受野的常见模块有SPP [25]、ASPP [5]和RFB [47]。SPP模块源自空间金字塔匹配（Spatial Pyramid Matching, SPM）[39]，SPM的原始方法是将feature map拆分为多个d×d的等块，其中d可以是{1,2,3,…}，从而形成空间金字塔，然后提取bag-of-word特征。SPP将SPM集成到CNN中，并使用最大池化（max-pooling）操作，而不是bag-of-word操作。由于He等人提出的SPP模块[25]将输出一维特征向量，因此无法应用于全卷积网络（Fully Convolutional Network, FCN）中。因此，在YOLOv3[63]的设计中，Redmon和Farhadi改进了SPP模块，使多个核大小为k×k的最大池化输出串联，其中k={1,2,3,…}，步长等于1。在这种设计下，相对较大的k×k最大池化可有效增加骨干特征的感受野。添加改进版的SPP模块后，YOLOv3-608在MS COCO目标检测任务中将AP50提升了2.7%，但额外的计算代价为0.5%。ASPP [5]模块与改进的SPP模块之间操作的不同主要在于原来的核大小为k×k，最大池化步长等于1变成了3×3的核大小，膨胀比等于k，步长等于1的膨胀卷积（dilated convolution）操作。RFB模块是使用k×k核的多个膨胀卷积，膨胀比等于k，步长等于1，以获得比ASPP更全面的空间覆盖。RFB [47]只需花费额外7%的推理时间，就将SSD在MS COCO上的AP50增加5.7%。

目标检测中常用的注意力模块主要分为channel-wise attention和point-wise attention，这两个注意力模型的代表分别是Squeeze-and-Excitation（SE）[29]和空间注意力模块（Spatial Attention Module, SAM）[85]。虽然SE模块可以提高ResNet50在ImageNet图像分类任务中1%的top-1精度，而代价只增加计算工作量的2%，但在GPU上通常会增加10%左右，因此在移动设备中使用更合适。但对于SAM，它只需要额外支付0.1%的计算代价，并且它可以提高ResNet50-SE 在ImageNet 图像分类任务中 0.5% 的top-1精度。最重要的是，它根本不影响 GPU上的推理速度。

在特征集成方面，早期做法是使用跳过连接（skip connection）[51]或hyper-column [22]将低级物理特征集成到高级语义特征。由于FPN等多尺度预测方法已经普及，许多集成不同特征金字塔的轻量级模块被提出来。此类模块包括 SFAM [98]、ASFF [48]和BiFPN [77]。SFAM的主要思想是使用SE模块在多尺度串联feature map上执行channel-wise级重新加权（re-weighting）。至于ASFF，它使用softmax作为point-wise级重新加权，然后添加不同尺度的feature map。在 BiFPN 中，提出多输入加权残差连接（multi-input weighted residual connections）执行scale-wise级重新加权，然后添加不同尺度的feature map。

在深度学习的研究中，有些人把精力放在寻找良好的激活函数上。良好的激活函数可以使梯度更有效地传播，同时也不会制造过多的额外计算代价。2010年，Nair and Hinton [56]提出ReLU从根本上解决在传统的tanh和sigmoid激活函数中常见的梯度消失问题。之后，提出的LReLU[54]，PReLU[24]，ReLU6[28]，Scaled Exponential Linear Unit（SELU）[35]，Swish [59]，hard-Swish [27]和Mish[55]等，也用于解决梯度消失问题。LReLU和PReLU的主要目的是解决当输出小于零时ReLU梯度为零的问题。至于ReLU6和hard-Swish，它们是专门为量化网络（quantization networks）设计的。为了实现神经网络的自正则化（self-normalizing），提出了符合目标的SELU激活函数。需要注意的是，Swish 和 Mish 都是连续可微（continuously differentiable）的激活功能。

在基于深度学习的目标检测中常用的后处理方法是NMS，可用于过滤那些预测相同目标的坏BBox，并且仅保留响应较高的候选BBoxes。NMS尝试改进的方式与优化目标函数的方法一致。NMS提出的原始方法不考虑上下文信息，因此Girshick等人[19]在R-CNN中添加了分类置信度分数作为参考，并根据置信度分数的顺序，以高分到低分的顺序进行greedy NMS。至于soft NMS [1]，它考虑的问题是目标物体的遮挡可能会导致在greedy NMS与IoU分数的置信度得分下降的问题。DIoU NMS [99]的开发人员的思维方式是在soft NMS的基础上将中心点距离的信息添加到BBox筛选过程中。值得一提的是，由于上述后处理方法都没有直接参考捕获的图像特征（none of above postprocessing methods directly refer to the captured image features），因此在后续开发无锚方法时不再需要后处理。

3. 方法

基本目标是加快神经网络的运行速度，在生产系统中优化并行计算，而不是低计算量理论指标（BFLOP）。我们提出了两个实时神经网络选项：

对于GPU，我们在卷积层中使用少量组（1 - 8）：CSPReSNeXt50 / CSPDarknet53
对于VPU - 我们使用分组卷积，但我们不使用Squeeze-and-excitement（SE）块 - 具体来说，这包括以下型号：EfficientNet-lite / MixNet [76] / GhostNet [21] / MobileNetV3

3.1. 结构选择

我们的目标是在输入网络分辨率、卷积层数、参数个数（filter size2 * filters * channel / groups）和图层输出数（过滤器）之间找到最佳平衡。例如，我们的大量研究表明，在 ILSVRC2012（ImageNet）数据集[10]上，CSPResNext50比 CSPDarknet53要好得多。但是，相反，在检测MS COCO数据集[46]上的目标方面，CSPDarknet53优于CSPResNext50。

下一个目标是选择其他模块，以增加感受野和不同骨干级别参数聚合的最佳方法：例如FPN、PAN、ASFF、BiFPN。

分类方面最佳的参考模型在检测器上并不总是最佳的。与分类器不同，检测器需要:

更高的输入网络大小（分辨率）–用于检测多个小目标
更多层 - 用于更高的感受野，以覆盖输入网络增加的大小
更多参数 - 提高模型在单个图像中检测不同大小的多个目标的容量

我们可以假设一个感受野大小的模型（具有较多的卷积层3×3）和更多的参数应作为骨干。表1显示了CSPReSNeXt50、CSPDarknet53和EfficientNet B3 的信息。CSPResNext50仅包含16个卷积层3×3、425×425感受野和20.6 M参数，而CSPDarknet53包含29个卷积层3×3、725×725感受野和27.6 M参数。这一理论论证，加上我们的大量实验，表明CSPDarknet53神经网络是两者中作为检测器骨干的最佳模型。

不同大小的感受野的影响总结如下：

取决于目标大小（Up to the object size） - 允许查看整个目标
取决于网络大小（Up to network size） - 允许查看目标周围的上下文
超过网络大小（Exceeding the network size） - 增加图像点和最终激活之间的连接数量

表1：用于图像分类的神经网络参数。

我们在CSPDarknet53上添加SPP块，因为它显著增强（increase）了感受野，分离出最重要的上下文特征，并且几乎不降低网络操作速度。我们使用PANet作为不同检测器级别的参数聚合方法，而不是YOLOv3中使用的FPN。

最后，我们选择CSPDarknet53骨干、SPP附加模块、PANet路径聚合颈部和YOLOv3（基于锚）头部作为YOLOv4的框架。

今后，我们计划大幅扩展检测器Bag of Freebies（BoF）的含量，理论上可以解决一些问题，提高检测器的精度，并按顺序以实验方式检查每个功能的影响。

我们不使用Cross-GPU批处理规范化（Cross-GPU Batch Normalization）（CGBN或SyncBN）或昂贵的专业设备。这允许任何人在传统的图形处理器上复现我们最先进的结果，例如GTX 1080Ti或RTX 2080Ti。

3.2. BoF and BoS的选择

为了改进目标检测训练，CNN通常使用以下内容：

激活：ReLU、leaky-ReLU、parametric-ReLU、ReLU6、SELU、Swish或Mish
边界框回归损失：MSE、IoU、GIoU、CIoU、DIoU
数据扩增：CutOut、MixUp、CutMix
正则化方法：DropOut、DropPath [36]、Spatial DropOut [79]或DropBlock
通过均值和方差对网络激活进行标准化:批处理规范化（Batch Normalization, BN） [32]，Cross-GPU批处理规范化（CGBN或SyncBN）[93]，过滤器响应规范化（Filter Response Normalization, FRN）[70]或跨迭代批处理规范化（Cross-Iteration Batch Normalization, CBN）[89]
Skip-connections：残差连接、加权残差连接、多输入加权残差连接或交叉阶段部分连接（Cross stage partial connections, CSP）

至于训练激活函数，由于PReLU和SELU更难训练，并且ReLU6是专门为量化网络设计的，因此我们从候选列表中删除了上述激活函数。在再量化（reqularization）方法中，发布Drop-Block的人将该方法与其他方法进行了详细的比较，其正则化方法赢得了很多。因此，我们毫不犹豫地选择DropBlock作为我们的正则化方法。至于规范化方法的选择，由于我们专注于只使用一个GPU 的训练策略，因此不考虑syncBN。

3.3. 其他改进

为了使设计的检测器更适合于单GPU的训练，我们进行了如下其他设计和改进：

我们介绍了一种新的数据扩增Mosaic和自对抗训练（Self-Adversarial Training, SAT）的方法
我们通过运用遗传算法选择最佳的超参数
我们修改了一些外在方法，使我们的设计适合高效的训练和检测 - modified SAM、modified PAN和Cross mini-Batch Normalization（CmBN）

Mosaic是一种新的数据扩增方法，它混合了4个训练图像。因此，混合有4个不同的上下文，而CutMix只混合2个输入图像。这允许检测其正常上下文之外的目标。此外，批处理规范化计算每个层上4个不同图像的激活统计信息。这大大减少了对大型小批次大小的需求。

自对抗训练（SAT）也代表一种新的数据扩增技术，可在2个向前向后阶段运行。在第一阶段，神经网络更改原始图像而不是网络权重。通过这种方式，神经网络对自身执行对抗攻击，更改原始图像以创建图像上没有所需目标的欺骗。在第二阶段，神经网络以正常方式训练以检测修改后的图像上的目标。

CmBN表示CBN的修改版本，如图4所示，定义为Cross mini-Batch Normalization（CmBN）。这仅在单个批次处理中的小批次处理之间收集统计信息。

我们从spatial-wise注意力到point-wise注意力来修改SAM，并将PAN的shortcut连接改为串联，如图5和图6所示。

【论文翻译】详细翻译论文—YOLOv4: Optimal Speed and Accuracy of Object Detection_第3张图片

图4: Cross mini-Batch Normalization.

3.4. YOLOv4

在本节中，我们将详细阐述YOLOv4的细节。

YOLOv4包括：

骨干：CSPDarknet53 [81]
颈部：SPP [25]，PAN [49]
头部：YOLOv3 [63]

YOLOv4使用：

骨干的Bag of Freebies（BoF）：CutMix 和Mosaic数据扩增、DropBlock正则化、类标签平滑
骨干的Bag of Specials（BoS）：Mish激活、Cross-stage partial connections（CSP）、多输入加权残差连接（Multi-input weighted residual connections, MiWRC）
用于检测器的Bag of Freebies（BoF）：CIoU 损失、CmBN、DropBlock 正化、Mosaic数据扩增、自对抗训练、消除网格灵敏度、对一个真值使用多个锚、 Cosine annealing scheduler [52]、最佳超参数、随机训练形状
用于检测器的Bag of Specials（BoS）：Mish激活、SPP块、SAM块、PAN 路径聚合块、DIoU-NMS

4. 实验

我们测试不同改进训练的技术对分类器在ImageNet（ILSVRC 2012 val）数据集上准确性的影响，然后测试检测器在MS COCO（test-dev 2017）数据集上的准确性。

4.1. 实验设置

在ImageNet图像分类实验中，默认的超参数如下：训练步数为8,000,000；批次大小和小批量大小分别为128和32；采用多项式衰减学习率调度策略，初始学习速率为0.1; 预热步数为1000;动量和权重衰减分别设置为0.9和0.005。我们所有的BoS实验都使用与默认设置相同的超参数，在BoF实验中，我们增加了50%的训练步数。在BoF实验中，我们验证 MixUp、CutMix、Mosaic、Bluring data augmentation和标签平滑正则化方法。在BoS实验中，我们比较了LReLU、Swish和Mish激活函数的影响。所有实验都使用1080 Ti或2080 Ti GPU进行训练。

在MS COCO目标检测实验中，默认超参数如下：训练步数为500,500；采用步长衰减学习率调度策略，初始学习速率0.01，在400,000步和450,000步时乘以因子（factor）0.1；动量和权重衰减分别设置为0.9和0.0005。所有体系结构都使用单个GPU执行批处理大小为64的多级训练，而小批量处理大小为8或4 取决于体系结构和GPU内存限制。除了使用遗传算法进行超参数搜索实验外，所有其他实验都使用默认设置。遗传算法使用YOLOv3-SPP训练与GIoU损失和搜索300个epochs为min-val 5k集。采用搜索学习速率0.00261、动量0.949、分配真值的IoU阈值为0.213和遗传算法实验的损失规范化为0.07。我们已经验证了大量的BoF，包括网格灵敏度消除、mosaic数据扩增、IoU阈值、遗传算法、类标签平滑、交叉小批量规范化、自对抗性训练、cosine annealing scheduler、动态小批量大小、DropBlock、优化锚、不同类型的IoU损失。我们还对各种BoS 进行实验，包括Mish、SPP、SAM、RFB、BiFPN 和Gaussian YOLO [8]。对于所有实验，我们只使用一个GPU进行训练，因此不使用同步BN优化多个GPU 等技术。

4.2. 不同功能对分类器训练的影响

首先，研究了不同功能对分类器训练的影响；具体来说，类标签平滑的影响，不同数据扩增技术的影响，bilateral blurring，MixUp，CutMix和Mosaic，如图7所示，以及不同激活的影响，如Leaky-ReLU（默认情况下），Swish和Mish。

在我们的实验中，如表2所示，分类器的精度通过引入以下功能得到提高，例如：CutMix和Mosaic数据扩增、类标签平滑和Mish激活。因此，我们的BoF骨干（Bag of Freebies）用于分类器训练包括以下内容：CutMix和Mosaic数据扩增和类标签平滑。此外，我们使用Mish激活作为补充选项，如表2和表3所示。

【论文翻译】详细翻译论文—YOLOv4: Optimal Speed and Accuracy of Object Detection_第5张图片

图7：各种数据扩增方法。

【论文翻译】详细翻译论文—YOLOv4: Optimal Speed and Accuracy of Object Detection_第6张图片

表2：BoF和Mish对CSPReSNeXt-50分类器精度的影响。

【论文翻译】详细翻译论文—YOLOv4: Optimal Speed and Accuracy of Object Detection_第7张图片

表3：Bof和Mish对CSPDarknet-53分类器精度的影响。

4.3. 不同功能对检测器训练的影响

进一步研究涉及不同的Bag-of-Freebies（BoF-检测器）对检测器训练精度的影响，如表4所示。我们在不影响FPS的情况下研究那些能够提高检测器精度的不同功能，以此显著扩展了BoF列表：

S：消除网格灵敏度方程（其中和总是整数）在YOLOv3中用于评估目标坐标，因此，接近或值的bx值需要极高的绝对值。我们通过将sigmoid乘以超过1.0的因子来解决此问题，从而消除了在目标无法检测到的网格的影响。
M：Mosaic数据扩增 - 在训练期间使用4个图像镶嵌，而不是单个图像
IT：IoU阈值 - 对单个IoU(truth, anchor)＞IoU_threshold的真值使用多个锚
GA：遗传算法 - 在前10%的时间段的网络训练期间使用遗传算法选择最佳超参数
LS：类标签平滑 - 对sigmoid激活使用类标签平滑
CBN：CmBN - 使用交叉小批次规范化收集整个批次中的统计信息，而不是在单个小批次中收集统计信息（using Cross mini-Batch Normalization for collecting statistics inside the entire batch, instead of collecting statistics inside a single mini-batch）
CA：Cosine annealing scheduler - 改变正弦训练（sinusoid training）中的学习速率
DM：动态小批次大小- 使用随机训练形状在小分辨率训练期间自动增加小批次大小
OA：优化的锚 - 使用优化的锚进行512x512网络分辨率的训练
GIoU、CIoU、DIoU、MSE - 对边界框回归使用不同的损失算法

进一步研究涉及不同的Bag-of-Specials（BoS-检测器）对检测器训练精度的影响，包括PAN、RFB、SAM、Gaussian YOLO（G）和ASFF，如表5所示。在我们的实验中，检测器在使用SPP、PAN和SAM时获得最佳性能。

【论文翻译】详细翻译论文—YOLOv4: Optimal Speed and Accuracy of Object Detection_第8张图片

表4：Bag-of-Freebies的消融研究。（CSPReSNeXt50-PANet-SPP，512x512）。

【论文翻译】详细翻译论文—YOLOv4: Optimal Speed and Accuracy of Object Detection_第9张图片

表5：Bag-of-Specials的消融研究。（尺寸 512x512）。

4.4. 不同骨干和预先训练的权重对检测器训练的影响

进一步研究了不同骨干模型对检测器精度的影响，如表6所示。我们注意到，在检测器精度方面，具有最佳分类精度的模型并不总是最好的。

首先，虽然与CSPDarknet53模型相比，具有不同功能的CSPReSNeXt-50型号的分类精度较高，但CSPDarknet53模型在目标检测方面表现出更高的精度。

其次，将BoF和Mish用于CSPResNeXt50分类器训练，提高了其分类精度，但进一步将这些预先训练的权重应用于检测器训练，降低了检测器的精度。但是，将BoF和Mish用于CSPDarknet53分类器训练可提高分类器和检测器的准确性，后者使用此分类器预先训练的权重。最终结果是，骨干CSPDarknet53更适合检测器，而不是CSPResNeXt50。

我们观察到，CSPDarknet53模型表明，由于各种改进，提高了检测器精度的能力。

【论文翻译】详细翻译论文—YOLOv4: Optimal Speed and Accuracy of Object Detection_第10张图片

表6：使用不同的分类器预训练权重进行检测器训练（所有其他训练参数在所有型号中都相似）。

4.5. 不同小批次对检测器训练的影响

最后，分析了使用不同小批次大小的模型获得的结果，结果显示在表7中。从表7所示的结果中，我们发现，在添加了BoF和BoS训练策略后，小批次大小对检测器的性能几乎没有影响。这一结果表明，在引入BoF和BoS后，不再需要使用昂贵的GPU进行训练。换句话说，任何人都可以只使用传统的GPU来训练出色的检测器。

【论文翻译】详细翻译论文—YOLOv4: Optimal Speed and Accuracy of Object Detection_第11张图片

表 7：使用不同的小批次大小进行检测器训练。

5. 结果

图8显示了与其他最先进的目标检测器结果的比较。我们的YOLOv4位于帕雷托最佳曲线（Pareto optimality curve）上，在速度和精度方面优于最快、最精确的检测器。

由于不同方法使用不同体系结构的GPU来进行推理时间验证，因此我们在通常采用的Maxwell、Pascal和Volta体系结构的GPU上运行YOLOv4，并将其与其他最先进的方法进行比较。表8列出了使用Maxwell GPU的帧率比较结果，它可以是GTX Titan X (Maxwell)或Tesla M40 GPU。表9列出了使用Pascal GPU 的帧率比较结果，它可以是Titan X (Pascal), Titan Xp, GTX 1080 Ti或Tesla P100 GPU。至于表10，它列出了使用Volta GPU的帧率比较结果，它可以是Titan Volta或Tesla V100 GPU。

6. 结论

我们提供最先进的检测器，比所有可用的替代检测器更快（FPS）和精度更高（MS COCO AP50…95和AP50）。所述检测器可在具有8-16 GB-VRAM的传统 GPU上进行训练和使用，这使得其广泛使用成为可能。基于锚的one-stage检测器的最初概念已证明其具有可行性。我们已经验证了大量的功能，并选择用这些功能，以提高分类器和检测器的准确性。这些功能可用作未来研究和发展的最佳实践。

【论文翻译】详细翻译论文—YOLOv4: Optimal Speed and Accuracy of Object Detection_第12张图片

图8：不同目标检测器的速度和精度比较。（有些文章指出，他们检测器的FPS只为一个GPU：Maxwell/Pascal/Volta）

【论文翻译】详细翻译论文—YOLOv4: Optimal Speed and Accuracy of Object Detection_第13张图片

表 8：MS COCO数据集上不同目标器的速度和准确性比较（test-dev 2017）。（此处突出显示了具有FPS 30或更高的实时检测器。我们将结果与batch=1进行比较，而不使用tensorRT。）

【论文翻译】详细翻译论文—YOLOv4: Optimal Speed and Accuracy of Object Detection_第14张图片

表 9：MS COCO数据集上不同目标检测器的速度和准确性比较（test-dev 2017）。（此处突出显示了具有FPS 30或更高的实时检测器。我们将结果与batch=1进行比较，而不使用tensorRT。）

【论文翻译】详细翻译论文—YOLOv4: Optimal Speed and Accuracy of Object Detection_第15张图片

表 10：MS COCO数据集上不同目标检测器的速度和准确性比较（test-dev 2017）。（此处突出显示了具有FPS 30或更高的实时检测器。我们将结果与batch=1进行比较，而不使用tensorRT。）

你可能感兴趣的:(论文翻译)

论文翻译：arxiv-2022 Ignore Previous Prompt: Attack Techniques For Language Models CSPhD-winston-杨帆论文翻译 LLMs-安全 prompt 语言模型人工智能
IgnorePreviousPrompt:AttackTechniquesForLanguageModelshttps://arxiv.org/pdf/2211.09527忽略之前的提示：针对语言模型的攻击技术文章目录忽略之前的提示：针对语言模型的攻击技术摘要1引言摘要基于Transformer的大型语言模型（LLMs）为大规模面向客户的应用程序中的自然语言任务提供了强大的基础。然而，探索恶意用户
论文翻译：arxiv-2024 Data Contamination Quiz: A Tool to Detect and Estimate Contamination in Large CSPhD-winston-杨帆 LLMs-数据污染论文翻译语言模型人工智能深度学习
DataContaminationQuiz:ATooltoDetectandEstimateContaminationinLargeLanguageModelshttps://arxiv.org/abs/2311.06233数据污染测验：一种检测和估计大型语言模型中污染的工具文章目录数据污染测验：一种检测和估计大型语言模型中污染的工具摘要1引言摘要我们提出了数据污染测验（DataContamina
实验DAY5：借假修真放逐997
a.昨日完成情况不佳，起床是9.30，除了报名（一口气报了五门..祝我好运），论文翻译和教育都没有完成；b.明日计划：9点前起床；明天优先复盘教育，以及准备cpa的考试资料；论文、和cpa留到周末做吧c.今天读到一篇讲美团公司战略的文章，对于整体战略搭建的方法论、具体业务的促成、以及更偏意识上层的“借假修真”思想的解读非常佩服，摘录核心如下：美团的增长引擎：1.严明的纪律性：放弃不符合业务逻辑的利
开源Bluespec bsc编译器和可重用示例设计达坦科技DatenLord 硬件加速 fpga fpga开发硬件工程开源
这篇介绍Bluespec以及设计示例的文章，是在2021年ICCAD（InternationalConferenceOnComputer-AidedDesign）发布的论文。达坦科技的open-rdma项目和推广的MIT体系结构学习社区都用到Bluespec，因此将此论文翻译成中文，以便大家了解2020年Bluespec开源后相关的开源项目。摘要：bsc编译器是一个商业可用的编译器，在过去的二十年
论文翻译 - BITE: Textual Backdoor Attacks with Iterative Trigger Injection anniewwy LLM Backdoor Attack
论文链接：https://arxiv.org/pdf/2205.12700.pdf项目代码：https://github.com/INK-USC/BITEBITE:TextualBackdoorAttackswithIterativeTriggerInjectionAbstract1Introduction2ThreatModel3Methodology3.1BiasMeasurementonLa
我做这件事，唯一的目的就是让你开心沉吟大叔
一个男人心里满满的爱意：我做这件事，唯一的目的就是让你高兴，而不是赢得你的好感、证明我的能力、让你对我感恩戴德。所以，我不想让你知道我的付出，不想让你对我怀有歉意和内疚，更不想因此获得什么回报。我只是心甘情愿地想为你做点什么，因为我爱你。这才是真爱吧。以前有个读者，说她男朋友特别小气，还不诚实。请她吃顿饭要念叨很久，给她买礼物，花一百要说成三百，帮她做论文翻译，明明一小时就搞定了，非要说是熬了个通
剖析以太坊上的庞氏骗局：识别、分析和影响卷神
区块链安全防护论文翻译：Bartoletti,Massimo,etal."DissectingPonzischemesonEthereum:identification,analysis,andimpact."FutureGenerationComputerSystems102(2020):259-277.摘要：庞氏骗局是一种以高额利润为诱饵的金融欺诈。实际上，只有新用户加入了庞氏骗局，用户才能得
《 HFContractFuzzer: Fuzzing Hyperledger Fabric Smart Contractsfor Vulnerability Detection》论文翻译 WXF_Security 智能合约安全研究 fabric golang
《HFContractFuzzer:FuzzingHyperledgerFabricSmartContractsforVulnerabilityDetection》（EASE2021）摘要区块链技术以其特有的去中心化、不可变性等优点，近年来被广泛应用于各个领域。运行在区块链上的智能合约在去中心化应用场景中也扮演着越来越重要的角色。因此，自动检测智能合约中的安全漏洞成为区块链技术应用中亟待解决的问题
Data Augmentation and Deep Learning Methods in SoundClassification: A Systematic Review ggqyh 深度学习人工智能
文章为翻译，仅供学习参考论文原地址：DataAugmentationandDeepLearningMethodsinSoundClassification:ASystematicReview作者：OlusolaO.Abayomi-Alli,RobertasDamaševiˇcius,AtikaQazi,MariamAdedoyin-OloweandSanjayMisra4论文翻译地址：https:
因果学习及反因果学习（论文翻译）三分钟湿度
OnCausalandAnti-causalLearning本博文对论文OnCausalandAnti-causalLearning的摘要和模型部分做了翻译和小修改，本论文主要描述因果学习中常见的几类基于函数估计的模型，同时说明了因果与相关性、因果学习与机器学习之间的关系，论文重点在讨论和比较不同模型，内容较为笼统，不做深入探讨，但对不同模型之间的本质关系的讨论值得一看。论文地址：https://
Convolutional Neural Networks for No-Reference Image Quality Assessment 论文翻译亚里论文阅读 NR-IQA 使用卷积网络进行图像质量评价
ConvolutionalNeuralNetworksforNo-ReferenceImageQualityAssessment论文翻译TranslationAbstract1Introduction2RelatedWork3CNNforNR-IQA3.1NetworkArchitecture3.2LocalNormalization3.3Pooling3.4ReLUNonlinearity3.5
有道论文翻译接口，python版和lua版 monsterskiller 手机编程脚本编程 python
论文翻译接口python版importrequestsimporthashlibfromurllib.parseimportquotedefget_md5(s,is_hex=True):md5=hashlib.md5()md5.update(s.encode())ifis_hex:returnmd5.hexdigest()returnmd5.digest()deftranslate(source_
医学论文翻译有哪些要求，应该如何翻译呢？英信翻译公司其他
近年来，随着国内医学水平的不断提高，医学论文翻译的需求也呈现出快速增长的趋势。在国外期刊上发表论文，往往需要将整篇论文翻译成英文。那么，医学论文翻译有哪些要求，应该如何翻译呢？专家指出，医学论文翻译最基本的要求就是准确性，要求翻译者能够准确地将原文的含义传达给读者，不出现歧义或者误解的情况。这要求翻译者具备深厚的医学专业知识和语言能力，能够理解原文的含义，并将其准确地表达出来。除了准确性之外，医学
GPT原始论文：Improving Language Understanding by Generative Pre-Training论文翻译 iKang_dlut gpt 人工智能深度学习
1摘要自然语理解包括文本蕴含、问题回答、语义相似性评估和文档分类等一系列多样化的任务。尽管大量未标注的文本语料库很丰富，但用于学习这些特定任务的标注数据却很稀缺，这使得基于区分性训练的模型难以充分发挥作用。我们展示了通过在多样化的未标注文本语料库上对语言模型进行生成式预训练，随后对每个特定任务进行区分性微调，可以实现这些任务的大幅度改进。与以往的方法不同，我们在微调过程中使用了任务感知的输入转换，
【论文翻译】Generation of Non-Deterministic Synthetic Face Datasets Guided by Identity Priors（21.12）联系丝信计算机视觉
文章目录读后感Abstract1Introduction1.1Ourcontributions2RelatedWorks2.1SyntheticImageGeneration2.2MatedSampleGeneration2.3LimitationsinState-of-the-art3PCA-FR-GuidedSampling4SyntheticMatedFace(SymFace)Dataset
ORB-SLAM2代码学习1 rgdb_tum.cc Dziwu SLAM 学习计算机视觉人工智能
论文翻译参考1参考2rgdb_tum.cc的框架代码大致思路LoadImages()加载图像——判断rgb图是否存在——判断rgb图与depth图数量是否对应相同。ORB_SLAM2::SystemSLAM()初始化，创建SLAM系统，并初始化各个线程。遍历每一对RGB图和depth图【读取RGB图和depth图，读取时间戳（vTimestamps存储了时间戳，实际上就是存储了数据文件的每一幅图像
GFS--Google File System论文翻译和理解不争_900c
一、系统设计目标高可用的大文件分布式文件系统。二、关键点Architecture-架构：有哪些Server，每个Server的功能。Master存储的MetaData的结构。client写数据流程。client读数据流程。启动时Master和ChunkServer的交互。ChunkServer发生故障时，Master和ChunkServer的交互。三、核心设计概述2.Master中存储的MetaD
翻译 5765f3fa240e
对于论文翻译，大家要极其重视阅读平行文本和查资料的重要性。我平时经常做论文翻译和润色，每一次都是如履薄冰。需要阅读核心参考文献，查资料消除术语，彻底领会论文背后的逻辑。这些都解决了，才轮到运用语言基本功。假如大家接论文翻译，请认真对待查资料和阅读平行文本这两件事，如果做不到，暂时不要接论文翻译。
BERT论文翻译 TheHonestBob NLP 自然语言处理
一、写在前面在Transformer和BERT大行其道的时代，搞懂这两种基础模型结构很有必要，在网上没有搜索到满意的论文翻译结果，最近刚好有时间，把BERT的论文在个人英语水平基础上最大程度的保留原作者的本意翻译一遍，如有翻译不到位的地方请各位指出，觉得不错的点个赞鼓励一下，Tansformer的论文我之前已经翻译了，可以查看我的这篇博客attentionisallyouneed论文翻译。查看be
ImageNet Classification with Deep Convolutional Neural Networks论文翻译——中英文对照 SnailTyan 深度学习 Deep Learnig
文章作者：Tyan博客：noahsnail.com|CSDN|简书翻译论文汇总：https://github.com/SnailTyan/deep-learning-papers-translationImageNetClassificationwithDeepConvolutionalNeuralNetworksAbstractWetrainedalarge,deepconvolutionaln
2021-02-05 碰撞检测GJK算法详解（初学者慎入） MathPhilosophy
碰撞检测有2个经典算法，一个是分离轴算法SAT,还有一个就是本文要介绍的GJK，GJK是三个人的名字首写大字母；这个算法的数学推导有点复杂，目前网上只有这篇https://blog.csdn.net/u010016421/article/details/104788769/相对比较详细的介绍了算法，其主要也是参考原始论文翻译的；考虑到原始论文比较难读，博主特地专门写一篇文章介绍，博主的这篇文章会必
YoloV8改进策略：BackBone改进|DCNv4最新实践|高效涨点|多种改进教程|完整论文翻译静静AI学堂 YOLO
摘要涨点效果：在我自己的数据集上，mAP50由0.986涨到了0.993，mAP50-95由0.737涨到0.77，涨点明显！DCNv4是可变形卷积的第四版，速度和v3相比有了大幅度的提升，但是环境搭建有一定的难度，对新手不太友好。如果在使用过程遇到编译的问题，请严格按照我写的环境配置。论文：《DCNv4：对视觉应用的动态和稀疏算子的重新思考》https://arxiv.org/pdf/2401.
论文翻译 SVSGAN: Singing Voice Separation Via Generative Adversarial Network 夏HL
文章主要是将混合音频的声谱作为输入，人声,bgm的声谱作为标签，通过GAN来完成近似过程，生成器最后一层用的output_voice=[z_voice/(z_voice+z_bgm)]*x,output_bgm=[z_bgm/(z_voice+z_bgm)]*x而且文章中的生成器是经过预先训练后的。我在MKR-100上用SVSGAN时难以训练(以后换成wgan)。0.摘要从混合音频中分离出两种来源
ALOHA论文翻译：Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware baidu_huihui 精细双手操作低成本硬件
学习用低成本硬件进行精细双手操作MobileALOHA论文翻译：LearningFine-GrainedBimanualManipulationwithLow-CostHardware论文翻译@[TOC]在这里插入图片描述图1：ALOHA：一种用于双手远程操作的低成本开源硬件系统。整个系统使用现成的机器人和3D打印组件，总成本不到20,000美元。左图：用户通过反向驱动领导机器人进行远程操作，从而
手把手教你用GPT写提示词；进行文献综述；论文翻译/润色及写作 asyxchenchong888 gpt4 GPT gpt chatgpt 人工智能 python
2023年随着OpenAI开发者大会的召开，最重磅更新当属GPTs，多模态API，未来自定义专属的GPT。微软创始人比尔盖茨称ChatGPT的出现有着重大历史意义，不亚于互联网和个人电脑的问世。360创始人周鸿祎认为未来各行各业如果不能搭上这班车，就有可能被淘汰在这个数字化时代，如何能高效地处理文本、文献查阅、PPT编辑、编程、绘图和论文写作已经成为您成功的关键。而ChatGPT，作为一种强大的自
【Linux系统下论文翻译软件Zotero】 Dymc 安装笔记 linux 服务器论文翻译软件
Linux系统下论文翻译软件Zotero1下载安装包2建立快捷方式3插件安装4翻译插件出现报错1下载安装包Linux系统下的论文翻译软件Zotero，下载地址：https://www.zotero.org/download/2建立快捷方式解压后，创建快捷方式，即创建软链接：sudomkdir/opt/zoterosudomvZotero_linux-x86_64/*/opt/zotero/cd/o
KGCapsAN论文翻译毕一
摘要：基于方面(方面级)的情感分析是在细粒度情感分析中非常重要的子任务，旨在自动推断出某一方面在其上下文中的情绪。之前的研究已经表明，利用注意力为基础的方法可以有效地提高基于方面的情感分析的精度。尽管有了卓越的进步,基于方面的情绪分析现实中几个方面挑战。(1)目前基于注意力的方法可能会导致某一方面的注意力不正确地集中在与句法无关的词上。(2)传统的方法无法将情感与特殊的句子结构区分开来，如双重否定
记你我的第一次相遇易美编校
Hi大家好！今天是易美编校在与你们的第一次相遇，让我想到了白落梅的《世间所有的相遇都是久别重逢》,人和人的缘分真的很深，可以维系千年，任凭风尘起落，情怀不改。人和人的缘分真的很浅，只不过是相逢刹那，转身便成了永远的陌路。不知道你我之间将会有怎样的一个开始？先做个自我介绍吧，Emate易美编校是北京龙华全科教育科技有限公司旗下学术服务品牌，旨在为非英语国家的科学家提供专业化的论文翻译、润色、修改及其
基于ChatGPT的代码解释神器：GPT Academic、GitHub Copilot 码上出奇迹 chatgpt gpt github
（个人推荐使用第二个GitHubCopilot）1.GPT学术优化(GPTAcademic)工具简介GPTAcademic是什么为ChatGPT/GLM提供实用化交互界面，特别优化论文阅读/润色/写作体验，模块化设计，支持自定义快捷按钮&函数插件，支持Python和C++等项目剖析&自译解功能，PDF/LaTex论文翻译&总结功能，支持并行问询多种LLM模型，支持chatglm2等本地模型。兼容文
推荐几个将pdf论文翻译转化为中文论文的免费在线网站 Wency(王斯-CUEB) 经验分享
如果你需要将英文PDF研究论文翻译成中文，有几个网站可以帮助你：OnlineDocTranslator【传送门】这项免费服务允许您上传PDF并将其翻译成中文。它支持包括PDF在内的多种文档格式，并保持文档的原始布局。GroupDocs【传送门】这个在线工具提供免费的PDF文档从英文到中文的翻译。它是一个基于浏览器的应用程序，因此不需要安装软件。请注意，PDF文档的字符限制为10,000个字符。Do
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数