耿鬼喝椰汁

YOLOv4论文翻译(已校正)

此篇为目标检测系列论文：YOLOv4 论文翻译（YOLOv4: Optimal Speed and Accuracy of Object Detection）翻译（已逐句校正，方便大家学习）

论文下载：https://arxiv.org/pdf/2004.10934.pdf

论文源码：GitHub - AlexeyAB/darknet: YOLOv4 / Scaled-YOLOv4 / YOLO - Neural Networks for Object Detection (Windows and Linux version of Darknet )

YOLOv4: Optimal Speed and Accuracy of Object Detection

摘要

据说有大量的特征可以提高卷积神经网络(CNN)的准确性。需要在大数据集上对这些特征的组合进行实际测试，并对结果进行理论验证。有些特征专门针对某些模型和某些问题，或者只针对小规模数据集;而一些特性，如批处理标准化和剩余连接，适用于大多数模型、任务和数据集。我们假设这些通用特征包括加权剩余连接(WRC)，跨阶段部分连接(CSP)，跨小批处理标准化(CmBN)，自我对抗训练(SAT)和mish激活。我们使用了新的功能:WRC, CSP，CmBN, SAT, Mish激活，马赛克数据增强，CmBN, DropBlock regularization, CIoU loss，并结合其中一些方法，达到最先进的效果:43.5%，对MS COCO数据集的AP (65.7% AP50)，在Tesla V100上的实时速度约为65 FPS。源代码在https://github.com/AlexeyAB/darknet。

1、介绍

大多数基于cnn的对象检测器在很大程度上只适用于推荐系统。例如，通过城市摄像机搜索免费停车位是由慢速准确的模型执行的，而车辆碰撞预警则与快速不准确的模型相关。提高实时对象检测器的准确性使它们不仅可以用于生成提示推荐系统，还可以用于独立进程管理和减少人工输入。实时对象检测器操作在传统的图形处理单元(GPU)上，允许他们大量使用在一个负担得起的价格。最精确的现代神经网络并不实时运行，并且需要大量的gpu来进行大规模的小批量训练。我们通过创建一个在传统GPU上实时运行的CNN来解决这些问题，而对于CNN的训练只需要一个传统的GPU。

图1：对拟建的YOLOv4和其他最先进的目标检测器进行比较。YOLOv4 的速度比高效德特快两倍，具有同等的性能。YOLOv3 的 AP 和 FPS 分别提高了 10% 和 12%。

这项工作的主要目标是设计在生产系统中能快速运行速度的目标检测器，并行优化，而不是低的浮点量理论指标（BFLOP）。我们希望设计的对象能够轻松训练和使用。例如，任何使用传统 GPU 进行训练和测试的人都可以获得实时、高质量和令人信服的目标检测结果，如图 1 所示的 YOLOv4 结果所示。我们的贡献总结如下：

1、我们开发一种高效、强大的物体检测模型。它使每个人都可以使用1080 Ti或2080 Ti GPU来训练超快速和准确的目标检测器；

2、在检测器训练期间，我们验证最先进的开源方法和特殊检测方法的影响；

3、我们修改最先进的方法，使其更高效，适合单次 GPU 训练，包括 CBN [89]、PAN [49]、SAM [85]等。

（图2 目标检测器）

2、相关工作

2.1、目标检测模型

现代目标检测器通常由两部分组成。ImageNet上预训练的backbone和用于预测类和BBOX的检测器head。对于那些在GPU平台上运行的探测器，其backbone可以是VGG[68]，ResNet[26]、ResNeXt[86]、或 DenseNet [30]。对于那些运行在CPU平台上的检测器形式，它们的backbone可以是SqueezeNet[31]、MobileNet[28，66，27，74]，或ShuffleNet[97，53]。至于head部分，它通常被分两类：即one-stage目标检测器和two-stage目标检测器。最有代表性的two-stage检测器是R-CNN[19]系列。包括快速的R-CNN[18]，更快的R-CNN[64]，R-FCN[9],和Libra R-CNN[58]。也可以做一个two-stage目标检测器一个anchor-free目标检测器，如RepPoints[87]。对于one-stage检测器来说，最代表性的有YOLO[61、62、63]、SSD[50]、和RetinaNet[45]。近几年来，anchor-free one-stage目标探测器被开发，如CenterNet[13]，CornerNet[37，38]，FCOS[78]等。近年来发展起来的检测器，往往会在backbone和head之间插入一些层，这些层用于收集不同阶段的特征图。我们可以称它为检测器的neck。通常情况下neck是由几个bottom-up paths and several top-down paths组成。Feature Pyramid Network (FPN)[44], Path Aggregation（PAN）[49]、BiFPN[77]和NAS-FPN[17]具有这个机制。

除上述模型外，有的研究者重新构建backbone（DetNet[43], DetNAS[7]）或重新构建整个模型（SpineNet[12]，HitDetector[20])用于目标检测。总结，通常目标检测模型有如下架构：
• Input: Image, Patches, Image Pyramid
• Backbones: VGG16 [68], ResNet-50 [26], SpineNet[12], EfficientNet-B0/B7 [75], CSPResNeXt50 [81],CSPDarknet53 [81]
• Neck:
• Additional blocks: SPP [25], ASPP [5], RFB[47], SAM [85]
• Path-aggregation blocks: FPN [44], PAN [49],NAS-FPN [17], Fully-connected FPN, BiFPN[77], ASFF [48], SFAM [98]
• Heads::
• Dense Prediction (one-stage):RPN [64], SSD [50], YOLO [61], RetinaNet[45] (anchor based) CornerNet [37], CenterNet [13], MatrixNet[60], FCOS [78] (anchor free)
• Sparse Prediction (two-stage):Faster R-CNN [64], R-FCN [9], Mask R-CNN [23] (anchor based) RepPoints [87] (anchor free)

2.2. Bag of freebies

通常情况下，传统的目标检测器的训练都是在离线进行的，因此，研究者们总是喜欢研究更好的训练方法，使之目标检测器在不增加推理损耗的情况下达到更好的精度。我们将这些方法称为只需转变训练策略或只增加训练量成本为 " bag of freebies "。目标检测经常采用这种方法，并符合这个定义的就是数据增强。数据增强的目的是：增加输入图像的可变性，从而使设计的目标检测模型对不同环境的图片具有较高的鲁棒性。比如photometric distortions和geometric distortions是两种常用的数据增强方法，它们对检测任务肯定是有好处的。在处理photometric distortions，我们调整亮度，对比度。图像的色相、饱和度和噪声。对于geometric distortions，我们添加了随机缩放、裁剪、翻转和旋转。

上面提到的数据增强方法都是像素的调整，以及所有原始像素信息在调整后的区域被保留下来。此外，一些从事数据扩容工作的研究者，把重点放在了模拟object occlusion问题。他们在图像分类和目标检测取得了好的结果。例如，random erase [100] and CutOut [11]可以随机的选取图像中的矩形区域，并随机填入或补充值为零。至于hide-and-seek [69]和grid mask [6]，他们随机或均匀地选择多个图像中的矩形区域，并将其替换为全0。如果将类似的概念应用到特征图中，就是DropOut[71]、DropConnect[80]和DropBlock[16]方法。此外，有研究者提出了多张图像一起使用数据的方法扩增。例如，MixUp[92]使用了两个图像乘以不同系数的乘法叠加，并调整标签。至于CutMix[91]，它是为了覆盖裁剪后的图像到其他图像的矩形区域，并根据混合区的大小调整标签。除了以上提到的方法，style transfer GAN[15]也是数据扩容方法，这种使用可以有效地实现数据扩容，减少CNN学习的纹理偏差。
与上面提出的各种方法不同。其他的一些Bag of freebies方法是专门解决数据集中的语义分布偏差。在处理语义困扰的问题上，有一个很重要的问题是不同类别之间的数据不平衡，而two-stage 检测器处理这个问题通常是通过hard negative example mining [72]或online hard example mining [67]。但example mining method不适用于one-stage 目标检测器，因为这种检测器属于密集预测架构。因此，Linet al.[45]提出了focal loss解决数据不平衡问题。另一个很重要的问题是，one-hot编码很难表达出类与类之间关联程度问题。在执行标签化通常使用这种表示方式。在[73]中提出的label smoothing方案是将硬标签转化为软标签进行训练，可以使模型更鲁棒。为了获得更好的软标签，Islam等[33]将知识蒸馏的概念引入标签细化网络设计中。
最后一个bag of freebies是objective function of Bounding Box (BBox) 回归。检测器通常使用MSE对BBOX的中心点和宽高进行回归，至于anchor-based方法，它是为了估算出对应的偏移量。但是，要直接估计BBOX的点坐标值，是要将这些点作为独立变量，但实际上未考虑对象本身的完整性。为了使这一问题得到更好的处理，一些研究人员最近提出的IoU损失[90]，同时考虑预测的BBox面积和ground truth BBox面积覆盖。IoU损失会计算到BBox的四个坐标点，然后连接到生成一个完整的代码。因为IOU是一个尺度不变表示，它可以解决当传统方法计算{x，y，w，h}的l1或l2损失导致尺度增加。最近，一些研究人员不断改善IOU损失。例如GIoU损失[65]除覆盖面积也考虑物体的形状和方向。他们建议找到能同时覆盖预测BBOX和ground truth BBox的最小面积BBOX，并使用这个BBox作为分母，以取代IoU损失的分母。至于 DIoU 损失[99]，它另外还包括考虑物体中心的距离，CIoU损失[99]，另一方面，同时考虑到重叠区域，中心点之间的距离，以及长宽比。CIoU可以在BBox回归问题上实现更好的收敛速度和精度。

2.3、Bag of specials

对于那些插件模块和后处理方法，它只增加少量的推理成本，但可以显著提高目标检测的准确性，我们称之为”“bag of specials”。一般来说，这些插件模块用于增强模型中的某些属性，如扩大感受野、引入关注机制、增强特征提取能力等，后处理是筛选模型预测结果的方法。

可用于增加感受野的常见模块有 SPP [25]、ASPP [5] 和 RFB [47]。SPP 模块源自空间金字塔匹配（SPM） [39]，SPM 的原始方法是将feature map拆分为多个d*d等块，其中 d 可以是 {1、2、3、……｝，从而形成空间金字塔，然后提取词袋（bag-of-word）特征。SPP 将 SPM 集成到 CNN 中，并使用最大池化操作，而不是词袋操作。由于He等人提出的SPP模块[25]将输出一维特征矢量，因此在全卷积网络（FCN）中应用是不可行的。因此，在 YOLOv3 [63] 的设计中，Redmon 和 Farhadi 改进了 SPP 模块与内核大小 k * k 的最大池输出的串联，其中 k = {1、5、9、13 } 和步长等于 1。在此设计下，相对较大的 k * k maxpool 可有效增加骨干特征的感受野。添加改进版的 SPP 模块后，YOLOv3-608 在 MS COCO 目标检测任务中将 AP 50 升级 2.7%，额外计算成本为 0.5%。ASPP [5] 模块与改进的SPP模块之间的操作不同主要是从原来的k*k内核大小，最大步幅等于1改至多个3× 3内核大小，膨胀率等于k，在扩张卷积操作中，步长等于1。RFB 模块是使 k*k 内核的多个膨胀卷积，膨胀比等于 k，步长等于 1，以获得比 ASPP 更全面的空间覆盖。RFB [47] 只需花费 7% 的额外推理时间，就将 MS COCO 上的 AP 50 SSD 增加 5.7%。

目标检测中常用的注意模块主要分为channel-wise attention和pointwise attention，这两个注意模型的代表分别是Squeeze-and-Excitation (SE) [29]和Spatial Attention Module[SAM][85]。虽然SE模块可以提高ResNet50在ImageNet图像分类任务中的top-1 准确率提高1%，而成本只增加计算工作量2%（这里指的是floats），但在GPU上通常会增加10%左右计算时间，因此在移动设备中使用更合适。但对于 SAM，它只需要额外花费0.1% 的计算，并且它可以提高 ResNet50-SE 在 ImageNet 图像分类任务中 0.5% 的前 1 精度。最重要的是，它根本不影响 GPU 上的推理速度。

在特征融合方面，早期做法是使用skip connection [51] 或hyper-column [22] 将低级物理特征与高级语义特征进行融合。由于FPN等多尺度预测方法已经普及，许多融合不同特征金字塔的轻量级模块被提出来。此类模块包括 SFAM [98]、ASFF [48] 和 BiFPN [77]。SFAM 的主要思想是使用 SE 模块在多尺度channelwise level re-weighting上执行通道级重新加权。至于ASFF，它使用softmax作为point-wise级reweighting，然后添加不同层级的特征图。在 BiFPN 中，输入多尺度权重残差连接来提取不同层的scale-wise level re-weighting，然后添加不同层的特征图。

在深度学习的研究中，有些人把精力放在寻找好的激活函数上。良好的激活函数可以使梯度更有效地传播，同时也不会造成过多的额外计算成本。2010年，Nair和Hinton[56]提出ReLU激活函数从根本上解决梯度消失问题。随后，提出了LReLU[54]，PReLU[24]，ReLU6[28]，缩放指数线性单位（SELU）[35]，Swish [59]，hard-Swish[27]，和Mish[55]等，也用于解决梯度消失问题。LReLU 和 PReLU 的主要目的是解决当输出小于零时 ReLU 梯度为零的问题。至于ReLU6和硬hard-Swish，它们是专门为量化网络设计的。为了实现神经网络的自规范化，提出了符合目标的SELU激活函数。需要注意的是，Swish 和 Mish 都是连续可微的激活函数。

在基于深度学习的目标检测中常用的后处理方法是 NMS，它用于筛选掉那些预测同一对象的不好的BBox，并且仅保留置信度较高的候选BBox。NMS 尝试改进的方式与优化目标函数的方法一致。NMS提出的原始方法不考虑上下文信息，因此Girshick等人[19]在R-CNN中添加了分类置信度分数作为参考，并根据置信度分数的顺序，以高分到低分的顺序进行贪婪的NMS。至于 soft NMS [1]，它考虑的问题，对象的遮挡可能会导致在贪婪的NMS与IoU分数的置信度分数下降的问题。DIoU NMS [99] 开发人员的思维方式是在软 NMS 的基础上将中心点距离的信息添加到 BBox 筛选过程中。值得一提的是，由于上述后处理方法没有一种直接是指捕获的图像特征，因此在后续开发无锚方法时不再需要后处理。

3. 方法论

基本目的是生产系统中的神经网络的快速运行速度和并行计算的优化
我们提出了两种实时神经网络。

1.对于GPU，我们在卷积层使用少量组（1-8）。CSPResNeXt50 / CSPDarknet53

2.对于VPU----我们使用分组卷积，但不使用Squeeze-and-excitement (SE) blocks--具体来说，这包括以下模型：EfficientNet-lite / MixNet [76] / GhostNet[21] / MobileNetV3

3.1架构选择

我们的目标是在输入网络分辨率、卷积层数、参数量（滤波器大小： 2 * 滤波器 * 通道 / 分组）和图层输出数（筛选器）之间找到最佳平衡。例如，我们的大量研究表明，在 ILSVRC2012 （ImageNet）数据集 [10] 上，CSPResNext50比 CSPDarknet53要好得多。但是，相反，在 MS COCO检测数据集 [46] 上，CSPDarknet53 优于 CSPResNext50。

下一个目标是选择更多的block扩大感受野，为不同级别的backbone、不同的检测器级别：如FPN、PAN、ASFF、BiFPN找到参数聚合的最佳方法。一个最佳的分类参考模型是并不总是最佳的检测器。相比之下，检测器需要满足：

更高的输入网络尺寸（分辨率）----用于检测多个小物件
更多的层数：提高模型的感受野，能应对网络输入尺寸增加
更多参数–更大的模型容量，在单个图像中检测多个大小不同的物体。

我们可以假设一个模型具有较大的感受野（很多3×3卷积层），应该选择很多参数的backbone，表1显示了CSPResNeXt50，CSPDarknet53和EfficientNet B3的信息。CSPResNext50仅包含16个3×3卷积层、425×425感受野大小和20.6M个参数，而CSPDarknet53包含29个3×3卷积、725×725感受野大小和27.6M个参数。这种理论上的证明，连同我们的大量实验表明，CSPDarknet53神经网络是最佳的backbone。

不同大小的感受野的影响总结如下：
•最大对象尺寸-允许查看整个对象
•取决于网络大小-允许查看周围的环境物体
•超出网络规模-图片输入和最终激活值的连接数

我们将SPP模块添加到CSPDarknet53上，因为它大大增加了感受野，分离出最重要的context特征，几乎不会导致降低网络运行速度。我们使用PANet作为来自不同backbone的参数聚合方法而不是YOLOv3中使用的FPN。最后，我们选择CSPDarknet53主干，SPP添加模块，PANet path-aggregation neck和YOLOv3（anchor based）头作为YOLOv4架构。
将来，我们计划大幅扩展（BoF）的内容，可以解决一些问题并增加检测器准确性，并顺序检查每个功能的影响。
我们不使用Cross-GPU Batch Normalization（CGBN或SyncBN）或昂贵的专用设备。这个使任何人都可用常规图形处理器再现我们最新的成果，例如GTX 1080Ti或RTX2080Ti。

3.2、BoF 和 BoS 的选择

为了提升目标检测训练，CNN 通常使用以下内容：

激活函数: ReLU, leaky-ReLU, parametric-ReLU, ReLU6, SELU, Swish, or Mish

框回归损失: MSE, IoU, GIoU, CIoU, DIoU

数据增强: CutOut, MixUp, CutMix

正则化方法: DropOut, DropPath [36], Spatial DropOut [79], or DropBlock

归一化层: Batch Normalization (BN) [32], Cross-GPU Batch Normalization (CGBN or SyncBN) [93], Filter Response Normalization (FRN) [70], or Cross-Iteration Batch Normalization (CBN) [89]

跳跃连接: Residual connections, Weighted residual connections, Multi-input weighted residual connections, or Cross stage partial connections (CSP)

至于训练激活函数，由于 PReLU 和 SELU 更难训练，而 ReLU6 是专门为量化网络设计的，因此我们从候选列表中剔除了上述激活函数。在重量化方法中，一些人将DropBlock 的方法与其他方法进行了详细的比较，其正则化方法略好一些。因此，我们毫不犹豫地选择 DropBlock 作为我们的规范化方法。至于规范化方法的选择，由于我们专注于只使用一个 GPU 的训练策略，因此不考虑 syncBN。

3.3、其它的改进

为了使设计的检测器更适合于单 GPU 的训练，我们进行了如下其他设计和改进：

我们引入了一种新的数据扩增Mosaic和Self-Adversarial Training (SAT)方法；
应用遗传算法选择最佳的超参数。

我们修改了一些现有的方法，使我们的设计适合高效的训练和检测 – modiﬁed SAM, modiﬁed PAN, and Cross mini-Batch Normalization (CmBN)Mosaic(马赛克)是一种新的数据扩增方法，它混合了4个训练图像。因此，4个不同的上下文混合，而CutMix只混合2个输入图像。这允许检测其正常上下文之外的对象。此外，批处理规范化计算每个层上 4 个不同图像的激活统计信息。这大大减少了对大batch size的需求。

图3：Mosaic 数据增强表现

Self-Adversarial Training (SAT) 代表一种新的数据扩增技术，可在 2 个forward backward阶段运行。在第一阶段，神经网络更改原始图像而不是网络权重。通过这种方式，神经网络对自身执行对抗攻击，更改原始图像以创建映像上没有所需对象的假图。在第二阶段，神经网络被训练以正常方式检测此修改图像上的目标。

CmBN 表示 CBN 修改版本，如图 4 所示，定义为交叉小批量规范化（CmBN）。这仅在单个批处理中的微型批处理之间收集统计信息。

我们修改SAM，从spatial-wise attention改为pointwise attention，并将 PAN 的shortcut connection改为concatenation，如图 5 和图 6 所示。

3.4、YOLO V4

在本节中，我们将详细阐述YOLOv4的细节。

YOLOv4 包括：

主干： CSPDarknet53 [81]
颈部： SPP [25]， PAN [49]
头部： YOLOv3 [63]

YOLO v4 使用：

Bag of Freebies (BoF) for backbone: CutMix 和 Mosaic 数据增强, DropBlock regularization, Class label smoothing
Bag of Specials (BoS) for backbone: Mish 激活, Cross-stage partial connections (CSP), Multiinput weighted residual connections (MiWRC)
Bag of Freebies (BoF) for detector: CIoU 损失, CmBN, DropBlock 正则化, Mosaic数据扩增, Self-Adversarial 训练, Eliminate grid sensitivity, Using multiple anchors for a single ground truth, Cosine annealing scheduler [52], Optimal hyperparameters, Random training shapes
Bag of Specials (BoS) for detector: Mish 激, SPP-block, SAM-block, PAN path-aggregation block, DIoU-NMS

4、实验

我们测试不同训练改进技术对 ImageNet （ILSVRC 2012 val）数据集上的分类器准确性的影响，然后测试 MS COCO （test-dev 2017）数据集上的检测器的准确性。

4.1.实验设置

在 ImageNet 图像分类实验中，默认的超参数如下：训练steps 为 8,000,000； batch size和mini-batch size大小分别为128和32；采用多项式衰减学习率调度策略，初始learning rate为0.1；warm-up steps为1000；momentum 和weight decay分别设置为 0.9 和 0.005。我们所有的 BoS 实验都使用与默认设置相同的超参数，在 BoF 实验中，我们增加了 50% 的训练步骤。在 BoF 实验中，我们验证 MixUp、CutMix、Mosaic、Bluring数据扩增和label smoothing regularization方法。在BoS实验中，我们比较了LReLU、Swish和Mish激活函数的影响。所有实验都使用 1080 Ti 或 2080 Ti GPU 进行训练。

在MS COCO目标检测实验中，默认超参数如下：训练steps为500,500；采用step decay learning rate调度策略，初始学习速率0.01，在400,000步和45万步时乘以因子0.1；momentum和weight decay分别设置为 0.9 和 0.0005。所有网络结构都使用单个 GPU 执行批处理大小为 64 的多级训练，而mini-batch大小为 8 或 4 取决于网络结构和 GPU 内存限制。除了使用遗传算法进行超参数搜索实验外，所有其他实验都使用默认设置。遗传算法使用YOLOv3-SPP训练与GIoU损失和搜索300个epochs为min-val 5k验证集。采用搜索学习速率0.00261、动量0.949、分配真值IoU阈值为0.213，遗传算法实验的损失规范化器0.07。我们已经验证了大量的BoF，包括grid sensitivity elimination、mosaic数据扩增、IoU阈值、遗传算法、class label smoothing, cross mini-batch normalizationselfadversarial training, cosine annealing scheduler, dynamic mini-batch size, DropBlock, Optimized Anchors、不同类型的IoU损失。我们还对各种 BoS 进行实验，包括Mish、SPP、SAM、RFB、BiFPN 和Gaussian YOLO [8]。对于所有实验，我们只使用一个 GPU 进行训练，因此不使用syncBN 优化多个 GPU 等技术。

4.2、不同特性对分类器训练的影响

首先，研究了不同特性对分类器训练的影响；具体来说，class label smoothing，不同数据扩增技术的影响，双边模糊，MixUp，CutMix和Mosaic，如Fugure 7所示，以及不同激活的影响，如Leaky-ReLU（默认情况下），Swish和Mish。

图7：不同的数据增强方法

在我们的实验中，如表2所示，引入了以下技巧提高了精度，如CutMix和Mosaic数据增强，Class label smoothing,和Mish activation。因此，我们的分类器训练BoF-backbone (Bag of Freebies)是： CutMix和Mosaic data augmentation和Class label smoothing，此外我们还使用Mish activation作为补充方案，如表2和表3所示。

4.3、不同特性对检测器训练的影响

进一步研究涉及不同的BoF-检测器对检测器训练精度的影响，如表4所示。我们通过研究在不影响 FPS 的情况下提高检测器精度的不同特征，显著扩展了 BoF 列表：

S：消除grid sensitivity方程 bx = delta(tx ）+ cx， by = delta（ty ）+ cy ，其中 cx 和 cy 始终为整数，在 YOLOv3 中使用其用于评估目标坐标，因此，接近 cx 或 cx = 1 值的 bx 值需要极高的 tx 绝对值。我们通过将 sigmoid 乘以超过1.0 的因子来解决此问题，从而消除了网格无法检测到对象的影响；
M：Mosaic数据扩增 – 在训练期间使用 4 图像镶嵌，而不是单个图像；
IT：IoU 阈值 – 使用多个锚点进行单个接地真值 IoU（真锚）> IoU 阈值；
GA：遗传算法 – 在前 10% 的时间段的网络训练期间使用遗传算法选择最佳超参数；
LS：class label smoothing – 使用类标签平滑进行 sigmoid 激活；
CBN： CmBN – 使用交叉小批处理规范化收集整个批处理中的统计信息，而不是在单个小批处理中收集统计信息；
CA：模拟退火调节器 – 改变正弦训练中的学习速率；
DM：动态小批量尺寸– 在小分辨率训练期间使用随机训练尺度，自动增加mini-batch的大小；
OA：优化的锚点 – 使用优化的anchors 进行 512×512 网络分辨率的训练；
GIoU、CIoU、DIoU、MSE – 对边界框回归使用不同的损失函数。

进一步研究涉及不同的BoS-检测器对检测器训练精度的影响，包括PAN、RFB、SAM、Gaussian YOLO（G）和ASFF，如表5所示。在我们的实验中，检测器在使用 SPP、PAN 和 SAM 时获得最佳性能。

4.4、不同backbones 和预训练权重对检测器训练的影响

进一步研究了不同backbones 对检测器精度的影响，如表6所示。我们注意到，在检测器精度方面，具有最佳分类精度的模型并不总是最好的。

首先，虽然与CSPDarknet53模型相比，训练具有不同功能的CSPReSNeXt50模型的分类精度较高，但CSPDarknet53模型在物体检测方面表现出更高的精度。

其次，将BoF和Mish用于CSPResNeXt50分类器训练，提高了其分类精度，但进一步将这些预先训练的权重应用于检测器训练，降低了检测器的精度。但是，将 BoF 和 Mish 用于 CSPDarknet53 分类器训练可提高分类器和检测器的准确性，后者使用此分类器预先训练的权重。最终结果是，主干 CSPDarknet53 更适合检测器，而不是 CSPResNeXt50。

我们观察到，CSPDarknet53模型表明，由于各种改进，提高了检测器精度的能力。

4.5、不同mini-batch大小对检测器训练的影响

最后，分析了使用不同小批次大小的模型获得的结果，结果显示在表7中。从表7所示的结果中，我们发现，在添加了BoF和BoS训练策略后，小批量大小对检测器的性能几乎没有影响。这一结果表明，在引入BoF和BoS后，不再需要使用昂贵的 GPU 进行训练。换句话说，任何人都可以只使用传统的 GPU 来训练出色的检测器。

5、实验结果

图8显示了与其他最先进的目标检测器结果的比较。我们的 YOLOv4 位于Pareto最佳曲线上，在速度和精度方面优于最快、最精确的检测器。

图8: 不同物体检测速度和精度的比较

由于不同方法使用不同模型结构的 GPU 进行推理时间验证，因此我们在通常采用的 Maxwell、Pascal 和 Volta 体系结构的 GPU 上运行 YOLOv4，并将其与其他最先进的方法进行比较。表 8 列出了使用 Maxwell GPU 的帧速率比较结果，它可以是 GTX 泰坦 X （Maxwell）或特斯拉 M40 GPU。表 9 列出了使用 Pascal GPU 的帧速率比较结果，它可以是Titan X （Pascal）、Titan Xp、GTX 1080 Ti 或Tesla P100 GPU。至于表10，它列出了使用Volta GPU的帧速率比较结果，它可以是 Titan Volta或Tesla V100 GPU。

6、结论

我们提供最先进的检测器，它比所有可用的替代检测器更快（FPS）和更准确（MS COCO AP 50…95 和 AP 50）。所述检测器可在具有 8-16 GB-VRAM 的传统 GPU 上进行训练和使用，这使得其广泛使用成为可能。one-stage检测器的最初概念已证明其可行性。我们已经验证了大量的功能，并选择用于这些功能，以提高分类器和检测器的准确性。这些功能可用作未来研究和发展的最佳实践。

7、致谢

作者希望感谢Glenn Joche的Mosaic的数据扩增想法，选择超参数通过使用遗传算法和解决网格敏感性问题，https://github.com/ultralytics/yolov3。

你可能感兴趣的:(#,论文翻译（已校正）,YOLO,深度学习,计算机视觉)

将 VOC 格式 XML 转换为 YOLO 格式 TXT JeJe同学 xml YOLO
目录1.导入必要的模块2.定义类别名称3.设置文件路径完整代码1.导入必要的模块importosimportxml.etree.ElementTreeasETos：用于文件和目录操作，例如创建目录、遍历文件等。xml.etree.ElementTree：用于解析XML文件，从中提取信息。2.定义类别名称class_names=['nest','balloon','kite','trash']这是一
vs code配置python_如何在vscode里的python配置好matplotlib？,vscode配置python环境教程 weixin_39564151 vs code配置python
如何在vscode里的python配置好matplotlib？,vscode配置python环境教程vscode配置python环境教程2020-09-2015:14:33人已围观VScode配置Python环境“配置任务运行程序”遇到问题我建议尝试再把bug写出来，不能因为不一样就不继续首先需要VScodePython插件。打开Python任意脚可以直接拖入。点击左下角的扩展按钮，在弹出界面选择
图像处理篇---图像预处理 Ronin-Lotus 图像处理篇深度学习篇程序代码篇图像处理人工智能 opencv python 深度学习计算机视觉
文章目录前言一、通用目的1.1数据标准化目的实现1.2噪声抑制目的实现高斯滤波中值滤波双边滤波1.3尺寸统一化目的实现1.4数据增强目的实现1.5特征增强目的实现：边缘检测直方图均衡化锐化二、分领域预处理2.1传统机器学习（如SVM、随机森林）2.1.1特点2.1.2预处理重点灰度化二值化形态学操作特征工程2.2深度学习（如CNN、Transformer）2.2.1特点2.2.2预处理重点通道顺序
目前市场上主流的机器视觉的框架有哪些？他们的特点及优劣 yuanpan 机器学习计算机视觉
目前市场上主流的机器视觉框架和工具可以分为商业软件、开源工具和深度学习框架三大类。以下是它们的总结及特点对比：1.商业软件(1)Halcon(MVTec)特点：专注于工业机器视觉，提供高精度、高效率的算法。支持复杂的工业应用，如缺陷检测、3D视觉、深度学习等。提供图形化开发工具HDevelop和多种编程接口。优势：算法优化好，适合实时工业应用。硬件兼容性强，支持多种工业相机和设备。劣势：商业软件，
1.1PaddleTS_环境配置：一个易用的深度时序建模的Python库 pythonQA python paddlepaddle
PaddleTS是一个易用的深度时序建模的Python库，它基于飞桨深度学习框架PaddlePaddle，专注业界领先的深度模型，旨在为领域专家和行业用户提供可扩展的时序建模能力和便捷易用的用户体验。PaddleTS的主要特性包括：设计统一数据结构，实现对多样化时序数据的表达，支持单目标与多目标变量，支持多类型协变量封装基础模型功能，如数据加载、回调设置、损失函数、训练过程控制等公共方法，帮助开发
【大模型科普】AIGC技术发展与应用实践（一文读懂AIGC）人工智能
【专栏介绍】⌈⌈⌈人工智能与大模型应用⌋⌋⌋人工智能（AI）通过算法模拟人类智能，利用机器学习、深度学习等技术驱动医疗、金融等领域的智能化。大模型是千亿参数的深度神经网络（如ChatGPT），经海量数据训练后能完成文本生成、图像创作等复杂任务，显著提升效率，但面临算力消耗、数据偏见等挑战。当前正加速与教育、科研融合，未来需平衡技术创新与伦理风险，推动可持续发展。文章目录一、AIGC概述（一）什么是
代码逐行解析 | 教你在C++中使用深度学习提取特征点 3Ｄ视觉工坊 3D视觉从入门到精通 c++深度学习开发语言人工智能
点击下方卡片，关注「3D视觉工坊」公众号选择星标，干货第一时间送达扫描下方二维码，加入3D视觉技术星球，星球内汇集了众多3D视觉实战问题，以及各个模块的学习资料：最新顶会论文、书籍、源码、视频（近20门系统课程[星球成员可免费学习]）等。想要入门3D视觉、做项目、搞科研，就加入我们吧。作者：泡椒味的口香糖|来源：3DCV添加微信：dddvision
Halcon 和 opencv比有什么区别与优劣 yuanpan opencv 人工智能计算机视觉
Halcon和OpenCV都是机器视觉领域的重要工具，但它们的设计目标、功能特点和适用场景有所不同。以下是两者的详细对比：1.定位与目标用户Halcon：定位：商业机器视觉软件，专注于工业应用。目标用户：工业自动化、质量控制、机器人引导等领域的专业开发者。OpenCV：定位：开源计算机视觉库，适用于通用图像处理和计算机视觉任务。目标用户：学术研究、教育、初创公司以及需要低成本解决方案的开发者。2.
【产品小白】什么是AI产品经理百事不可口y 产品经理的一步一步人工智能产品经理学习产品运营内容运营用户运营
一、AI产品经理的定义与角色定位AI产品经理是人工智能技术与商业应用之间的核心桥梁，负责将复杂的AI技术转化为满足市场需求的产品。需同时具备技术理解力、商业洞察力和用户思维，既要参与算法选型与数据建模，又要定义产品功能与市场策略，是贯穿产品全生命周期的关键角色。与传统互联网产品经理相比，AI产品经理的独特之处在于：技术深度参与：需理解机器学习、自然语言处理（NLP）、计算机视觉等技术原理，并参与数
Canary Capital 向 SEC 递交首个 SUI ETF 申请文件 Sui_Network 区块链大数据物联网人工智能智能合约 ETF
随着对Sui这一L1区块链的机构兴趣不断增长，其生态正在加速迈向大规模采用。作为一项重大里程碑，CanaryCapital已向美国证券交易委员会（SEC）提交注册申请，拟推出首支基于SUI的交易所交易基金（ExchangeTradedFund，ETF）。SEC已正式受理该申请，这是ETF获批的关键初期步骤，一旦获得批准，该基金将能够在美国公开交易所上市交易。该ETF计划以传统基金产品的形式，为机构
深度学习-130-RAG技术之基于Anything LLM搭建本地私人知识库的应用策略问题总结(一) 皮皮冰燃深度学习深度学习人工智能 RAG
文章目录1AnythingLLM的本地知识库1.1本地知识库应用场景1.2效果对比及思考1.3本地体现在哪些方面1.3.1知识在本地1.3.2分割后的文档在本地1.3.3大模型部署运行在本地2问错问题带来的问题2.1常见的问题2.2原因分析3为什么LLM不使用我的文件？3.1LLM不是万能的【omnipotent】3.2LLM不会自省【introspect】3.3AnythingLLM是如何工作的
3DMAX点云算法：实现毫米级BIM模型偏差检测（附完整代码）夏末之花人工智能
摘要本文基于激光雷达点云数据与BIM模型的高精度对齐技术，提出一种融合动态体素化与多模态特征匹配的偏差检测方法。通过点云预处理、语义分割、模型配准及差异分析，最终实现建筑构件毫米级偏差的可视化检测。文中提供关键代码实现，涵盖点云处理、特征提取与深度学习模型搭建。一、核心算法流程点云预处理与特征增强去噪与下采样：采用统计滤波与体素网格下采样，去除离群点并降低数据量。语义分割：基于PointNet++
数据增强：扩充数据集，提升模型的鲁棒性 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 LLM大模型落地实战指南计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
数据增强：扩充数据集，提升模型的鲁棒性1.背景介绍1.1数据集的重要性在机器学习和深度学习领域中,数据集是训练模型的基础。高质量的数据集对于构建准确、鲁棒的模型至关重要。然而,在现实世界中,获取大量高质量的数据通常是一个巨大的挑战。数据采集过程耗时耗力,而且成本高昂。此外,某些领域的数据存在隐私和安全问题,难以获取。1.2数据集不足的挑战当数据集规模有限时,模型很容易过拟合,无法很好地推广到新的、
vue3+springboot电影院售票选座管理系统 qq_3166678367 spring boot 后端 java
目录本系统(已开发完成)->成品实现截图开发技术本系统支持的技术栈源码获取详细视频演示：文章底部获取博主联系方式！！！！本课题重点核心代码部分展示论文提纲来自指导老师帅的肯定视频演示/源码获取本系统(已开发完成)->成品实现截图开发技术关键技术实现：在Java的开发过程中，可以使用HTML、CSS、JavaScript等前端技术来实现系统的用户界面设计和交互功能。后端可以使用Java语言编写业务逻
weixin049校园外卖平台设计与实现+ssm(文档+源码)_kaic 开心毕设kaic_kaic 模拟退火算法散列表随机森林支持向量机启发式算法逻辑回归
校园外卖平台设计与实现摘要随着信息技术在管理上越来越深入而广泛的应用，管理信息系统的实施在技术上已逐步成熟。本文介绍了校园外卖平台的开发全过程。通过分析校园外卖平台管理的不足，创建了一个计算机管理校园外卖平台的方案。文章介绍了校园外卖平台的系统分析部分，包括可行性分析等，系统设计部分主要介绍了系统功能设计和数据库设计。本校园外卖平台有管理员，用户，商家。管理员功能有个人中心，用户管理，商家管理，菜
Docker打包深度学习项目 FLY_LTL docker 深度学习容器
文章目录Docker打包深度学习项目1.Docker和NVIDIAContainerToolkit的安装1.Docker2.NVIDIAContainerToolkit3.添加国内镜像源2.使用Dockerfile打包并保存镜像1.Dockerfile2.通过Dockerfile生成镜像3.保存镜像和加载4.运行Docker并测试参考Docker打包深度学习项目本文来源于个人实践总结，供各位同学参
PyCINRAD读取探测中心天气雷达拼图系统v3产品 pysoer python
PyCINRADPyCINRAD号称国内最强大的雷达数据处理工具，支持多种CINRAD雷达数据格式，兼容性强，横扫CMA雷达基数据和产品，国内首个支持“探测中心拼图3.0”。快速提取、计算雷达衍生产品，如组合反射率CR、回波顶高ET、降水粒子分类HCL等。作为一个开源项目，PyCINRAD对所有用户免费开放，鼓励社区贡献和改进。据悉已遍布CMA的各个系统角落。PyCINRAD官网https://p
使用TensorFlow、OpenCV和Pygame实现图像处理与游戏开发 UwoiGit tensorflow opencv pygame
在本篇文章中，我们将介绍如何结合使用TensorFlow、OpenCV和Pygame来进行图像处理和游戏开发。这三个工具在机器学习、计算机视觉和游戏开发领域都非常流行，并且它们的结合可以提供强大的功能和无限的创造力。我们将逐步介绍如何安装和配置这些工具，并提供相关的源代码示例。安装TensorFlowTensorFlow是一个基于数据流图的开源机器学习框架，提供了丰富的工具和库来构建和训练各种深度
仓库可视化管理有哪几个点： wms系统
在现代仓库管理的广阔议题中，仓库可视化无疑是一个无法绕过的关键话题。无论是对现场管理进行深度优化，还是在数字化系统的选择上，企业都致力于实现仓库整体运营数据的直观展现与高效管理，以推动仓库管理水平的全面提升。仓库可视化的内涵丰富，主要包括以下几个方面：仓库运营可视化：通过智慧大屏的融入，仓库的动态数据得以生动呈现。这包括但不限于已处理订单数量、待处理订单数量、实时库存等核心运营指标。库存可视化：这
【AI大模型】RAG如何让生成AI更智能？最新方法与优劣深度解析健忘的派大星人工智能语言模型 ai AI大模型 agi RAG 程序员
前言近年来，人工智能技术突飞猛进，尤其是生成式AI，简直像是开了挂一样，各种惊艳的表现让人直呼“未来已来”。根据IDC的研究，生成式AI的市场规模在2022年已经达到了107亿美元，而到2026年，这个数字预计会飙升至326亿美元！不过，尽管生成式AI很强大，但它也并非完美无缺——比如生成内容的质量、准确性和可靠性，依然有提升的空间。这时候，检索增强生成（RAG）技术登场了！RAG的核心思路很简单
深度革命：ResNet 如何用 “残差连接“ 颠覆深度学习安意诚Matrix 机器学习笔记深度学习人工智能
一文快速了解ResNet创新点在深度学习的历史长河中，2015年或许是最具突破性的一年。这一年，微软亚洲研究院的何恺明团队带着名为ResNet（残差网络）的模型横空出世，在ImageNet图像分类竞赛中以3.57%的错误率夺冠，将人类视觉的识别误差（约5.1%）远远甩在身后。更令人震撼的是，ResNet将神经网络的深度推至152层，彻底打破了"深层网络无法训练"的魔咒。这场革命的核心，正是一个简单
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算【超级详细版】 AI筑梦师计算机视觉算法深度学习人工智能机器学习计算机视觉 python
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算1.引言1.1研究背景在计算机视觉、模式识别、医学影像分析和自动驾驶等领域，形状匹配是核心任务之一。然而，现实世界的形状往往存在可变性（Variability），主要体现在以下几个方面：形变（Deformation）：物体可能由于柔性材料、外力作用或生物运动发生非刚性形变。尺度变化（ScaleVariation）：目标形状在不同场景下可能大
使用 Vue 2.x + Element UI 搭建后台管理系统详解不知名靓仔 vue.js ui 前端
引言Vue.js是一个非常流行的前端框架，而ElementUI是基于Vue2.x的一套完整的UI组件库，非常适合用来构建企业级的后台管理系统。本文将详细介绍如何使用Vue2.x和ElementUI来搭建一个后台管理系统，包括项目初始化、路由配置、状态管理、权限验证等关键步骤。vue2后台管理项目源码合集下载地址见最下方1.环境准备确保你的开发环境中已安装Node.js和npm。接下来，我们将使用V
使用LangChain实现大规模语言模型自发现推理结构 VYSAHF langchain 语言模型人工智能 python
使用LangChain实现大规模语言模型自发现推理结构在现代自然语言处理(NLP)的研究中，大规模语言模型（LLMs）已经展示了强大的能力。然而，在应对复杂的推理问题时，传统的提示方法常常力不从心。这篇文章将带您了解SELF-DISCOVER，一种新兴的框架，如何通过LangChain来实现自动化、动态化的推理结构构建，以提高LLMs的性能。技术背景介绍大规模语言模型（如GPT-4和PaLM2）已
机器人触觉的意义越来越胖的GuanRunwei 触觉传感机器人触觉传感人工智能
机器人触觉的重要性触觉在机器人领域至关重要，尤其是在自主操作、精细操控、人机交互等方面。虽然视觉和语音技术已高度发展，但机器人在现实世界中的操作仍然受限，因为：视觉有局限性：仅凭视觉，机器人难以判断物体的材质、温度、表面摩擦力等信息。例如，看起来像金属的物体，可能是塑料镀层。接触与力控制是核心问题：无论是抓取、操作工具，还是进行柔性物体（如布料）操作，触觉信息比视觉更直接。例如，手术机器人需要触觉
基于PyTorch和ResNet18的花卉识别实战（附完整代码）意.远 pytorch 人工智能 python 深度学习
一、项目背景与效果花卉分类是计算机视觉的经典任务。本文使用PyTorch框架，基于ResNet18模型实现了102种花卉的分类任务。完整代码可直接复制运行，最终验证集准确率达8.2%，文中同步分析性能瓶颈与优化方案。二、环境配置与数据准备1.环境要求#主要依赖库importtorchfromtorchimportnn,optimfromtorchvisionimporttransforms,dat
Python 模拟鼠标轨迹算法 a485240 鼠标轨迹计算机外设
一.鼠标轨迹模拟简介传统的鼠标轨迹模拟依赖于简单的数学模型，如直线或曲线路径。然而，这种方法难以捕捉到人类操作的复杂性和多样性。AI大模型的出现，使得能够通过深度学习技术，学习并模拟更自然的鼠标移动行为。二.鼠标轨迹算法实现AI大模型通过学习大量的人类鼠标操作数据，能够识别和模拟出自然且具有个体差异的鼠标轨迹。以下是实现这一技术的关键步骤：数据收集：收集不同玩家在各种游戏环境中的鼠标操作数据，包括
Yolov8训练自己的数据集(脱离ultralytics库) 爱吃肉的鹏 YOLO
最近在整理关于yolov8的相关内容，有个很大的问题，抛开yolov8性能不谈，yolov8代码的使用灵活性不如yolov5，尤其是对于一些新手或者对yolo框架不是很熟悉的人(这也是因人而异，有些人可能会喜欢v8代码的使用方式)。比如在使用v8的时候需要安装ultralytics库，然后再调用YOLO进行训练或者预测，那么就有这几个问题：问题1：安装了ultralytics库后如何使用YOLO呢
手机抓https包安卓7以上ca证书安装方法慕城南风 android
用charles或fiddler抓app包的https接口必须要安装ca证书,才能正常抓包,安卓7之前把ca证书安装到用户证书下即可,但安卓7以上只有系统级证书才能被信任,所以为了能正常抓包,需要把ca证书安装到系统证书下流程:下载OpenSSL制作证书导入到手机准备工作:电脑安装了OpenSSL电脑安装了Charles(其他抓包工具也是一样的原理)一台已root手机(模拟器也可以,但部分app会
【论文精读】PatchTST-基于分块及通道独立机制的Transformer模型打酱油的葫芦娃时序预测算法时序预测 PatchTST Transformer 预训练微调表征学习
《ATIMESERIESISWORTH64WORDS:LONG-TERMFORECASTINGWITHTRANSFORMERS》的作者团队来自PrincetonUniversity和IBMResearch，发表在ICLR2023会议上。动机Transformer模型因其自注意力机制在处理序列数据方面的优势，在自然语言处理（NLP）、计算机视觉（CV）、语音等多个领域取得了巨大成功。这种机制使得模型
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$