理心炼丹

【论文阅读】YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors

原始题目：YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors

中文翻译：YOLOv7:可训练的免费包为实时目标检测器设置了最新的技术

发表时间：2022年7月6日

平台：arXiv

来源：中央研究院信息科学研究所，台湾

文章链接：https://arxiv.org/pdf/2207.02696.pdf

开源代码：GitHub - WongKinYiu/yolov7: Implementation of paper - YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors

Alexey Bochkovskiy 大神亲自背书。

摘要

在 5 FPS 到 160 FPS 的范围内，YOLOv7 在 speed 和 accuracy 上都超过了所有已知的目标检测器，并且在 GPU V100 上 30 FPS 或更高的实时目标检测器中，YOLOv7 有最高的 56.8% AP的 accuracy。YOLOv7-E6 目标检测器( 56FPS V100，55.9%AP ) 比基于 transformer 的检测器 SWINL Cascade-MASK R-CNN(9.2 FPS A100，53.9%AP) 的 speed 快 509%， accuracy 高2%；比基于卷积的检测器 ConvNeXt-XL Cascade-MASK R-CNN(8.6 FPS A100，55.2%AP) speed 快 551%， accuracy 高 0.7%；YOLOv7性能优于：YOLOR、YOLOX、Scaled-YOLOv4、YOLOv5、DETR、 Deformable DETR、Dino-5Scale-R50、R50VIT-Adapter-B 和许多其他目标检测器的 speed 和 accuracy。此外，我们仅在MS Coco数据集上从头开始训练YOLOv7，而不使用任何其他数据集或预训练的权重。

6. 结论

本文提出了一种新的实时目标检测器的架构和相应的模型缩放（scaling）方法。此外，我们发现，目标检测方法的演变过程产生了新的研究课题。在研究过程中，我们发现了 re-parameterized 模块的替换问题和动态标签分配的分配问题。为了解决这一问题，我们提出了可训练的 bag-of-freebies 方法来提高目标检测的 accuracy 。在此基础上，开发了YOLOv7系列目标检测系统，取得了最先进的检测结果。

1.引言

实时目标检测是计算机视觉中一个非常重要的课题，因为它往往是计算机视觉系统中必不可少的组成部分。例如，多目标跟踪[94，93]、自动驾驶[40，18]、机器人[35，58]、医学图像分析[34，46]等。执行实时对象检测的计算设备通常是一些移动CPU或GPU，以及由主要制造商开发的各种神经处理单元(NPU)。例如，苹果神经引擎(Apple)、神经计算棒(Intel)、 Jetson AI edge devices (Nvidia)、 the edge TPU(Google)、神经处理引擎(Qualcomm)、AI处理单元(MediaTek)、AI SoCs(Kneron)，都是NPU。上面提到的一些边缘设备专注于加速不同的运算，如 vanilla 卷积、 depth-wise 卷积或 MLP 运算。在本文中，我们提出的实时目标检测器主要是希望它能够同时支持从边缘到云的移动GPU和GPU设备。

近年来，实时目标检测器仍在针对不同的边缘设备进行开发。例如，MCUNet [49, 48] 和 NanoDet [54] 的开发专注于生产低功耗单芯片并提高边缘 CPU 的推理速度。至于 YOLOX [21] 和 YOLOR [81] 等方法，他们专注于提高各种 GPU 的推理速度。最近，实时目标检测器的发展集中在高效架构的设计上。至于可以在 CPU [54, 88, 84, 83] 上使用的实时目标检测器，他们的设计主要基于 MobileNet [28, 66, 27]、ShuffleNet [92, 55] 或 GhostNet [25] 。另一个主流的实时目标检测器是为 GPU [81, 21, 97] 开发的，它们大多使用 ResNet [26]、DarkNet [63] 或 DLA [87]，然后使用 CSPNet [80] 策略来优化架构。本文提出的方法的发展方向与当前主流的实时目标检测器不同。除了架构优化之外，我们提出的方法将专注于训练过程的优化。我们的重点将放在一些优化的模块和优化方法上，它们可能会增加训练成本以提高目标检测的准确性，但不会增加推理成本。我们将提出的模块和优化方法称为可训练的 bag-of-freebies 。

最近，模型 re-parameterization [13,12,29]和动态标签分配[20,17,42]已成为网络训练和目标检测的重要课题。主要是在上述新概念提出之后，物体检测器的训练演变出了很多新的问题。在本文中，我们将介绍我们发现的一些新问题，并设计解决这些问题的有效方法。对于模型 re-parameterization，我们用梯度传播路径的概念分析了适用于不同网络层的模型 re-parameterization 策略，并提出了 planned re-parameterization 模型。此外，当我们发现使用动态标签分配技术时，具有多个输出层的模型的训练会产生新的问题。即：“如何为不同分支的输出分配动态目标？” 针对这个问题，我们提出了一种新的标签分配方法，称为从粗到细的引导式（ coarse-to-fine lead guided）标签分配。

本文的主要贡献如下：

设计了几种可训练的 bag-of-freebies 方法，使得实时目标检测可以在不增加推理代价的情况下大大提高检测 accuracy；
在目标检测方法的演变过程中，我们发现了两个新的问题，即 re-parameterized 模块如何取代原有的模块，以及动态标签分配策略如何处理不同输出层的分配。此外，我们还提出了解决这些问题的方法；
提出了能够有效利用参数和计算量的实时目标检测器的“扩展（ extend）”和“复合缩放（compound scaling）”方法；
我们提出的方法可以有效地减少现有实时目标检测器约40%的参数和50%的计算量，并且具有更快的推理速度和更高的检测精度。

2. 相关工作

2.1 实时目标检测器

目前最先进的实时目标检测器主要基于YOLO[61，62，63]和FCOS[76，77]，它们是[3，79，81，21，54，85，23]。要成为最先进的实时目标检测器通常需要以下特征：

更快、更强大的网络架构；
更有效的特征集成方法[22、97、37、74、59、30、9、45]；
更 accurate 的检测方法[76、77、69]；
更健壮的损失函数[96、64、6、56、95、57]；
更高效的标签分配方法[99、20、17、82、42]；
更有效的训练方法。

在本文中，我们不打算探索需要额外数据或大模型的自我监督学习（self-supervised learning ）或知识蒸馏（ knowledge distillation）方法。取而代之的是，我们将设计新的可训练的 bag-of-freebies 方法，以解决上述(4)、(5)和(6)相关的最先进方法产生的问题。

2.2. 模型 re-parameterization

模型 re-parameterization 技术[71，31，75，19，33，11，4，24，13，12，10，29，14，78]在推理阶段将多个计算模块合并为一个。模型 re-parametrization 技术可以看作是一种集成技术，可以分为两类，即模块级集成和模型级集成。

为了获得最终的推理模型，有两种常见的模型级 re-parameterization 的做法。一种是用不同的训练数据训练多个相同的模型，然后对多个训练模型的权值进行平均。另一种方法是对不同迭代次数的模型权重进行加权平均。

模块级 re-parameterization 是近年来比较热门的研究课题。这种方法在训练过程中将一个模块拆分成多个相同或不同的模块分支，在推理过程中将多个分支模块集成到一个完全等价的模块中。然而，并不是所有提出的 re-parameterized 模块都能完美地应用于不同的架构。有鉴于此，我们开发了新的 re-parameterization 模块，并针对不同的架构设计了相关的应用策略。

2.3.模型缩放

模型缩放[72，60，74，73，15，16，2，51]是一种放大或缩小已经设计的模型并使其适合不同计算设备的方法。模型缩放方法通常使用不同的缩放因子，如分辨率(输入图像的大小)、深度(层数)、宽度(通道数)和阶段(特征金字塔数)，以便在网络参数的数量、计算量、推理速度和 accuracy 之间取得良好的折衷。

网络架构搜索(NAS)是一种常用的模型缩放方法。NAS可以自动从搜索空间中搜索合适的缩放因子，而不需要定义太复杂的规则。NAS的缺点是需要非常昂贵的计算来完成模型缩放因子的搜索。在[15]中，研究人员分析了缩放因子与参数和运算量之间的关系，试图直接估计一些规律，从而得到模型缩放所需的缩放因子。查阅文献，我们发现几乎所有的模型缩放方法都是独立分析单个缩放因子的，即使是复合缩放范畴的方法也是独立优化缩放因子的。这是因为大多数流行的NAS架构处理的缩放因子不是很相关。我们观察到，所有基于串联（ concatenation）的模型，如DenseNet[32]或VoVNet[39]，当这些模型的深度被缩放时，将改变某些层的输入宽度。由于所提出的架构是基于串联（concatenation）的，因此我们必须为该模型设计一种新的复合缩放方法。

3. 架构

3.1. 扩展的高效层聚合网络

图2：扩展的高效层聚合网络。提出的 extended ELAN (E-ELAN) 完全不改变原架构的梯度传输路径，而是利用分组卷积来增加所增加特征的基数（cardinality），并将不同分组的特征以一个 shuffle 和 merge 基数的方式组合在一起。这种操作方式可以增强不同特征图学习的特征，提高参数和计算的使用。

在大多数关于设计高效架构的文献中，主要的考虑是不超过参数的数量、计算量和计算密度。从存储器访问成本的特点出发，Ma等人提出了一种新的解决方案。[55]分析了输入输出通道比、架构分支数、 element-wise 运算对网络推理速度的影响。 Doll ́ar等人[15]此外，还考虑了在执行模型缩放时的 activation，即更多地考虑卷积层输出张量中的元素数量。图2(B)中的CSPVoVNet[79]设计是VoVNet[39]的变体。除了考虑上述基本设计问题外，CSPVoVNet[79]的架构还分析了梯度路径，以便使不同层的权重学习更多样化的特征。上述梯度分析方法使推断更快、更 accurate。图2(C)中的Elan[1]考虑了以下设计策略：“如何设计一个高效的网络？”他们得出一个结论：通过控制最短最长的梯度路径，一个更深的网络可以有效地学习和收敛。在本文中，我们提出了基于ELAN的 Extended-ELAN (E-ELAN)，其主要结构如图2(D)所示。

无论梯度路径长度和大规模 ELAN 中计算块的堆叠数量如何，它都达到了稳定状态。如果无限堆叠更多的计算块，可能会破坏这种稳定状态，参数利用率会降低。提出的 E-ELAN 使用expand、shuffle、merge cardinality来实现在不破坏原有梯度路径的情况下不断增强网络学习能力的能力。在架构方面，E-ELAN 只改变了计算块的架构，而过渡（transition）层的架构完全没有改变。我们的策略是使用组卷积来扩展计算块的通道和基数。我们将对计算层的所有计算块应用相同的组参数和通道乘数（multiplier）。然后，每个计算块计算出的特征图会根据设置的组参数 g 被 shuffled 成 g 个组，然后将它们连接（concatenate）在一起。此时，每组特征图的通道数将与原始架构中的通道数相同。最后，我们添加 g 组特征图来执行合并基数（cardinality）。除了保持原有的 ELAN 设计架构，E-ELAN 还可以引导不同组的计算块学习更多样化的特征。

3.2.基于级联（concatenation）模型的模型缩放

图3:基于 concatenation 的模型的模型 scaling 。从(a)到(b)，我们观察到当对基于级联的模型进行深度缩放时，计算块的输出宽度也会增加。这种现象会导致后续传输层的输入宽度增大。因此，我们提出(c)，即对基于级联的模型进行模型缩放时，只需要对计算块中的深度进行缩放，其余的传输层进行相应的宽度缩放。

模型缩放的主要目的是调整模型的一些属性，生成不同 scales 的模型，以满足不同推理速度的需求。例如，EfficientNet [72] 的缩放模型考虑了宽度、深度和分辨率。至于 scaled-YOLOv4 [79]，其缩放模型是调整阶段数。在 [15] 中，Doll ́ar 等人分析了 vanilla 卷积和组卷积在进行宽度和深度缩放时对参数量和计算量的影响，并以此设计了相应的模型缩放方法。上述方法主要用于PlainNet或ResNet等架构。这些架构在执行扩容或缩容时，每一层的入度（in-degree）和出度（ out-degree）都不会发生变化，因此我们可以独立分析每个缩放因子对参数量和计算量的影响。但是，如果将这些方法应用于基于 concatenation 的架构，我们会发现，当对深度进行放大或缩小时，紧接基于 concatenation 的计算块之后的 translation 层的入度（in-degree）会减小或增加，如图3（a）和（b）所示。

从上述现象可以推断，对于基于 concatenation 的模型，我们不能单独分析不同的缩放因子，而必须一起考虑。以按比例放大深度为例，这种行为会导致过渡层的输入通道和输出通道的比例变化，从而导致模型的硬件使用量下降。因此，对于基于级联的模型，我们必须提出相应的复合模型缩放方法。当我们缩放一个计算块的深度因子时，我们还必须计算该块输出通道的变化。然后，我们将对 transition 层进行相同变化量的宽度因子缩放，结果如图3 (c)所示。我们提出的复合缩放方法可以保持模型在初始设计时的属性，并保持最优结构。

4. 可训练的bag-of-freebies

4.1 Planned re-parameterized 卷积

虽然RepConv[13]在VGG上已经取得了优异的性能[68]，但当我们将其直接应用于ResNet[26]和DenseNet[32]等架构时，其精度会显著降低。我们用梯度流传播路径来分析如何将 re-parameterized 的卷积与不同的网络相结合。并据此设计了 planned re-parameterized 卷积。

RepConv实际上是在一个卷积层中结合了 3 × 3卷积、1 × 1卷积和 identity 连接。通过分析RepConv与不同架构的结合及其性能，我们发现RepConv中的 identity 连接破坏了ResNet中的残差和DenseNet中的拼接（concatenation），残差和拼接为不同的特征图提供了更多的梯度多样性。基于上述原因，我们使用无 identity 连接的 RepConv (RepConvN)来设计 planned re-parameterized 卷积的架构。在我们的思维中，当一个带有残差或拼接的卷积层被 re-parameterized 的卷积所取代时，应该不存在 identity 连接。图4 显示了我们设计的在PlainNet和ResNet中使用的“规划的重新参数化卷积”的示例。关于基于残差模型和基于级联模型的完整规划的重新参数化卷积实验，将在消融研究环节中进行介绍。

4.2. Coarse（粗） for auxiliary（辅助） and fine（细） for lead loss

深度监督[38]是一种经常用于训练深层网络的技术。其主要思想是在网络的中间层增加额外的辅助（auxiliary）头，以 assistant loss 为指导的浅层网络加权。即使对于ResNet[26]和DenseNet[32]这样通常收敛良好的架构，深度监督[70、98、67、47、82、65、86、50]仍然可以显著提高模型在许多任务上的性能。图5(A)和(B)分别示出了目标检测器架构，分别为无深度监督和有深度监督。在本文中，我们将负责最终输出的头称为主导头（ lead head），用于辅助训练的头称为辅助头（auxiliary head）。

接下来，我们想讨论一下标签分配问题。过去，在深度网络的训练中，标签分配通常直接参考 the ground truth ，并根据给定的规则生成硬标签。然而，近年来，如果我们以目标检测为例，研究人员往往利用网络输出的预测的质量和分布，然后结合地面实际情况，使用一些计算和优化方法来生成可靠的软标签[61，8，36，99，91，44，43，90，20，17，42]。例如，YOLO[61]使用包围盒回归预测和地面事实的借条作为客观性的软标签。在本文中，我们将网络预测结果与地面真实情况结合起来，然后将软标签分配为“标签分配器”。

无论 auxiliary head 或 lead head 的情况如何，都需要对目标对象进行深度监督训练。在开发软标签分配器（ soft label assigner）相关技术的过程中，我们偶然发现了一个新的衍生问题，即：如何为辅助头（ auxiliary head）和引导头（ lead head）分配软标签（ soft label）？据我们所知，到目前为止，相关文献还没有对这个问题进行过探讨。目前最流行的方法的结果如图5(C)所示，即将 auxiliary head 和 lead head 分离，然后利用各自的预测结果和 ground truth 来执行标签分配。本文提出的方法是一种新的标签分配方法，通过对 lead head 的预测来指导 auxiliary head 和 lead head 。也就是说，我们使用 lead head 预测作为指导，生成从粗到精的层次标签（ coarse-to-fine hierarchical labels），分别用于 auxiliary head 和 lead head 学习。图5(D)和(E)分别显示了提出的两种深度监督标签分配策略。

图5:粗的辅助头和细的 lead head 标签分配器。与正常模型(a)相比，(b)中的 schema 有 auxiliary head。不同于通常的独立标签分配器(c)，我们提出(d) lead head 指导标签分配器和(e) coarse-to-fine lead head 指导标签分配器。利用 lead head 预测和 ground truth 优化标签分配器，同时获得训练 lead head 和 auxiliary head 的标签。详细的从粗到细（ coarse-to-fine）的实现方法和约束设计细节将在附录中详细阐述。

Lead head guided 标签分配器主要根据 the lead head 的预测结果和 the ground truth 情况进行计算，并通过优化过程生成软标签。这组软标签将作为 auxiliary head 和 lead head 的目标训练模型。这样做的原因是因为 Lead Head 具有相对较强的学习能力，因此由其生成的软标签应该更能代表源数据和目标数据之间的分布和相关性。此外，我们可以将这种学习视为一种广义残差（ residual）学习。通过让较浅的 auxiliary head 直接学习 lead head 已经学习的信息， lead head 将更能专注于学习尚未学习的 residual 信息。

由粗到精的 lead head g 指导标签分配器 还利用 lead head 的预测结果和 ground truth 情况生成软标签。然而，在这个过程中，我们产生了两组不同的软标签，即粗标签和细标签，其中细标签与 lead head 指导标签分配器生成的软标签相同，而粗标签是通过放松正样本分配过程的约束来允许更多的网格被视为正目标来生成的。究其原因， auxiliary head 的学习能力不如 lead head 强，为了避免丢失需要学习的信息，我们会在目标检测任务中重点优化 auxiliary head的recall。对于 lead head 的输出，我们可以从较高的 recall 结果中筛选出 precision 较高的结果作为最终输出。但是，我们必须注意，如果粗标签的附加权重（ additional weight）接近细标签的附加权重（ additional weight），可能会在最终预测时产生较差的先验。因此，为了使这些 extra coarse positive grids 的影响更小，我们在解码器中加入了限制条件，使 extra coarse positive grids 不能完美地产生软标签。上述机制允许 fine label 和 coarse label的重要性在学习过程中动态调整，使 fine label 的可优化上界始终高于coarse label。

4.3. 其他可训练的 bag-of-freebies

在这一部分中，我们将列出一些可训练的 bag-of-freebies 。这些 freebies 是我们在训练中使用的一些技巧，但最初的概念并不是我们提出的。这些 freebies 的训练细节将在附录中详细说明，包括：

conv-bn-activation 拓扑中的 Batch normalization：这部分主要将 Batch normalization 层直接连接到卷积层。这样做的目的是在推理阶段将 Batch normalization 的均值和方差整合到卷积层的 bias 和 weight中。
将YOLOR[81]中的隐含知识与卷积特征图相结合，并采用加法和乘法相结合的方式：在推理阶段通过预计算将YOLOR中的隐含知识简化为向量。该向量可与前一卷积层或后卷积层的bias 和 weight 组合。
EMA模型：EMA是Mean Teacher[75]中使用的一种技术，在我们的系统中，我们纯粹使用EMA模型作为最终的推理模型。

5.实验

5.1 实验装置

我们使用Microsoft COCO 数据集进行了实验，验证了我们的目标检测方法。我们所有的实验都没有使用预训练好的模型。也就是说，所有的模型都是从头开始训练的。在开发过程中，我们使用 train 2017 set 进行训练，然后使用 val 2017 set 进行验证和选择超参数。最后，我们展示了目标检测在 test 2017 set 上的性能，并与最新的目标检测算法进行了比较。详细的训练参数设置见附录。

我们设计了边缘GPU、普通GPU、云GPU的基本模型，分别命名为 YOLOv7-tiny 、YOLOv7、YOLOv7-W6。同时，我们还使用基本模型对不同的业务需求进行模型缩放，得到不同类型的模型。对于YOLOv7，我们对 neck 进行堆叠缩放，并使用提出的复合缩放方法对整个模型的深度和宽度进行放大，从而得到 YOLOv7-X。对于 YOLOv7-W6，我们使用新提出的复合标度方法得到了 YOLOv7-E6 和YOLOv7-D6。此外，我们将提出的 EELAN 用于 YOLOv7-E6，从而完成YOLOv7E6E。由于YOLOv7-tiny 是一个面向边缘GPU的架构，它将使用 leaky ReLU 作为激活函数。对于其他模型，我们使用 SiLU 作为激活函数。我们将在附录中详细描述每个模型的比例因子。

5.2.基线

表1：基线目标探测器的比较。

我们选择了先前版本的YOLO[3，79]和最先进的目标检测器YOLOR[81]作为我们的基线。表1显示了我们提出的 YOLOv7 模型与使用相同设置训练的基线的比较。

从结果可以看出，与YOLOv4相比，YOLOv7的参数减少了75%，计算量减少了36%，AP增加了1.5%。与最先进的 YOLOR-CSP 相比，YOLOv7的参数减少了43%，计算量减少了15%，AP增加了0.4%。在性能上，与 YOLOv4-tiny-31 相比， YOLOv7-tiny 在保持AP不变的情况下，参数个数减少了39%，计算量减少了49%。在云GPU模型上，我们的模型仍然可以有更高的AP，同时参数数量减少了19%，计算量减少了33%。

5.3.与 state-of-the-arts的比较

表2:最先进的实时目标检测器的比较。

1. 我们的 FLOPs 是按矩形输入分辨率计算的，如640×640或1280×1280。

2. 我们的推理时间是通过使用 letterbox resize 输入图像，使其长边等于640或1280来估计的。

我们将该方法与现有的 general GPUs 和 Mobile GPUs 的目标检测器进行了比较，结果如表2所示。从表2的结果可以看出，该方法综合考虑了速度和精度之间的最佳折衷。如果我们将YOLOv7-Tiny-Silu 与YOLOv5-N(r6.1) 进行比较，我们的方法是127fps 更快，AP上的 accurate 高10.7%。此外，YOLOv7 在161fps的帧率下有51.4%的AP，而具有相同AP的 PPYOLOE-L 只有78fps的帧率。在参数使用方面，YOLOv7 比 PPYOLOE-L 少41%。如果我们比较 YOLOv7-X 114fps的推理速度和 YOLOv5-L(r6.1) 99fps 的推理速度，YOLOv7-X 可以提高3.9%的AP。如果将YOLOv7-X 与类似规模的 YOLOv5-X(r6.1) 进行比较，则YOLOv7-X的推理速度快31fps。此外，在参数和计算量方面，与 YOLOv5-X(r6.1) 相比，YOLOv7-X减少了22%的参数和 8%的计算量，而AP提高了2.2%。

如果使用输入分辨率1280将 YOLOv7 与 YOLOR 进行比较，则 YOLOv7-W6 的推理速度比YOLOR-P6 快8fps，检测率也提高了 1%AP。对于YOLOv7-E6和YOLOv5-X6(r6.1)的比较，前者比后者有 0.9%AP增益，45%更少参数，63%的更少计算量，47%的更快推理速度。YOLOv7-D6的推理速度与 YOLOR-E6 相近，但AP提高了0.8%。YOLOv7-E6E 的推理速度与 YOLOR-D6 相近，但AP提高了0.3%。

5.4.消融研究

5.4.1提出的复合 scaling 方法

表3：提出的模型 scaling下的消融研究

表3显示了使用不同的模型缩放策略进行 scaling up 时所获得的结果。其中，我们提出的复合scaling 方法是将 computational 块的深度放大1.5倍，将 transition 块的宽度放大1.25倍。如果与仅放大宽度的方法相比，我们的方法可以以更少的参数和计算量提高AP 0.5%。如果与仅放大深度的方法相比，我们的方法只需要增加2.9%的参数和1.2%的计算量，可以提高AP 0.2%。从表3的结果可以看出，我们提出的复合缩放策略可以更有效地利用参数和计算。

5.4.2 提出的 planned re-parameterized 模型

为了验证我们提出的 planned re-parameterized 模型的通用性，我们分别对基于 concatenation 的模型和基于 residual 的模型进行了验证。我们选择了基于级联的模型和基于residual 的模型进行验证，分别是3层 ELAN 模型和CSPDarknet模型。

在基于 concatenation 模型的实验中，我们用 RepConv 替换了3层 ELAN 中不同位置的 3×3卷积层，具体配置如图6所示。从表4所示的结果可以看出，我们提出的 planned re-parameterized 模型上存在所有较高的AP值。

图6： Planned RepConv 3-stacked ELAN。蓝色圆圈是我们用 RepConv 替换Conv的位置。

表4：Planned RepConcatenation 模型的消融研究。

在基于残差模型的实验中，由于原始的黑暗块没有一个符合我们设计策略的3 × 3卷积块，所以我们为实验额外设计了一个反向的黑暗块，其架构如图7所示。由于带有暗块和反向暗块的CSPDarknet 具有完全相同的参数和操作量，所以比较是公平的。表5所示的实验结果充分证明了所提出的 planned re-parameterized 模型对基于残差的模型同样有效。我们发现RepCSPResNet[85]的设计也符合我们的设计模式。

图7：反向 CSPDarknet。我们颠倒了暗块中1×1和3×3卷积层的位置，以符合我们 planned reparameterized 模型设计策略。

表5： planned RepResidual 模型的消融研究。

5.4.3 提出的 auxiliary head 的 assistant loss

在 auxiliary head assistant loss 实验中，我们比较了一般的 lead head 和 auxiliary head 的独立标签分配方法，并对两种提出的 lead 指导标签分配方法进行了比较。我们在表6中显示了所有比较结果。从表6中列出的结果可以清楚地看出，任何增加 assistant loss 的模型都可以显著提高整体性能。此外，我们提出的 lead 指导标签分配策略在 AP、AP50和AP75 上获得了比一般独立标签分配策略更好的性能。至于我们提出的 coarse for assistant 和 fine for lead label assignment strategy，它在所有情况下都会得到最好的结果。在图8中，我们展示了不同方法在 auxiliary head 和 lead head 预测的对象图。从图8中我们发现，如果 auxiliary head 学习 lead guided soft label，确实有助于 lead head 从一致的目标中提取残留信息。

表6:提出的auxiliary head 的消融研究。

在表7中，我们进一步分析了所提出的coarse-to-fine lead guided 标签分配方法对 auxiliary head 解码器的影响。也就是说，我们比较了引入上界约束和不引入上界约束的结果。从表中的数字来看，用距离目标中心的距离来约束目标的上限的方法可以获得更好的性能。

表7:约束 auxiliary head 的消融研究。

由于提出的 YOLOv7 使用多个金字塔来共同预测目标检测结果，我们可以直接将 auxiliary head 连接到中间层的金字塔进行训练。这种类型的训练可以弥补在下一级金字塔预测中可能丢失的信息。基于上述原因，我们在提出的 E-ELAN 架构中设计了部分 auxiliary head。我们的方法是在合并基数（cardinality）之前，在一组特征图后连接 auxiliary head ，这种连接可以使新生成的特征图 set 的权值不被 assistant loss 直接更新。我们的设计允许每个 lead head 金字塔仍然从不同大小的目标中获取信息。表8显示了两种不同方法的结果，即 coarse-to-fine lead guided 方法和 partial coarse-to-fine lead guided 方法。显然， partial coarse-to-fine lead guided 方法具有较好的 auxiliary 效果。

表8： partial auxiliary head 的消融研究。

8. 更多的比较

YOLOv7 在 5 FPS到160 FPS的速度和 accuracy 上超过了所有已知的目标检测器，在GPU V100上所有已知的30 FPS或更高的实时目标检测器中，YOLOv7具有最高的56.8%的AP test-dev/ 56.8%的AP min-val 。 YOLOv7-E6 目标检测器(56 FPS V100, 55.9% AP)比基于 transformer 的检测器 SWIN-L Cascade-Mask R-CNN (9.2 FPS A100, 53.9% AP)速度509%， accuracy 2%，基于卷积的检测器 ConvNeXt-XL CascadeMask R-CNN (8.6 FPS A100, 55.2% AP) 速度551%，accuracy 0.7% AP，以及YOLOv7在速度和accuracy 方面优于:YOLOR, YOLOX, scale- yolov4, YOLOv5, DETR， Deformable DETR , DINO-5scale-R50, ViT-Adapter-B 和许多其他目标检测器。此外，我们只在MS COCO数据集上从头开始训练YOLOv7，而不使用任何其他数据集或预训练的权重。

在COCO数据集上，YOLOv7-E6E(56.8%AP)实时模型的最大 accuracy 比目前最 accurate 的 meituan/YOLOv6-s model (43.1% AP)高+13.7%AP。我们的 YOLOv7-tiny (35.2%AP，0.4ms)模型在相同条件下，在COCO数据集和 batch=32 的V100 GPU上，比 meituan/YOLOv6-n(35.0%AP，0.5ms)快+25%和+0.2%AP。

表9：更多比较( (batch=1, no-TRT，无需额外的目标检测训练数据)

图9：与其他目标检测器的比较。

图10：与其他实时目标检测器的比较。

表10：不同设置的比较。

* 与 meituan/YOLOv6 和PPYOLOE类似，当设置较高的IOU阈值时，我们的模型可以获得更高的AP。

图11：与其他实时目标探测器的比较。

你可能感兴趣的:(视觉,论文阅读,YOLO,目标检测)

【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
番茄西红柿叶子病害分类数据集12882张11类别 futureflsl 数据集分类数据挖掘人工智能
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：12882分类类别数：11类别名称:["Bacterial_Spot_Bacteria","Early_Blight_Fungus","Healthy","Late_Blight_Water_Mold","Leaf_Mold_Fungus","Powdery
钢筋长度超限检测检数据集VOC+YOLO格式215张1类别 futureflsl 数据集 YOLO 深度学习机器学习
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：215标注数量(xml文件个数)：215标注数量(txt文件个数)：215标注类别数：1标注类别名称:["iron"]每个类别标注的框数：iron框数=215总框数：215使用标注工具：labelImg标注规则：对类别进
COCO 格式的数据集转化为 YOLO 格式的数据集 QYQY77 YOLO python
"""--json_path输入的json文件路径--save_path保存的文件夹名字，默认为当前目录下的labels。"""importosimportjsonfromtqdmimporttqdmimportargparseparser=argparse.ArgumentParser()parser.add_argument('--json_path',default='./instances
yolov5＞onnx＞ncnn＞apk 图像处理大大大大大牛啊 opencv实战代码讲解 yolo onnx ncnn 安卓
一.yolov5pt模型转onnx条件：colabnotebookyolov51.安装环境!pipinstallonnx>=1.7.0#forONNXexport!pipinstallcoremltools==4.0#forCoreMLexport!pipinstallonnx-simplifier2.修改common.py在classFocus下面
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
国庆节的一天安心雨
昨晚朋友间就转发国庆阅兵时间安排细节。今早，六点起床，到公园散步，一路上国旗招展，浓浓喜庆味。图片发自App准时坐到电脑前，拉上窗帘，关了房门，一个人静静感受，视觉和心灵的震撼。怕大脑内存不足，想要永远留存住那些属于这个时代，属于这个国家的骄傲。于是，拿出手机，对着屏幕拍了一张一张又一张。下午，朋友圈各种关于国庆的想法、评论、图片刷屏，翻了一遍一遍又一遍，每一遍都是骄傲和自豪。为生在这个伟大的时代
[数据集][目标检测]汽车头部尾部检测数据集VOC+YOLO格式5319张3类别 FL1623863129 数据集目标检测汽车 YOLO
数据集制作单位：未来自主研究中心(FIRC)版权单位：未来自主研究中心(FIRC)版权声明：数据集仅仅供个人使用，不得在未授权情况下挂淘宝、咸鱼等交易网站公开售卖,由此引发的法律责任需自行承担数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：5319标注数量(xml文件
轻量级模型解读——轻量transformer系列 lishanlu136 #图像分类轻量级模型 transformer 图像分类
先占坑，持续更新。。。文章目录1、DeiT2、ConViT3、Mobile-Former4、MobileViTTransformer是2017谷歌提出的一篇论文，最早应用于NLP领域的机器翻译工作，Transformer解读，但随着2020年DETR和ViT的出现(DETR解读，ViT解读)，其在视觉领域的应用也如雨后春笋般渐渐出现，其特有的全局注意力机制给图像识别领域带来了重要参考。但是tran
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
你会读书吗阿杰说澄长
一上学那会，朋友W报名了一个快速阅读培训课。出于好奇，我拿着他的培训资料进行了一个月的自我训练，并一度深陷其中。材料主要是无规则的符号以及横跨A4纸的连线，通过视线快速移动，扩大视幅来提升信息的接受速度，又通过图案和符号锻炼大脑的视觉记忆，摆脱音读习惯。那一个月，我沉溺其中，每天用很多的时间练习。一个月后，我确实做到了快速阅读，以句群接受信息，一目一行。只是速度虽快，却读过无痕，该知道的全忘记了。
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
遥感图像分割系统：融合空间金字塔池化（FocalModulation)改进YOLOv8 xuehaisj YOLO 人工智能计算机视觉 yolov8
1.研究背景与意义项目参考AAAIAssociationfortheAdvancementofArtificialIntelligence研究背景与意义遥感图像分割是遥感技术领域中的一个重要研究方向，它的目标是将遥感图像中的不同地物或地物类别进行有效的分割和识别。随着遥感技术的不断发展和遥感图像数据的大规模获取，遥感图像分割在农业、城市规划、环境监测等领域具有广泛的应用前景。然而，由于遥感图像的特
Python和MATLAB及C++信噪比导图(算法模型) 亚图跨际算法交叉知识 Python 视频图像修复模数转换信号链噪音频谱计算量化周期性视觉刺激高斯噪声的矩形脉冲心率失常检测算法
要点视频图像修复模数转换中混合信号链噪音测量频谱计算和量化周期性视觉刺激脑电图高斯噪声的矩形脉冲总谐波失真周期图功率谱密度各种心率失常检测算法胶体悬浮液跟踪检测计算交通监控摄像头图像噪音计算Python信噪比信噪比是科学和工程中使用的一种测量方法，用于比较所需信号水平与背景噪声水平。信噪比定义为信号功率与噪声功率之比，通常以分贝表示。高于1:1（大于0dB）的比率表示信号大于噪声。信噪比是影响处理
Python(PyTorch)和MATLAB及Rust和C++结构相似度指数测量导图亚图跨际 Python 交叉知识算法量化检查图像压缩质量低分辨率多光谱峰值信噪比端到端优化图像压缩手术机器人三维实景实时可微分渲染重建三维可视化
要点量化检查图像压缩质量低分辨率多光谱和高分辨率图像实现超分辨率分析图像质量图像索引/多尺度结构相似度指数和光谱角映射器及视觉信息保真度多种指标峰值信噪比和结构相似度指数测量结构相似性图像分类PNG和JPEG图像相似性近似算法图像压缩，视频压缩、端到端优化图像压缩、神经图像压缩、GPU变速图像压缩手术机器人深度估计算法重建三维可视化推理图像超分辨率算法模型三维实景实时可微分渲染算法MATLAB结构
题解 | #完全数计算#不知道为什么没超时的暴力解法 huaxinjiayou java
兄弟们，坚持就是胜利啊，找工作从去年秋招就开始找，到五月底才收到第一个offer星环的，然后六月初t咋六月了还有面试啊，有兄弟了解这个部门吗面完了家人们，纯纯kpi啊，上来就是一道题是打印多个字符串的华为接头人话术指南：欲投华为，必看此贴!引流华为招聘提前批【奖】这个夏天，和牛牛一起打卡刷题~Java面试实战项目25届本科找暑期实习的历程飞猪旅行运营岗面经百度视觉算法一面面经感谢牛友们，腾子pcg
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
微信小程序常用开发框架有哪些？ +码农快讯+ 分享微信小程序小程序开发
想要开发出一套高质量的小程序，运用框架，组件库是省时省力省心必不可少一部分，随着小程序日渐火爆，各种不同类型的小程序也渐渐更新，其中不乏一些优秀好用的框架/组件库。1：WeUI小程序–使用教程https://weui.io/官方介绍：WeUI是一套同微信原生视觉体验一致的基础样式库，由微信官方设计团队为微信内网页和微信小程序量身设计，令用户的使用感知更加统一。小程序开发中最常用到的一款框架，受广大
js的书写位置和css的书写位置的区别？为什么要这样写？李是啥也不会 javascript css 开发语言
JavaScript和CSS的书写位置有以下区别：CSS通常写在标签中，或者在外部样式表文件中（）。CSS主要用于控制页面的视觉样式和布局，通常在HTML文件的部分引入，以确保在页面渲染时样式已经加载完毕，从而避免样式闪烁。JavaScript通常写在标签中，或者在外部脚本文件中（）。JavaScript用于添加页面的动态行为和交互。一般建议将JavaScript放在HTML文件的末尾（标签之前）
云南印象一玉龙雪山把日子过成诗吧
一顿饱眠后，兴冲冲前往玉龙雪山，为了预防高反，提前数日已服红景天，又买了氧气瓶，心理上安心多了。第一站，观看印象丽江，满满的男子汉气息扑面而来，谁说现在的男人越来越娘，这里的男子个个演的豪情万丈，满足了女性视觉感受。节目是否精彩，因人而异，看懂了等于了解了少数民族的风土人情，看不懂就是一帮群众演员在闹腾。这种表演风格，场面壮观，红色情怀，老谋子的最爱，不深评。图片发自App表演毕，前往玉龙雪山，人
如何理解深度学习的训练过程奋斗的草莓熊深度学习人工智能 python scikit-learn virtualenv numpy pandas
文章目录1.训练是干什么？2.预训练模型进行训练，主要更改的是预训练模型的什么东西？1.训练是干什么？以yolov5为例子，训练的目的是把一组输入猫狗图像放到神经网络中，得到一个输出模型，这个模型下次可以直接用来识别哪个是猫，哪个是狗2.预训练模型进行训练，主要更改的是预训练模型的什么东西？超参数（Hyperparameters）：这是模型结构中定义的参数，比如：卷积核大小（kernel_size
掌握这些思维、习惯，让你在职业生涯中受益匪浅伽马有话说
有哪些对职业生涯有益的思维和习惯呢？这里有四个建议：一、收集各行各业人类失败与灾难的反面案例我们总是高估自己，小瞧别人。有一个有趣的例子。据统计，瑞典有百分之九十的司机都认为他们的驾驶技术在平均水平之上。让我们看看抖音上那些失败的案例吧。有多少视频都是骑着单车到货车的视觉盲区被碾伤碾死；有多少视频都是醉酒开车撞伤路人、撞坏栅栏；有多少视频都是相互赌气，相互别车，最后大打出手。人类失败与灾难案例从来
Unreal Engine——AI生成高精度的虚拟人物和环境（虚拟世界构建、电影场景生成）（二）（技术分析）爱研究的小牛 AIGC—虚拟现实人工智能虚幻游戏引擎 AIGC
UnrealEngine（虚幻引擎）是业界领先的3D实时渲染引擎，广泛应用于游戏开发、影视制作、建筑可视化和虚拟现实等领域。其核心技术实现涵盖了多项复杂的功能模块，包括图形渲染、物理引擎、动画系统、音效系统和网络系统等。1.图形渲染技术UnrealEngine的图形渲染系统非常强大，支持实时渲染复杂的3D场景，生成高品质的视觉效果。虚幻引擎使用先进的渲染管线，主要分为以下几个方面：1.1渲染管线虚
录像与录像装置的区别 wjq77
录像装置是20世纪晚期艺术的一个多元界面。它糅合了艺术与科技、私人空间与公共场所、主观视觉与机器的非透明表面、高雅文化与大众文化、博物馆艺术品的严肃性与卫星电视的数字狂欢，这是一个身体消失的时刻与身体再度被发现的时刻。录像装置不能以信件形式发送或拍成视频。它不能成为原始录像的拷贝或是拷贝的拷贝。没有人能将其买来放在客厅的角落，艺术家也不能靠自己口袋里的小钱来创作它。录像装置拥有它自己的历史，受制于
视频也能分割？！在云服务器上部署最新视觉大模型SAM2教程、详细代码注释和视频演示 Hanley_Yeung 图像处理人工智能 python 人工智能 python 深度学习 SAM2 计算机视觉图像分割
使用SAM2进行视频分割本笔记本展示了如何使用SAM2在视频中进行交互式分割。它将涵盖以下内容：在帧上添加点击以获取和细化masklets（时空掩码）在整个视频中传播点击以获取_masklets同时分割和跟踪多个目标我们使用术语_segment_或_mask_来指代单个帧上对象的模型预测，_masklet_指代整个视频中的时空掩码。如果使用Jupyter在本地运行，请首先根据安装说明在您的环境中安
基于YOLOV5人脸检测打上码赛克 Deep-white YOLO 人工智能深度学习
还在为自己的隐私而烦恼吗，还在为拍摄的视频因不想露脸而无法发布吗。yolov5检测人脸，并打上马赛克，保护自己的隐私。只需下载代码，解压缩后就可以传入你想要打马赛克的视频或者图片了。这个是需要你对代码有一些了解的，等我开发一下使大家都可以用。里面权重已经训练好了，也有一些人脸的数据集，数据量不多，训练完的权重不是很好，但是给自己的视频打上马赛克足够了。大家要是想去增加数据集，可以使用里面的权重利用
万里素食行是一场巅峰体验吉林长春张耀辉
2020年5月24日，全家周日观影日，是N师学院的一次特别精神大餐，感谢互加计划吴虹校长的推荐和邀约，徐立导演的素食题材电影《巅峰体验》，这是一部超过瘾的影片，全程视觉享受，影片中体验人生巅峰为了寻找人生的终极意义，为了挖掘自己未知的潜能，记录了一群人63天的素食雷达骑行者从繁华似锦的大上海万里到达宁静致远的拉萨圣地，预计骑行1万里的故事。这是一部真人真事的纪录片，没有任何情节设计，也没有预设台词
Python计算机视觉编程第三章图像到图像的映射一只小小程序猿计算机视觉 python opencv
目录单应性变换直接线性变换算法仿射变换图像扭曲图像中的图像分段仿射扭曲创建全景图RANSAC拼接图像单应性变换单应性变换是将一个平面内的点映射到另一个平面内的二维投影变换。在这里，平面是指图像或者三维中的平面表面。单应性变换具有很强的实用性，比如图像配准、图像纠正和纹理扭曲，以及创建全景图像。单应性变换本质上是一种二维到二维的映射，可以将一个平面内的点映射到另一个平面上的对应点。代码如下：impo
DIODE：超高分辨率室内室外数据集（猫脸码客第186期）猫脸码客: catCode2024 开源数据集猫脸码客开源数据集超高分辨率室内室外数据集
亲爱的读者们，您是否在寻找某个特定的数据集，用于研究或项目实践？欢迎您在评论区留言，或者通过公众号私信告诉我，您想要的数据集的类型主题。小编会竭尽全力为您寻找，并在找到后第一时间与您分享。在计算机视觉和深度学习领域，深度信息作为三维空间感知的重要组成部分，对于实现高级视觉任务如场景理解、机器人导航、增强现实等具有至关重要的作用。然而，获取准确且密集的深度数据一直是一个挑战，尤其是在同时涵盖室内和室
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，