香菜烤面包

从YOLOv1到YOLOv8的YOLO系列最新综述【2023年4月】

作者：Juan R. Terven 、Diana M. Cordova-Esparaza

摘要：YOLO已经成为机器人、无人驾驶汽车和视频监控应用的核心实时物体检测系统。我们对YOLO的演变进行了全面的分析，研究了从最初的YOLO到YOLOv8每次迭代的创新和贡献。我们首先描述了标准指标和后处理；然后，我们讨论了每个模型的网络结构和训练技巧的主要变化。最后，我们总结了YOLO发展的基本经验，并提供了对其未来的看法，强调了提高实时物体检测系统的潜在研究方向。

1. 简介

实时物体检测已经成为众多应用中的一个重要组成部分，横跨自主车辆、机器人、视频监控和增强现实等各个领域。在各种物体检测算法中，YOLO（You Only Look Once）框架因其在速度和准确性方面的显著平衡而脱颖而出，能够快速、可靠地识别图像中的物体。自成立以来，YOLO系列已经经历了多次迭代，每次都是在以前的版本基础上解决局限性并提高性能（见图1）。本文旨在全面回顾YOLO框架的发展，从最初的YOLOv1到最新的YOLOv8，阐释每个版本的关键创新、差异和改进。

本文首先探讨了原始YOLO模型的基本概念和架构，这为YOLO系列的后续进展奠定了基础。随后，我们深入探讨了从YOLOv2到YOLOv8每个版本中引入的改进和提高。这些改进包括各个方面，如网络设计、损失函数的修改、锚框的调整和输入分辨率的扩展。通过研究这些发展，对YOLO框架的演变及其对物体检测的影响有一个整体的理解。

除了讨论每个YOLO版本的具体进展外，本文还强调了在整个框架的发展过程中出现的速度和准确性之间的权衡问题。这强调了在选择最合适的YOLO模型时，考虑具体应用的背景和要求的重要性。最后，我们设想了YOLO框架的未来方向，触及了进一步研究和发展的潜在途径，这将塑造实时物体检测系统的持续进展。

2. YOLO在不同领域的应用

YOLO的实时物体检测能力在自主车辆系统中是非常宝贵的，能够快速识别和跟踪各种物体，如车辆、行人[1, 2]、自行车和其他障碍物[3, 4, 5, 6]。这些能力已被应用于许多领域，包括用于监控的视频序列中的动作识别[7][8]、体育分析[9]和人机交互[10]。

YOLO模型已被用于农业，以检测和分类作物[11, 12]、害虫和疾病[13]，协助精准农业技术和自动化耕作过程。它们还被用于生物识别、安全和面部识别系统中的面部检测任务[14, 15]。

在医学领域，YOLO已被用于癌症检测[16, 17]、皮肤分割[18]和药片识别[19]，从而提高诊断的准确性和更有效的治疗过程。在遥感领域，它已被用于卫星和航空图像中的物体检测和分类，有助于土地利用绘图、城市规划和环境监测[20, 21, 22, 23]。

安防系统已经将YOLO模型整合到视频资料的实时监控和分析中，允许快速检测可疑活动[24]、社会距离和脸部面具检测[25]。这些模型还被应用于表面检测，以检测缺陷和异常，加强制造和生产过程的质量控制[26, 27, 28]。

在交通应用中，YOLO模型已被用于车牌检测[29]和交通标志识别[30]等任务，促进了智能交通系统和交通管理解决方案的发展。它们已被用于野生动物检测和监测，以识别濒危物种，用于生物多样性保护和生态系统管理[31]。最后，YOLO已被广泛用于机器人应用[32, 33]和无人机的物体检测[34, 35]。

3. 物体检测指标和非极大值抑制（NMS）

平均精度（AP），传统上称为平均精度（mAP），是评价物体检测模型性能的常用指标。它测量所有类别的平均精度，提供一个单一的数值来比较不同的模型。COCO数据集没有对AP和AP进行区分。在本文的其余部分，我们将把这个指标称为AP。

在YOLOv1和YOLOv2中，用于训练和基准测试的数据集是PASCAL VOC 2007和VOC 2012[36]。然而，从YOLOv3开始，使用的数据集是微软COCO（Common Objects in Context）[37]。对于这些数据集，AP的计算方法是不同的。以下各节将讨论AP背后的原理，并解释它是如何计算的。

3.1 AP

AP指标是基于精度-召回指标，处理多个对象类别，并使用Intersection over Union（IoU）定义一个积极的预测。

Precision和Recall：精确率衡量的是模型正面预测的准确性，而召回率衡量的是模型正确识别的实际正面案例的比例。精确率和召回率之间通常有一个权衡；例如，增加检测到的对象的数量（更高的召回率）会导致更多的假阳性（更低的精确率）。为了考虑到这种权衡，AP指标包含了精度-召回曲线，该曲线将精度与不同置信度阈值的召回率作了对比。这个指标通过考虑精度-召回曲线下的面积，对精度和召回进行了平衡的评估。

处理多个物体类别：物体检测模型必须识别和定位图像中的多个物体类别。AP指标通过单独计算每个类别的平均精度（AP），然后取所有类别中这些AP的平均值来解决这个问题（这就是为什么它也被称为平均平均精度）。这种方法确保了对每个类别的模型性能进行单独评估，从而对模型的整体性能提供了更全面的评估。

IoU：物体检测的目的是通过预测边界框来准确定位图像中的物体。AP指标包含了 "联合体上的交集"（IoU）措施，以评估预测的边界盒的质量。IoU是预测界线盒和地面真实界线盒的交集面积与联合面积之比（见图2）。它衡量的是地面实况和预测边界盒之间的重叠程度。COCO基准考虑了多个IoU阈值，以评估模型在不同定位精度水平上的表现。

3.2 计算AP

在VOC和COCO数据集中，AP的计算方法是不同的。在这一节中，我们将描述它是如何在每个数据集上计算的。

VOC数据集

这个数据集包括20个物体类别。为了计算VOC中的AP，我们遵循以下步骤：

对于每个类别，通过改变模型预测的置信度阈值，计算出精确-召回曲线
使用精度-召回曲线的内插11点抽样，计算每个类别的平均精度（AP）
通过取所有20个类别中的AP的平均值来计算最终的平均精度（AP）

COCO数据集

这个数据集包括80个对象类别，并使用更复杂的方法来计算AP。它没有使用11点插值，而是使用101点插值，也就是说，它计算了从0到1的101个召回阈值的精度，增量为0.01。另外，AP是通过对多个IoU值进行平均而不是只对一个IoU值进行平均得到的，除了一个常见的AP指标，即AP50 ，它是单个IoU阈值为0.5的AP。COCO中计算AP的步骤如下：

对于每个类别，通过改变模型预测的置信度阈值，计算出精确-召回曲线
使用101-recall阈值计算每个类别的平均精度（AP）
在不同的交叉联合（IoU）阈值下计算AP，通常从0.5到0.95，步长为0.05。更高的IoU阈值需要更准确的预测才能被认为是真阳性
对于每个IoU阈值，取所有80个类别的AP的平均值
最后，通过平均每个IoU阈值计算的AP值来计算总体AP

AP计算的差异使得我们很难直接比较两个数据集的物体检测模型的性能。目前的标准使用COCO AP，因为它对一个模型在不同的IoU阈值下的表现有更精细的评估。

3.3 非极大值抑制 (NMS)

非极大值抑制（NMS）是物体检测算法中使用的一种后处理技术，用于减少重叠边界盒的数量，提高整体检测质量。物体检测算法通常会在同一物体周围产生多个具有不同置信度分数的边界框。NMS过滤掉多余的和不相关的边界盒，只保留最准确的边界盒。算法1描述了该程序。图3显示了一个包含多个重叠边界框的物体检测模型的典型输出和NMS之后的输出。

4. YOLO: You Only Look Once

Joseph Redmon等人的YOLO发表在CVPR 2016[38]。它首次提出了一种实时的端到端物体检测方法。YOLO这个名字代表了 "你只看一次"，指的是它是与之前的方法相比，YOLO只需通过一次网络就能完成检测任务，而之前的方法要么使用滑动窗口，要么使用分类器，每个图像需要运行数百次或数千次，更先进的方法则将任务分为两步，第一步检测有物体或候选框的可能区域，第二步对候选框进行分类。另外，YOLO使用了一个更直接的输出，只基于回归来预测检测输出，而Fast R-CNN[39]则使用了两个单独的输出，一个是概率的分类，一个是方框坐标的回归。

4.1 YOLOv1如何工作？

YOLOv1通过同时检测所有的边界框，统一了物体检测步骤。为了实现这一目标，YOLO将输入图像划每个边界框的预测由五个值组成：Pc、bx、by、bh、bw ，其中Pc是bounding box的置信度分数，反映了模型对bbox包含物体的置信度以及bbox的精确程度。bx和by坐标是方框相对于网格单元的中心，bh和bw是方框相对于整个图像的高度和宽度。YOLO的输出是一个S×S×(B×5+C)的张量，可以选择用非最大抑制（NMS）来去除重复的检测结果。

在最初的YOLO论文中，作者使用了PASCAL VOC数据集[36]，该数据集包含20个（C = 20）；一个7×7（S = 7）网格最多预测两个类（B = 2），输出7×7×30预测结果。

YOLOv1在PASCAL VOC2007数据集上取得了63.4的平均精度（AP）。

4.2 YOLOv1网络架构

YOLOv1架构包括24个卷积层，然后是两个全连接层，用于预测bbox坐标和概率。除了最后一个层使用线性激活函数外，所有层都使用了漏整流线性单元激活[40]。受GoogLeNet[41]和Network in Network[42] 的启发，YOLO使用1×1卷积层来减少特征图的数量并保持相对较低的参数数量。作为激活层，表1描述了YOLOv1的架构。作者还介绍了一个更轻的模型，称为快速YOLO，由九个卷积层组成。

4.3 YOLOv1训练

作者使用ImageNet数据集[43]在224x224的分辨率下对YOLO的前20层进行了预训练。然后，他们用随机初始化的权重增加了最后四层，并在448x448的分辨率下用PASCAL VOC 2007和VOC 2012数据集[36]对模型进行了微调，以增加细节，实现更准确的物体检测。对于增强，作者使用了最多为输入图像大小20%的随机缩放和平移，以及HSV色彩空间中上端系数为1.5的随机曝光和饱和度。

YOLOv1使用了一个由多个和平方误差组成的损失函数，如图5所示。在该损失函数中、 λcoord = 5是一个比例因子，赋予边界框预测更多的重要性，而λnoobj = 0.5是一个比例因子，降低不包含物体的框的重要性。λnoobj = 0.5是一个比例因子，它降低了不包含物体的bbox的重要性。

4.4 YOLOv1优缺点

YOLO的简单结构，加上其新颖的全图像单次回归，使其比现有的物体检测器快得多，允许实时性能。然而，虽然YOLO的表现比任何物体检测器都快，但与最先进的方法如快速R-CNN[39]相比，定位误差更大。造成这种限制的主要原因有三个：

它在网格单元中最多只能检测到两个相同类别的物体，限制了它预测附近物体的能力
它在预测训练数据中未见的长宽比物体时很吃力
由于下采样层，它只能从粗略的物体特征中学习

5. YOLOv2：更好、更快、更强

YOLOv2由Joseph Redmon和Ali Farhadi发表在CVPR 2017[44]。它包括了对原始YOLO的一些改进，使其更好，保持相同的速度，也更强大，能够检测9000个类别！这些改进有以下几点：

在所有卷积层上的批量归一化改善了收敛性，并作为一个正则器来减少过拟合；
高分辨率分类器，和YOLOv1一样，他们在ImageNet 以224x224的分辨率对模型进行了预训练。然而，这一次，他们在分辨率为448 x 448的ImageNet上对模型进行了10次微调，提高了网络在高分辨率输入下的性能；
完全卷积。他们去掉了密集层，采用了全卷积架构；
使用Anchor来预测边界盒。他们使用一组先验框Anchor，这些Anchor具有预定义的形状，用于匹配物体的原型形状，如图6所示。每个网格单元都定义了多个Anchor，系统预测每个Anchor的坐标和类别。网络输出的大小与每个网格单元的Anchor数量成正比；
维度聚类。挑选好的Anchor有助于网络学习预测更准确的边界盒。作者对训练中的边界盒进行了k-means聚类，以找到好的先验。他们选择了五个Anchor，在召回率和模型复杂性之间进行了良好的权衡；
直接预测位置。与其他预测偏移量的方法不同[45]，YOLOv2遵循同样的理念，预测了相对于网格单元的位置坐标。网络为每个单元预测了五个bounding box，每个bounding box有五个值tx , ty , tw , th , to ，其中to 相当于YOLOv1的Pc，最终得到的bounding box坐标如图7所示；
细粒度的特征。与YOLOv1相比，YOLOv2去掉了一个池化层，对于416×416的输入图像，得到13×13的特征图，结构细节见图表2；
多尺度训练。由于YOLOv2不使用全连接层，输入可以是不同的尺寸。为了使YOLOv2对不同的输入尺寸具有鲁棒性，作者随机训练模型，每十批改变输入尺寸（从320 × 320到608 × 608）。

通过所有这些改进，YOLOv2在PASCAL VOC2007数据集上取得了78.6%的平均精度（AP），而YOLOv1则取得了63.4%。

5.1 YOLOv2架构

YOLOv2使用的骨干架构被称为Darknet-19，包含19个卷积层和5个maxpooling层。与YOLOv1的架构类似，它受到Network in Network[42]的启发，在3×3之间使用1×1 3×3之间的卷积，以减少参数的数量。此外，如上所述，他们使用批量归一化来规范化并帮助收敛。

5.2 YOLO9000是一个更强大的YOLOv2

作者在同一篇论文中介绍了一种训练联合分类和检测的方法。它使用来自COCO[37]的检测标记数据来学习bounding box坐标，并使用来自ImageNet的分类数据来增加它能检测的类别数量。在训练过程中，他们将这两个数据集结合起来，这样当使用检测训练图像时，它反向传播检测网络，而当使用分类训练图像时，它反向传播架构的分类部分。结果是一个能够检测超过9000个类别的YOLO模型，因此被称为YOLO9000。

6. YOLOv3

YOLOv3[46]于2018年由Joseph Redmon和Ali Farhadi发表在ArXiv。它包括重大的变化和更大的架构，以便在保持实时性能的同时与最先进的技术接轨。在下文中，我们描述了相对于YOLOv2的变化。

bounding box预测。与YOLOv2一样，该网络为每个bounding box预测四个坐标tx、ty、tw和th；然而，这次YOLOv3使用逻辑回归为每个bounding box预测一个目标分数。这个分数与ground truth重合度最高的Anchor来说是1，对于其他Anchor来说是0。与Faster R-CNN[45]相比，YOLOv3只为每个ground truth分配一个Anchor。另外，如果没有为一个对象分配Anchor，它只会产生分类损失，而不会产生定位损失或置信度损失；
类预测。他们没有使用softmax进行分类，而是使用二元交叉熵来训练独立的logistic分类器，并将问题作为多标签分类来提出。这种变化允许给同一个bounding box分配多个标签，这可能发生在一些标签重叠的复杂数据集上[47]。例如，同一个物体可以是一个人和一个男人；
新的骨干网络。YOLOv3的特点是一个更大的特征提取器，由53个卷积层组成，带有Res残余连接。第6.1节更详细地描述了该架构；
空间金字塔池(SPP)。 虽然在论文中没有提到，但作者还在骨干中加入了一个改进的SPP块[48]，它连接了多个最大集合输出，而没有子采样（stride = 1），每个内核大小不同的k×k，其中k=1、5、9、13，允许更大的感受野。这个版本被称为称为YOLOv3-spp，是表现最好的版本，将AP50提高了2.7%；
多尺度预测。与特征金字塔网络[49]类似，YOLOv3在三个不同尺度上预测三个bounding box。第6.2节描述了多尺度预测机制的更多细节；
Bounding box先验。与YOLOv2一样，作者也使用k-means来确定Anchor的bounding box预设。不同的是，在YOLOv2中，他们每个单元共使用了五个先验盒，而在YOLOv3中，他们使用了三个不同尺度的先验盒。

6.1 YOLOv3架构

YOLOv3中提出的架构主干被称为Darknet-53。它用全连接层取代了所有的max-pooling层，并增加了Res残差连接。总的来说，它包含53个卷积层。图8显示了该架构的细节。

Darknet-53骨干网获得了与ResNet-152相当的Top-1和Top-5的准确率，但速度几乎为2倍。

6.2 YOLOv3多尺度预测

除了更大的结构，YOLOv3的一个基本特征是多尺度预测，即在多个网格尺寸下的预测。这有助于获得更精细的方框，并大大改善了对小物体的预测，而这正是YOLO以前版本的主要弱点之一。

图9所示的多尺度检测架构的工作原理如下：第一个标记为y1的输出相当于YOLOv2的输出，其中一个13×13的网格定义了输出。第二个输出y2是由串联后的输出与（Res × 8）后的输出相连接。这些特征图有不同的尺寸，即13×13和26×26，所以在连接之前有一个上采样操作。最后，使用一个上采样操作，第三个输出y3将26×26的特征图与52×52的特征图连接起来。对于有80个类别的COCO数据集，每个尺度提供了一个形状为N×N×[3×(4+1+80)]的输出张量。其中N×N是特征图（或网格单元）的大小，3表示每个单元的方框，4+1包括四个坐标和置信度得分。4+1包括四个坐标和置信度得分。

6.3 YOLOv3结果

当YOLOv3发布时，物体检测的基准已经从PASCAL VOC变成了Microsoft COCO[37]。因此，从这里开始，所有的YOLO都在MS COCO数据集中进行评估。YOLOv3-spp在20FPS的情况下，平均精度AP为36.2%， AP50 为60.6%，达到了当时的最先进水平，速度快了2倍。

7. Backbone, Neck和Head

这时，物体检测器的结构开始被描述为三个部分：Backbone, Neck和Head。图10显示了一个高层次的Backbone, Neck 和 Head图。

Backbone负责从输入图像中提取有用的特征。它通常是一个卷积神经网络（CNN），在大规模的图像分类任务中训练，如ImageNet。骨干网在不同的尺度上捕捉层次化的特征，在较早的层中提取低层次的特征（如边缘和纹理），在较深的层中提取高层次的特征（如物体部分和语义信息）。

Neck是连接Backbone和Head的一个中间部件。它聚集并细化骨干网提取的特征，通常侧重于加强不同尺度的空间和语义信息。颈部可能包括额外的卷积层、特征金字塔网络（FPN）[49]，或其他机制，以提高特征的代表性。

Head是物体检测器的最后组成部分；它负责根据Backbone和Neck提供的特征进行预测。它通常由一个或多个特定任务的子网络组成，执行分类、定位，以及最近的实例分割和姿势估计。头部处理颈部提供的特征，为每个候选物体产生预测。最后，一个后处理步骤，如非极大值抑制（NMS），过滤掉重叠的预测，只保留置信度最高的检测。

在其余的YOLO模型中，我们将使用Backbone, Neck和Head来描述架构。

8. YOLOv4

两年过去了，YOLO没有新版本。直到2020年4月，Alexey Bochkovskiy、Chien-Yao Wang和Hong-Yuan Mark Liao在ArXiv发布了YOLOv4[50]的论文。起初，不同的作者提出一个新的YOLO "官方 "版本让人感觉很奇怪；然而，YOLOv4保持了相同的YOLO理念——实时、开源、端到端和DarkNet框架——而且改进非常令人满意，社区迅速接受了这个版本作为官方的YOLOv4。

YOLOv4试图通过试验许多被归类为bag-of-freebies和bag-of-specials的变化来找到最佳平衡。bag-of-freebies是指只改变训练策略和增加训练成本但不增加推理时间的方法，最常见的是数据增强。另一方面，bag-of-specials是指稍微增加推理成本但显著提高准确率的方法。这些方法的例子有扩大感受野[48, 51, 52]，结合特征[53, 49, 54, 55]，以及后处理[56, 40, 57, 58]等等。

我们将YOLOv4的主要变化总结为以下几点：

一个带有bag-of-specials集成的增强型架构。作者尝试了多种骨干架构，如ResNeXt50[59] 、EfficientNet-B3[60]和Darknet-53。表现最好的架构是对Darknet-53的修改，采用跨阶段部分连接（CSPNet）[61]，以Mish激活函数[57]作为骨干（见图11）。对于颈部，他们使用了YOLOv3-spp中的修改版空间金字塔集合（SPP）[48]和YOLOv3中的多尺度预测，但用修改版的路径聚合网络（PANet）[62]代替FPN，以及修改的空间注意模块（SAM）[63]。最后，对于检测头，他们使用YOLOv3中的锚。因此，该模型被称为CSPDarknet53-PANet-SPP。添加到Darknet-53中的跨阶段部分连接（CSP）有助于减少模型的计算量，同时保持相同的精度。与YOLOv3-spp中一样，SPP块在不影响推理速度的情况下增加了感受野。修改后的PANet版本将特征串联起来，而不是像原PANet论文中那样将其添加；
bag-of-freebies的高级训练方法。除了常规的增强，如随机亮度、对比度、缩放、裁剪、翻转和旋转，作者还实现了马赛克增强，将四张图像合并为一张，允许检测其通常背景之外的物体，同时也减少了对大批量正常化的小批量的需求。对于正则化，他们使用了DropBlock[64] ，作为Dropout[65]的替代品，但用于卷积神经网络以及类标签平滑[66, 67]。对于检测器，他们增加了CIoU 损失[68]和Cross mini-bath normalization (CmBN)，用于收集整个批次的统计数据，而不是像常规批次归一化中的单个小批次[69]；
自我对抗性训练（SAT）。为了使模型对扰动更加稳健，对输入的图像进行对抗性攻击，以创造一个欺骗性，即gound truth不在图像中，但保持原始标签以检测正确的对象；
用遗传算法进行超参数优化。为了找到用于训练的最佳超参数，他们在前10%的时期使用遗传算法，并使用余弦退火调度器[70]来改变训练期间的学习率。它开始缓慢地降低学习率，然后在训练过程的一半时快速降低，最后略微降低。

表3列出了骨干网和检测器的最终选择的BoF和BoS。

8.1 YOLOv4结果

在MS COCO数据集test-dev 2017上进行评估，YOLOv4在NVIDIA V100上实现了43.5%的AP和65.7%的AP50，速度超过了50 FPS。

9. YOLOv5

YOLOv5[72]是在YOLOv4之后几个月于2020年由Glenn Jocher发布。在写这篇文章时，还没有关于YOLOv5的科学论文，但从代码中，我们知道它使用了YOLOv4部分描述的许多改进，主要区别是它是用Pytorch而不是Darknet开发的。YOLOv5是开源的，由Ultralytics积极维护，有250多个贡献者，并经常有新的改进。YOLOv5很容易使用、培训和部署。Ultralytics提供了一个iOS和Android的移动版本，以及许多用于标签、培训和部署的集成。

YOLOv5 提供了五个版本： YOLOv5n（纳米级）、YOLOv5s（小型）、YOLOv5m（中型）、YOLOv5l（大型）和YOLOv5x（特大型）。

在撰写本文时，YOLOv5发布的版本是7.0版，包括能够进行分类和实例分割的YOLOv5版本。

9.1 YOLOv5结果

在MS COCO数据集test-dev 2017上进行评估，YOLOv5x在图像大小为640像素的情况下实现了50.7%的AP。使用32 个批次的大小，它在NVIDIA V100 上可以达到200 FPS 的速度。使用更大的输入尺寸1536 像素， YOLOv5实现了55.8%的AP。

10. Scaled-YOLOv4

在YOLOv4 的一年后，同一作者在CVPR 2021 上展示了Scaled-YOLOv4 [73] 。与YOLOv4 不同， Scaled YOLOv4是在Pytorch而不是Darknet中开发的。主要的创新之处在于引入了扩大和缩小的技术。扩大规模意味着以降低速度为代价来制作一个增加精度的模型；另一方面，缩小规模需要制作一个增加速度而牺牲精度的模型。此外，按比例缩小的模型需要更少的计算能力，可以在嵌入式系统上运行。

缩小的架构被称为YOLOv4-tiny；它是为低端GPU设计的，在Jetson TX2上能以46 FPS运行，在RTX2080Ti上能以440 FPS运行，在MS COCO上达到22%的AP。

扩大的模型架构被称为YOLOv4-large，其中包括三种不同尺寸的P5、P6和P7。这个架构是为云计算GPU设计的，取得了最先进的性能，超过了所有以前的模型[74, 75, 76]，在MS COCO上的AP为56%。

11. YOLOR

YOLOR[77]由YOLOv4的同一研究小组于2021年5月发表在ArXiv。它代表着你只学习一个表征。在这篇论文中，作者采用了一种不同的方法；他们开发了一种多任务学习方法，旨在通过学习一般的表征和使用子网络来创建特定任务的表征，为各种任务（如分类、检测、姿势估计）创建一个单一的模型。洞察到传统的联合学习方法经常导致次优特征的产生，YOLOR旨在通过编码神经网络的隐性知识来克服这一问题，以应用于多个任务，类似于人类使用过去的经验来处理新问题。结果显示，将隐性知识引入神经网络有利于所有的任务。

在MS COCO数据集test-dev 2017上进行评估，YOLOR在NVIDIA V100上以30 FPS的速度取得了55.4%的AP和73.3%的AP50。

12. YOLOX

YOLOX[78]于2021年7月发表在ArXiv上，由Megvii Technology的研究团队开发。它以Pytorch为基础，以Ultralytics的YOLOV3为起点，有五个主要变化：无锚结构、多阳性、解耦头、高级标签分配和强增强。它取得了最先进的结果。

2021年，在Tesla V100上以50.1%的AP和68.9%的FPS实现了速度和准确性的最佳平衡。在下文中，我们描述了YOLOX相对于YOLOv3的五个主要变化：

无锚（Anchor-free）。自YOLOv2以来，所有后续的YOLO版本都是基于锚点的检测器。YOLOX受到CornerNet[79]、CenterNet[80]和FCOS[81]等最先进的无锚物体检测器的启发，回到了一个无锚结构，简化了训练和解码过程。与YOLOv3基线相比，无锚的AP增加了0.9；
多重正样本（Multi positives）。为了弥补因缺乏锚点而产生的巨大不平衡，作者使用了中心采样[81]，他们将中心3×3的区域作为正例区域。这种方法使AP增加了2.1点；
解耦头（Decoupled head）。在[82, 83]中显示，分类置信度和定位精度之间可能存在错位。由于这个原因，YOLOX将这两者分离成两个头（如图12所示），一个用于分类任务，另一个用于回归任务，将AP提高了1.1 分，并加快了模型收敛。
高级标签分配。在[84]中，有研究表明，当多个对象的bounding box重叠时，ground truth标签分配可能存在模糊性，并将分配程序表述为最佳传输（OT）问题。YOLOX在这项工作的启发下，提出了一个简化的版本，称为simOTA。这一变化使AP增加了2.3分；
强化增强。YOLOX使用MixUP[85]和Mosaic增强。作者发现，在使用这些增强后，ImageNet预训练不再有好处。强势增强使AP增加了2.4分；

13. YOLOv6

YOLOv6[86]于2022年9月由美团视觉人工智能部发布在ArXiv。与YOLOv4和YOLOv5类似，它为工业应用提供了各种不同尺寸的模型。跟随基于锚点的方法[78, 81]的趋势，YOLOv6采用了无锚点的检测器。该模型的主要创新之处总结如下：

一个基于RepVGG[87]的新骨架，称为EfficientRep，比以前的YOLO骨架使用更高的并行性。对于颈部，他们使用PAN[62] 增强了RepBlocks[87] 或CSPStackRep[61]Blocks ，用于大型模型。而受YOLOX的启发，他们开发了一个高效的解耦头；
使用TOOD[88]中介绍的任务排列学习方法进行标签分配；
新的分类和回归损失。他们使用了一个分类VariFocal损失[89]和一个SIoU[90]/GIoU回归损失；
一个用于回归和分类任务的自我蒸馏策略；
使用RepOptimizer[92]和信道明智蒸馏[93]的检测量化方案，有助于实现更快的检测器。

13.1 YOLOv6结果

在MS COCO数据集test-dev 2017上进行评估，YOLOv6-L在NVIDIA Tesla T4上实现了52.5%的AP和70%的AP50 ，速度约为50 FPS。

14. YOLOv7

YOLOv7[94]由YOLOv4和YOLOR的同一作者于2022年7月发表在ArXiv。当时，在5 FPS到160 FPS的范围内，它的速度和准确度超过了所有已知的物体检测器。与YOLOv4一样，它只使用MS COCO数据集进行训练，没有预训练的骨干。YOLOv7提出了一些架构上的变化和一系列的免费包，在不影响推理速度的情况下提高了准确率，只影响了训练时间。

YOLOv7的架构变化是：

扩展高效层聚合网络（E-ELAN）。ELAN[95]是一种策略，通过控制最短的最长梯度路径，让深度模型更有效地学习和收敛。YOLOv7提出的E-ELAN适用于具有无限叠加计算块的模型。E-ELAN通过洗牌和合并cardinality结合不同组的特征，在不破坏原始梯度路径的情况下增强网络的学习；
基于串联的模型的模型缩放。缩放通过调整一些模型属性来生成不同大小的模型。YOLOv7的架构是一个基于串联的架构，其中标准的缩放技术，如深度缩放，导致过渡层的输入通道和输出通道之间的比例变化，这反过来又导致了模型的硬件使用量的减少。YOLOv7提出了一种新的基于串联模型的缩放策略，其中块的深度和宽度以相同的因素进行缩放，以保持模型的最佳结构。

YOLOv7中使用的bag-of-freebies包括：

计划中的重新参数化卷积。和YOLOv6一样，YOLOv7的架构也是受到重新参数化卷积（RepConv）的启发[87]。然而，他们发现RepConv中的身份连接破坏了ResNet[53]中的残差和DenseNet[96]中的串联。出于这个原因，他们删除了身份连接，并称之为RepConvN；
对辅助头进行粗略的标签分配，对主导头进行精细的标签分配。主导头负责最终输出，而辅助头则协助训练；
conv-bn-activation中的批量归一化。这将批量归一化的平均值和方差整合到推理阶段的卷积层的偏置和权重中；
YOLOR[77]中启发的隐性知识；
指数移动平均线作为最终推断模型。

14.1 与YOLOv4和YOLOR的比较

在这一节中，我们强调了YOLOv7与同一作者以前开发的YOLO模型相比的改进之处。

与YOLOv4相比，YOLOv7实现了参数减少75%，计算量减少36%，同时平均精度（AP）提高了1.5%。与YOLOv4-tiny相比，YOLOv7-tiny设法将参数和计算量分别减少39%和49%，同时保持相同的AP。最后，与YOLOR相比，YOLOv7的参数数量和计算量分别减少了43%和15%，同时AP也略微增加了0.4%。

14.2 YOLOv7结果

在MS COCO数据集test-dev 2017上评估，YOLOv7-E6在输入尺寸为1280像素的情况下，在NVIDIA V100上取得了55.9%的AP和73.5%的AP50 ，速度为50 FPS。

15. DAMO-YOLO

DAMO-YOLO[97]由阿里巴巴集团于2022年11月发表在ArXiv。受到当前技术的启发，DAMO-YOLO包括以下内容：

一个神经架构搜索（NAS）。他们使用了阿里巴巴开发的一种叫做MAE-NAS[98]的方法来自动寻找一个有效的架构；
一个大的颈部。受GiraffeDet[99]、CSPNet[61]和ELAN[95]的启发，作者设计了一个可以实时工作的脖子，称为Efficient-RepGFPN；
一个小头。作者发现，大头和小头能产生更好的性能，他们只留下一个线性层用于分类，一个用于回归。他们把这种方法称为ZeroHead；
AlignedOTA标签分配。动态标签分配方法，如OTA[84]和TOOD[88]，由于比静态方法有明显的改进，已经得到普及。然而，分类和回归之间的错位仍然是一个问题，部分原因是分类和回归损失之间的不平衡。为了解决这个问题，他们的AlignOTA方法在分类成本中引入了焦点损失[75]，并使用预测和ground truth的IoU作为软标签，使每个目标都能选择对齐的样本，并从全局角度解决这个问题；
知识的提炼。他们提出的策略包括两个阶段：教师在第一阶段指导学生，学生在第二阶段独立进行微调。此外，他们在蒸馏方法中加入了两项增强功能：对齐模块，它将学生的特征调整为与教师的特征相同的分辨率，以及通道动态温度，它将教师和学生的特征归一化，以减少实际价值差异的影响；

作者生成了名为DAMO-YOLO-Tiny/Small/Medium的比例模型，在NVIDIA V100上，最佳模型在233 FPS下的AP达到了50.0%。

16. YOLOv8

YOLOv8[100]由开发YOLOv5的公司Ultralytics于2023年1月发布。由于在撰写本文时，还没有关于YOLOv8的论文，我们需要深入了解与其他YOLO版本相比的架构决策。按照目前的趋势，YOLOv8是无锚的，减少了箱体预测的数量，加快了非极大值抑制（NMS）的速度。此外，YOLOv8在训练过程中使用了马赛克增强功能；但是，由于已经发现如果在整个训练过程中使用这种增强功能可能是有害的，所以在最后10个epoch中禁用了这种功能。

YOLOv8可以从命令行界面（CLI）运行，也可以作为一个PIP包安装。此外，它还配备了多个用于贴标、培训和部署的集成。

YOLOv8 提供了五个版本： YOLOv8n（纳米级）、YOLOv8s（小型）、YOLOv8m（中型）、YOLOv8l（大型）和YOLOv8x（特大型）。

16.1 YOLOv8结果

在MS COCO数据集test-dev 2017上进行评估，YOLOv8x在图像大小为640像素的情况下实现了53.9%的AP（相比之下，YOLOv5在相同的输入大小上为50.7%），在NVIDIA A100和TensorRT上的速度为280 FPS。

17. PP-YOLO、PP-YOLOv2和PP-YOLOE

PP-YOLO模型一直在与我们描述的YOLO模型平行发展。然而，我们决定将它们归为一个部分，因为它们从YOLOv3开始，一直在逐步改进以前的PP-YOLO版本。尽管如此，这些模型在YOLO的发展过程中还是很有影响力的。与YOLOv4和YOLOv5相似的PP-YOLO[76]是基于YOLOv3的。它于2020年7月由百度公司的研究人员发表在ArXiv上。该作者使用了PaddlePaddle[101]深度学习平台，因此它的PP名称。遵循我们从YOLOv4开始看到的趋势，PP-YOLO增加了十个现有的技巧来提高检测器的准确性，保持速度不变。根据作者的说法，本文的目的不是要介绍一个新的物体检测器，而是要展示如何一步一步地建立一个更好的检测器。PP-YOLO使用的大部分技巧都与YOLOv4中使用的技巧不同，重合的技巧使用了不同的实现。PP-YOLO关于YOLOv3的变化是：

ResNet50-vd骨干网取代了DarkNet-53骨干网，其架构在最后阶段增加了可去形成的卷积[102]，并提炼出预训练模型，在ImageNet上具有更高的分类精度。这个架构被称为ResNet5-vd-dcn；
更大的批次规模以提高训练的稳定性，他们从64个到192个，同时更新了训练计划和学习率；
对训练过的参数保持移动平均数，并使用它们来代替最终的训练值；
DropBlock只适用于FPN；
在另一个分支中增加了一个IoU损失，以及用于边界盒回归的L1损失；
增加了一个IoU预测分支，以衡量定位精度和IoU感知损失。在推理过程中，YOLOv3乘以分类概率和客观性分数来计算最终的检测结果，PP-YOLO也乘以预测的IoU来考虑定位精度；
类似于YOLOv4的网格敏感方法被用来改善网格边界的包围盒中心预测；
矩阵NMS[103]被使用，它可以并行运行，使得它比传统的NMS更快；
CoordConv[104]用于FPN的1×1卷积，并用于检测头的第一个卷积层。CoordConv允许网络学；
空间金字塔集合法只用于顶部特征图，以增加骨干的感受野。

17.1 PP-YOLO的增量和预处理

PP-YOLO使用了以下增强和预处理：

混合训练[85]，权重从Beta(α, β)分布中取样，其中α = 1.5，β = 1.5；
随机色彩失真；
随机展开；
随机裁剪和随机翻转，概率为0.5；
RGB通道的z-score规范化，其平均值为[0.485, 0.456, 0.406]，标准偏差为
[0 . 229 , 0 . 224 , 0 . 225]；
从[320, 352, 384, 416, 448, 480, 512, 544, 576, 608]中均匀地抽取多种图像尺寸。

17.2 PP-YOLO结果

在MS COCO数据集test-dev 2017上进行评估，PP-YOLO在NVIDIA V100上取得了45.9%的AP和65.2%的AP50，73 FPS。

17.3 PP-YOLOv2

PP-YOLOv2[105]于2021年4月发表在ArXiv上，对PP-YOLO增加了四项改进，在NVIDIA V100上69FPS时，性能从45.9%AP提高到49.5%AP。PP-YOLOv2关于PP-YOLO的变化如下：

骨干网从ResNet50改为ResNet101；
路径聚合网络（PAN）而不是类似于YOLOv4的FPN；
Mish激活函数。与YOLOv4和YOLOv5不同，他们只在检测颈部应用mish激活函数，以保持骨干的ReLU不变；
较大的输入尺寸有助于提高小物体的性能。他们将最大的输入尺寸从608扩大到768，并将每个GPU 的批量大小从24张图像减少到12张。输入尺寸从[320, 352, 384, 416, 448, 480, 512, 544, 576, 608, 640, 672, 704, 736, 768]中均匀抽取；
一个修改过的IoU意识到的分支。他们修改了使用软标签格式而不是软权重格式的IoU意识到的损失计算方法。

17.4 PP-YOLOE

PP-YOLOE[106]于2022年3月在ArXiv发表。它在PP-YOLOv2的基础上增加了改进，在NVIDIA V100上实现了51.4%的AP，78.1 FPS的性能。PP-YOLOE关于PP-YOLOv2的主要变化是：

无锚。在[81, 80, 79, 78]的工作推动下，PP-YOLOE使用了一个无锚的架构；
高效任务排列头（ET-head）。与YOLOX的分类头和位置头解耦不同，PP-YOLOE反而使用了基于TOOD的单一头，以提高速度和准确性；
任务对准学习（TAL）。YOLOX是第一个提出任务错位问题的人，在这种情况下，分类置信度和定位准确度并不一致。为了减少这个问题，PP-YOLOE实施了TOOD[88]中提出的TAL，其中包括动态标签分配与任务对齐损失相结合；
新的骨干和颈部。受TreeNet[107]的启发，作者用RepResBlocks修改了骨干和颈部的结构，结合了剩余和密集连接；
Varifocal（VFL）和Distribution focal loss（DFL）。VFL[89]使用目标分数对阳性样本的损失进行加权，对那些具有高IoU的样本给予更高的权重。这在训练过程中优先考虑了高质量的样本。同样，两者都使用IoU意识到的分类分数（IACS）作为目标，允许分类和定位质量的联合学习，导致训练和推理之间的一致性。另一方面，DFL[108]将Focal Loss从离散标签扩展到连续标签，使结合质量估计和类别预测的改进表征成功优化。这使得真实数据中的灵活分布得到了准确的描述，消除了不一致的风险。

和以前的YOLO版本一样，作者通过改变背脊和颈部的宽度和深度，生成了多个比例的模型。这些模型被称为PP-YOLOE-s（小型）、PP-YOLOE-m（中型）、PP-YOLOE-l（大型）和PP-YOLOE-x（特大型）。

18. 讨论

本文研究了15个YOLO版本，从最初的YOLO模型到最新的YOLOv8。表4提供了所讨论的YOLO版本的概况从这个表中，我们可以确定几个关键的模式：

锚Anchor：最初的YOLO模型相对简单，没有采用锚点，而最先进的模型则依赖于带有锚点的两阶段检测器。YOLOv2采用了锚点，从而提高了边界盒的预测精度。这种趋势持续了五年，直到YOLOX引入了一个无锚的方法，取得了最先进的结果。从那时起，随后的YOLO版本已经放弃了锚的使用；
框架：最初，YOLO是使用Darknet框架开发的，后续版本也是如此。然而，当Ultralytics将YOLOv3 移植到PyTorch时，其余的YOLO版本都是使用PyTorch开发的，导致了增强功能的激增。另一个利用的深度学习语言是PaddlePaddle，一个最初由百度开发的开源框架；
骨干Backbone：YOLO模型的骨干架构随着时间的推移发生了重大变化。从由简单的卷积层和最大集合层组成的Darknet架构开始，后来的模型在YOLOv4中加入了跨阶段部分连接（CSP），在YOLOv6和YOLOv7中加入了重新参数化，并在DAMO-YOLO中加入了神经架构搜索；
性能：虽然YOLO模型的性能随着时间的推移有所提高，但值得注意的是，它们往往优先考虑平衡速度和准确性，而不是只关注准确性。这种权衡是YOLO框架的一个重要方面，允许在各种应用中进行实时物体检测。

18.1 在速度和准确性之间进行权衡

YOLO系列的物体检测模型一直专注于平衡速度和精度，旨在提供实时性能而不牺牲检测结果的质量。随着YOLO框架在各种迭代中的发展，这种权衡一直是一个反复出现的主题，每个版本都试图以不同的方式优化这些相互竞争的目标。在最初的YOLO模型中，主要重点是实现高速物体检测。该模型利用单一的卷积神经网络（CNN）直接预测输入图像中的物体位置和类别，实现实时处理。然而，这种对速度的强调导致了准确性的妥协，主要是在处理小物体或具有重叠边界盒的物体时。

随后的YOLO版本在保持框架的实时性的同时，引入了完善和增强功能来解决这些限制。例如，YOLOv2（ YOLO9000）引入了锚定框和穿透层，以改善物体的定位，从而提高精确度。此外，YOLOv3通过采用多尺度特征提取架构增强了模型的性能，允许在不同尺度上进行更好的物体检测。

随着YOLO框架的发展，速度和准确性之间的权衡变得更加微妙。YOLOv4和YOLOv5等模型引入了创新，如新的网络主干、改进的数据增强技术和优化的训练策略。这些发展导致了准确度的显著提高，但并没有大幅影响模型的实时性能。

从Scaled YOLOv4开始，所有官方的YOLO模型都对速度和精度之间的权衡进行了微调，提供不同的模型比例以适应特定的应用和硬件要求。例如，这些版本通常提供为边缘设备优化的轻量级模型，用精度换取降低的计算复杂性和更快的处理时间。

19 YOLO的未来

随着YOLO框架的不断发展，我们预计以下趋势和可能性将决定未来的发展：

纳入最新技术。研究人员和开发人员将继续利用深度学习、数据增强和训练技术的最先进方法来完善YOLO架构。这种持续的创新过程可能会提高模型的性能、稳健性和效率。

基准的演变。目前用于评估物体探测模型的基准，即COCO 2017，最终可能会被一个更先进、更具挑战性的基准所取代。这反映了前两个YOLO版本中使用的VOC 2007基准的转变，反映了随着模型越来越复杂和准确，需要更多的基准。

YOLO模型和应用的激增。随着YOLO框架的发展，我们预计每年发布的YOLO模型的数量会增加，同时应用也会相应地扩大。随着该框架变得更加通用和强大，它可能会被应用于更多不同的领域，从家用电器设备到自动驾驶汽车。

扩展到新的领域。YOLO模型有可能将其能力扩展到物体检测和分割之外，分支到视频中的物体跟踪和三维关键点估计等领域。随着这些模型的发展，它们可能成为解决更广泛的计算机视觉任务的新解决方案的基础。

对不同硬件的适应性。YOLO模型将进一步跨越硬件平台，从物联网设备到高性能计算集群。这种适应性将使YOLO模型能够在各种情况下部署，这取决于应用程序的要求和限制。此外，通过定制模型以适应不同的硬件规格，YOLO可以被更多的用户和行业所接受和使用。

Reference：

《A COMPREHENSIVE REVIEW OF YOLO: FROM YOLOV1 TO YOLOV8 AND BEYOND 》

你可能感兴趣的:(#,目标检测,深度学习算法与框架,YOLO,计算机视觉,目标检测)

2023-05-06 知行合一1314
中原焦点团队，网初23+网初37+网中37期坚持分享第661天，本周约练1场,共56场当例外难以被发掘时，运用奇迹问句来帮助当事人形成愿景与解决之道，会是很有用的技巧。咨询师记得探问奇迹发生时之人、事、时、地、物的相关细节，让奇迹的愿景在当事人心中明朗、鲜明化，此将可帮助当事人产生盼望与方向。接着，咨询师便可以运用奇迹问句的内容，帮助当事人找寻与形成具体的小目标。奇迹问句使愿景与现今生活产生连结，
高通平台camera构架sensor驱动详解 a55662551 android camera 驱动 v4l2
1.Sensor驱动的基本概念与流程Sensor驱动的作用：Sensor驱动是Camera硬件与CamX框架之间的桥梁，负责控制Sensor的启动、数据采集、寄存器配置以及与图像处理单元（如IFE、BPS）的交互。通俗理解：就像工厂的“原料采集工”，负责从摄像头传感器（如CMOS）获取原始图像数据，并将数据传递到流水线（Pipeline）中进行加工。数据流关键步骤：Sensor初始化：配置电源、时
如何提高社群活跃度小鹿Lula
很多人都在说社群、做社群、但是，却很少有人真正的清楚社群的底层逻辑，下面我们来分享社群的概念。一、社群的定义社群是基于价值观统一的人，聚集形成的群体或组织，是由共同追求、共同理想、共同目标、共同兴趣的人聚集而成的群体。有内容有互动，由多种形式组成。社群实现了人与人、人与物之间的连接，提升了营销和服务的深度，建立起高效的的会员体系，增强了品牌影响力和用户归属感，为企业发展赋予新的驱动力。二、社群的产
黑咖啡的功效与禁忌是什么？经常喝黑咖啡有什么好处？高省张导师
黑咖啡的功效与作用有以下几点买咖啡上高省领取商品隐藏优惠券，优惠完还会返利，让你更省钱！大家好，我是高省APP最大团队，【高省】是一个可省钱佣金高，能赚钱有收益的平台，百度有几百万篇报道，也期待你的加入。高省邀请码520888，注册送2皇冠会员，送万元推广大礼包。给大家推荐一个公主号《张十五笔记》分享引流，思维，认知，项目，干货，讲的非常有用，如果你也想提高自己的思维认知，打开自己的眼界，可以去关
燕子飞时余生惜芳草 9d92492cd808
涉江采芙蓉兰泽多芳草采之欲遗谁所思在远道还顾望旧乡长路漫浩浩同心而离居忧伤以终老逝者长已矣室中更无人此水几时休此恨何时已但愿君心似我心定不负相思意死生契阔与子成说青青子衿悠悠我心燕子飞时绿水人家绕孔雀东南飞，沧海一声笑，燕子归来处，余生惜芳草。此生不再爱任何人。[偷笑]第一杯酒我敬你，感谢你出现在我的生命里，带给我的感动和欢喜，第二杯也敬你，愿你前程似锦从此豁达，有吃有穿有人疼！第三杯还敬你，怀念
为何淘宝天猫商家都愿意亏本做优惠券直播营销活动？氧惠评测
一些卖家现在选择做亏本发放优惠券活动的原因可能有很多，以下是其中一些可能的因素：氧惠APP是与以往完全不同的抖客+淘客app！2024全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（训练营导师每天出单带货几万单）。注册即可享受高补贴+0撸+捡漏等带货新体验。送万元推广大礼包，教你如何1年做到百万团队。珊珊导师氧惠邀请码888999，注册送万元推广大礼包，教你如何1年做到
手撕Spring底层系列之：后置处理器“PostProcessor” Xxtaoaooo Spring底层系列 java 开发语言后端 Spring底层源码剖析
人们眼中的天才之所以卓越非凡，并非天资超人一等而是付出了持续不断的努力。1万小时的锤炼是任何人从平凡变成超凡的必要条件。————马尔科姆·格拉德威目录一、后置处理器的概念1.1核心定义1.2两大核心对比1.3设计价值二、Bean生命周期扩展时机2.1执行步骤与实例化体现三、内置后置处理器解析3.1五大核心处理器职责3.2AOP代理创建流程四、总结嗨，我是Xxtaoaooo！本系列将用源码解剖+拆分
Leetcode3202. 找出有效子序列的最大长度 II
EverydayaLeetcode题目来源：3202.找出有效子序列的最大长度II解法1：动态规划本题是选与不选的子序列问题，可以尝试给出这样的状态定义：dp[i][j]：以nums[i]结尾模k后值为j的最长子序列的长度。那么状态转移方程是怎样的呢？对于每一个i，遍历j（0&nums,intk){intn=nums.size();//dp[i][j]:以nums[i]结尾模k后值为j的最长子序列
如何抉择HTTPS&Proxy？彬彬醤 https 网络协议 http 网络 chatgpt 服务器数据库
HTTPS（超文本传输安全协议）通过TLS/SSL加密保护数据传输，而Proxy（也就是我们常说的网络代理）作为网络中间节点转发请求，二者结合形成“加密传输+灵活转发”的双重保障。这种协同机制的核心价值在于：安全增强：HTTPS加密避免数据被窃听或篡改，代理隐藏真实IP降低直接攻击风险；访问控制：通过代理实现跨地域访问，同时HTTPS确保代理节点与客户端/目标服务器的通信安全。无论是企业跨境数据传
基于按键开源MultiButton框架深入理解代码框架(三)（指针的深入理解与应用）慈悲不渡自绝的人开源项目解读 c语言 arm开发单片机算法 stm32 51单片机
文章目录3、分析代码3.3按键的插入3.4按键的删除3.5继续分析状态机核心理解4、写在最后的总结5、思想感悟篇6、慈悲不渡自绝人3、分析代码3.3按键的插入//ButtonhandlelistheadstaticButton*head_handle=NULL;/***@briefStartthebuttonwork,addthehandleintoworklist*@paramhandle:ta
Kafka深度解析：架构、原理与应用实践 JouJz kafka 架构 linq
Kafka深度解析：架构、原理与应用实践引言在现代分布式系统架构中，消息队列作为系统解耦、异步通信的核心组件发挥着至关重要的作用。而在众多消息队列解决方案中，ApacheKafka凭借其卓越的性能、高吞吐量和可靠性，已成为企业级数据管道的首选技术。本文将深入剖析Kafka的核心架构、工作原理以及实践应用，帮助开发者全面掌握这一强大的分布式消息系统。一、Kafka概述与核心概念1.1Kafka的诞生
gcc 源码分析：从IR-RTL 到汇编输出
在完成了IR-RTL的优化与寄存器分配后就来到汇编代码的输出：实现如下：classpass_final:publicrtl_opt_pass{public:pass_final(gcc::context*ctxt):rtl_opt_pass(pass_data_final,ctxt){}/*opt_passmethods:*/unsignedintexecute(function*)finalov
旖旎感恩日记旖旎漫步
1.感恩一大早我睁开眼睛就去找女儿一起读经！在成长的道路上，我愿意与你携手共进！2.感恩女儿如此的热爱学习，在本次期末考试中实现了自己的目标，得到了梦寐以求的学习标兵！一切一切的美好都源自于自己坚持与努力！3.感恩春天老师倾情分享，相隔十万八千里，我能在微信的这头收到老师的能量传递！4.感恩每一件事情的发生，在心里默默的对她说，yes，是的，我只做当下最值得做的事情！所有一切事情的发生都是来祝福我
云手机隐私保护指南：如何保障账号与数据的云端安全？ Clownseven 智能手机安全
用云手机，担心账号被盗？数据泄露？其实，你不是一个人。只要是把设备和数据放在“云端”，很多人都会下意识问一句：“安全吗？”云手机虽方便，但毕竟是基于虚拟化的云服务，本地可控性差，安全隐患看似无处不在。那么，云手机到底安不安全？如何才能确保账号和数据的云端安全？这篇文章，我们不谈空洞理论，直接从实战角度帮你拆解云手机的隐私保护问题。云手机为什么会有隐私风险？很多人把云手机想得过于“透明安全”，但事实
2021-05-12 零龙881314
虽然自从石三鹰收拢这些人以来，从来也没有做过任何出格的事情，但是也被一些好事者看不下去，认为我们不应该有这样的生活。以至于引起相关部门的调查，但是调查来调查去，我们时刻遵纪守法，与过去的生活已经完全告别，所以正常的调查部门是查不到我们任何事情的。但是，自己这群人的存在毕竟触碰了一些人的某种利益，自然他们也会找这边的麻烦。正常来说，应该找相关部门寻求帮助，维护自己的合法权益。这条路也不是没走过，可是
直返APP：收益与适用人群的探索？氧惠购物达人
在当今数字化的商业环境中，直返APP以其独特的商业模式，逐渐成为电商领域的黑马。这种模式不仅为消费者提供了实实在在的收益，还为商家打开了新的销售渠道。那么，直返APP的收益如何？又适合哪些人群呢？一、直返APP的收益概览直返APP的核心优势在于为消费者提供直接返利。当消费者在直返APP上购买商品时，他们会获得一定比例的现金返还或积分奖励。这种返还机制不仅增加了消费者的购买动力，还为平台带来了持续的
Java Stream流详解
JavaStream流详解：从基础到原理引言：Java8的革命性变化2014年3月发布的Java8是Java语言发展史上的一个里程碑，它引入了一系列改变编程范式的新特性，其中Stream流（java.util.stream.Stream）与Lambda表达式、函数式接口共同构成了函数式编程在Java中的核心实现。这些特性不仅简化了代码编写，更推动Java从命令式编程向函数式编程转型，同时为多核处理
五绝·邀刘十九不来佳纱
文/佳纱红炉今夜酒，谁与话温存？醒看寒窗外，庭无踏雪痕。白居易原玉《问刘十九》绿蚁新醅酒，红泥小火炉。晚来天欲雪，能饮一杯无？
垃圾收集器-Serial 探索java JVM专栏 java jvm Serial GC
1.引言：JVM垃圾收集概述与Serial收集器的定位Java程序员享受的自动内存管理机制主要得益于JVM的垃圾收集器。JVM会自动检测无用对象并释放其占用的内存，避免了手动管理的复杂性和内存泄漏风险。在Java8中，HotSpot虚拟机提供了多种垃圾收集器，其中Serial收集器是最基础、最早期的实现之一。虽然它在现代系统中逐渐被更先进的收集器（如G1、CMS）所取代，但它在某些特定场景下仍然有
船型开关:四脚船型开关内部结构概述:从原理到产品应用指南~ 陈壹~东莞高迪电子人工智能
一、基础机械结构组件四脚功能差异总结‌类型‌‌结构特点‌‌引脚作用‌‌双极开关‌两组独立触点控制火线/零线1-2脚：火线通路；3-4脚：零线通路‌‌带指示灯开关‌增加氖泡灯与限流电阻1-3脚：主开关；2-4脚：指示灯回路‌注：实际接线前需用万用表验证引脚分组，避免因厂商差异导致指示灯常亮或功能异常‌操作机构‌‌翘板（操作按钮）‌：用户按压部分，通过杠杆原理驱动内部触点‌‌转动轴‌：连接翘板与触点系
Java 领域 MyBatis 与数据库连接池的搭配使用 Java技术栈实战 java mybatis 数据库 ai
Java领域MyBatis与数据库连接池的搭配使用关键词：MyBatis、数据库连接池、Java持久层、性能优化、Druid、HikariCP、Spring集成摘要：本文深入探讨Java领域中MyBatis框架与数据库连接池的搭配使用原理和实践。文章从基础概念入手，详细分析MyBatis的工作原理和数据库连接池的核心机制，重点讲解两者如何协同工作以提升应用性能。通过源码解析、性能对比和实际项目案例
IntelliJ IDEA 与 Java 开发的自动化部署方案 Java技术栈实战 java intellij-idea 自动化 ai
IntelliJIDEA与Java开发的自动化部署方案关键词：IntelliJIDEA、Java开发、自动化部署、CI/CD、Docker、Jenkins、Maven/Gradle摘要：本文深入探讨了如何利用IntelliJIDEA这一强大的JavaIDE与现代化工具链实现Java应用的自动化部署。我们将从开发环境配置开始，逐步介绍构建工具集成、持续集成/持续部署(CI/CD)流程搭建、容器化部署
关于父母爱情芸小小
对于我自己父母的爱情，我是一点都不了解，为什么我会起题目为父母爱情呢？是因为一个电视剧，名叫“父母爱情”。讲毛泽东那个时代的事情，一个资产阶级的姑娘和一个离异的身为村官的大老粗结婚，虽然身份是差距很大，但是依旧不影响夫妻两人的感情，从两人之家到七人之家，中间虽然与小姑子吵吵闹闹，但是却依旧很向着自己的小姑子，不许别人欺负她，帮着小姑子去骂那个男人老丁，反而骂醒了老丁，娶了老江的妹妹德华，帮助她完满
Java NLP炼金术：从词袋到深度学习，构建AI时代的语言魔方墨夶 Java学习资料人工智能 java 自然语言处理
一、JavaNLP的“三剑客”：框架与工具链1.1ApacheOpenNLP：传统NLP的“瑞士军刀”目标：用词袋模型实现文本分类与实体识别代码实战：文档分类器的“炼成术”//OpenNLP文档分类器（基于词袋模型）importopennlp.tools.doccat.*;importopennlp.tools.util.*;publicclassDocumentClassifier{//训练模型
Java代码异味终结者：三大神器实战拆解与深度优化墨夶 Java学习资料 java 开发语言
2025年某电商平台因代码异味导致的崩溃事件，让业界震惊——重复代码占项目总量的32%，单个类方法行数超1500行，最终导致日活下降40%。本文通过代码异味检测工具，带你：1秒定位重复代码与魔法数字0误报率识别God类与空方法自动化修复代码异味，减少80%人工检查一、代码异味的科学分类与检测工具选择1.1代码异味的5大死亡陷阱类别典型症状危害等级重复代码相同逻辑在3处以上重复★★★★★God类单类
Java实现端到端加密终极指南：密钥管理与分发的深度解析墨夶 Java学习资料4 java python 开发语言
一、为什么选择Java实现端到端加密？企业级可靠性：Java生态提供BouncyCastle等成熟加密库，支持国密SM2/SM4及国际标准算法。全栈可控：从密钥生成到存储、分发、销毁，全程代码可审计，符合GDPR等安全规范。扩展性强：可集成HSM硬件安全模块，支持密钥轮换策略与前向安全性设计。二、核心代码实战：密钥管理与分发全流程2.1密钥生成与存储（国密SM2算法）importorg.bounc
第四十五章夜半烧烤林纤尘原创
千兮虽知道顾辙并非真正的顾辙，只觉得他好似无所不知，虽然毫无灵力，却绝非寻常之人，此时，见那老者的表情便觉得他定是大有来头。只是如此本事之人，为何要来建安府做管家？但他的目的却不像是自己？他身边如此多异能之士，倘若他想对自己不利，自己还能活到今天吗？他的目的到底在于何处？而长山与长青面面相觑，猜不出个所以然。那四个侍卫更是摸不着头脑头脑。内房里。“我虽记不起公子是具体身份，却也知道公子非凡，还望公
【无标题】 Aczone28 单片机嵌入式硬件
学习记录：初识Linux操作系统与基本命令今天我正式开始学习Linux操作系统，并对Ubuntu有了初步的了解。Ubuntu是基于GNU工程发布的Linux发行版之一，具有开源、自由、安全和高效的特点，是目前主流的Linux系统之一，广泛应用于服务器、开发环境以及日常桌面使用。在实践中，我接触并掌握了一些常用的Linux命令，包括但不限于以下几个方面：文件和目录操作：-ls：查看当前目录下的文件和
好省app可以赚钱挣钱吗,好省app有什么危险吗?真的能赚钱吗? 氧惠评测
好省App是一款线上购物返利平台，用户通过在平台上购物，可以获得一定比例的返利。好省App本身是合法的应用程序，但是在使用过程中需要注意一些可能存在的风险：购物、看电影、点外卖、用氧惠APP！更优惠！氧惠（全网优惠上氧惠）——是与以往完全不同的抖客+淘客app！2022全新模式，我的直推也会放到你下面，送1:1超级补贴(邀请好友自购多少，你就推广得多少，非常厉害)，欢迎各位团队长体验！也期待你的加
封装---统一处理接口与打印错误信息寻觅~流光封装工具前端 javascript 开发语言 typescript
一.简介我在重构代码时突然想到一个想法并实现出来:封装一个统一处理接口与打印错误信息,控制显示错误信息在控制台,接口请求时loading效果展示等等这个只是个人想法,而且比较简略,不太清楚实际工作是否这样写,但是我认为只要有这个想法就要去实现,总比没实现好,欢迎大家的建议与指导介绍我在项目中如何封装一个统一的API请求函数，解决每个接口都要写try...catch的繁琐问题，并实现自动错误日志、t
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag