himarsmty

yolo算法的优缺点分析_【精选推荐】基于深度学习的单阶段目标检测算法研究综述...

DOI:10.12132/ISSN.1673-5048.2019.0100

引用格式

刘俊明,孟卫华. 基于深度学习的单阶段目标检测算法研究综述[J]. 航空兵器, 2020, 27(3): 44-53.

Liu Junming,Meng Weihua. Review on Single-Stage Object Detection Algorithm Based on Deep Learning[J]. Aero Weaponry, 2020, 27(3): 44-53.(in Chinese)

基于深度学习的单阶段目标检测算法研究综述

刘俊明1*, 孟卫华1,2

1.中国空空导弹研究院

2.航空制导武器航空科技重点实验室

摘要

近年来, 深度学习技术推动目标检测算法取得了突破式进展。基于深度学习的目标检测算法可分为两阶段检测算法和单阶段检测算法。相比两阶段检测算法, 单阶段检测算法的结构简单、计算高效, 同时具备不错的检测精度, 在实时目标检测领域中具有较高的研究和应用价值。本文首先回顾了单阶段检测算法的发展历史, 分析总结了相关算法的优缺点, 然后归纳提出了单阶段目标检测算法的通用框架, 接着对框架中的特征提取模块和检测器进行了深入分析, 指出了其对算法性能的影响, 最后对单阶段检测算法的发展趋势进行了展望。

关键词

深度学习; 单阶段目标检测算法; 特征提取; 特征融合; anchor; 损失函数; 人工智能

0 引言

目标检测是计算机视觉领域的重要问题之一, 是完成目标跟踪、场景理解等复杂视觉任务的基础, 在视频监控、智能交通等领域中应用广泛。目标检测的任务是判断图像中是否存在属于指定类别的目标, 如果存在, 则给出目标的类别和位置信息。由于图像中目标的类别、数量、位置、尺度和外观变化较大, 一般而言, 目标检测任务比目标分类任务更具有挑战性。

传统目标检测算法主要致力于解决少数几类目标的检测问题, 如行人检测[1]、红外目标检测[2]。深度学习技术[3], 特别是深度卷积神经网络技术[4]出现以后, 目标检测算法取得了突破式发展, 在Pascal VOC[5,6], MS COCO[7]等大型数据集上已经能够取得不错的检测效果。

深度学习技术带来的进步主要体现在: ①目标检测精度大幅提升; ②单一模型能够检测的目标类别数大幅增长。但深度学习算法运行时需要耗费大量的计算资源, 运行速度一般远低于传统算法。在计算资源受限的条件下, 许多基于深度学习的目标检测算法往往难以达到实时运行的要求。

基于深度学习的目标检测算法分为两阶段检测算法和单阶段检测算法两种, 如图1所示。两阶段检测算法也被称为基于候选区域的目标检测算法, 其将目标检测过程分解为候选区域提取、候选区域分类和候选区域坐标修正三个步骤。单阶段检测算法也被称为基于回归分析的目标检测算法, 其将目标检测问题视为对目标位置和类别信息的回归分析问题, 通过一个神经网络模型可直接输出检测结果。

yolo算法的优缺点分析_【精选推荐】基于深度学习的单阶段目标检测算法研究综述..._第1张图片

图1 基于深度学习的目标检测算法

Fig.1 Object detection algorithm based on deep learning

从本质上而言, 两阶段检测算法包含了两次目标检测的过程, 候选区域提取模块是第一个检测器, 用于检测前景和背景区域; 候选区域分类和坐标修正模块构成了第二个检测器, 用于对第一个检测器的结果进行补充和修正。两阶段检测算法中的两次目标检测过程提升了算法的准确性, 但也增加了模型复杂度, 制约了模型计算效率的提高。单阶段检测算法只包含一次目标检测的过程, 其结构简单、计算效率高, 能够方便地进行端到端的训练, 在实时目标检测领域中有很大的应用潜力。

目前, 基于深度学习的单阶段检测算法仍然存在着不足, 其结构形式、检测精度和检测速度仍然需要进一步提升。近年来, 虽然有不少学者对基于深度学习的目标检测算法进行了梳理总结[8,9,10], 但这些总结主要集中于对目标检测算法的整体框架进行介绍, 对单阶段目标检测算法中关键模块的分析却不足。本文首先回顾了单阶段目标检测算法的发展历程, 然后归纳提出了单阶段检测算法的通用框架, 并对算法中特征提取模块和检测器模块进行深入分析, 最后对单阶段检测算法的发展趋势进行了展望。

1 发展历史

单阶段目标检测算法可以看作是一个回归分析模型, 用于分析输入图像的像素值与图像中目标位置和类别等变量之间的关系。由于图像和目标并不是一一对应的关系, 利用回归分析方法直接预测目标的位置和类别具有一定的难度, 因此, 早期基于深度学习的目标检测算法都是目标检测问题分解为候选区域提取、分类和坐标修正等过程, 如图1(a)所示。图像分类算法和两阶段目标检测算法中回归分析方法对于单阶段目标检测算法的发展都有重要的促进作用。图2时间轴上方展示了单阶段目标检测算法的发展历程, 时间轴下方展示了基于深度学习的分类网络的发展历程。不同单阶段目标检测算法在Pascal VOC数据集和COCO数据集上的性能如表1所示。

yolo算法的优缺点分析_【精选推荐】基于深度学习的单阶段目标检测算法研究综述..._第2张图片

图2 单阶段目标检测算法发展历史

Fig.2 Development history of single-stage object detection algorithm

yolo算法的优缺点分析_【精选推荐】基于深度学习的单阶段目标检测算法研究综述..._第3张图片

2012年, Krizhevsky A利用深度卷积神经网络AlexNet[4]在ILSVRC2012图像分类任务上以明显优于传统算法的成绩获得冠军, 在计算机视觉领域引起了研究深度学习技术的热潮。许多学者开始研究将深度卷积神经网络应用于目标检测任务, 并利用AlexNet构建了DetectorNet[11]、 OverFeat[12]、 R-CNN[13]、 DeepMultiBox[14]、 MultiGrasp[15]等目标检测算法。

DetectorNet和OverFeat是最早提出的基于深度神经网络的目标检测算法, 二者的模型中包含了回归分析的思想。DetectorNet利用神经网络直接预测用于指示目标区域的掩模图像。OverFeat则利用卷积神经网络的特性高效地实现了基于滑动窗方法的图像分类和目标定位。由于算法结构仍然不完善, 这两种算法并未取得突破性进展, 但二者对基于深度学习的目标检测算法研究具有启发性意义。

R-CNN是典型的两阶段目标检测算法, 其使用Selective Search[16]算法生成候选区域, 并利用深度卷积神经网络对候选区域进行分类。在修正候选区域坐标时, R-CNN使用了回归分析方法。具体而言, R-CNN利用全连接网络层实现了从输入特征到候选区域坐标修正系数的映射。修正系数衡量了新坐标相对于初始坐标的偏离程度。这种预测坐标偏离程度不是直接预测坐标绝对值的作法在后续目标检测算法中应用得十分普遍。

DeepMultiBox同样是两阶段目标检测算法, 但不同于R-CNN的是, 其利用卷积神经网络来抽取特征, 并利用全连接层来预测候选区域坐标和类别。在预测目标位置时, DeepMultiBox引入了一系列固定尺寸的矩形框作为预测目标位置的基础。这一机制与R-CNN中候选区域坐标修正模块的预测机制类似。因为尺寸确定以后就不再改变, 这些固定尺寸的矩形框被称为anchor。anchor是基于深度学习的目标检测算法中一个十分重要的机制, 对算法有多方面的提升。

Faster R-CNN[17]算法是对R-CNN算法的改进。该算法利用RPN(Region Proposal Network)生成候选区域。RPN与DeepMultiBox有一定的相似性, 不同的是前者对候选区域坐标和类别的预测过程是通过卷积层实现的。由于卷积操作的特性, 在特征图的不同位置进行预测时可以共享权重。RPN中也引入了anchor机制, 这些anchor以类似于卷积操作的方式在特征图的每个位置上共享。

MultiGrasp[15]是利用AlexNet构造的单阶段目标检测算法, 可用于预测图像中物体的可握持区域。MultiGrasp将图像分为7×7的网格, 然后预测网格每个单元对应的图像区域内是否存在可握持物体, 以及可握持区域的位置。

YOLO[18]是第一个在检测精度、检测速度上都取得不错效果的单阶段目标检测算法, 其模型结构如图3所示。YOLO算法的核心思想类似于MultiGrasp, 但与后者不同的是, YOLO算法中增加了分类器, 并重新设计了损失函数, 使得算法能够检测多种类别的目标, 此外, YOLO算法中还包含了重新设计的特征提取网络。由于高效的检测机制和网络结构, YOLO算法是深度学习领域中第一个可以实时运行的目标检测算法, 受到了广泛关注。

yolo算法的优缺点分析_【精选推荐】基于深度学习的单阶段目标检测算法研究综述..._第4张图片

图3 YOLO算法模型

Fig.3 Model of YOLO algorithm

在预测目标位置时, YOLO算法没有利用先验信息, 需要直接预测目标的实际位置, 使得其对目标的定位精度相对较差。此外, YOLO算法在预测每个单元格对应的检测结果时, 要求目标中心点必须位于该单元格内部。这一作法对算法的预测过程施加了较强的空间约束, 使得算法对成群出现的小目标检测效果较差。

SSD[19]是另一个受到广泛关注的单阶段目标检测算法, 其网络结构如图4所示。SSD算法与YOLO算法的不同之处主要体现在两方面。首先, SSD利用多个不同尺度的特征图进行目标检测, 提升了算法对不同尺度目标的检测能力。其次, SSD采用了与RPN网络中类似的目标预测机制。与YOLO算法相比, 这种机制有三点优势: ① 使用卷积层实现对目标位置和类别的预测, 参数量和计算量相对较小; ② 没有对目标检测过程施加空间限制, 能够检测成群出现的小目标; ③ 使用了多个尺寸的anchor作为目标位置的先验信息。因此, SSD算法的检测精度和运行速度都优于YOLO。

yolo算法的优缺点分析_【精选推荐】基于深度学习的单阶段目标检测算法研究综述..._第5张图片

图4 SSD算法模型

Fig.4 Model of SSD algorithm

YOLO和SSD是两种使用较为广泛的单阶段目标检测算法。研究者针对这两种算法作了很多改进。

针对YOLO算法的缺点, YOLO研究者提出了YOLOv2[20]算法, 主要改进内容包括: 采用了新的全卷积特征提取网络Darknet-19; 使用2个不同尺度的特征进行目标检测; 引入了anchor机制; 使用了多尺度训练机制。YOLOv2算法的运行速度和检测精度相比YOLO都有了明显提升。在VOC2007数据集上, YOLOv2的性能与SSD512相当, 但前者的运行速度是后者的3.5倍。

YOLOv3[21]对YOLOv2进行了改进: 采用了更深层的特征提取网络Darknet-53; 使用了3个尺度的特征进行目标检测, 同时增加了anchor数量。由于模型结构更加复杂, YOLOv3相比YOLOv2检测速度有所降低, 但检测精度有明显提升, 对小目标的检测效果也有明显改善。

对于SSD算法, 研究者同样作了多方面的改进。其中DSSD[22]、 F-SSD[23]和R-SSD[24]等都是对神经网络中不同特征的融合方式进行了改进, 并取得了不错的效果。RetinaNet[25]是在SSD目标检测算法框架下一项具有重要意义的算法。相比SSD算法, RetinaNet使用特征金字塔网络[26](Feature Pyramid Network, FPN)构建了用于目标检测的多尺度特征, 并提出了新型损失函数, 显著提高了目标检测算法的准确性。

2018年, Law H等借鉴了人体姿态估计算法的一些设计思想, 提出基于关键点的目标检测算法CornerNet[27]。CornerNet将目标检测过程视为预测目标所在矩形框的左上角点和右下角点的过程, 并取得了非常好的效果。

单阶段目标检测算法虽然晚于两阶段目标检测算法出现, 但凭借结构简单、计算高效的特点受到了许多研究者的关注, 发展十分迅速。早期的单阶段目标检测算法往往运行速度较快, 但检测能力与两阶段检测算法有较大差距。目前的单阶段目标检测算法在保持较快速度的同时, 检测能力已经达到与两阶段目标检测算法相当的水平。同时, 单阶段目标检测算法在发展过程中已经成了一个相对固定的框架结构, 有助于研究者从不同方面对其进行研究改进。

2 算法框架

基于深度学习的单阶段目标检测算法的主体结构是一个可以进行端到端训练的深度神经网络。根据对目前单阶段目标检测算法的分析, 将单阶段目标检测模型分解为特征提取和目标检测两个模块。其中, 特征提取模块负责从输入图像中提取特征, 目标检测模块则利用提取的特征对目标位置和类别进行预测, 如图5所示。

yolo算法的优缺点分析_【精选推荐】基于深度学习的单阶段目标检测算法研究综述..._第6张图片

图5 基于深度学习的单阶段目标检测算法框架

Fig.5 Framework of single-stage object detection algorithm based on deep learning

特征提取模块包含两部分: 特征提取网络和辅助网络。特征提取网络一般由图像分类网络改造而成, 这样可以利用在图像分类数据集上预训练的权重, 实现迁移学习效果。辅助网络用于对特征提取网络输出的特征进行变换、融合等操作。

目标检测模块一般由若干全连接层或卷积层构成, 每个全连接层或者卷积层可以看作若干检测器的集合。每个检测器只能输出1个检测结果, 检测器的数量决定了算法可检测目标数量的上限。

每个检测器由1个定位器和1个分类器组成。定位器负责将输入特征映射为目标位置信息, 分类器负责将输入特征映射为目标类别信息。目前, 目标位置信息常用目标外接矩形框的中心点坐标、宽度和高度表示, 记为x,y,w,h; 目标类别信息用cj(j∈[0, 1, 2, …, N-1])表示, 其中N是目标类别数量。

不同单阶段目标检测算法的区别在于以下三个方面: ① 特征提取网络不同; ② 特征选择和融合策略不同; ③ 检测器不同。其中, 前两个方面都与特征相关。

与图像分类领域类似, 许多目标检测算法都倾向于使用更深的特征提取网络, 使用更多数量的特征来提升检测精度。一般情况下, 这样的做法会大幅增加模型的计算量, 但只能得到相对较小的性能提升。

检测器直接关乎目标检测结果的输出, 是单阶段目标检测算法中的核心部件。不同类型的目标检测算法可能在检测器的数量、 anchor机制、构造形式、预测机制、匹配机制、损失函数等方面存在差别。

下面对单阶段目标检测算法中的特征提取网络、特征选择和融合策略以及检测器进行论述。

3 特征提取模块

3.1 特征提取网络

作为深度学习领域的一项基础性技术, 深度神经网络近年来发展很快[28]。图2中时间轴下方展示了历年来一些典型的深度神经网络模型, 这些模型在ImageNet数据集上的分类性能和计算量如表2所示。由图2和表2可知, 在AlexNet出现之后的最初几年内, 许多大规模的深度神经网络模型被提出来。与AlexNet相比, 这些模型分类错误率明显降低, 但计算量也有较大增长。另一方面, 为了促进深度学习技术在移动设备、嵌入式设备等平台上的应用, 网络规模更小、计算量更低的轻量级网络也成为深度神经网络发展的一个重要方向。

yolo算法的优缺点分析_【精选推荐】基于深度学习的单阶段目标检测算法研究综述..._第7张图片

深度神经网络模型一般由一定的基本结构单元反复堆叠而成, 各种模型的不同也主要体现在其基本结构单元的不同。图6展示了常见神经网络模型的基本结构单元。其中, AlexNet和VGG[29]都是常规的卷积神经网络, 采用卷积层作为基本结构单元。与AlexNet不同的是, VGG网络只使用了3×3和1×1的卷积核, 并堆叠了更多层的网络。GoogLeNet[30]采用了Network in Network的思想, 其基本结构单元是一个被称为Inception模块的子网络。基于残差学习的思想, He K等[31]在ResNet中引入了跨越不同网络层的捷径连接。捷径连接有助于增强信息在不同网络层之间的流动, 缓解深度模型训练中的过拟合问题。DenseNet[32]则将捷径连接更广泛地应用在深度神经网络的构建过程中, 但不同于ResNet的是, DenseNet中的捷径连接采用了通道串接的方式, 而不是对应元素相加的方式, 这有助于促进特征的再利用, 降低模型参数量。

yolo算法的优缺点分析_【精选推荐】基于深度学习的单阶段目标检测算法研究综述..._第8张图片

图6 不同深度神经网络的基本结构单元

Fig.6 Basic modules of some deep neural networks

逐层可分离卷积[33]是近年来轻量级神经网络发展过程中的一项重要技术, 其将卷积过程分解为逐层卷积和驻点卷积。相比常规卷积过程, 逐层可分离卷积的计算量和参数量更少。

MobileNet[34]使用逐层可分离卷积替代常规卷积构, 建了一个轻量级神经网络模型, 其分类性能与VGG和GoogLeNet等网络性能相当, 但参数量和计算量明显降低。MobileNetV2[35]在MobileNet的基础上, 增加了捷径连接, 构建了残差学习模块, 进一步提升了网络的分类准确性。在SSD目标检测算法框架中, 使用MobileNetV2作为特征提取网络取得的性能与MobileNet相当, 但模型的参数量仅为后者的83%, 计算量仅为后者的62%。

ShuffleNet[36]将分组卷积、逐层卷积和通道次序打乱这三种操作引入到残差模块中。其中, 分组卷积是将输入矩阵在通道方向上划分为若干组之后, 分别进行卷积运算, 然后将相应的输出矩阵在通道方向上串接。逐层卷积是分组卷积的一种特殊情况, 即分组数等于通道数。通道次序打乱则是将输入矩阵在通道方向上随机打乱后再进行后续计算。ShuffleNet可通过一系列超参数控制模型规模, 当模型计算量与MobileNet相当时, ShuffleNet的分类错误率更低。ShuffleNetV2[37]在ShuffleNet的基础上, 考虑了内存存取成本等影响模型运算速度的因素, 重新设计基本结构单元, 进一步提升了模型的效率。

3.2 特征选择和融合策略

深度卷积神经网络可以从图像中提取层次化的特征, 其中低层网络输出的是简单几何特征, 高层网络输出的是抽象语义特征[38]。由于需要同时预测目标的位置和类别, 目标检测模型既需要几何特征, 也需要语义特征。

随着网络层数的增加, 神经网络的下采样率一般逐渐增大, 特征图的分辨率也越来越小。为提升算法对多尺度目标的检测能力, 单阶段目标检测算法一般会利用多个尺度的特征图进行预测。其中的特征选择和融合操作一般通过特征提取模块中的辅助网络实现。

单阶段目标检测算法的典型特征选择和融合策略如图7所示。其中, 图7(a)基于特征提取网络最顶层的特征进行目标检测, 如YOLO算法。图7(b)基于特征提取网络自底向上生成的多个特征图分别进行目标检测, 如SSD算法。图7(c)基于特征提取网络生成的特征图, 采用自顶向下的方式重新构建一套融合的特征图, 代表算法是RetinaNet、 FPN和DSSD。YOLOv2和YOLOv3算法也采用这种策略, 不过使用了较少的特征图。图7(d)基于特征提取网络生成的特征图, 采用自底向上的方式重新构建了一套融合的特征图, 代表算法是FSSD。

yolo算法的优缺点分析_【精选推荐】基于深度学习的单阶段目标检测算法研究综述..._第9张图片

图7 特征选择与融合策略

Fig.7 Feature selection and fusion strategy

通过对比不同的算法发现, 目标越小, 对特征图分辨率的要求越高; 使用多尺度特征进行目标检测较使用单个尺度的特征效果好; 使用融合的特征较使用独立的特征效果好。但从另一方面说, 增加特征的数量, 对更多特征进行融合虽然会促进算法检测能力的提升, 但也增加了模型中的参数量和计算量, 导致算法的运行速度降低。因此, 设计特征选择与融合策略的关键, 在于利用适当数量的特征和合理的融合机制取得算法性能和算法运行速度之间的平衡。

4 检测器

检测器的功能是根据特征直接输出目标检测结果。从实现形式上看, 检测器的结构十分简单, 但在目标检测算法的训练和测试过程中, 检测器又包含十分复杂的机制, 对神经网络的训练过程和最终性能有重要影响。

检测器包含定位器和分类器, 其中分类器一般较简单, 与图像分类网络中的分类层类似。定位器作为目标检测网络独有的部件, 复杂度较高, 对模型的影响更大。

4.1 构造形式

根据前文的论述可知, 检测器一般有两种构造形式, 分别是全连接层和卷积层。在YOLO, DeepMultiBox等算法中, 使用全连接层构造了检测器。在YOLOv3, SSD和RetinaNet等算法中, 检测器通过卷积层实现。其中YOLOv3使用了1×1的卷积核, 而SSD使用了3×3卷积核。值得注意的是, 全连接层可以看作是一种特殊的卷积层, 其卷积核的尺寸与输入特征的尺寸相同。

表3中列举了目标类别数N=20时, 一些算法的检测器构造信息。通过YOLO与其他三种算法对比发现, 使用卷积层来构造检测器能够在不同空间位置的检测器之间共享参数, 极大地减少参数量。另外, YOLOv3拥有较多的检测器, 参数数量却少于SSD。这是因为YOLOv3的检测器是在较大的特征图中通过卷积构造实现, 参数共享程度高, 而SSD算法是在多个较小的特征图中构造检测器, 参数共享程度低。

yolo算法的优缺点分析_【精选推荐】基于深度学习的单阶段目标检测算法研究综述..._第10张图片

4.2 anchor机制

anchor为单阶段目标检测算法提供了目标位置的先验信息。在这些先验信息的基础上, 检测器中的定位器更容易预测目标位置。anchor应当尽可能地贴近真实目标的矩形框尺寸分布。事实上, 两阶段目标检测算法中的候选区域可以理解为动态的anchor。这种动态anchor往往比事先指定的静态矩形框更贴近目标的真实位置, 所以一般情况下, 两阶段目标检测算法的检测效果更好。

在Pascal VOC和COCO等目标检测数据集中, 目标大小和长宽比往往分布在较大的范围中。所以, 一般选用若干不同大小和长宽比的anchor, 促进定位器通过学习来预测不同大小和长宽比的目标, 从而增加定位器的多样性, 增强算法对不同目标的检测能力。

目前一般有两种方式来确定anchor的尺寸。第一种是通过人工选择, 这种方法在SSD, RPN, RetinaNet等算法中有应用。第二种是通过聚类的方法在训练集中选取合适的anchor尺寸, 这种方法在DeepMultiBox和YOLO等算法中有应用。

聚类方法获得的anchor更加符合数据集中目标矩形框的分布情况, 使得算法在训练过程中更容易收敛。而人工选择法要达到同样效果, 一般要选择较多的anchor, 以尽可能覆盖不同尺度和长宽比的目标。

典型目标检测算法中anchor的数量如表4所示。作为对比, YOLOv2中仅使用了5种anchor, 而SSD算法中使用了30种anchor, 但二者的检测精度相当。

yolo算法的优缺点分析_【精选推荐】基于深度学习的单阶段目标检测算法研究综述..._第11张图片

在RetinaNet算法中, 作者研究了anchor数量与算法检测精度之间的关系, 结果如表5所示。这进一步说明, 选用更多的anchor不一定能产生更好的结果。

yolo算法的优缺点分析_【精选推荐】基于深度学习的单阶段目标检测算法研究综述..._第12张图片

4.3 预测机制

检测器的预测机制是指检测器输出值与目标位置和类别信息的预测值之间的映射关系, 即根据检测器输出如何计算目标检测结果。预测机制不同, 检测器的检测能力也不同。

在SSD算法中, 检测器的预测机制可表示为

yolo算法的优缺点分析_【精选推荐】基于深度学习的单阶段目标检测算法研究综述..._第13张图片

SSD算法预测的是目标矩形框相对anchor中心位置和边框尺寸的偏差程度, 这使得算法更容易检测到与anchor形状相似的目标。这种检测机制未对矩形框中心做任何限制, 检测器预测的矩形框可能出现在图像的任意位置, 因此, 图像不同区域的特征可能用于检测同一个目标。

YOLO算法未采用anchor机制, 其检测器的预测机制可用下列公式表达:

yolo算法的优缺点分析_【精选推荐】基于深度学习的单阶段目标检测算法研究综述..._第14张图片

式中: (cx,cy,cw,ch)是定位器所在单元格的左上角的坐标、以及单元格的宽度和高度; t^o是检测器输出的矩形框置信度; W, H是输入图像的宽度和高度; 其他变量的含义与式(1)相同。

YOLO对检测器施加了一定的限制, 使得其预测的矩形框中心必须位于检测器所对应单元格内。同时检测器也需要在较大的搜索空间内预测目标矩形框的尺寸, 难度较大, 这也导致YOLO算法的定位误差较大。

YOLOv2和YOLOv3的预测机制相同, 用公式表示为

yolo算法的优缺点分析_【精选推荐】基于深度学习的单阶段目标检测算法研究综述..._第15张图片

式中: (aw, ah)是anchor的宽度和高度; 其他变量的含义与式(2)相同。anchor机制的引入使得检测器更容易预测目标矩形框的尺寸, 同时YOLOv2和YOLOv3算法还增大了特征图的分辨率和检测器的数量, 使算法的检测效果有了明显提升。

4.4 匹配机制

在单阶段目标检测算法中, 网络模型中有多个检测器, 输入图像中也有多个真实目标, 只有在二者之间建立匹配关系之后才能计算相应损失值, 从而对神经网络进行优化。

从匹配形式来说, 目前有两种。第一种是每个真实目标只与一个检测器匹配, 如YOLO系列算法。第二种是多个检测器可以与同一个目标匹配, 如SSD, Retina等算法。第二种匹配机制使得有多个检测器负责检测同一个目标, 有助于提升检测效果。

从匹配方法来说, 一般也分为两种。在anchor机制出现以前, 一般是通过检测器输出的矩形框来构建匹配关系。如果检测器输出的矩形框与某个真实矩形框的IoU最大或者超过了一定的阈值, 则在二者之间建立匹配关系。在算法训练过程中, 检测器输出的矩形框是动态变化的, 因此在不同迭代步中, 同一个检测器可能匹配到差异较大的目标, 这种匹配机制称为动态匹配机制。动态匹配机制可能造成模型训练过程不稳定, 特别是在早期训练阶段。

在anchor机制出现以后, 一般利用与检测器绑定的anchor计算匹配关系。由于anchor确定以后就不再发生变化, 这种匹配机制称为静态匹配机制。静态匹配机制保证了匹配关系的稳定性, 使得不同检测器根据anchor尺寸和长宽比的不同向着不同方向优化, 保证了检测器的多样性。

4.5 损失函数

检测器与真实目标(正样本)建立了匹配关系之后, 就可以基于检测器输出和真实目标的标记计算损失值。其中分类器的损失值一般用交叉熵损失函数计算。定位器的损失值一般采用均方差(MSE)损失函数或SmoothL1损失函数计算, 二者的差别如图8所示。当误差较大时, 均方差损失函数会产生过大的梯度, 因此一般采用SmoothL1来计算定位器的损失。

yolo算法的优缺点分析_【精选推荐】基于深度学习的单阶段目标检测算法研究综述..._第16张图片

图8 损失函数示意图

Fig.8 Diagram of loss functions

另一个值得注意的问题是大目标和小目标的损失函数。对于同样的尺寸误差, 小目标显然比大目标更敏感, 但是MSE和SmoothL1损失函数并没有考虑这一点。YOLO算法中利用( w^- w)和( h^- h)计算矩形框尺寸的预测值( w^, h^)与真实(w,h)之间的误差, 缓解了这种现象。在基于anchor的预测机制中, 通过为不同尺度的目标设定不同尺度的anchor也可以缓解此问题。

未能与真实目标建立匹配关系的检测器实际上是与背景区域(负样本)建立了匹配关系。对于负样本, 只需计算分类器对应的损失值。但图像中背景区域面积较大, 负样本的数量远大于正样本, 二者之间存在严重的类别不均衡问题。

常规的做法是对负样本进行筛选, 使得正负样本的比例更加均衡。SSD算法利用困难负样本挖掘技术对负样本进行筛选, 使得正样本和负样本的比例保持为1∶3。这使得模型训练更加稳定, 收敛速度更快。

在ReintaNet中, 作者提出了改进的分类器损失函数FocalLoss:

式中: Pt是分类器给出的类别概率; 系数α用于缓解正样本和负样本数量的不均衡问题; 权重(1-pt)γ用于对样本的损失值进行加权, 降低来自容易检测的样本的损失值, 增加来自困难样本的损失值, 如图9所示。在COCO数据集上, ReintaNet的检测精度大幅领先其他单阶段目标检测算法, 甚至比Faster R-CNN算法的检测效果还要好。

yolo算法的优缺点分析_【精选推荐】基于深度学习的单阶段目标检测算法研究综述..._第17张图片

图9 FocalLoss损失函数示意图

Fig.9 Diagram of FocalLoss functions

YOLO系列算法并没有计算来自负样本的分类损失值, 而是利用检测器输出的置信度 t^o来区分正负样本。对于正样本, 置信度 t^o的目标值to为1; 对于负样本, 如果检测器输出的矩形框与任意真实目标矩形框的IoU大于0.5, 则忽略这个预测结果, 否则将目标值to置为0, 然后计算 t^o和to之间的损失值。YOLOv3的这种机制巧妙地解决了负样本的问题, 在实际中取了良好的效果。

5 挑战与展望

本文对基于深度学习的单阶段目标检测算法的研究进展进行了综述, 归纳提出了单阶段目标检测算法的通用框架, 并对算法框架中的特征提取模块和检测器模块进行了深入分析。

综述发现, 基于深度学习的单阶段目标检测算法在短短几年时间里从出现到兴盛, 发展十分迅速。这主要是由于两方面的原因: 一方面单阶段检测算法结构简单、高效, 在实时目标检测领域应用潜力大, 吸引了大量研究者的参与; 另一方面深度神经网络技术发展迅猛, 促进了单阶段目标检测算法性能的提高。目前, 单阶段目标检测算法已经形成了相对固定的算法框架, 并具有以下特点:

(1) 经过预训练的深度神经网络是构建目标检测算法特征提取模块的基础。虽然DSOD[39]等算法的构建可以不依赖预训练模型, 但预训练模型仍具有十分重要的作用, 特别是对于缺乏标记数据的领域。

(2) 充分利用特征提取网络形成的多尺度特征是实现多尺度目标检测的基础。在选择和融合多尺度特征时大多采用沙漏型的网络结构, 即特征图的分辨率先逐渐减小, 再逐渐增大。这种方式有利于不同层级的特征相互融合。

(3) 以YOLO和SSD为代表的单阶段目标检测算法已经发展的较为成熟, 其算法框架中的检测器已经从构造形式、预测机制、匹配机制、损失函数等多方面得到了改进, 但检测器的构造形式、预测机制和损失函数等方面仍然有提升的空间。

从算法性能来看, 单阶段目标检测算法已经具有不错的检测精度和速度, 但是距离实用尚有一段距离。展望未来, 有必要在以下方面展开单阶段目标检测算法的研究:

(1) 研究弱监督或无监督条件下的单阶段目标检测算法, 促进其在标记数据缺乏的领域中应用。

(2) 研究深度神经网络输出的各层级特征与图像中各类目标的联系, 指导构建更高效的特征选择和融合机制, 提升对特征的利用效率, 改善算法运行速度和精度。

(3) 研究新的目标位置表示方法和检测器设计形式。目前普遍采用矩形框表示目标位置, 其中包含了一些背景区域, 对于轮廓模糊或细长的物体, 这种表示方法并不合适。而检测器的形式与目标位置表示具有一定联系。目前的检测器形式已经相对固定, 在算法性能上很难再有大的突破, 有必要构造新的检测器形式, 进一步提升单阶段目标检测算法性能。在这两方面, DOTA数据集[40]和CornerNet算法是两个很好的例子。在前者中, 作者使用斜矩形框来表示目标位置; 在后者中, 作者提出使用矩形框的两个角点表示目标位置, 并构造了新形式的检测器。

(4) 研究更好的定位器损失函数。目前的定位器损失函数没有考虑目标尺度对损失函数的影响, 使得模型对小目标的定位误差不敏感, 需要进行改进。目前已有研究者将改造后的IoU准则作为定位器损失函数对模型进行了优化[41], 提升了模型的性能。

(5) 研究改善单阶段目标检测算法对于小目标的检测能力。目前算法对于小目标的检测能力相对较弱, 但无人机航拍、卫星遥测、红外目标识别等领域对小目标检测有较强的需求。在这些领域中, 有的小目标占据的像素面积小, 例如在红外目标识别、卫星遥测领域中, 目标最小时可能仅占据十几个像素; 有的小目标占据的相对面积较小, 例如在无人机高清航拍过程, 照片分辨率已经达到4K级别。改善对小目标的检测能力, 可以增强单阶段目标检测算法在这些领域的应用价值。

刘俊明(1990-), 男, 河南济源人, 博士研究生, 研究方向为深度学习、红外目标检测。

E-mail：[email protected]

本文已刊登于《航空兵器》2020年第27卷第3期

原文链接

http://www.aeroweaponry.avic.com/CN/10.12132/ISSN.1673-5048.2019.0100

或点击下方

了解更多文章信息~

航空兵器

中文核心期刊

中国科技核心期刊

CSCD来源期刊

yolo算法的优缺点分析_【精选推荐】基于深度学习的单阶段目标检测算法研究综述..._第18张图片

Tel:0379-63385246

E-mail:[email protected]

http://www.aeroweaponry.avic.com

洛阳市030信箱3分箱

编辑：鲁璐

校对：王春录

yolo算法的优缺点分析_【精选推荐】基于深度学习的单阶段目标检测算法研究综述..._第19张图片

你可能感兴趣的:(yolo算法的优缺点分析)

Three.js 实现导出模型文件（.glb,.gltf）功能 GLTFExporter
Three.js提供了导出（.glb,.gltf）文件的APIGLTFExporter用于实现场景内容导出模型文件的功能导出模型文件主要使用parse方法，该方法接收三个参数：1.scene：要导出的场景对象。2.onComplete：解析完成后的回调函数，接收一个参数result，表示解析后的glTF数据。3.options：可选参数，用于配置导出的选项。下面是options的一些常用参数选项：
ECR仓库CloudFormation模板完整指南 ivwdcwso 运维与云原生自动化 aws 运维 ECR CloudFormation 镜像容器
概述本文档详细介绍了一个通用的AmazonECR（ElasticContainerRegistry）仓库CloudFormation模板，该模板支持多业务组、参数化配置，并包含完整的安全策略、生命周期管理和监控功能。模板特性核心功能✅支持4个业务组：app、ai、mall、frontend✅灵活的服务名手动输入✅多环境支持（dev/test/staging/prod）✅自动镜像扫描和安全检查✅生命
[晕事]今天做了件晕事83: pen test mzhan017 英语学习笔记晕事英语学习
这个缩写，就不能顾名思义了，而且pen是一个独立的单词，从读音上来说还容易和pain混淆，所以导致初接触者有些困扰。所以这个pentest的缩写，有些失败。全写是penetrationtest：渗透测试。https://en.wikipedia.org/wiki/Penetration_test修改建议是改成penetest，至少可以和pen在书写上区分，在读音是也可以区分，就读“排你test”。
青少年编程与数学 02-022 专业应用软件简介 24 项目管理工具：Trello
青少年编程与数学02-022专业应用软件简介24项目管理工具：Trello引言一、Trello的发展背景与历程1.1创立初衷1.2被Atlassian收购二、Trello的核心功能与特性2.1看板式任务管理（KanbanBoard）2.2卡片内容丰富性2.3自动化与规则引擎（Butler）2.4团队协作与权限管理三、Trello的应用场景与行业应用3.1软件开发与敏捷项目管理3.2市场营销与内容策
Python通关秘籍之基础教程(一） Smile丶Life丶 Python 通关指南：从零基础到高手之路 python 开发语言后端
引言在编程的世界里，Python就像一位温和而强大的导师，它以简洁优雅的语法和强大的功能吸引着无数初学者和专业人士。无论你是想开发网站、分析数据、构建人工智能，还是仅仅想学习编程思维，Python都是你的理想选择。Python的魅力在于它的易读性和广泛的应用场景。它的代码就像英语句子一样自然，即使是完全没有编程经验的人也能快速上手。同时，Python拥有庞大的生态系统，从Web开发（Django、
Python 包管理工具（uv） cliffordl python python uv 开发语言
Python虚拟环境（conda）Python虚拟环境（venv）Python包管理工具（uv）文章目录1.uv的特点2.安装uv2.1.使用官方推荐方式2.2.使用pip安装（Python>=3.8）2.3.使用conda/mamba安装3.基本使用方法3.1.初始化项目并创建虚拟环境3.1.1.CMD运行结果3.1.2.VScode运行结果3.2.安装依赖3.3.生成依赖文件3.4.使用pyp
探秘阿里云消息队列：解锁分布式系统的异步通信奥秘云资源服务商阿里云云计算中间件
阿里云消息队列：分布式架构的基石在当今数字化快速发展的时代，分布式系统已成为企业构建高可用、高性能应用的关键架构。而消息队列，作为分布式系统中的重要组件，犹如基石一般，支撑着整个架构的稳定运行。它能够有效地解决分布式系统中的异步通信、解耦、削峰填谷等问题，为系统的可靠性和扩展性提供了强大的保障。阿里云作为云计算领域的领军者，其推出的阿里云消息队列凭借着卓越的性能、高可靠性以及丰富的功能，成为了众多
Python协程从入门到精通：9个案例解析yield、gevent与asyncio实战 python_chai Python python 开发语言协程并发 yield生成器 gerrnlet gevent
引言痛点分析：传统多线程在高并发场景下的性能瓶颈。协程优势：轻量级、高并发、低资源消耗。本文目标：通过9个代码案例，系统讲解协程的核心技术和应用场景。目录引言1.协程基础：理解yield生成器1.1yield的暂停与恢复机制1.2生产者-消费者模型实战1.3双向通信：send()方法详解2.手动协程控制：greenlet进阶2.1greenlet的显式切换原理2.2多任务协作案例3.自动化协程：g
数据结构：位图顾小玙数据结构算法
目录问题引入位图定义相关整型位操作疑点位运算C++库里的bitset实现应用优缺点问题引入有一道经典的面试题：有40亿个无序无符号整数，要求你高效判断一个数是否在这堆数中。想法一：暴力查找似乎能够解决问题，但显然找一次就要消耗O(N)的时间，这是不能接受的；想法二：问题的本质是查找，因此想到使用高效的二分查找：先进行一次O(NlogN)的排序，之后的每次查找都只要O(logN)。想法二的改进很不错
多模态大模型发展全景：从架构创新到应用突破陈敬雷-充电了么-CEO兼CTO python 大模型多模态大模型 AIGC 机器学习深度学习 DeepSeek
注：此文章内容均节选自充电了么创始人，CEO兼CTO陈敬雷老师的新书《GPT多模态大模型与AIAgent智能体》（跟我一起学人工智能）【陈敬雷编著】【清华大学出版社】《GPT多模态大模型与AIAgent智能体》新出书籍配套视频【陈敬雷】推荐算法系统实战全系列精品课【陈敬雷】文章目录GPT多模态大模型系列四多模态大模型发展全景：从架构创新到应用突破更多技术内容总结GPT多模态大模型系列四多模态大模型
大模型中标斩获3项第一！百度智能云
今年1-4月，百度智能云在主流大模型厂商中一举拿下三项第一！数量最多！中标项目数量7个！行业最全！覆盖最多行业6个！金额最高！中标金额总数最高5600万+南方电网、泰康保险、北京车网、中华总工会、上海城投污水处理有限公司等行业头部客户，纷纷与百度智能云达成合作，体现出大模型技术在政策、市场的双轮驱动下的强劲增长态势。百度智能云将继续深化与行业客户合作，共同探索大模型技术在各行业的应用场景，推动行业
李彦宏的求真务实：AI领域的生死局，信心从何而来？
文|大力财经据自媒体『划重点』独家报道，李彦宏在季度高管会上，来了一场《求真务实》的内部演讲，还把原文向全员公开，这实在可罕。“不是所有的game百度都能去玩、都能赢，所以要搞清楚该干什么、不该干什么。”李彦宏这话，算是把“求真务实”给点透了。他还直接开炮：“百度为什么打不赢仗？为什么起大早赶晚集？因为我们不聚焦。”他要求百度高管得敢于批评和自我批评，要开诚布公，知道自己几斤几两，还得能指出队友的
c语言逻辑运算符编程,C语言之逻辑运算符详解湛蓝色的迷惘 c语言逻辑运算符编程
一逻辑运算符：&&：逻辑与，读作并且表达式左右两边都为真，那么结果才为真口诀：一假则假||：逻辑或，读作或者表达式左右两边，有一个为真，那么结果就为真口诀：一真则真!:逻辑非，读作取反表达式的结果如果为假，就变成真，如果为真，就变成假口诀：真变假，假变真二逻辑运算符的短路问题tips:非0为真，0为假短路的情况：&&：左边如果为假，则右边短路(右边不会被执行)||：左边如果为真，则右边短路(右边不
C语言正则表达式使用详解
标准的C和C++都不支持正则表达式，但有正则表达式的函数库提供这功能.C语言处理正则表达式常用的函数有regcomp()、regexec()、regfree()和regerror()。使用正则表达式步骤：1)编译正则表达式regcomp()2)匹配正则表达式regexec()3)释放正则表达式regfree()4)获取regcomp或者regexec产生错误，获取包含错误信息的字符串函数声明如下：
PHP安全编程实践系列（三）：安全会话管理与防护策略软考和人工智能学堂 php #php程序设计经验 php 安全开发语言
前言会话管理是Web应用安全的核心环节，不安全的会话实现可能导致用户账户被劫持、敏感数据泄露等严重后果。本文将深入探讨PHP中的会话安全机制，分析常见会话攻击手段，并提供全面的防护策略和实践方案。一、会话安全基础1.1PHP会话机制工作原理理论：PHP会话是通过会话ID（SessionID）在服务器和客户端之间维持状态的一种机制。关键流程包括：会话初始化：session_start()调用会话ID
Python爬虫在社交平台数据挖掘中的应用：深入探索用户互动程序员威哥 python 爬虫数据挖掘
引言社交媒体已经成为全球用户互动的主要平台，每天都有大量的信息生成，用户之间的互动行为如点赞、评论、分享、转发等构成了宝贵的数据资源。如何利用这些互动数据为商业决策、用户行为分析以及产品优化提供支持，已经成为数据科学与大数据分析领域的一个重要课题。Python作为一款强大的编程语言，凭借其丰富的爬虫库和数据分析工具，已经成为挖掘社交平台数据的重要工具。在本文中，我们将通过Python爬虫技术，深入
Python 爬虫实战：精准抓取母婴电商平台数据，深入分析用户评价洞察市场趋势程序员威哥最新爬虫实战项目 python 爬虫开发语言
前言随着生活水平的提高，越来越多的年轻父母开始关注母婴产品的质量和品牌。而母婴电商平台成为了他们选择和购买产品的主要渠道之一。母婴产品市场也因此变得异常活跃且充满竞争。在这样的市场环境下，用户评价不仅反映了产品的实际质量，也揭示了消费者的需求和偏好，成为品牌决策的核心依据之一。Python爬虫是获取电商平台用户评价数据、产品详情、价格等关键信息的强大工具。通过抓取和分析这些数据，品牌商可以实时了解
*Python爬虫应用：从社交媒体数据中提取有价值的用户行为洞察程序员威哥 python 爬虫媒体
引言在现代数字化时代，社交媒体已成为获取用户行为数据的重要来源。每秒钟，数百万条信息在平台上传播，用户的互动行为——点赞、评论、分享、关注等，构成了大量宝贵的行为数据。企业和个人通过分析这些数据，不仅可以理解用户需求、改进产品，还能精准制定营销策略。然而，如何高效地抓取、分析并从中提取有价值的用户行为洞察？这正是Python爬虫和数据分析技术的优势所在。本文将介绍如何利用Python爬虫从社交媒体
Python异步编程终极指南：用协程与事件循环重构你的高并发系统
title:Python异步编程终极指南：用协程与事件循环重构你的高并发系统date:2025/2/24updated:2025/2/24author:cmdragonexcerpt:深入剖析Python异步编程的核心机制。你将掌握：\n事件循环的底层实现原理与调度算法\nasync/await协程的6种高级用法模式\n异步HTTP请求的性能优化技巧（速度提升15倍+）\n常见异步陷阱的26种解决
python 异步编程：协程与 asyncio 花_城 Python 开发语言后端异步协程
文章目录一、协程（coroutine）1.1协程的概念1.2实现协程的方式二、asyncio异步编程2.1事件循环2.2快速上手2.3运行协程2.4await关键字2.5可等待对象2.5.1协程2.5.2任务（Task）2.5.3asyncio.Future三、concurrent.futures.Future（补充）3.1爬虫案例（asyncio+不支持异步的模块）四、asyncio异步迭代器五
Vue3 学习教程，从入门到精通，使用 VSCode 开发 Vue3 的详细指南（3）知识分享小能手前端开发 vue3 网页开发学习前端 javascript vue.js vue3 vue 前端框架
使用VSCode开发Vue3的详细指南本文将详细介绍如何使用VisualStudioCode(VSCode)开发Vue3项目，包括创建项目、打开项目、运行第一个入门程序，并涵盖关键的语法知识点及使用方法。每个知识点都将提供具体的案例代码，并附有详细注释。此外，还将提供一些入门案例，帮助您快速上手Vue3开发。目录准备工作创建Vue3项目在VSCode中打开Vue3项目运行第一个入门程序Vue3关键
【实战派×学院派】32｜上线后一堆优化需求，到底是 Bug 还是改进？郭菁菁 (BA/PM)实战派常踩的坑学院派如何补上 bug 业务分析需求分析 BA
学院派：用Bug/Enhancement分类机制+优化反馈池+二次迭代评审机制，避免优化失控、节奏紊乱你是不是也遇到过这样的场景：“这个报表逻辑不太合理，麻烦调整下。”“那个按钮位置不合适，顺便挪一挪吧。”“这个功能可以加个提醒吗？体验会好一点。”项目刚上线没多久，各路优化意见像潮水一样涌来。最让人头疼的是：到底这些算Bug（缺陷）还是Enhancement（优化改进）？该优先处理哪个？哪些该打回
进阶之App 测试一只舰性能测试
App知识点什么是activityActivity一个应用程序的组件，它提供一个屏幕来与用户交互。Activity:应用程序中，一个Activity就相当于手机屏幕，它是一种可以包含用户界面的组件，主要用于和用户进行交互。一个应用程序可以包含许多活动，比如事件的点击，一般都会触发一个新的Activity。Activity生命周期四种状态:1、运行2、暂停3、停止4、系统回收（killed）Andr
万向节死锁公式推导微小冷机器人欧拉角旋转矩阵万向节万向节死锁旋转轴旋转
文章目录欧拉角的万向节死锁旋转轴欧拉角的万向节死锁如果把刚体的旋转沿着三个旋转轴进行拆分，那么可以变成三个旋转角的叠加，这三个旋转角就是欧拉角，分别对应旋转矩阵，为了书写方便，记Sθ=sin⁡θ,Cθ=cos⁡θS_\theta=\sin\theta,C_\theta=\cos\thetaSθ=sinθ,Cθ=cosθ，则三个旋转矩阵为Rx(θ)R_x(\theta)Rx(θ)Ry(θ)R_y(\
Three.js引擎开发：Three.js动画系统实现_（9）.Three.js中的骨骼动画实现 chenlz2007 游戏开发 javascript nginx 开发语言 vr 性能优化 ecmascript 前端
Three.js中的骨骼动画实现在上一节中，我们介绍了如何在Three.js中加载和显示3D模型。接下来，我们将深入探讨如何在Three.js中实现骨骼动画。骨骼动画是一种高级的动画技术，它通过控制模型的骨骼来驱动模型的动画，广泛应用于虚拟角色的动画制作。在本节中，我们将学习如何在Three.js中实现骨骼动画，包括骨骼动画的基本原理、如何加载带有骨骼的模型、如何创建和控制动画混合器（Animat
虚幻引擎UE5专用服务器游戏开发-19 设置头顶状态条可见性控制 AA陈超虚幻 ue5 游戏引擎 c++游戏服务器
头顶状态条的动态显示控制。状态条会根据与玩家角色的距离（默认300单位）进行自动隐藏，并通过定时器（默认0.2秒频率）持续检测距离变化。当角色由本地玩家控制时，状态条会自动隐藏。代码采用服务器-客户端初始化架构，并包含碰撞设置、组件创建等基础角色配置。Source/Crunch/Public/Character/CCharacter.h：变量：//计时器频率UPROPERTY(EditDefaul
突破性能瓶颈，几个高性能Python网络框架，高效实现网络应用
引言随着互联网和大数据时代的到来，高性能网络应用的需求日益增加。Python作为一种流行的编程语言，在高性能网络编程领域也具有广泛的应用。本文将深入探讨基于Python的几种高性能网络框架，分析它们各自的优势和适用场景，帮助开发者选择最适合自己需求的网络框架这里插播一条粉丝福利，如果你正在学习Python或者有计划学习Python，想要突破自我，对未来十分迷茫的，可以点击这里获取最新的Python
LeetCode 第91题：解码方法
题目描述：一条包含字母A-Z的消息通过以下映射进行了编码1-A......26-Z要特别注意，11106可以映射为AAJF或KJF06不是一个合法编码给你一个只含数字的非空字符串s，请计算并返回解码方法的总数。如果没有合法的方法解码整个字符串，返回0示例1：输入：s="12"输出：2解释：它可以解码为"AB"（12）或者"L"（12）。示例2：输入：s="226"输出：3解释：它可以解码为"BZ"
Python面试题：Python中的异步编程：详细讲解asyncio库的使用超哥同学 Python系列 python 开发语言面试编程
Python的异步编程是实现高效并发处理的一种方法，它使得程序能够在等待I/O操作时继续执行其他任务。在Python中，asyncio库是实现异步编程的主要工具。asyncio提供了一种机制来编写可以在单线程内并发执行的代码，适用于I/O密集型任务。以下是对asyncio库的详细讲解，包括基本概念、用法、示例以及注意事项。1.基本概念1.1协程（Coroutines）协程是一个特殊的函数，它可以被
Fiddler中文版如何提升API调试效率：本地化优势与开发者实战体验汇总代码背锅人日志 ios 小程序 uni-app iphone android webview https
在现代软件开发中，调试网络请求是不可或缺的一环。无论是Web前端、移动App，还是后端微服务，只要涉及到API通信，就离不开高效的抓包工具。Fiddler作为全球使用最广泛的抓包调试工具之一，凭借功能强大、灵活扩展和跨平台支持，深受开发者喜爱。而对于中文用户而言，Fiddler中文版的出现，让这款专业工具变得更加亲民、高效和易于掌握。本文将结合开发者日常使用场景，解析Fiddler中文版如何通过本
mondb入手木zi_鸣 mongodb
windows 启动mongodb 编写bat文件， mongod --dbpath D:\software\MongoDBDATA mongod --help 查询各种配置配置在mongob 打开批处理，即可启动，27017原生端口，shell操作监控端口扩展28017，web端操作端口启动配置文件配置，数据更灵活
大型高并发高负载网站的系统架构 bijian1013 高并发负载均衡
扩展Web应用程序一.概念简单的来说，如果一个系统可扩展，那么你可以通过扩展来提供系统的性能。这代表着系统能够容纳更高的负载、更大的数据集，并且系统是可维护的。扩展和语言、某项具体的技术都是无关的。扩展可以分为两种： 1.
DISPLAY变量和xhost(原创) czmmiao display
DISPLAY 在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.0
获取B/S客户端IP 周凡杨 java 编程 jsp Web 浏览器
最近想写个B/S架构的聊天系统，因为以前做过C/S架构的QQ聊天系统，所以对于Socket通信编程只是一个巩固。对于C/S架构的聊天系统，由于存在客户端Java应用，所以直接在代码中获取客户端的IP，应用的方法为： String ip = InetAddress.getLocalHost().getHostAddress(); 然而对于WEB
浅谈类和对象朱辉辉33 编程
类是对一类事物的总称，对象是描述一个物体的特征，类是对象的抽象。简单来说，类是抽象的，不占用内存，对象是具体的，占用存储空间。类是由属性和方法构成的，基本格式是public class 类名{ //定义属性 private/public 数据类型属性名； //定义方法 publ
android activity与viewpager+fragment的生命周期问题肆无忌惮_ viewpager
有一个Activity里面是ViewPager，ViewPager里面放了两个Fragment。第一次进入这个Activity。开启了服务，并在onResume方法中绑定服务后，对Service进行了一定的初始化，其中调用了Fragment中的一个属性。 super.onResume(); bindService(intent, conn, BIND_AUTO_CREATE);
base64Encode对图片进行编码 843977358 base64 图片 encoder
/** * 对图片进行base64encoder编码 * * @author mrZhang * @param path * @return */ public static String encodeImage(String path) { BASE64Encoder encoder = null; byte[] b = null; I
Request Header简介 aigo servlet
当一个客户端(通常是浏览器)向Web服务器发送一个请求是，它要发送一个请求的命令行，一般是GET或POST命令，当发送POST命令时，它还必须向服务器发送一个叫“Content-Length”的请求头(Request Header) 用以指明请求数据的长度，除了Content-Length之外，它还可以向服务器发送其它一些Headers，如：
HttpClient4.3 创建SSL协议的HttpClient对象 alleni123 httpclient 爬虫 ssl
public class HttpClientUtils { public static CloseableHttpClient createSSLClientDefault(CookieStore cookies){ SSLContext sslContext=null; try { sslContext=new SSLContextBuilder().l
java取反 -右移-左移-无符号右移的探讨百合不是茶位运算符位移
取反：在二进制中第一位，1表示符数，0表示正数 byte a = -1; 原码：10000001 反码：11111110 补码：11111111 //异或: 00000000 byte b = -2; 原码：10000010 反码：11111101 补码：11111110 //异或: 00000001
java多线程join的作用与用法 bijian1013 java 多线程
对于JAVA的join，JDK 是这样说的：join public final void join （long millis ）throws InterruptedException Waits at most millis milliseconds for this thread to die. A timeout of 0 means t
Java发送http请求(get 与post方法请求) bijian1013 java spring
PostRequest.java package com.bijian.study; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURL
【Struts2二】struts.xml中package下的action配置项默认值 bit1129 struts.xml
在第一部份，定义了struts.xml文件，如下所示： <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts
【Kafka十三】Kafka Simple Consumer bit1129 simple
代码中关于Host和Port是割裂开的，这会导致单机环境下的伪分布式Kafka集群环境下，这个例子没法运行。实际情况是需要将host和port绑定到一起， package kafka.examples.lowlevel; import kafka.api.FetchRequest; import kafka.api.FetchRequestBuilder; impo
nodejs学习api ronin47 nodejs api
NodeJS基础什么是NodeJS JS是脚本语言，脚本语言都需要一个解析器才能运行。对于写在HTML页面里的JS，浏览器充当了解析器的角色。而对于需要独立运行的JS，NodeJS就是一个解析器。每一种解析器都是一个运行环境，不但允许JS定义各种数据结构，进行各种计算，还允许JS使用运行环境提供的内置对象和方法做一些事情。例如运行在浏览器中的JS的用途是操作DOM，浏览器就提供了docum
java-64.寻找第N个丑数 bylijinnan java
public class UglyNumber { /** * 64.查找第N个丑数具体思路可参考 [url] http://zhedahht.blog.163.com/blog/static/2541117420094245366965/[/url] * 题目：我们把只包含因子 2、3和5的数称作丑数（Ugly Number）。例如6、8都是丑数，但14
二维数组（矩阵）对角线输出 bylijinnan 二维数组
/** 二维数组对角线输出两个方向例如对于数组： { 1, 2, 3, 4 }, { 5, 6, 7, 8 }, { 9, 10, 11, 12 }, { 13, 14, 15, 16 }, slash方向输出： 1 5 2 9 6 3 13 10 7 4 14 11 8 15 12 16 backslash输出： 4 3
[JWFD开源工作流设计]工作流跳跃模式开发关键点(今日更新) comsci 工作流
既然是做开源软件的,我们的宗旨就是给大家分享设计和代码,那么现在我就用很简单扼要的语言来透露这个跳跃模式的设计原理大家如果用过JWFD的ARC-自动运行控制器,或者看过代码,应该知道在ARC算法模块中有一个函数叫做SAN(),这个函数就是ARC的核心控制器,要实现跳跃模式,在SAN函数中一定要对LN链表数据结构进行操作,首先写一段代码,把
redis常见使用 cuityang redis 常见使用
redis 通常被认为是一个数据结构服务器，主要是因为其有着丰富的数据结构 strings、map、 list、sets、 sorted sets 引入jar包 jedis-2.1.0.jar (本文下方提供下载) package redistest; import redis.clients.jedis.Jedis; public class Listtest
配置多个redis dalan_123 redis
配置多个redis客户端 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&quo
attrib命令 dcj3sjt126com attr
attrib指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的写保护. 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.
Yii使用公共函数 dcj3sjt126com yii
在网站项目中，没必要把公用的函数写成一个工具类，有时候面向过程其实更方便。在入口文件index.php里添加 require_once('protected/function.php'); 即可对其引用，成为公用的函数集合。 function.php如下： <?php /** * This is the shortcut to D
linux 系统资源的查看（free、uname、uptime、netstat） eksliang netstat linux uname linux uptime linux free
linux 系统资源的查看转载请出自出处：http://eksliang.iteye.com/blog/2167081 http://eksliang.iteye.com 一、free查看内存的使用情况语法如下： free [-b][-k][-m][-g] [-t] 参数含义 -b:直接输入free时，显示的单位是kb我们可以使用b(bytes),m
JAVA的位操作符 greemranqq 位运算 JAVA位移 <<>>>
最近几种进制，加上各种位操作符，发现都比较模糊，不能完全掌握，这里就再熟悉熟悉。 1.按位操作符：按位操作符是用来操作基本数据类型中的单个bit,即二进制位，会对两个参数执行布尔代数运算，获得结果。与（&）运算： 1&1 = 1, 1&0 = 0, 0&0 &
Web前段学习网站 ihuning Web
Web前段学习网站菜鸟学习：http://www.w3cschool.cc/ JQuery中文网：http://www.jquerycn.cn/ 内存溢出：http://outofmemory.cn/#csdn.blog http://www.icoolxue.com/ http://www.jikexue
强强联合：FluxBB 作者加盟 Flarum justjavac r
原文：FluxBB Joins Forces With Flarum作者：Toby Zerner译文：强强联合：FluxBB 作者加盟 Flarum译者：justjavac FluxBB 是一个快速、轻量级论坛软件，它的开发者是一名德国的 PHP 天才 Franz Liedke。FluxBB 的下一个版本(2.0)将被完全重写，并已经开发了一段时间。FluxBB 看起来非常有前途的，
java统计在线人数（session存储信息的） macroli java Web
这篇日志是我写的第三次了前两次都发布失败！郁闷极了！由于在web开发中常常用到这一部分所以在此记录一下，呵呵，就到备忘录了！我对于登录信息时使用session存储的，所以我这里是通过实现HttpSessionAttributeListener这个接口完成的。 1、实现接口类，在web.xml文件中配置监听类，从而可以使该类完成其工作。 public class Ses
bootstrp carousel初体验快速构建图片播放 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
img{ border: 1px solid white; box-shadow: 2px 2px 12px #333; _width: expression(this.width > 600 ? "600px" : this.width + "px"); _height: expression(this.width &
SparkSQL读取HBase数据，通过自定义外部数据源 superlxw1234 spark sparksql sparksql读取hbase sparksql外部数据源
关键字：SparkSQL读取HBase、SparkSQL自定义外部数据源前面文章介绍了SparSQL通过Hive操作HBase表。 SparkSQL从1.2开始支持自定义外部数据源(External DataSource)，这样就可以通过API接口来实现自己的外部数据源。这里基于Spark1.4.0，简单介绍SparkSQL自定义外部数据源，访
Spring Boot 1.3.0.M1发布 wiselyman spring boot
Spring Boot 1.3.0.M1于6.12日发布，现在可以从Spring milestone repository下载。这个版本是基于Spring Framework 4.2.0.RC1,并在Spring Boot 1.2之上提供了大量的新特性improvements and new features。主要包含以下： 1.提供一个新的sprin