目标检测综述:基于至今先进深度学习的目标检测模型综述(附综述论文及代码下载)...

关注并星标

从此不迷路

计算机视觉研究院

10b8bddeb8006a84faf2b4713d68c8c1.gif

公众号ID|ComputerVisionGzq

学习群|扫码在主页获取加入方式

目标检测综述:基于至今先进深度学习的目标检测模型综述(附综述论文及代码下载)..._第1张图片

论文地址:https://arxiv.org/pdf/2104.11892.pdf

计算机视觉研究院专栏

作者:Edison_G

目标检测是对图像或视频中的目标进行分类和定位的任务。 由于其广泛的应用,近年来它已获得突出地位。 

01

概述

今天分享中我们调查了基于深度学习的目标检测器的最新发展。还提供了检测中使用的基准数据集和评估指标的简明概述,以及检测任务中使用的一些突出的主干架构。它还涵盖了边缘设备上使用的当代轻量级分类模型。最后,我们比较了这些架构在多个指标上的性能。

目标检测综述:基于至今先进深度学习的目标检测模型综述(附综述论文及代码下载)..._第2张图片

02

背景

  • 问题陈述

目标检测是物体分类的自然延伸,其目的只是识别图像中的物体。目标检测的目标是检测预定义类的所有实例,并通过轴对齐框在图像中提供其粗略定位。检测器应该能够识别目标类的所有实例并在其周围绘制边界框。它通常被视为一个有监督的学习问题。现代目标检测模型可以访问大量标记图像进行训练,并在各种规范基准上进行评估。

  • 目标检测的主要挑战

计算机视觉在过去十年中取得了长足的进步,但仍有一些重大挑战需要克服。网络在现实生活应用中面临的一些关键挑战包括:

目标检测综述:基于至今先进深度学习的目标检测模型综述(附综述论文及代码下载)..._第3张图片

• 类内变化:同一目标的实例之间的类内变化在本质上是相对常见的。这种变化可能是由于各种原因造成的,例如遮挡、照明、姿势、视点等。这些不受约束的外部可能会对目标外观产生巨大影响。预计目标可能具有非刚性变形或旋转、缩放或模糊。一些物体可能有不显眼的环境,使提取变得困难。

• 类别数量:可用于分类的目标类别的绝对数量使其成为一个难以解决的问题。它还需要更多高质量的标签数据,这很难获得。使用更少的示例来训练检测器是一个开放的研究问题。

• 效率:当今的模型需要大量计算资源来生成准确的检测结果。随着移动和边缘设备的普及,高效的物体检测器对于计算机视觉领域的进一步发展至关重要。

03

数据集和评估指标

目标检测综述:基于至今先进深度学习的目标检测模型综述(附综述论文及代码下载)..._第4张图片

db6c0341d84f264c553eb934973bbe53.png

目标检测器使用多个标准来衡量检测器的性能,即每秒帧数 (FPS)、精度和召回率。然而,平均精度(mAP)是最常见的评估指标。精度来自于联合交集(IoU),它是GT实况与预测边界框之间的重叠面积与联合面积的比值。设置阈值以确定检测是否正确。如果IoU大于阈值,则将其分类为True Positive,而IoU低于阈值则将其分类为False Positive。如果模型未能检测到地面实况中存在的对象,则称为假阴性。精度衡量正确预测的百分比,而召回衡量关于基本事实的正确预测。

04

常见主干网络

目标检测综述:基于至今先进深度学习的目标检测模型综述(附综述论文及代码下载)..._第5张图片

05

常见目标检测框架

我们根据两种类型的检测器(两级和单级检测器)划分了这篇评论。然而,我们也讨论了开创性的工作,我们简要检查了一些传统的物体检测器。具有生成区域建议的单独模块的网络称为两阶段检测器。这些模型在第一阶段尝试在图像中找到任意数量的对象建议,然后在第二阶段对它们进行分类和定位。由于这些系统有两个独立的步骤,它们通常需要更长的时间来生成候选,具有复杂的架构并且缺乏全局上下文。

单级检测器使用密集采样在一次过程中对目标进行分类和定位。他们使用各种比例和纵横比的预定义框/关键点来定位目标。它在实时性能和更简单的设计方面超越了两级检测器。

目标检测综述:基于至今先进深度学习的目标检测模型综述(附综述论文及代码下载)..._第6张图片

目标检测综述:基于至今先进深度学习的目标检测模型综述(附综述论文及代码下载)..._第7张图片

06

轻量级网络

近年来形成了一个新的研究分支,旨在为物联网 (IoT) 部署中常见的资源受限环境设计小型高效网络。这种趋势也渗透到了强大的物体检测器的设计中。可以看出,尽管大量目标检测器实现了出色的准确性并实时执行推理,但这些模型中的大多数都需要过多的计算资源,因此无法部署在边缘设备上。

过去,许多不同的方法都显示出令人兴奋的结果。利用高效组件和压缩技术,如修剪、量化、hashing等,提高了深度学习模型的效率。使用经过训练的大型网络来训练较小的模型,称为蒸馏,也显示出有趣的结果。然而,在本节中,我们将探讨一些用于在边缘设备上实现高性能的高效神经网络设计的突出示例。

目标检测综述:基于至今先进深度学习的目标检测模型综述(附综述论文及代码下载)..._第8张图片

目标检测综述:基于至今先进深度学习的目标检测模型综述(附综述论文及代码下载)..._第9张图片

© THE END 

转载请联系本公众号获得授权

9ac7678350a79a65c5572664237baa53.gif

计算机视觉研究院学习群等你加入!

ABOUT

计算机视觉研究院

计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!

VX:2311123606

目标检测综述:基于至今先进深度学习的目标检测模型综述(附综述论文及代码下载)..._第10张图片

往期推荐 

  • Yolov7:最新最快的实时检测框架,最详细分析解释(附源代码)

  • 打假Yolov7的精度,不是所有的论文都是真实可信

  • 最新的目标检测的深度架构 | 参数少一半、速度快3倍+(文末福利)

  • SSD7 | 对嵌入式友好的目标检测网络,产品落地

  • 精度提升方法:自适应Tokens的高效视觉Transformer框架(已开源)

  • ONNX 浅析:如何加速深度学习算法工程化?

  • 劲爆!YOLOv6又快又准的目标检测框架开源啦(附源代码下载)

  • FastestDet:比yolov5更快!更强!全新设计的超实时Anchor-free目标检测算法(附源代码下载)

  • 目前精度最高效率最快存储最小的目标检测模型(附源码下载)

  • CVPR小目标检测:上下文和注意力机制提升小目标检测(附论文下载)

  • Yolo系列的高效更精确的目标检测框架(附源代码)

你可能感兴趣的:(深度学习,目标检测,计算机视觉,人工智能)