经典物体检测框架,Faster RCNN、SSD、YOLO以及扩展

经典物体检测框架

文章目录

    • 经典物体检测框架
  • 前言
  • 一、二阶检测器Faster RCNN
      • 根据Faster RCNN改进的算法
  • 二、单阶检测器
    • 1.SSD
      • 根据SSD改进的算法
    • 2.YOLO
  • 总结


前言

这篇文章是我本人看完三大经典物体检测框架后的一些总结


一、二阶检测器Faster RCNN

Faster RCNN发表与NIPS 2015,相比之前的RCNN,在精度和速度上都有了很大的提升,在VOC22012测试集上实现了70.04%的检测结果,主要思路是Anchor的逐层递减。
  Faster RCNN的优点如下:
  1.性能优越:和一阶的网络相比,二阶网络更为精准,在多尺度、高精度和小物体的问题上,两阶网络优势更为明显。
  2.通用性与鲁棒性:在多个数据集和物体检测任务上表现良好
  3.可优化点多:有很大的算法优化空间
  Faster RCNN的缺点如下:
  1.不利于小物体检测:单层特征图和小分辨率导致其对小物体的检测上有明显的不足
  2.遮挡物体识别不佳:使用NMS对遮挡物体不友好,属于两个物体的proposal可能因为NMS的过滤而只留下一个
  3.RoI Pooling取整:两次的取整导致精度损失
  4.全连接:使用全连接网络导致参数量大

根据Faster RCNN改进的算法

1.HyperNet:2016的CVPR上发表,将浅、中、深三层特征进行融合,提升了检测的精度。主要优点:检测精度进一步提升,特征细节丰富,有利于检测小物体,没有冗余计算。
2.Mask RCNN:2017的ICCV何凯明大神提出,同时兼顾物体检测与实例分割。主要优点:采用ResNet和RoI Align,在多尺度和小物体的检测上优势明显,增加了Mask分支来对每一个像素进行预测
3.R-FCN:采用ResNet-101作为backbone,去掉了全连接层,采用全卷积。主要优点:速度快,检测效果更好。
4.Cascade RCNN:发表于2018年的CVPR,级联多个检测器以优化结果,每个检测器都有不同的IoU阈值。主要优点:在多个数据集上精度都有明显的提升。

二、单阶检测器

单阶检测器的主要优点就是速度快

1.SSD

借鉴了Faster RCNN和YOLO的思想,在检测的精度和速度上都有一定的提升,是一个优雅高效的检测网络。SSD以VGGNet为基础网络,增加了几个卷积层,利用3*3的卷积核在6个特征层上进行预测,得到预选框的分类于回归预测值,直接得出结果。
  SSD的优点如下:
  1.数据增强:经过光学变换和几何变换两个过程,此部分给mAP带来了8.8%的提升
  2.使用两个卷积层代替VGG16的全连接层
  3.使用浅层特征检测小物体,深层特征检测大物体
  4.检测速度超同时期的YOLO
  5.网络优雅简单,方便后续的改善工作
  SSD的缺点如下:
  1.由于浅层的语义信息不足,对小物体的检测一般
  2.Prior Box的大小依赖于人工设置
  3.在一些要求高精度的场景下表现不佳

根据SSD改进的算法

1.DSSD:将深浅特征图融合,采用的是逐元素相乘。提升了浅层特诊的语义信息,在小物体检测方面的性能有不少提升。
2.RSSD:尝试了3种深浅特征融合方法:池化融合、反卷积融合、彩虹式融合,效果也是在小物体检测上的提升。
3 .RefineDet:这是基于SSD的二阶检测器,对预选框进行两次优化,结合了Faster RCNN、SSD、FPN的优点,在高效的前提上实现了更高精度的检测,并且提升了小物体检测的效果。
4. RFBNet:使用空洞卷积,将多感受野结合,实现了较好的检测性能和较快的速度。

2.YOLO

YOLO系列的检测器以速度快著称,应用广泛,实时化效果特别好。
YOLO v1算法利用回归的思想,直接完成了分类与位置定位,速度极快,v2和v3在精度和速度上进一步提升。去年发布的v4和v5(非官方)更是将速度提升到了另一个档次。
YOLO v2网络采用全新的DarkNet网络,并且设置了一定数量的先验框(YOLO v1 没有),并且移除全连接层,添加了特征融合,使得其性能得到了不错的提升。不过其没有解决小物体检测的问题,并且后续改进和扩展的空间不足。
YOLO v3改进了网络结构、网络特征和后续计算,采用了残差模块,能够进行多尺度预测,对小物体的检测也有一定提升。不过v3的速度并没有前两个快。
YOLO v4采用马赛克数据增强方法,使得精度的到不小的提升。
YOLO v5也在20年的中旬发布,成为当下最火热的目标检测器


总结

这是本人的第一篇博客,不足之处希望大家在评论区指出。

你可能感兴趣的:(深度学习,神经网络,计算机视觉,网络)