SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)

本文转载自:

http://www.cnblogs.com/lillylin/p/6207292.html


SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)


 

目录

  • 作者及相关链接
  • 文章的选择原因
  • 方法概括
  • 方法细节
  • 相关背景补充
  • 实验结果
  • 与相关文章的对比
  • 总结

 


 

作者

 

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第1张图片

 

  • intro: ECCV 2016 Oral
  • arxiv: http://arxiv.org/abs/1512.02325
  • paper: http://www.cs.unc.edu/~wliu/papers/ssd.pdf
  • slides: http://www.cs.unc.edu/%7Ewliu/papers/ssd_eccv2016_slide.pdf
  • github: https://github.com/weiliu89/caffe/tree/ssd
  • video: http://weibo.com/p/2304447a2326da963254c963c97fb05dd3a973
  • github(MXNet): https://github.com/zhreshold/mxnet-ssd
  • github: https://github.com/zhreshold/mxnet-ssd.cpp
  • github(Keras): https://github.com/rykov8/ssd_keras

文章的选择原因

  • 性能好,single stage

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第2张图片

方法概括

  1. 文章的方法介绍

    • SSD主要用来解决目标检测的问题(定位+分类),即输入一张待测图像,输出多个box的位置信息和类别信息
    • 测试时,输入一张图像到SSD中,网络输出一个下图最右边的tensor(多维矩阵),对该矩阵进行非极大值抑制(NMS)就能得到每个目标的位置和label信息
    • SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第3张图片

      Figure2的最右图的1th-20th Channel表示类别,每一个Channel上的map对应原图,last 4 channel的每一个map分别对应x,y,w,h的偏移量。最后4个通道可以确定一个box的位置信息,前20个通道确定类别信息。

  2. 方法的pipeline和关键点

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第4张图片

方法细节

 

  • 模型结构

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第5张图片

  • 多尺度特征图

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第6张图片

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第7张图片

  • 用来预测的卷积滤波器

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第8张图片

  • defaul box

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第9张图片SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第10张图片SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第11张图片

  • groundTruth的标定,损失函数

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第12张图片

  • default box和尺度的选择

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第13张图片

 

  • SSD的训练——Hard negative mining

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第14张图片

  • SSD的训练——数据扩增

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第15张图片

相关背景补充

  • Atrous算法(hole算法)

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第16张图片SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第17张图片

  • FPS/SPF, Jaccard overlap

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第18张图片

  • 二类分类/检测常用的评价标准 (recall, precision, f-measure, accuracy, error, PR曲线和ROC曲线,AP,AUC)

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第19张图片SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第20张图片

  • ImageNet多类分类的评价标准

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第21张图片

  • ImageNet单目标检测的评价标准

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第22张图片

  • ImageNet(多)目标检测的评价标准

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第23张图片

验结果

  • PASCAL VOC2007 test detection结果

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第24张图片

  • 使用数据扩增、多尺度default box、atrous算法的对比效果

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第25张图片

  • SSD512在某类Ianimals)上的检测性能可视化

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第26张图片SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第27张图片

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第28张图片SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第29张图片

  • SSD对于目标大小的敏感性实验

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第30张图片SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第31张图片

  • SSD使用的feature map的个数对结果的影响

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第32张图片

  • 示例结果

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第33张图片

  • 时间和速度

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第34张图片

 

与相关文章的对比

 

  • 原始R-CNN方法的变形

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第35张图片

  • Faster R-CNN和SSD对比

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第36张图片

  • YOLO和SSD对比

SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)_第37张图片

总结

  • 文章贡献

    • SSD, a single-shot detector for multiple categories (faster than YOLO, accurate as Faster R-CNN)
    • The core of SSD is predicting category scores and box offsets for a fixed set of default bounding boxes using small convolutional filters applied to multiple feature maps from different layers
    • Experimental evidencehigh accuracy, high speed, simple end-to-end training (single shot)
  • SSD对于其他方法的改进的关键点

    • Using a small convolutional filter to predict object categories and offsets in bounding box locations
    • Using separate predictors (filters) for different aspect ratio detections
    • Using multiple layers for prediction at different scales (apply these filters to multiple feature maps to perform detection at multiple stages)

你可能感兴趣的:(YOLO系列,目标检测,目标检测,SSD)