目标检测——SSD(九)

简介:

前面已经总结了RCNN系列和YOLO系列,那么SSD同样是目标检测领域的经典论文,后续很多论文以此为基础,所以还是有必要来梳理一下。
SSD全名Single Shot MultiBox Detector,对于Faster R-CNN,先通过CNN得到候选框,然后进行分类和回归,而YOLO和SSD可以一步完成检测;对于YOLO,SSD采用CNN来直接进行检测,而不是像YOLO那样采用全连接层后做检测。
原论文地址:https://arxiv.org/pdf/1512.02325.pdf

一、网络结构:

目标检测——SSD(九)_第1张图片
可以看到SSD有以下优势:

  1. SSD提取了不同尺度的特征图来做检测,大尺度特征图可以用来检测小物体,而小特征图用来检测大物体;
  2. SSD采用了不同尺度和长宽比的先验框,在faster r-cnn中称为Anchors。YOLO算法缺点是难以检测小物体,而且定位不准,但是对于这几点,SSD在一定程度上克服这些缺点。

SSD采用VGG16作为基础模型,并且做了以下修改:

  1. 分别将VGG16的全连接层FC6和FC7转换成 3x3 的卷积层 Conv6和 1x1 的卷积层Conv7;
  2. 去掉所有的Dropout层和FC8层;
  3. 同时将池化层pool5由原来的 stride=2 的 2x2 变成stride=1的 3x3 ;
  4. 添加了Atrous算法(hole算法),目的获得更加密集的得分映射;
  5. 然后在VGG16的基础上新增了卷积层来获得更多的特征图以用于检测。

二、损失函数:

总损失函数=得分损失+位置损失
在这里插入图片描述
对于置信度误差,其采用softmax loss;对于位置误差,其采用Smooth L1 loss。

系列传送门:
目标检测——R-CNN(一)
目标检测——Fast R-CNN(二)
目标检测——Faster R-CNN(三)
目标检测——Mask R-CNN(四)
目标检测——R-FCN(五)
目标检测——YOLOv3(六)
目标检测——YOLOv4(七)
目标检测——YOLOv5(八)
目标检测——SSD(九)
目标检测——RetinaNet(十)
目标检测——RefineDet(十一)

你可能感兴趣的:(计算机视觉,深度学习,计算机视觉,目标检测,SSD算法,python)