论文笔记——CFENet

会议:CVPR 2018

标题:《CFENet: An Accurate and Efficient Single-Shot Object Detector for Autonomous Driving

论文链接:https://arxiv.org/abs/1806.09790v1

代码链接:暂无


Abstract

         目标检测器检测小目标的能力检测速度对于自动驾驶来说是非常重要的。本文提出了一个有效且高效的单步检测器,该检测器获得了CVPR2018自动驾驶研习会的道路目标检测竞赛第二名。CFENet继承了SSD的结构,并且引入了CFE模块,全称为Comprehensive Feature Enhancement。CFENet比SSD性能更好,效率更高;比state-of-the-art的RefineDet性能更好,尤其是在小目标检测方面。

论文笔记——CFENet_第1张图片

                                 图1  CFENet在BDD数据集上的检测结果示例

1.Introduction

       目标检测器是自动驾驶汽车视觉感知单元的核心。自动驾驶汽车需要一个有效且高效的目标检测器,并且具有较强的小目标检测能力。需要强调的是,交通灯和交通标志等小目标对自动驾驶汽车的决策和路线规划至关重要;实时目标检测能帮助无人驾驶汽车及时避开障碍物。

       最先进的目标检测方法分为,一步法:YOLO,SSD,RetinaNet,RefineDet,和两步法:Fast/Faster R-CNN,FPN,Mask R-CNN。一般而言,一步法效率高,速度快;两步法检测性能更好。其中,YOLO架构简单,高效,但不能处理大尺度目标和密集目标。SSD可以从多尺度特征图中检测不同尺寸的目标,使用anchor来检测密集目标。SSD小目标检测性能并不好,主要原因是使用浅层特征图来检测小目标,浅层特征图没有包含丰富的高级语义信息。

论文笔记——CFENet_第2张图片

                                                                                    图2 SSD结构

       RefineDet使用一个编码-解码结构加深网络和上采样特征图,使得大尺度特征图可以学习到更深层次的语义信息。RefineDet还采用像Faster R-CNN一样的cascade regression,首先利用编码部分对目标进行粗略定位,然后在此基础上利用解码部分进行更精准的定位。RefineDet的骨干网络为VGG网络。

论文笔记——CFENet_第3张图片

                                                                                图3 RefineDet结构

2.Architecture of SSD

       SSD是一个使用特征金字塔结构的全卷积网络。采用骨干网络Conv4_3对小目标进行检测,更深的层用来检测更大的目标。每一个特征图上的anchor大小的范围都是根据训练集上目标尺度的分布来确定。

anchor match

  • 将每个ground truth box匹配到具有最佳jaccard覆盖率(IoU交并比)的default box
  • default box匹配到任何ground truth box的jaccard覆盖率(IoU交并比)大于阈值(0.5)

改进SSD:增强小目标检测特征。

3.CFENet

       CFENet在原始SSD上添加了4个CFE模块和2个Feature Fusion Block(FFB)。

       CFE模块的设计是为了增强SSD检测小目标的浅层特性,它的灵感来自于Inception,Xception,Large separable和ResNeXt等模块。CFE模块由两个相似的分支组成,左支使用 kxk Conv连接 1x1 Conv来学习更多非线性关系和扩大接受域,将 kxk 分解成 1xk 和 kx1可以保证扩大接受域的同时保持推断时间。右支将1xk 和 kx1调换位置。

论文笔记——CFENet_第4张图片

                                              图4 CFE模块

       在CFE模块的基础上提出了CFENet,其对小目标检测更有效。在Conv4_3和fc_7以及fc_7和Conv6_1之间增加两个CFE模块,在Conv4_3和fc_7的检测分支上连接了两个CFE模块。由于这两层相对较浅,学习到的特征对后面的检测过程不是很好,添加CFE模块来增强它们的特征。Step forward,feature fusion策略学习了更好的特征,这些特征结合了原始特征的优点。

        CFE模块也可以放置在其他侯选位置,更多的CFE模块会给原始网络带来更多改进。考虑到精度和时间的权衡,我们进行了大量实验,最终选择了如图所示的版本。

论文笔记——CFENet_第5张图片

                                                                                          图5 CFENet结构

4.Experiments

论文笔记——CFENet_第6张图片

论文笔记——CFENet_第7张图片

论文笔记——CFENet_第8张图片

论文笔记——CFENet_第9张图片

5.Conclusion

       CFENet800的多尺度版本在最终测试排行榜上获得了29.69的mAP,排名第二。MSCOCO和BDD的实验结果表明,CFENet的性能明显优于原始SSD和RefineDet,尤其是小目标检测。CFENet512的的单尺度版本可以实现21fps的实时速度。这些优点表明,CFENet更适合自动驾驶的应用。

你可能感兴趣的:(目标检测,论文笔记)