Receptive Field Block Net for Accurate and Fast Object Detection论文阅读

论文阅读:Receptive Field Block Net for Accurate and Fast Object Detection

论文下载地址:https://eccv2018.org/openaccess/content_ECCV_2018/papers/Songtao_Liu_Receptive_Field_Block_ECCV_2018_paper.pdf

论文代码:https://github.com/ruinmessi/RFBNet

 

论文摘要:

当前目标检测效果很好的算法都使用了很深的网络结构(例如残差网络等),虽然这些算法可以取得很好的计算效果但是它们的计算量十分的巨大。虽然有一些轻量级的目标检测的网络结构但是他的准确率和鲁棒性相对较差。作者引入了生物中人类视觉的感受野概念建立了一个感受野块的网络结构,将偏心率和感受野大小关联起来。用来增强这些轻网络结构的准确率和鲁棒性。

论文创新:

1.提出了感受野块,来模拟人类视觉中感受野和偏心率之间的关系。

2.将感受块嵌入到SSD框架中,在维持计算量的情况下来提高精度和鲁棒性。

3.修改之后的网络才COCO和VOC里面去得了很好的效果。

相关工作:

只要介绍了两步检测,一步检测和感受野的定义概念。

偏心率和感受野之间的关系:(在生物学和神经学中的结果)

Receptive Field Block Net for Accurate and Fast Object Detection论文阅读_第1张图片

A图表示1.随着偏心率的增加,感受野也会不断的增加。2.不同的特征图上感受野是不一样的。

B图是A 图的空间阵列。

网络结构:

Receptive Field Block Net for Accurate and Fast Object Detection论文阅读_第2张图片

上图就是一个本文中的一个感受野块。通过1*1,3*3,5*5使用不同的卷积核来模拟人类视觉中的不同的感受野结构(RFs)。rate=1,3,5来模拟人类视觉中不同的偏心率对感受野的影响。

Receptive Field Block Net for Accurate and Fast Object Detection论文阅读_第3张图片

上图是感受野块的两个网络结构,右边的网络通过使用3*3的卷积来代替5*5卷积来减少网络的计算量。(具体的还是要看代码中的网络结构。)

SSD网络结构:

Receptive Field Block Net for Accurate and Fast Object Detection论文阅读_第4张图片

上图中灰色的使用的是VGG-16的网络结构。黄色的区域就是感受野块网络结构。将感受野嵌入到网络中取得了很好的效果。

这是她实验的一个效果图。效果提升很明显。

Receptive Field Block Net for Accurate and Fast Object Detection论文阅读_第5张图片

下图是SSD框架下mobilenet基础上增加的感受野块效果提升了1.4%,参数增加了0.6M。效果还是很明显的。

Receptive Field Block Net for Accurate and Fast Object Detection论文阅读_第6张图片

你可能感兴趣的:(深度学习)