【为自己打call】一作论文:一阶全卷积遥感影像倾斜目标检测

引用格式:Zhou Y, Yang Q Q, Ma Q, Xue B W and Kong X N. 2022. Improved one-stage fully convolutional network for oblique object detection in remote sensing imagery. Journal of Image and Graphics,27(08):2537-2548(周院,杨庆庆,马强,薛博维,孔祥楠. 2022. 一阶全卷积遥感影像倾斜 目标检测. 中国图象图形学报,27(08):2537-2548)[DOI:10. 11834 / jig. 210157]

目录

1.摘要

2. 网络结构

3.总结 


1.摘要

目的 主流深度学习的目标检测技术对自然影像的识别精度依赖于锚框设置的好坏,并使用平行于坐标轴的正框表示物体位置,而遥感影像中地物目标具有尺寸多变、分布密集、长宽比悬殊且朝向不定的特点,更宜通过与物体朝向一致的斜框表示其位置。本文试图结合无锚框和斜框检测技术,在遥感影像上实现高精度目标识别。方法 使用斜框标注能够更为紧密地贴合目标边缘,有效减少识别干扰因素。本文基于单阶段无锚框目标检测算法:一阶全卷积目标检测网络(fully convolutional one-stage object detector,FCOS),通过引入滑动点结构,在遥感影像上实现高效率、高精度的斜框目标检测。与FCOS的不同之处在于,本文改进的检测算法增加了用于斜框检测的两个分支,通过在正框的两邻边上回归滑动顶点比率产生斜框,并预测斜框与正框的面积比以减少极端情况下的检测误差。结果 在当前最大、最复杂的斜框遥感目标检测数据集DOTA (object detection in aerial images)上对本文方法进行评测,使用ResNet50作为骨干网络,平均精确率(mean average precision,mAP)达到74.84%,相比原始正框FCOS算法精度提升了33.02%,相比于YOLOv3(you only look once)效率提升了38.82%,比斜框检测算法R3Det (refined rotation RetinaNet)精度提升了1.53%。结论 实验结果说明改进的FCOS算法能够很好地适应高分辨率遥感倾斜目标识别场景。

2. 网络结构

【为自己打call】一作论文:一阶全卷积遥感影像倾斜目标检测_第1张图片

 【为自己打call】一作论文:一阶全卷积遥感影像倾斜目标检测_第2张图片

 【为自己打call】一作论文:一阶全卷积遥感影像倾斜目标检测_第3张图片

网路结构比较简单,主要的创新点在于:

  1.  在原始 FCOS 的基础上,改进了金字塔特征融合的 方式,不仅仅是将多个尺度的特征图进行通道维度拼接,还增加了 1 × 1 卷积核的卷积操作和批量归一 化操作,有效提升算法速度和精度。金字塔特征融合模块一方面可以保证特征空间分辨率不下降,另一方面也可以有效扩大感受野,提升网络鲁棒性。
  2. 在第 2 分支回归目标框参 数(l,t,r,b,α1 ,α2 ,k)上,(l,t,r,b)是前景点至目标框的左边、上边、右 边和下边之间的距离, (α1 ,α2 ) 表示两条邻边的斜框 在正框边上的比率。k 表示斜框面积与正框面积的比率,比普通斜框目标检测减少回归参数。
  3. 在DOTA上获得了较好得精度表现,虽然不饿能达到每个类别都是表现最好的,但是整体mAP是表现最优的。

【为自己打call】一作论文:一阶全卷积遥感影像倾斜目标检测_第4张图片

3.总结 

 原始FCOS是正框目标检测方法,本文将FCOS改为斜框目标检测,更适用于遥感影像中常见的窄长型目标识别。

欢迎一键三连!!!

你可能感兴趣的:(目标检测论文,计算机视觉,目标检测,深度学习)