DOTA数据集介绍(论文A Large-scale Dataset for Object Detection in Aerial Images)

HBB:horizontal Bounding Boxes 水平边界框

OBB:oriented Bounding Boxes 带方向的(倾斜)边界框

1 introduction

(1) 航空影像目标检测与传统目标检测的区别

  • 航空影像目标尺寸差异很大
  • 航空影像中很多小目标密集分布,且类别不均衡
  • 航空影像中的目标可能是任意方向的

    除此之外,数据集的问题也是航空影像目标检测面临的挑战之一。

(2) 主要内容

本研究介绍了一个大型的目标检测数据集。该数据集包含了286张来自不同传感器和平台的航空影像,每张影像大小都在4000×4000pixel内,分为15种类别,188282个目标,每个目标都标记为一个带方向的边界框。

(3)好的数据集的特征

  • 数据量大
  • 每类有足够多目标
  • 目标标注带有确切的方向
  • 类别较多,能反映实际

DOTA数据集介绍(论文A Large-scale Dataset for Object Detection in Aerial Images)_第1张图片

存在问题:类别单一、缺少方向信息

2. DOTA数据标注

(1)数据源:来自多种传感器和平台的不同分辨率航空影像

(2)类别选择:15类,包括飞机、舰船、储罐、棒球场、网球场、篮球场、田径场、海港、桥梁、大型车辆、小型车辆、直升机、环岛、足球场、游泳池

(3)标注方式

  • (x, y, w, h, θ): 不能完全包围各部分变形大的旋转目标
  • (x1, y1, x2, y2, x3, y3, x4, y4): 从左上角或者目标头部开始顺时针标注

(4)数据集划分:1/2训练,1/6验证,1/3测试

3. DOTA数据集属性

(1)原始影像大小从800-4000(大部分大于1000), 无切割直接标记

(2)不同方法的目标分布均衡

(3)数据集中提供了每张影像的空间分辨率

(4)类别的不同目标大小分布

DOTA数据集介绍(论文A Large-scale Dataset for Object Detection in Aerial Images)_第2张图片

(5)目标的不同长宽比:

  • 最小外切水平矩形边界的长宽比
  • 原始四边形边框的长宽比

(6)影像中不同目标的密度:一个个标注密集分布的目标

4. 评价

(1) 垂直框目标检测:Faster R-CNN1 [26], R-FCN2 [4], YOLOv23 [25] and SSD2 [16]

(2)倾斜框目标检测:改进版的Faster R-CNN

(3)将影像分割成1024×1024,步长512。当目标被切分的面积小于原始面积的0.7,就将其定为difficult。之后,确定被切分的目标能否被四个顺时针顶点的边界框所表示。

(4)评价指标:mAP

(5)水平框检测时,SSD效果很差:分析原因可能是因为SSD在数据增强时会进行随即裁剪操作,导致小目标的检测难度增加。

DOTA数据集介绍(论文A Large-scale Dataset for Object Detection in Aerial Images)_第3张图片

(6)倾斜框检测时,结果精度比水平框检测低很多。

DOTA数据集介绍(论文A Large-scale Dataset for Object Detection in Aerial Images)_第4张图片

5. 结果分析

(a) vs. (b): OBB优于HBB

(c) vs. (d): HBB优于OBB: 在OBB中,目标长宽比很大;在HBB中,目标具有正常的长宽比

(e) vs. (f): OBB和HBB效果都不好

你可能感兴趣的:(文献阅读,目标检测,人工智能,计算机视觉)