【CVPR 2020】Learning RoI Transformer for Oriented Object Detection in Aerial Images

介绍

这篇文章是针对旋转框任务的;

摘要

由于鸟瞰视角、高度复杂的背景和多变的物体外观,航拍图像中的目标检测是计算机视觉中一项活跃但具有挑战性的任务。许多检测方法依赖于通用目标检测中的水平候选框,而这类方法尤其在航拍图像中检测密集目标时则会引入RoI和目标之间的不匹配。这会导致最终目标分类置信度和定位精度之间常见的错位。在本文中,作者提出一种RoI-Transformer来解决这些问题。RoI-Transformer的核心想法是对RoI进行空间变形并在oriented-bounding-box(OBB)标注监督下学习变形参数。RoI-Transformer是轻量级的,并且能够轻易地嵌入到旋转目标检测器中。单纯将RoI-Transformer应用于轻量head的RCNN就在两项常见和挑战性的航拍数据集中取得了SOTA的表现,这两项数据集分别是DOTA和HRSC2016,检测速度的降低可忽略不计。在有旋转限位框标注的情况下,所提出的RoI-Transformer超过了deformable-Position-Sensitive-RoI-pooling。大量实验也验证了所提出RoI-Transformer的灵活性和有效性。

你可能感兴趣的:(transformer,自动驾驶,深度学习)