The KFIOU Loss For Rotated Object Detection

THE KFIOU LOSS FOR ROTATED OBJECT DETECTION

paper:https://arxiv.org/pdf/2201.12558.pdf

摘要

与水平目标检测不同,计算友好的IoU Loss很容易被采用,并且很好的符合检测度量。相反旋转检测器通常涉及更复杂的SkewIoU Loss,这对基于梯度的训练不友好。本文中提出了一种基于高斯模式和卡尔曼滤波器的有效近似SkewIoU Loss,该损耗主要由两项组成:

  1. 不区分比例的中心点Loss,快速获取边界框之间的中心点
  2. 与距离无关的第二项,卡尔曼滤波器通过其定义模拟了SkewIoU,并在一定距离内显示其于SkewIoU Loss对齐
    与最近的基于高斯模型的旋转检测器(GWD/KLD)形成对比,后者涉及人类指定的分布距离度量。KFIoU Loss由于其完全可微性和处理非重叠情况的能力,与精确的SkewIoU Loss相比更容易实现,效果更好。

介绍

旋转目标检测中难以定位任意方向的目标并将其与背景有效分离,尽管取得了相当大的进展,但是对于实际设置而言,对于具有大纵横比、密集分布的旋转目标仍然存在挑战。
大纵横比目标之间的SkewIoU分数对对象位置的偏差很敏感,会导致度量之间不一致的负面影响。
当角度偏差固定时,纵横比增加,SkewIoU将急剧减小,而Smooth L1 Loss不变。
类似的,当SkewIoU不变时,Smooth L1 Loss会随着角度偏差的增加而增加。
The KFIOU Loss For Rotated Object Detection_第1张图片

通过IoU Loss和相关变量,如GIoUh和DIoU,在水平检测中广泛讨论了度量和回归不一致的解决方案,然而收到旋转目标检测的阻碍,两个旋转框之间相交比较复杂,不容易提供SkewIoU计算过程的解析解。
所以需要研究一种易于实现的近似SkewIoU Loss。
本文基于卡尔曼滤波器设计了一种新的、有效的SkewIoU Loss替代方案,称为KFIoU,可以通过深度学习的算子轻松实现,而不需要额外cuda加速。
亮点如下:

  1. 对于旋转检测,提出了一种KFIoU Loss,而不是精确计算SkewIoU Loss,使用高斯建模,创新地使用卡尔曼滤波器模拟SkewIoU
  2. KFIoU Loss易于实现,由于完全可微并且能够处理非重叠的情况效果更好,与高斯损失相比,本文对SkewIoU机制的模拟更具可解释性和自然性,并且不需要超参数调整
  3. 与GWD和KLD相比,KFIoU在一定距离内实现了与SkewIoU的最佳趋势水平对齐
  4. 进一步将高斯建模和KFIoU从二维拓展到三维,与baseline相比有显著改进

相关工作

旋转目标检测
基于IoU Loss的变体
度量和回归损失之间的不一致是水平检测和旋转检测的常见问题。通过使用与IoU相关的Loss,在水平检测中已经广泛讨论了不一致的解决方案,然而,由于SkewIoU难以实现,在旋转检测中的应用受到了阻碍,最近已经提出了一些关于SkewIoU Loss的近似方法
基于长方体、多边形

高斯建模背景

如何将任意定向的边界框转换为高斯分布G(µ,∑)
The KFIOU Loss For Rotated Object Detection_第2张图片
其中R表示旋转矩阵,∧表示特征值的对角矩阵。
The KFIOU Loss For Rotated Object Detection_第3张图片
最近的工作GWD和KLD也属于高斯建模,与本文工作相比,他们使用分布距离的非线性变换来近似SkewIoU Loss,在此过程中引入了额外的超参数。由于高斯建模具有不收边界不连续性和类正方形问题影响的优势,本文从另一个角度来近似SkewIoU Loss,而无需任何额外超参数。
The KFIOU Loss For Rotated Object Detection_第4张图片

建议方法

首先将边界框转换为高斯分布,并移动两个高斯分布的中心点使它们接近,通过卡尔曼滤波获得重叠区域的分布函数,最后将获得的分布函数转化为旋转的边界框,以计算重叠面积和SkewIoU loss
The KFIOU Loss For Rotated Object Detection_第5张图片
基于卡尔曼滤波器的SkewIoU
首先当我们获得新的高斯分布时,可以根据协方差计算相应旋转盒的体积
在这里插入图片描述
n表示维度
要获得最终的SkewIoU,计算重叠面积至关重要,对于两个高斯分布,使用卡尔曼滤波器获得重叠区域的分布函数:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
两个高斯分布无论如何移动,只要协方差固定,VB面积不会改变,距离无关
然而当两个高斯分布距离较远时,应减少重叠面积,我们可以首先使用中心点损失Lc来缩小两个高斯分布的中心距离,然后计算重叠面积:
在这里插入图片描述
B1,B2,B3是图2右侧所示三个不同的边界框
在附录中,我们证明了n维空间中KFIoU的上界,可以通过线性变换或占到[0,1],与IoU进行一致性比较
The KFIOU Loss For Rotated Object Detection_第6张图片
(a)(b)显示了在不同情况下具有相同中心的两个边界框的五种损失曲线
(a)描述了角度差和损失函数之间的关系。尽管它们都具有单调性,但显然平滑L1损耗曲线更为独特。(b)显示了不同纵横比条件下五种损耗的变化。可以看出,两个边界框的平滑L1损失是恒定的(主要来自角度差),但其他损失将随着纵横比的变化而急剧变化。无论(c)中的情况如何,KFIoU损失可以在5像素贬值范围内保持与SkewIoU损失的最佳趋势水平对齐。这一结论在9个像素处仍然成立,这已经是相当长的距离,特别是对于航空图像。
为了进一步探索不同金属SkewIoU Loss,设计了误差均值EMean和误差方差EVar
在这里插入图片描述
EVar测量设计Loss和SkewIoU Loss之间趋势水平一致性

to be continued…

你可能感兴趣的:(目标检测,目标检测,深度学习,计算机视觉)