IoU、GIoU、DIoU、CIoU

IoU就是我们所说的交并比


作为损失函数会出现的问题(缺点)

  1. 如果两个框没有相交,根据定义,IoU=0,不能反映两者的距离大小(重合度)。同时因为loss=0,没有梯度回传,无法进行学习训练。
  2. IoU无法精确的反映两者的重合度大小。如下图所示,三种情况IoU都相等,但看得出来他们的重合度是不一样的,左边的图回归的效果最好,右边的最差。

IoU、GIoU、DIoU、CIoU_第1张图片


GIoU:

先计算两个框的最小闭包区域面积

(通俗理解:同时包含了预测框和真实框的最小框的面积),再计算出IoU,再计算闭包区域中不属于两个框的区域(Ac-U)占闭包区域的比重(U=AUB),最后用IoU减去这个比重得到GIoU。

  • GIoU是IoU的下界,在两个框无限重合的情况下,IoU=GIoU=1
  • IoU取值[0,1],但GIoU有对称区间,取值范围[-1,1]。在两者重合的时候取最大值1,在两者无交集且无限远的时候取最小值-1,因此GIoU是一个非常好的距离度量指标。
  • 与IoU只关注重叠区域不同,GIoU不仅关注重叠区域,还关注其他的非重合区域,能更好的反映两者的重合度。


GIoU不足:重叠区域相同但方向和距离不同时不能反应到损失函数中。


DIoU

要比GIou更加符合目标框回归的机制,将目标与anchor之间的距离,重叠率以及尺度都考虑进去,使得目标框回归变得更加稳定,不会像IoU和GIoU一样出现训练过程中发散等问题。

0eb5a66b50b76a6f9b05bd6d8bdaf82f.png

其中,

分别代表了预测框和真实框的中心点,且
代表的是计算两个中心点间的欧式距离。
代表的是能够同时包含预测框和真实框的
最小闭包区域的对角线距离。

IoU、GIoU、DIoU、CIoU_第2张图片
  • 与GIoU loss类似,DIoU loss(
    )在与目标框不重叠时,仍然可以为边界框提供移动方向。
  • DIoU loss可以直接最小化两个目标框的距离,因此比GIoU loss收敛快得多。
  • 对于包含两个框在水平方向和垂直方向上这种情况,DIoU损失可以使回归非常快,而GIoU损失几乎退化为IoU损失。
  • DIoU还可以替换普通的IoU评价策略,应用于NMS中,使得NMS得到的结果更加合理和有效。

CIoU

考虑到bbox回归三要素中的长宽比还没被考虑到计算中,因此,进一步在DIoU的基础上提出了CIoU。其惩罚项如下面公式:

其中
是权重函数,


用来度量长宽比的相似性,定义为

完整的 CIoU 损失函数定义:

Error:IoU、GIoU、DIoU、CIoU损失函数的那点事儿

你可能感兴趣的:(机器学习,深度学习,人工智能,计算机视觉,算法)