IoU、GIoU、DIoU、CIoU、EIoU、αIoU

文章目录

  • 1. IoU (Intersection over Union)
  • 2. GIoU (Generalized IoU)
  • 3. DIoU(Distance-IoU)
  • 4. CIoU(Complete-IoU)
  • 5. EIoU(Efficient-IoU)
  • 6. α IoU

1. IoU (Intersection over Union)

IoU、GIoU、DIoU、CIoU、EIoU、αIoU_第1张图片
另一种IoU损失计算:LIoU = 1 - IoU

  • 优点

    1. IoU具有尺度不变性
    2. 结果非负,且范围是(0, 1)
  • 缺点

    1. 如果两个对象不重叠,则IoU值将为零,并且将不反映两个形状彼此相距多远。在非重叠对象的这种情况下,如果IoU被用作损失,则其梯度将为零并且不能被优化。

2. GIoU (Generalized IoU)

为了解决IoU Loss在不重叠的边界框的情况下进行优化不可行的情况,有人提出了GIoU
IoU、GIoU、DIoU、CIoU、EIoU、αIoU_第2张图片

AC代表是两个框的最小外接矩形的面积。
u u u代表两个边界框的并集

举两个极端的例子,当IoU为1时,也就是两个框完全重合时,GIoU = IoU - 0 = IoU
当两个边界框相距无穷远的时候,Ac是无穷大的,GIoU = IoU - 1

IoU、GIoU、DIoU、CIoU、EIoU、αIoU_第3张图片

  • 优点

    1. 当IoU=时,仍然可以很好的表示两个框的距离
    2. GIoU不仅关注重叠区域,还关注其他的非重合区域,能够更好的反应两者的重叠度
  • 缺点

    1. 当两个框属于包含关系,或者在同一方向重合时会退化成IoU
      IoU、GIoU、DIoU、CIoU、EIoU、αIoU_第4张图片
    2. 收敛较慢,由于严重依赖IoU项,GIoU经验上需要更多迭代来收敛。

3. DIoU(Distance-IoU)

为了解决IoU和GIoU收敛速度慢和回归不准确的问题提出了DIoU。通过合并预测框和目标框之间的归一化距离来实现,它在训练中的收敛速度比IoU和GIoU损失快得多。

IoU、GIoU、DIoU、CIoU、EIoU、αIoU_第5张图片
b是预测框的中心点,bgt是真实框的中心点, ρ(g,gt) 代表两点的距离,C是覆盖两个框的最小矩形的对角线长度。

同样举两个极端的例子,当两个框重合的时候给ρ(b,bgt)=0, DIoU=IoU=1
当两个框无穷远的时候,DIoU= 0 - 1 = -1
IoU、GIoU、DIoU、CIoU、EIoU、αIoU_第6张图片

  • 优点
    1. DIoU loss可以直接最小化两个目标框的距离,因此比GIoU loss收敛快的多
    2. DIoU可以替换溥侗的IoU评价策略,应用于NMS中,使得NMS得到的结果更加合理和有效

  • 缺点
    1. 虽然DIOU能够直接最小化预测框和真实框的中心点距离加速收敛,但是Bounding box的回归还有一个重要的因素纵横比暂未考虑。如下图,三个红框的面积相同,但是长宽比不一样,红框与绿框中心点重合,这时三种情况的DIoU相同,证明DIoU不能很好的区分这种情况。
    IoU、GIoU、DIoU、CIoU、EIoU、αIoU_第7张图片

4. CIoU(Complete-IoU)

IoU和DIoU来自同一篇论文,作者认为一个好的边界框回归损失应该考虑三个重要的几何因素,即重叠面积、中心点距离和宽高比。DIoU损失是同时考虑包围盒的重叠面积和中心点距离,但没有考虑包围框的纵横比,因此CIoU在DIOU的基础上,考虑边界框宽高比的尺度信息
IoU、GIoU、DIoU、CIoU、EIoU、αIoU_第8张图片

IoU、GIoU、DIoU、CIoU、EIoU、αIoU_第9张图片

  • 优点
    考虑了框的纵横比,可以解决DIoU的问题

  • 缺点

    1. 如果预测框和gt框的长宽比是相同的,那么长宽比的惩罚项恒为0,不合理
    2. 观察CIoU中w, h相对于v的梯度,发现这两个梯度是一对相反数,也就是说,w和h不能同时增大或减小,这显然也不够合理的。

5. EIoU(Efficient-IoU)

EIoU是在CIoU的惩罚项基础上将预测和真实框的纵横比的影响因子拆开,分别计算预测框和真实框的长和宽,来解决CIoU存在的问题。

该损失函数包含三个部分:重叠损失、中心距离损失、宽高损失,前两部分延续CIoU中的方法,但是宽高损失直接使目标框与预测框的宽度和高度之差最小,使得收敛速度更快。

IoU、GIoU、DIoU、CIoU、EIoU、αIoU_第10张图片

IoU、GIoU、DIoU、CIoU、EIoU、αIoU_第11张图片
wc和hc是覆盖两个框的最小外接矩形框的宽度和高度。

  • 优点
    1. 将纵横比的损失项拆分成预测的宽高分别与最小外接框宽高的差值,加速了收敛,提高了回归精度
    2. CIOU loss= IOUloss+中心点损失+长宽比例损失、EIOU loss =IOUloss+中心点损失+宽损失+长损失,将预测和真实框的纵横比的影响因子拆开了。

6. α IoU

作者将现有的基于IoU Loss推广到一个新的IoU系列,该系列具有一个Power IoU项和一个附件的Power正则项,具有单个Power参数α。
通过调节α,是检测器在不同水平的BBox回归精度方面具有更大的灵活性。并且α IoU对小数据集和噪声的鲁棒性更强。
在这里插入图片描述
IoU、GIoU、DIoU、CIoU、EIoU、αIoU_第12张图片
经过实验发现α=3,性能最好。

你可能感兴趣的:(深度学习,pytorch,深度学习,人工智能)