论文学习笔记:Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regressi

Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression

作者:Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir Sadeghian, Ian Reid, Silvio Savarese
论文链接:https://arxiv.org/abs/1902.09630
论文解读:https://mp.weixin.qq.com/s/6QsyYtEVjavoLfU_lQF1pw

重点:包围框boundingbox优化方法

1、零碎的笔记

我首先看的是论文解读连接里面的讲解,截图来自极市平台的解读。

1)bounding box regression中L1、L2 loss这个可以提升的点。

2)IoU是目标检测中一个重要的概念,在anchor-based的方法中,他的作用不仅用来确定正样本和负样本,还可以用来评价输出框(predict box)和ground-truth的距离,或者说predict box的准确性。IoU有一个好的特性就是对尺度不敏感(scale invariant)。

3)loss和IoU对比

论文学习笔记:Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regressi_第1张图片

4)IoU也有问题,所以要用GIou

论文学习笔记:Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regressi_第2张图片

5)GIoU

论文学习笔记:Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regressi_第3张图片

疑问:这里不是很看得懂是什么意思,上下约分一下不就变成了,1/|AUB|了吗。

而且不是很董C是什么,smallest enclosing convex object,最小封闭凸体。

6)GIoU和IoU作为loss的计算方法

论文学习笔记:Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regressi_第4张图片

上一个疑问在这里找到了答案:

从这个算法我们回看上面的GIoU截图,最后的使用不太准确,应该是|C-(AUB)|/|C|

然后C这个最小封闭凸体,就是最小外切矩形,解读里面将之翻译成最小闭包区域

这个闭包虽然在这个代码里面,因为用的是矩形的boundingbox,所以是最小外切矩形

考虑引申,使用在多边形的mask计算中的时候,应该使用凸包来计算。

7)实验效果

论文学习笔记:Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regressi_第5张图片

纵向的MSE是YOLO的原始loss,然后对比LIOU和LGIOU,三行是三个loss比较

AP是Average Precision,目标检测(Object Detection)中性能衡量指标

参考:https://blog.csdn.net/asasasaababab/article/details/79994920

 

 

 

 

 

 

你可能感兴趣的:(论文学习笔记:Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regressi)