我最爱的目标检测1——IOU的正确打开方式

我最爱的目标检测1——IOU的正确打开方式

  • 学习前言
  • 什么是IOU
  • IOU的特点
  • 计算原理
  • 代码实现

学习前言

IOU是目标检测里面很重要的一个指标~
我最爱的目标检测1——IOU的正确打开方式_第1张图片

什么是IOU

IOU的全称为交并比(Intersection over Union),通过这个名称我们大概可以猜到 IOU 的计算方法。IOU计算的是 “预测框” 和 “真实框” 的交集与并集的比值(如图:红色为预测框,绿色为真实框)。
我最爱的目标检测1——IOU的正确打开方式_第2张图片
我最爱的目标检测1——IOU的正确打开方式_第3张图片

IOU的特点

与分类任务不同,我们的预测框的坐标需要去匹配实际框的坐标,而坐标的完全匹配是不现实的。
因此,我们需要定义一个评估指标,奖励那些与匹配框匹配较好的预测框。

我最爱的目标检测1——IOU的正确打开方式_第4张图片我最爱的目标检测1——IOU的正确打开方式_第5张图片我最爱的目标检测1——IOU的正确打开方式_第6张图片

计算原理

开始计算IOU之前,我们首先分析下交集并集到底应该怎么计算?

  1. 首先需要计算交集
  2. 两个边框的面积和减去一个交集即为并集

因此IOU的计算的难点在于交集的计算
两个框交集的计算的实质是两个集合交集的计算,因此我们可以将两个框的交集的计算简化为:
我最爱的目标检测1——IOU的正确打开方式_第7张图片我最爱的目标检测1——IOU的正确打开方式_第8张图片
通过简化,我们可以清晰地看到,交集计算的关键是交集上下界点(图中蓝点)的计算。
我们假设集合A为[x1, x2],集合B为[y1, y2],然后求AB交集的上下界限。
交集计算逻辑:

  • 交集下界 z1:max (x1, y1)
  • 交集上界 z2:min (x2, y2)
  • 如果 z2-z1 < 0,则说明集合 A 和集合 B 没有交集
  • 如果 z2-z1 > 0,则说明集合 A 和集合 B 有交集

代码实现

我最爱的目标检测1——IOU的正确打开方式_第9张图片

import cv2
import numpy as np
def CountIOU(RecA, RecB):
    xA = max(RecA[0], RecB[0])
    yA = max(RecA[1], RecB[1])
    xB = min(RecA[2], RecB[2])
    yB = min(RecA[3], RecB[3])
    # 计算交集部分面积
    interArea = max(0, xB - xA + 1) * max(0, yB - yA + 1)
    # 计算预测值和真实值的面积
    RecA_Area = (RecA[2] - RecA[0] + 1) * (RecA[3] - RecA[1] + 1)
    RecB_Area = (RecB[2] - RecB[0] + 1) * (RecB[3] - RecB[1] + 1)
    # 计算IOU
    iou = interArea / float(RecA_Area + RecB_Area - interArea)
    
    return iou

img = np.zeros((512,512,3), np.uint8)   
img.fill(255)

RecA = [50,50,300,300]
RecB = [60,60,320,320]

cv2.rectangle(img, (RecA[0],RecA[1]), (RecA[2],RecA[3]), (0, 255, 0), 5)
cv2.rectangle(img, (RecB[0],RecB[1]), (RecB[2],RecB[3]), (255, 0, 0), 5)

IOU = CountIOU(RecA,RecB)
font = cv2.FONT_HERSHEY_SIMPLEX

cv2.putText(img,"IOU = %.2f"%IOU,(130, 190),font,0.8,(0,0,0),2)
cv2.imshow("image",img)

cv2.waitKey()
cv2.destroyAllWindows()

你可能感兴趣的:(我最爱的目标检测)