目标检测中的NMS算法(Non-max suppression)

非极大值抑制:即找到局部极大值,而非最大值,并抑制其领域内的其余值。
在目标检测中,对于一个物体可能会预测出多个候选框,那么这时就可以用极大值抑制对一些冗余的框进行滤除。

 一般来说,每一个预测框的输出都会带有该框的位置信息以及置信度。

NMS算法流程:

  1. 首先,对所有的框,通过一个置信度阈值将置信度低的框滤除。
  2. 接着,选出置信度最高的框,将其保存进输出列表中。
  3. 依次计算该框与其他剩余的框的IOU值。然后通过一个IOU阈值将和这个置信度最高的框拥有较大IOU的框(即和这个框相近的框)去除。也就是去掉冗余的框咯。
  4. 继续对剩余的框进行2,3操作,直到遍历完毕。

Example:

Output:
目标检测中的NMS算法(Non-max suppression)_第1张图片
NMS Iteration 1:
目标检测中的NMS算法(Non-max suppression)_第2张图片
NMS Iteration 2:
目标检测中的NMS算法(Non-max suppression)_第3张图片

Code:
注:这里的NMS是单类别的!多类别则只需要在外加一个for循环遍历每个种类即可。

def py_cpu_nms(dets, thresh): 
"""Pure Python NMS baseline.""" 
    #dets某个类的框,x1、y1、x2、y2、以及置信度score
    #eg:dets为[[x1,y1,x2,y2,score],[x1,y1,y2,score]……]]
    # thresh是IoU的阈值     
    x1 = dets[:, 0] 
    y1 = dets[:, 1]
    x2 = dets[:, 2] 
    y2 = dets[:, 3] 
    scores = dets[:, 4] 
    #每一个检测框的面积 
    areas = (x2 - x1 + 1) * (y2 - y1 + 1) 
    #按照score置信度降序排序 
    order = scores.argsort()[::-1] 
    keep = [] #保留的结果框集合 
    while order.size > 0: 
        i = order[0] 
        keep.append(i) #保留该类剩余box中得分最高的一个 
        #得到相交区域,左上及右下 
        xx1 = np.maximum(x1[i], x1[order[1:]]) 
        yy1 = np.maximum(y1[i], y1[order[1:]]) 
        xx2 = np.minimum(x2[i], x2[order[1:]]) 
        yy2 = np.minimum(y2[i], y2[order[1:]]) 
        #计算相交的面积,不重叠时面积为0 
        w = np.maximum(0.0, xx2 - xx1 + 1) 
       h = np.maximum(0.0, yy2 - yy1 + 1) 
       inter = w * h 
        #计算IoU:重叠面积 /(面积1+面积2-重叠面积) 
        ovr = inter / (areas[i] + areas[order[1:]] - inter) 
       #保留IoU小于阈值的box 
        inds = np.where(ovr <= thresh)[0] 
        order = order[inds + 1] #因为ovr数组的长度比order数组少一个,所以这里要将所有下标后移一位 
    return keep

参考链接:
[1] 目标检测:NMS——非极大值抑制
[2] 非极大值抑制(non-maximum suppression)的理解
[3] 图像处理中常用的非极大值抑制是什么意思?
[4] 目标检测之NMS非极大值抑制

你可能感兴趣的:(目标检测,深度学习,图像识别)