python numpy 实现非极大值抑制 NMS

单独只讲最普通的 NMS,在很多物体检测的最后阶段经常需要 NMS 来输出最后的结果(这也是一个后处理步骤),早先的算法中一般都有,比如 RCNN 系列、YOLO 等都是有这个步骤的,后面有些算法比如 CenterNet 嫌弃它把它去掉了。

NMS 的目的就是保留置信度较高的、去除冗余检测框,实现的时候采用贪心的策略,每次在待处理的检测框中拿出来一个置信度最高的保留,然后去掉所有与其重叠过大的,直至所有框都被处理后,输出保留的高置信度框。

NMS 会产生的问题:

  • 多个类别的框只在类别内做 NMS,最后效果很不可思议(保留下来的有较多错);
  • 两个物体客观上确实严重重叠,最后效果可能出现目标丢失的问题;
  • 本身需要单独处理,不能和神经网络一起进行学习运算。

解决办法:

  • soft NMS,不再直接删除“冗余”检测框,而是降低其置信度,最后再按照阈值输出置信度较大的;
  • CenterNet 去掉了 NMS 步骤,实现端到端检测。
import numpy as np

def nms(dets, thresh):
    x1 = dets[:, 0]
    y1 = dets[:, 1]
    x2 = dets[:, 2]
    y2 = dets[:, 3]
    scores = dets[:, 4]

    areas = (x2 - x1 + 1) * (y2 - y1 + 1)
    order = scores.argsort()[::-1]

    keep = []
    while order.size > 0:
        i = order[0]
        keep.append(i)
        xx1 = np.maximum(x1[i], x1[order[1:]])
        yy1 = np.maximum(y1[i], y1[order[1:]])
        xx2 = np.minimum(x2[i], x2[order[1:]])
        yy2 = np.minimum(y2[i], y2[order[1:]])

        w = np.maximum(0.0, xx2 - xx1 + 1)
        h = np.maximum(0.0, yy2 - yy1 + 1)
        inter = w * h
        ovr = inter / (areas[i] + areas[order[1:]] - inter)

        inds = np.where(ovr <= thresh)[0]
        order = order[inds + 1]

    return keep

你可能感兴趣的:(算法,python,Object,Detection,算法)