【OpenCV 例程 300篇】247. 特征检测之最大稳定极值区域(MSER)

『youcans 的 OpenCV 例程300篇 - 总目录』


【youcans 的 OpenCV 例程 300篇】247. 特征检测之最大稳定极值区域(MSER)


1. 最大稳定极值区域(MSER)

最大稳定极值区域(MSER-Maximally Stable Extremal Regions),是一种检测图像文本区域的算法,基于分水岭的思想对图像进行斑点区域检测。
MSER算法具有仿射不变性,对灰度的变化具有较强的鲁棒性,但检测准确率低于深度学习方法,主要用于自然场景的文本检测的前期阶段。

MSER算法对灰度图像进行阈值处理,阈值从0到255依次递增,类似于分水岭算法中的水平面的上升。最低点首先被淹没,随着水面的上升逐渐淹没整个山谷,直到所有的点全部被淹没。在不同阈值下,如果某些连通区域不变或变化很小,则该区域称为最大稳定极值区域。

Q i Q_i Qi表示阈值为 i 时的某一连通区域,则变化率 q i q_i qi 为:

q i = ∣ Q i + Δ − Q i ∣ ∣ Q i ∣ q_i= \frac{|Q_{i+\Delta} - Q_i|}{|Q_i|} qi=QiQi+ΔQi

当变化率 q i q_i qi 为局部极小值时,则 Q i Q_i Qi为最大稳定极值区域。


2. OpenCV 的 cv::MSER类

OpenCV中提供了MSER类,MSER类继承了cv::Feature2D类。

在Python语言中,OpenCV提供了MSER类的接口函数cv.MSER.create实例化MSER类,成员函数detectRegions检测并返回找到的所有区域。

函数原型:

cv.MSER.create([, delta, min_area, max_area, max_variation, min_diversity, max_evolution, area_threshold, min_margin=, edge_blur_size]) → retval

cv.MSER_create([, delta, min_area, max_area, max_variation, min_diversity, max_evolution, area_threshold, min_margin=, edge_blur_size]) → retval

mser.detectRegions(image[, ]) → msers, bboxes

参数说明:

● image:输入图像,8位单通道、3通道或4通道图像
● msers:检测到的所有区域的点集,列表格式
● bboxes:检测到的所有区域的边界矩形,列表格式
● delta:灰度值的变化量,变化率公式中的 Δ \Delta Δ,默认值5
● min_area:区域最小面积阈值,默认值60
● max_area:区域最大面积阈值,默认值14400
● max_variation:最大变化率,默认值0.25

注意问题:

⒈函数cv.MSER.create或cv.MSER_create实例化MSER类,创建一个MSER对象mser。在OpenCV的不同版本中可能只允许其中一种方式。
⒉OpenCV的部分版本中,参数delta、min_area、max_area、max_variation的格式为 _delta、_min_area、_max_area、_max_variation。
⒊成员函数detectRegions检测并返回找到的所有区域,输出参数msers、bboxes都是列表格式,列表长度为N,对应于找到的N个区域。
⒋列表msers的第i个元素msers[i]是形如(k,2)的Numpy数组,表示第i个区域点集,k是第i个区域的像素点数量。msers[i]的每一行msers [i][k,:]表示第i个区域的第k个像素点的坐标[x,y]。
⒌列表bboxes的第i个元素bboxes[i]是形如(4,)的Numpy数组,表示第i个区域的垂直边界矩形。数组元素[x, y, w, h]分别表示左上角顶点坐标 (x,y)、矩形宽度w和高度h。


3. 例程14.29:特征检测之最大稳定极值区域(MSER)

本例程示例MSER检测最大稳定极值区域,并通过NMS删除重复结果。MSER检测到4082个区域,NMS删除重复结果后减少到了149个区域。

# 14.29 特征检测之最大稳定极值区域(MSER)
import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt

def NonMaxSuppression(boxes, thresh=0.5):
    x1, y1 = boxes[:,0], boxes[:,1]
    x2, y2 = boxes[:,0]+boxes[:,2], boxes[:,1]+boxes[:,3]
    area = boxes[:,2] * boxes[:,3]  # 计算面积
    # 删除重复的矩形框
    pick = []
    idxs = np.argsort(y2)  # 返回的是右下角坐标从小到大的索引值
    while len(idxs) > 0:        
        last = len(idxs) - 1  # 将最右下方的框放入pick 数组
        i = idxs[last]
        pick.append(i)
        # 剩下框中最大的坐标(x1Max,y1Max)和最小的坐标(x2Min,y2Min)
        x1Max = np.maximum(x1[i], x1[idxs[:last]])
        y1Max = np.maximum(y1[i], y1[idxs[:last]])
        x2Min = np.minimum(x2[i], x2[idxs[:last]])
        y2Min = np.minimum(y2[i], y2[idxs[:last]])
        # 重叠面积的占比
        w = np.maximum(0, x2Min-x1Max+1)
        h = np.maximum(0, y2Min-y1Max+1)
        overlap = (w * h) / area[idxs[:last]]
        # 根据重叠占比的阈值删除重复的矩形框
        idxs = np.delete(idxs, np.concatenate(([last], np.where(overlap > thresh)[0])))
    return boxes[pick]  # x, y, w, h

if __name__ == '__main__':
    img = cv.imread("../images/Fig0944a.tif", flags=1)
    gray = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
    height, width = gray.shape[:2]

    # 创建 MSER 对象,检测 MSER 区域
    # mser = cv.MSER_create(_min_area=500, _max_area=20000)
    mser = cv.MSER.create(_min_area=306, _max_area=20000)  # 实例化 MSER
    regions, boxes = mser.detectRegions(gray)  # 检测并返回找到的 MSER
    lenMSER = len(regions)  # 4082
    print("Number of detected MSER: ", lenMSER)
    # print(regions[0].shape, boxes[0].shape)

    imgMser1 = img.copy()
    imgMser2 = img.copy()
    for i in range(lenMSER):
        # 绘制 MSER 凸壳
        points = regions[i].reshape(-1, 1, 2)  # (k,2) -> (k,1,2)
        hulls = cv.convexHull(points)
        cv.polylines(imgMser1, [hulls], 1, (255,0,0), 2)  # 绘制凸壳 (x,y)
        # 绘制 MSER 矩形框
        x, y, w, h = boxes[i]  # 区域的垂直矩形边界框
        cv.rectangle(imgMser2, (x,y), (x+w,y+h), (0,0,255), 2)

    # 非最大值抑制 (NMS)
    imgMser3 = img.copy()
    nmsBoxes = NonMaxSuppression(boxes, 0.6)
    lenNMS = len(nmsBoxes)  # 149
    print("Number of NMS-MSER: ", lenNMS)
    for i in range(lenNMS):
        # 绘制 NMS-MSER 矩形框
        x, y, w, h = nmsBoxes[i]  # NMS 矩形框
        cv.rectangle(imgMser3, (x,y), (x+w,y+h), (0,255,0), 2)

    plt.figure(figsize=(9, 6))
    plt.subplot(131), plt.title("MSER regions")
    plt.axis('off'), plt.imshow(cv.cvtColor(imgMser1, cv.COLOR_BGR2RGB))
    plt.subplot(132), plt.title("MSER boxes")
    plt.axis('off'), plt.imshow(cv.cvtColor(imgMser2, cv.COLOR_BGR2RGB))
    plt.subplot(133), plt.title("NMS-MSER boxes")
    plt.axis('off'), plt.imshow(cv.cvtColor(imgMser3, cv.COLOR_BGR2RGB))
    plt.tight_layout()
    plt.show()


运行结果:

Number of detected MSER: 4082
Number of NMS-MSER: 149

【OpenCV 例程 300篇】247. 特征检测之最大稳定极值区域(MSER)_第1张图片

程序说明
程序运行结果如图17-9所示。
⑴ 子图1绘制MSER算法检测到的最大稳定极值区域,检测结果取决于区域面积的阈值设置。子图2绘制检测到的MSER区域的垂直边界矩形。
⑵ 子图3通过NMS方法删除了检测到的MSER区域中的重复结果。MSER算法检测到4082个区域,NMS去重后减少为 149 个区域。


4. 非极大值抑制 NMS

非极大值抑制(non maximum suppression, nms)是通常用于目标检测算法,作用是去除重复的区域,就是抑制不是极大值的元素,在这里就是去除和想要的框重叠部分过大的框。

NMS的基本思想是将所有框按得分进行排序,然后无条件保留其中得分最高的框,然后遍历其余框找到和当前最高分的框的重叠面积(IOU)大于一定阈值的框,并删除。然后继续这个过程,找另一个得分高的框,再删除和其IOU大于阈值的框,一直循环直到所有的框都被处理。

在目标检测中,常用非极大值抑制算法(NMS)对生成的大量候选框进行后处理,在 faster R-CNN 中,每一个 bbox 都有一个得分,然后使用 NMS 去除冗余的候选框,得到最具代表性的 bbox,以加快目标检测的效率。

NMS的具体实现流程为:

  • 根据候选框的类别分类概率(得分),按最高到最低将BBox排序,例如:A>B>C>D>E>F
  • 先标记最大概率矩形框A是要保留下来的,即A的分数最高,则无条件保留
  • 将B~E分别与A求重叠率IoU(两框的交并比),假设B、D与A的IoU大于设定的阈值,那么B和D可以认为是重复标记被剔除
  • 继续从剩下的矩形框C、E、F中选择概率最大的C,标记为要无条件保留下来的框,然后分别计算C与E、F的重叠度,扔掉重叠度超过设定阈值的矩形框
  • 就这样一直重复下去,直到剩下的矩形框没有了,得到所有要保留下来的矩形框

【本节完】

版权声明:
youcans@xupt 原创作品,转载必须标注原文链接:(https://blog.csdn.net/youcans/article/details/125724395)
Copyright 2022 youcans, XUPT
Crated:2022-11-28

你可能感兴趣的:(opencv,python,计算机视觉,图像处理,人工智能)