opencv 十六 python下各种连通域处理方法(按面积阈值筛选连通域、按面积排序筛选连通域、连通域分割等方法)

本博文基于python-opencv实现了按照面积阈值筛选连通域、按照面积排序筛选topK连通域、 连通域细化(连通域骨架提取)、连通域分割(基于分水岭算法使连通域在细小处断开)、按照面积排序赛选topK轮廓等常见的连通域处理代码。并将代码封装为shapeUtils类,在自己的python代码中import shapeUtil后即可使用相应的连通域处理方法。

1、背景知识

1.1 轮廓

轮廓(Contour )由连续的点组成,以线条的形式聚集在一起,通常是一个有x,y组成的点集,形式为N x 2(N表示轮廓中有n个点)。其是空心的,通常所统计的轮廓面积是那一圈线所包含的面积。在opencv中使用cv2.findContours来查找轮廓,使用cv2.contourArea来统计轮廓包含的面积,使用cv2.drawContours绘制轮廓。如下图就包含了2个轮廓
opencv 十六 python下各种连通域处理方法(按面积阈值筛选连通域、按面积排序筛选连通域、连通域分割等方法)_第1张图片

1.2 连通域

连通域(Connection)由在空间上连续(相邻)的像素点组成,是一个图形区域。相邻的标准有4连通域和8连通域,具体可以参考https://zhuanlan.zhihu.com/p/394073982。对二值图统计完连通域后,得到一个labels图,具体如下右图所示,其背景区域被标记为0,每个联通域的值都从原来的255更改为连通域序号。下图是按照8连通域的方式进行统计的,如果按照4连通域进行统计,那么标记为2的连通域就会被断开为两个(总共会有5个连通域,标签从1~5)。
opencv 十六 python下各种连通域处理方法(按面积阈值筛选连通域、按面积排序筛选连通域、连通域分割等方法)_第2张图片

1.3 连通域与轮廓的转换

连通域信息与轮廓存在本质的区别,联通域是一个形状(Mat),轮廓是一个闭合的线条点集(list,元素为坐标)。我们可以使用cv2.drawContours将轮廓绘制为连通域,也可以使用cv2.findContours统计连通域的轮廓信息。在某些情况下,一个轮廓就可以对应一个连通域;当连通域中存在孔洞的时候,则需要多个轮廓才能表示一个连通域。
具体如下图所示,当连通域没有孔洞时,可以转换为一个轮廓;当前存在一个孔洞时,则需要转换2个轮廓。
opencv 十六 python下各种连通域处理方法(按面积阈值筛选连通域、按面积排序筛选连通域、连通域分割等方法)_第3张图片

2、连通域处理方法

2.1 按照面积阈值筛选连通域

通过cv2.connectedComponentsWithStats函数统计出联通域的信息,labels为连通域标记图(具体参考1.2中的描述),stats为联通域统计信息(可见代码中的注释,其包含连通域的xywhs信息),通过对联通域统计信息stats的判断(将连通域面积与阈值threshold进行比较),修改连通域标记图labels将小于阈值的连通域标签值修改为0)。最后通过二值化方法,将联通域标记图转换为二值图。

import cv2
import numpy as np 
class shapeUtils:   
	def find_big_areo(img,threshold=1000):
        #https://blog.csdn.net/weixin_44599604/article/details/111687531
        retval, labels, stats, centroids = cv2.connectedComponentsWithStats(img, connectivity=8)
        #stats的格式为二维数组,其中每一个元素为 x,y,w,h,s的格式,s为联通域面积
        '''
        stats      #我们看出有3个连通区域
                   # x   y   w   h  s 
        >>> array([[ 0,  0, 10, 10, 76],  # 这代表整个图片,0值也有连通区域
                   [ 4,  1,  5,  6, 18],  # 这里18代表有18个像素 下面的6同理
                   [ 2,  2,  3,  2,  6]], dtype=int32)
        '''
        for i in range(1,stats.shape[0]):
            conj=i#获取联通域的标记值
            areo=stats[i,4]
            if areo<threshold:
                labels[labels==conj]=0
        labels=labels.astype(np.uint8)
        ret,labels=cv2.threshold(labels,1,255,cv2.THRESH_BINARY)
        return labels
img=cv2.imread("res.png",0)
ret,img=cv2.threshold(img,64,255,cv2.THRESH_BINARY)
im2=shapeUtils.find_big_areo(img,5000)
cv2.imshow("img",img)
cv2.imshow("labels",im2)
cv2.waitKey()

opencv 十六 python下各种连通域处理方法(按面积阈值筛选连通域、按面积排序筛选连通域、连通域分割等方法)_第4张图片

2.2 按照面积排序筛选topK连通域

按照面积排序筛选topK连通域。先使用connectedComponentsWithStats统计出labels和stats,然后创建一个行号(其实就是labels中连通域的标签值),并使其与stats的shape相同并将其与stats拼接在一起(在原始的stats中,第i个信息对应着标签值为i的联通域,对stats按面积排序后则会无法正常对应,故需要进行拼接),然后使用np.argsort对stats进行排序,在根据排序结果将topk个连通域后的标签值全部修改为0(将topk后的连通域删除),最后通过二值化方法,将联通域标记图转换为二值图。


import cv2
import numpy as np 
class shapeUtils:   
        def find_topK_areo(img,k=1):
        #https://blog.csdn.net/weixin_44599604/article/details/111687531
        retval, labels, stats, centroids = cv2.connectedComponentsWithStats(img, connectivity=8)
        #stats的格式为二维数组,其中每一个元素为 x,y,w,h,s的格式,s为联通域面积
        '''
        stats      #我们看出有3个连通区域
                   # x   y   w   h  s 
        >>> array([[ 0,  0, 10, 10, 76],  # 这代表整个图片,0值也有连通区域
                   [ 4,  1,  5,  6, 18],  # 这里18代表有18个像素 下面的6同理
                   [ 2,  2,  3,  2,  6]], dtype=int32)
        '''
        #创建一个行号,并使其与stats的shape相同
        rows_num=[x for x in range(stats.shape[0])]
        rows_num=np.array(rows_num)#shape (3)
        rows_num=rows_num.reshape((-1,1)) #shape (3,1)

        print(rows_num.shape,stats.shape)
        #数据维度变化:(3, 1) (3, 5)=>(3, 6)
        stats=np.concatenate((rows_num,stats),axis=1)#拼接时要仅有一个维度不同,才能拼接
        #此时的stats的格式为二维数组,其中每一个元素为 x,y,w,h,s的格式,s为联通域面积
        '''
        拼接后的 stats 如下所示
                  #row x   y   w   h  s 
        >>> array([[0, 0,  0, 10, 10, 76],  # 这代表整个图片,0值也有连通区域
                   [1, 4,  1,  5,  6, 18],  # 这里18代表有18个像素 下面的6同理
                   [2, 2,  2,  3,  2,  6]], dtype=int32)
        '''

        #安装面积对连通域进行排序
        sortId=np.argsort(stats[:,-1])#生成一个排序好的下标,从小到大排序
        sortId=sortId[::-1]#对下标进行逆序,使其变为从大到小的排序
        stats=stats[sortId]#根据序号重新取数据
        #stats=stats[np.argsort(stats[:,-1])[::-1] ]
        print(stats)

        #将第k面积个后的连通域label设置为0
        for i in range(k+1,stats.shape[0]):
            conj=stats[i][0]#获取联通域的标记值
            labels[labels==conj]=0
        print(labels

你可能感兴趣的:(opencv实战,opencv,python,人工智能)