分水岭算法
用于分割多个相邻的物体。
原理
灰度图像根据灰度值可以把像素之间的关系看成山峰和山谷的关系,高亮度(灰度值高)的地方是山峰,低亮度的地方是山谷。给每个孤立的山谷(局部最小值)不同颜色的水(label),当水涨起来,根据周围的山峰(梯度),不同的山谷也就是不同的颜色会开始合并,要避免这个,可以在水要合并的地方建立障碍,直到所有山峰都被淹没。所创建的障碍就是分割结果,这个就是分水岭的原理,但是这个方法会分割过度,因为有噪点,或者其他图像上的错误。所以OpenCV实现的分水岭算法,可以指定哪些是要合并的点,哪些不是,我们要做的是给不同的标签。给我们知道是前景或者是目标用一种颜色加上标签,给我们知道是背景或者非目标加上另一个颜色,最后不知道是什么的区域标记为0。
这篇文章翻译地很好了:
OpenCV-Python教程:31.分水岭算法对图像进行分割
markers = cv2.watershed(img, markers)
# img: 8-bit 3-channel image
# markers: 32-bit single-channel
# markers(input): 0表示未知区域, 其他正数表示确定是不同物体的标签
# markers(output): -1表示是边界
# 初始化marker的基本套路
img = cv2.imread('xxx.png')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
ret, thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV+cv2.THRESH_OTSU)
# noise removal
kernel = np.ones((3,3), np.uint8)
opening = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, kernel, iterations = 2)
# sure background area
sure_bg = cv2.dilate(opening, kernel, iterations=3)
# Finding sure foreground area
dist_transform = cv2.distanceTransform(opening, cv2.DIST_L2, 5)
ret, sure_fg = cv2.threshold(dist_transform, 0.7*dist_transform.max(), 255, 0)
# Finding unknown region
sure_fg = np.uint8(sure_fg)
unknown = cv2.subtract(sure_bg, sure_fg)
# Marker labelling
ret, markers = cv2.connectedComponents(sure_fg)
# Add one to all labels so that sure background is not 0, but 1
markers = markers + 1
# Now, mark the region of unknown with zero
markers[unknown==255] = 0
GrabCut算法
mask = cv2.grabCut(img, mask, rect, bgdModel, fgdModel, iterCount, mode=None)
"""
img: 8-bit 3-channel image
mask: 8-bit single-channel 最终的结果,shape和img一样
当mode设置为cv2.GC_INIT_WITH_MASK时,需要用户自己对mask进行初始化
矩阵里面只有四个值:
GC_BGD = 0, //背景
GC_FGD = 1, //前景
GC_PR_BGD = 2, //可能背景
GC_PR_FGD = 3 //可能前景
rect: 一块矩形区域,矩形外面一定是背景,当mode设置为cv2.GC_INIT_WITH_RECT时,才会使用
bgdModel, fgdModel: 算法过程中用到的临时矩阵,不用管,传None即可
mode:
cv2.GC_INIT_WITH_RECT
cv2.GC_INIT_WITH_MASK
"""
RECT可以通过findContour等方式获得
获得mask之后,从源图像中提取前景的方法
mask2 = np.where((mask == 2) | (mask == 0), 0, 1).astype('uint8')
img = img * mask2[:, :, np.newaxis]