图像分割是将一幅图像分割成有意义区域的过程。区域可以是图像的前景与背景或图像中一些单独的对象。这些区域可以利用一些诸如颜色,边界或近邻相似性等特征进行构建。
首先创建有4个节点的有向图,4个节点的索引分为0,1,2,3,如下图所示:
然后用add_edge()增添边并为每一条边指定特定的权重。边的权重用来衡量边的最大流容量。
from pygraph.classes.digraph import digraph
from pygraph.algorithms.minmax import maximum_flow
gr = digraph()
gr.add_nodes([0,1,2,3])
gr.add_edge((0,1), wt=4)
gr.add_edge((1,2), wt=3)
gr.add_edge((2,3), wt=5)
gr.add_edge((0,2), wt=3)
gr.add_edge((1,3), wt=4)
flows,cuts = maximum_flow(gr, 0, 3)
print ('flow is:' , flows)
print ('cut is:' , cuts)
以节点0位源点,3位汇点,计算最大流。打印出流和分割结果。打印结果如下:
0是包含源点的部分,1是与汇点相连的节点。
给定一个领域结构,我们可以利用图像像素作为节点定义一个图。这里我们讨论最简单的像素四领域和两个图像区域(前景和背景)情况。一个四领域指一个像素与其正上方,正下方,左边,右边的像素直接相连。
处理像素节点外,我们还需要两个特定的节点——“源”点和“汇”点,来分别代表图像的前景和背景。
下面给出创建这样一个图的步骤:
1、每个像素节点都有一个从源点的传入边
2、每个像素点都有一个汇点的传出边
3、每个像素节点都有一条传入边和传出边连接到它的近邻
为确定变的权重,需要一个能够确定这些像素点之间,像素点与源点,汇点之间边的权重(表示那条边的最大流)的分割模型。
# -*- coding: utf-8 -*-
from scipy.misc import imresize
from PCV.tools import graphcut
from PIL import Image
from numpy import *
from pylab import *
im = array(Image.open("empire.jpg"))
im = imresize(im, 0.07)
size = im.shape[:2]
print ("OK!!")
# 添加两个矩阵训练区域
labels = zeros(size)
labels[3:18, 3:18] = -1
labels[-18:-3, -18:-3] = 1
print ("OK!!")
# 创建图
g = graphcut.build_bayes_graph(im, labels, kappa=1)
# 对图进行分割
res = graphcut.cut_graph(g, size)
print ("OK!!")
figure()
graphcut.show_labeling(im, labels)
figure()
imshow(res)
gray()
axis('off')
show()
读取一幅图像,从图像的两个矩阵区域估计出类概率,然后创建一个图。我们利用imresize()函数使图像小到合适我们的python graph库,在该例中将图像统一缩放到原图像尺寸的7%。图像分割后将结果和训练区域一起画出来。
结果如下: