Python计算机视觉-图像分割

图像分割

图像分割是将一幅图像分割成有意义区域的过程。区域可以是图像的前景与背景或图像中一些单独的对象,这些区域可以利用一些诸如颜色、边界或近邻相似性等特征进行构建。

图割(Graph Cut)

图割是将一个有向图分割成两个互不相交的集合,可以用来进行例如三维重建、图像拼接、图像分割等视觉方面的问题解决。
从图像像素和像素的近邻创建一个图,并引入一个能量或“代价”函数,就能利用图割方法将图像分割成两个或多个区域,而图割的基本思想就是将相似且彼此相近的像素划分到同一区域中。

图割图中所有边 C 的代价函数为割掉的边权重求和:Ecut = Σ(i,j)∈c (wij)
对图的划分应使代价 Ecut 最小,而为了拉开前景与背景,增加两个额外节点,即源点和汇点,仅考虑那些将源点和汇点分开的切割。而寻找最小割等同于在源点和汇点间寻找最大流,即最大流/最小割问题,在以下的例子中将采用 python-graph 工具包中的算法进行最大流最小割的计算。

以下是一个最大流/最小割的简单例子:
创建4个节点的有向图,索引分别是0…3,add_edge() 函数增添边,并为每条边指定特定权重用以衡量边的最大流容量。0为源点,3为汇点计算最大流;

from pygraph.classes.digraph import digraph
from pygraph.algorithms.minmax import maximum_flow

gr = digraph()
gr.add_nodes([0,1,2,3])
gr.add_edge((0,1), wt=4)
gr.add_edge((1,2), wt=3)
gr.add_edge((2,3), wt=5)
gr.add_edge((0,2), wt=3)
gr.add_edge((1,3), wt=4)
flows,cuts = maximum_flow(gr, 0, 3)
print ('flow is:' , flows)
print ('cut is:' , cuts)

运行结果显示流穿过的每条边和割出的节点标记结果,0表示与源点相连的节点,1表示与汇点相连的节点:
在这里插入图片描述

从图像创建图

给定一个邻域结构我们可以利用图像像素作为节点定义一个图,以下我们采用最简单的像素四邻域和前景与背景的情况分析。
像素与像素之间权重为 wij,源点到像素权重为 wsi,像素到汇点的权重为 wit

下面的例子读取一幅图像,从图像两个矩形区域估计出类概率,创建一个图,其中用到 PCV 包中的图割函数和贝叶斯分类器:

# -*- coding: utf-8 -*-

from scipy.misc import imresize
from PCV.tools import graphcut
from PIL import Image
from numpy import *
from pylab import *

im = array(Image.open("empire.jpg"))
im = imresize(im, 0.07)
size = im.shape[:2]
print ("OK!!")

# add two rectangular training regions
labels = zeros(size)
labels[3:18, 3:18] = -1
labels[-18:-3, -18:-3] = 1
print ("OK!!")


# create graph
g = graphcut.build_bayes_graph(im, labels, kappa=1)

# cut the graph
res = graphcut.cut_graph(g, size)
print ("OK!!")


figure()
graphcut.show_labeling(im, labels)

figure()
imshow(res)
gray()
axis('off')

show()

原图:
Python计算机视觉-图像分割_第1张图片
训练区域与分割结果:
Python计算机视觉-图像分割_第2张图片Python计算机视觉-图像分割_第3张图片

你可能感兴趣的:(计算机视觉)