学习笔记 11 —【图像分割】

一、基本原理

图割(Graph Cut)是将一个有向图分割成两个互不相交的集合,可以用来解决多种计算机视觉问题,诸如立体深度重建、图像拼接和图像分割等计算机视觉方面的不同问题。在图割的过程中,从图像像素和像素的近邻创建一个图并且引入一个代价函数。

总而言之,图割的基本思想为:相似且彼此相近的像素应该划分到同一个区域。

二、代码说明

2.1 一个简单例子

from pygraph.classes.digraph import digraph
from pygraph.algorithms.minmax import maximum_flow

gr = digraph()
gr.add_nodes([0,1,2,3])
gr.add_edge((0,1), wt=4)
gr.add_edge((1,2), wt=3)
gr.add_edge((2,3), wt=5)
gr.add_edge((0,2), wt=3)
gr.add_edge((1,3), wt=4)
flows,cuts = maximum_flow(gr, 0, 3)
print ('flow is:' , flows)
print ('cut is:' , cuts)

这段代码是建立出一个图像的最大流/最小割的简单例子。
首先先用digraph()函数创建一个有4个节点的有向图,4个节点的索引分别是0,1,2,,3。然后用add_edge()增加边并且为每条边指定特殊的权重。边的权重用来衡量边的最大容流量。以0节点为源点,3为汇点,计算最大流。并且打印出最后的流和割结果:
学习笔记 11 —【图像分割】_第1张图片
运行代码之后,我们看到流的的路径是0-4,0-2,1-2,1-3,2-3.

2.2 从图像创建图

# -*- coding: utf-8 -*-

from scipy.misc import imresize
from PCV.tools import graphcut
from PIL import Image
from numpy import *
from pylab import *

im = array(Image.open("empire.jpg"))
im = imresize(im, 0.07)
size = im.shape[:2]
print ("OK!!")

# add two rectangular training regions
labels = zeros(size)
labels[3:18, 3:18] = -1
labels[-18:-3, -18:-3] = 1
print ("OK!!")


# create graph
g = graphcut.build_bayes_graph(im, labels, kappa=1)

# cut the graph
res = graphcut.cut_graph(g, size)
print ("OK!!")


figure()
graphcut.show_labeling(im, labels)

figure()
imshow(res)
gray()
axis('off')

show()

我们利用了图像的像素作为节点定义一个图。首先利用imresize()函数使图像缩小来适应我们的Python graph库,我们将图像缩小为原来的7%。用label添加两个矩形训练区域。

graphcut.build_bayes_graph() 函数的作用是创建图,这是我们用1标记前景训练数据,用-1标记背景训练数据。基于这种标记,我们在RGB值上训练出一个朴素的贝叶斯分类器,然后计算每一个像素的分类概率。

res = graphcut.cut_graph()函数的作用计算图像的最小割并将输出结果重新格式化成一个带像素标记的二值图像。

graphcut.show_labeling()函数的作用是显示标签图像。

三、效果展示

用于训练模型的标记图像:

学习笔记 11 —【图像分割】_第2张图片

分割结果图:学习笔记 11 —【图像分割】_第3张图片

你可能感兴趣的:(学习笔记 11 —【图像分割】)