智能剪刀算法学习笔记

写在前面的话:如果以后我看到什么不懂的话,我一定会说:”天哪,这简直比计算机视觉还难!“

一边看论文,一边整理思路,决定整个思考过程都像流水账一样记下来。

高能:由于先整理思路,然后再动手写代码,所以,前面的内容可能有错,仅作为个人课程设计之用,请保持个人独立思考和分辨是非的习惯————>+_+。

智能剪刀概述

“智能剪刀”( Intelligent Scissors) 是 Morten-son 和 Barrett 在 1995 年提出来的一种图像分割交互工具,它可用于 2D 图像分割 ,通过这个工具, 用户可以容易且精确地在图像中勾画出感兴趣的区域 ROI( Region Of Interest) 。[3]

图像区域耗费值

图像区域耗费值(Image Local Cost) 是图像边界提取的依据。
Morten-son 和 Barrett 先后在1995年发表论文[1] 和 1998年发表论文[2] 。在两次的论文中,对于ILC 的取值有点不一样。
现在一般而言,ILC 的取值一共由六项图像特征值加权和[2],分别是:

  • 拉普拉斯交零点值(Laplacian zero-crossing)
  • 梯度量值(Gradient magnitude)
  • 梯度方向值(Gradient direction)
  • 边界像素灰度值(Edge pixel value)
  • 内部像素灰度值(Inside pixel value)
  • 外部像素灰度值(Outside pixel value)

而在论文[1] 中,仅由前面三项决定。

l(p,q)表示ILC 的值,p 表示像素,q表示p 的相邻像素。(p、q 是一维的矢量,表示像素在图像中的坐标)
那么在论文[1] 中的计算如下:
这里写图片描述

其中,各个变量值如下:

说明
fZ(q) 拉普拉斯交叉零点
fD(p, q) 梯度值方向
fG(q) 梯度值
WZ 加权值,0.43
WD 加权值,0.43
WG 加权值,0.14

在论文[2] 中,这个公式的计算如下:

说明
fZ(q) 拉普拉斯交叉零点
fD(p, q) 梯度值方向
fG(q) 梯度值
fP(q) 边界像素值
fI(q) 内部像素值
fO(q) 外部像素值
WZ 加权值,0.3
WD 加权值,0.3
WG 加权值,0.1
WP 加权值,0.1
WI 加权值,0.1
WO 加权值,0.1

fZ - 拉普拉斯交叉零点

fZ的计算如下:
这里写图片描述

其中 IL 表示的是图像的拉普拉斯变换值。
IL 的计算是使用如下模板对图像做卷积:

0 1 0
1 -4 1
0 1 0

(对图像进行二阶求导)

fG - 梯度值

令 IX 和 IY 表示像素在 x 和 y 方向的梯度,则梯度 G 的计算如下:
这里写图片描述

为使高梯度产生低能量,fG的计算定义如下:
智能剪刀算法学习笔记_第1张图片

其中IX 和 IY 的计算如下:

IX(i, j) = IX(i+1, j) -IX(i, j)
IY(i, j) = IX(i, j+1) - IX(i, j)

i, j 是像素的坐标

fD - 梯度方向值

假设 D(p) 表示的是像素点 p 的梯度方向,而 D(p) 表示的与梯度方向垂直的向量(顺时针旋转90° 得来),那么 D(p) 和 D(p) 的计算如下:

D(p) = [ IX(p), IY(p) ]
D(p) = [ IY(p), -IX(p) ]

fD这个在两篇论文里面计算的方式不一样。
在论文[1] 中如下:
这里写图片描述

*cos[]-1 表示的是反余弦函数

其中dp 和 dq 的计算如下:

这里写图片描述

在论文[2] 中这个公式变为:
这里写图片描述

L 的计算也变为:

*|| p - q || 表示的泛数,这里是两个向量差的平方和再开根
*原来的论文中还有一段fD 计算的举例,我验算了好久,才发现,好像坐标轴是

^
– | –>

这么放的………………可是我们是在处理图像呀……摔~

fP - 边界像素值


*I(p) 表示该坐标的像素值

fI 和 fO

内部像素值和外部像素值分别是在像素点的梯度方向和反方向的偏移像素值。
智能剪刀算法学习笔记_第2张图片

k是一个恒定距离值(由用户定义)。而偏移的像素也可以是最近的像素值(默认)或由周围的四个像素双线性插值得来。

最短路径生成算法

在计算出ILC 值后,就可以计算最短路径生成算法了。
这个算法在论文中有很详细的解释。
智能剪刀算法学习笔记_第3张图片

【参考资料】
[1] Mortensen E N, Barrett W A. Intelligent scissors for image composition[C]//Proceedings of the 22nd annual conference on Computer graphics and interactive techniques. ACM, 1995: 191-198.
[2] Mortensen E N, Barrett W A. Interactive segmentation with intelligent scissors[J]. Graphical models and image processing, 1998, 60(5): 349-384.
[3] 李志鹏. 智能剪刀在进入式漫游中的应用[J]. 计算机与数字工程, 2010, 38(3): 143-145.

你可能感兴趣的:(智能剪刀算法学习笔记)