关于马尔科夫随机场(MRF)在图像分割中应用的个人理解

首先明确几个基本概念(个人理解):

先验概率: 基于历史经验得到的当前事件发生的概率

后验概率: 根据数据或证据得到的事件发生的概率 (由因到果)

似然概率: 已知事件发生的概率下数据或证据发生的概率 (由果到因)


图像分割和目标识别都可以看成一个图像中各个像素点做label的过程。例如进行边缘检测,就是以一定阈值判断这些像素值属于标签集{edge,nonedge}中的哪一类。

为此,我们认为每个像素s在图像中具有一个特征向量,对整张图有

定义每个像素s属于label ws,对整张图有

根据以上定义,图形分割从概率的角度来说就是一种求各像素点属于每个label的概率,取其中最大的那个label的过程。

P(w|f)表示基于observed feature f的条件下属于一个标签的概率,也叫后验概率。因此,该过程就是最大化后验概率来寻找最优标签w。该思想被称作MAP(Maximum a Posteriori),即就是

基于贝叶斯理论可知P(w|f)与P(f|w)和P(w)有关

关于马尔科夫随机场(MRF)在图像分割中应用的个人理解_第1张图片

P(f|w)就是似然概率,P(w)是先验概率,P(f)是一个常量。

由于图像中某些区域的相邻像素点见会有相似的颜色,纹理之类的,那么马尔科夫随机场这种概率模型就能够得到很好的应用。

根据The Hammersley-Clifford Theorem可知,当且仅当先验概率P(w)满足Gibbs分布时,随机场为马尔可夫场。Gibbs分布就是如下形式

关于马尔科夫随机场(MRF)在图像分割中应用的个人理解_第2张图片

是归一化参数。

 

下面介绍Clique的概念。

当一个子集C属于S满足其中的每一对像素点都是相邻的情况下,该子集被称为clique,含有n个像素的C为Cn。图像中clique的交集表示为C,即

对每个C,对应有一个clique potential,定义为Vc(w),w是前文中的标签。那么易得

我们一般假定似然概率符合高斯分布(因为噪声呈高斯分布?)

对于定义的Clique potentials有以下值:

关于马尔科夫随机场(MRF)在图像分割中应用的个人理解_第3张图片关于马尔科夫随机场(MRF)在图像分割中应用的个人理解_第4张图片

singleton(单个像素点)Clique potential=logP(f|w)

doubleton(像素点对)Clique potential是一个分段函数,与平滑性有关,参数beta越大则该区域越homogenous(同质)

定义mrf模型的能量方程为

关于马尔科夫随机场(MRF)在图像分割中应用的个人理解_第5张图片

寻找最优w的过程就是优化能量函数的过程。

以上就是基本思路,常用优化算法如模拟退火 梯度下降之类的对能量函数进行优化。

 

参考资料:https://inf.u-szeged.hu/~ssip/2008/presentations2/Kato_ssip2008.pdf,主要为翻译,附带一点个人理解。

你可能感兴趣的:(其他)