Dense CRF的直观理解

原文地址:https://zhuanlan.zhihu.com/p/22464586

Dense CRF 的直观表示

用 X 表示图像上的像素,用 Z 表示预测的 label:
Dense CRF的直观理解_第1张图片
1)Plan A

最简单的建模方式就是每一个像素的类别只和自己所在的像素有关。用图来表示:
Dense CRF的直观理解_第2张图片
这个模型的计算很简单,输入是一个像素的特征,输出是一个像素所代表的类别。这个模型和一般的分类问题没有太多区别。

不过这样的效果显然不好,谁能只通过一个像素就知道这个地方是什么类别呢?这个模型虽然简单好解,但是我们一眼就可以看出,它并不是一个高级的模型。

2)Plan B

让每一个像素的类别和所有像素的信息有关,可以用下面的图表示这个模型:
Dense CRF的直观理解_第3张图片
CNN模型虽然很强大,但是CNN模型缺少一个关键点,就是 每一个像素点类别 之间实际上存在着一定关系,也就是我们常说的图像的平滑性——每一个图像像素点的类别都有可能和临近点的类别相近,这个特性是CNN模型所不具有的。所以我们对这个模型也保留意见。

3)Plan C

让每一个像素点的类别和它的 4 邻域的类别相关,于是模型变成了这个样子:
Dense CRF的直观理解_第4张图片
平滑性已经得到了一定的满足,但仅仅是这种程度的关联可能仍然不够的,如果临近的几个像素恰好产生了一点波动,不是我们想要的那个样子,那么这个像素点的类别就有可能出问题,我们还需要更深层次的关联。

4)Plan D:

为了得到更深层次的关联,提出 Dense CRF:
Dense CRF的直观理解_第5张图片
每一个像素点的类别都和其他所有像素点的类别相关,模型的复杂程度提到了最高的程度。

你可能感兴趣的:(论文笔记,#,CRF)