图像分割算法

图像分割算法

        图像分割是计算机视觉研究中的一个经典难题,已经成为图像理解领域关注的一个热点,图像分割是图像分析的第一步,是计算机视觉的基础,是图像理解的重要组成部分,同时也是图像处理中最困难的问题之一。所谓图像分割是指根据灰度、彩色、空间纹理、几何形状等特征把图像划分成若干个互不相交的区域,使得这些特征在同一区域内表现出一致性或相似性,而在不同区域间表现出明显的不同。简单的说就是在一副图像中,把目标从背景中分离出来。对于灰度图像来说,区域内部的像素一般具有灰度相似性,而在区域的边界上一般具有灰度不连续性。
        关于图像分割技术,由于问题本身的重要性和困难性,从20世纪70年代起图像分割问题就吸引了很多研究人员为之付出了巨大的努力。虽然到目前为止,还不存在一个通用的完美的图像分割的方法,但是对于图像分割的一般性规律则基本上已经达成的共识,已经产生了相当多的研究成果和方法。

1. 传统分割方法

        深度学习大火之前,主要利用数字图像处理、拓扑学、数学等方面的方法来进行图像分割。

(1)基于阈值的分割方法
        阈值法的基本思想是基于图像的灰度特征来计算一个或多个灰度阈值,并将图像中每个像素的灰度值与阈值作比较,最后将像素根据比较结果分到合适的类别中。因此,该方法最为关键的一步就是按照某个准则函数来求解最佳灰度阈值。阈值法特别适用于目标和背景占据不同灰度级范围的图。

(2)基于区域的图像分割方法

A. 区域生长

        区域生长是从一组代表不同生长区域的种子像素开始,接下来将种子像素邻域里符合条件的像素合并到种子像素所代表的生长区域中,并将新添加的像素作为新的种子像素继续合并过程,知道找不到符合条件的新像素为止。该方法的关键是选择合适的初始种子像素以及合理的生长准则。

B. 区域分裂合并

        区域生长是从某个或者某些像素点出发,最终得到整个区域,进而实现目标的提取;而分裂合并可以说是区域生长的逆过程,从整幅图像出发,不断的分裂得到各个子区域,然后再把前景区域合并,得到需要分割的前景目标,进而实现目标的提取。

C. 分水岭算法

        分水岭分割方法,是一种基于拓扑理论的数学形态学的分割方法,其基本思想是把图像看作是测地学上的拓扑地貌,图像中每一点像素的灰度值表示该点的海拔高度,每一个局部极小值及其影响区域称为集水盆,而集水盆的边界则形成分水岭。分水岭的概念和形成可以通过模拟浸入过程来说明。在每一个局部极小值表面,刺穿一个小孔,然后把整个模型慢慢浸入水中,随着浸入的加深,每一个局部极小值的影响域慢慢向外扩展,在两个集水盆汇合处构筑大坝,即形成分水岭。

(3)基于边缘检测的分割方法

        基于边缘检测的图像分割算法试图通过检测包含不同区域的边缘来解决分割问题。

2. 结合特定工具的图像分割算法

(1)基于小波分析和小波变换的图像分割方法

        小波变换在时间域和频率域上都有量高的局部化性质,能将时域和频域统一于一体来研究信号,而且小波变换具有多尺度特性,能够在不同尺度上对信号进行分析,因此在图像分割方面的得到了应用。
        二进小波变换具有检测二元函数的局部突变能力,因此可作为图像边缘检测工具。图像的边缘出现在图像局部灰度不连续处,对应于二进小波变换的模极大值点。通过检测小波变换模极大值点可以确定图像的边缘小波变换位于各个尺度上,而每个尺度上的小波变换都能提供一定的边缘信息,因此可进行多尺度边缘检测来得到比较理想的图像边缘。

(2)基于遗传算法的图像分割

        遗传算法擅长于全局搜索,但局部搜索能力不足,所以常把遗传算法和其他算法结合起来应用。将遗传算法运用到图像处理主要是考虑到遗传算法具有与问题领域无关且快速随机的搜索能力。其搜索从群体出发,具有潜在的并行性,可以进行多个个体的同时比较,能有效的加快图像处理的速度。但是遗传算法也有其缺点:搜索所使用的评价函数的设计、初始种群的选择有一定的依赖性等。要是能够结合一些启发算法进行改进且遗传算法的并行机制的潜力得到充分的利用,这是当前遗传算法在图像处理中的一个研究热点。

(3)基于主动轮廓模型的分割方法

        该方法是在给定图像中利用曲线演化来检测目标的一类方法,基于此可以得到精确的边缘信息。其基本思想是,先定义初始曲线C,然后根据图像数据得到能量函数,通过最小化能量函数来引发曲线变化,使其向目标边缘逐渐逼近,最终找到目标边缘。这种动态逼近方法所求得的边缘曲线具有封闭、光滑等优点。

3. 基于深度学习的分割

(1)基于特征编码(feature encoder based)

        在特征提取领域中VGGnet和ResNet是两个非常有统治力的方法。
        A. VGGNet
        B. ResNet

(2)基于区域选择(regional proposal based)

        Regional proposal 在计算机视觉领域是一个非常常用的算法,尤其是在目标检测领域,其核心思想是检测颜色空间和相似矩阵,根据这些来检测待检测的区域,然后根据检测结果可以进行分类预测。
        在语义分割领域,基于区域选择的几个算法主要是由前人的有关于目标检测的工作渐渐延伸到语义分割的领域的:
        Stage Ⅰ:R-CNN
        Stage Ⅱ:Fast R-CNN
        Stage Ⅲ:Faster R-CNN
        Stage Ⅳ:Mask R-CNN
        Stage Ⅴ:Mask Scoring R-CNN

(3)基于RNN的图像分割

        RNN是由Long-Short-Term Memory(LSTM)块组成的网络,RNN来自序列数据的长期学习的能力以及随着序列保存记忆的能力使其在许多计算机视觉的任务中游刃有余,其中也包括语义分割以及数据标注的任务。
        A. ReSeg模型
        B. MDRNNs(Multi-Dimensional Recurrent Neural Networks)模型

(4)基于上采样/反卷积的分割方法

        卷积神经网络在进行采样的时候会丢失部分细节信息,这样的目的是得到更具特征的价值。但是这个过程是不可逆的,有的时候会导致后面进行操作的时候图像的分辨率太低,出现细节丢失等问题。因此通过上采样在一定程度上可以不全一些丢失的信息,从而得到更加准确的分割边界。
        A. FCN(Fully Convolutional Network)
        B. SetNet

(5) 基于提高特征分辨率的分割方法
        恢复在深度卷积神经网络中下降的分辨率,从而获取更多的上下文信息:DeepLab

(6)基于特征增强的分割方法
        基于特征增强的分割方法包括:提取多尺度特征或者从一系列嵌套的区域中提取特征。
        A. SLIC
        B. Zoom-Out
        C. PSPNet

(7)使用CRF/MRF的方法

        MRF全称是Marcov Random Field,马尔可夫随机场,是一种基于统计的图像分割算法;CRF的全称是Conditional Random Field,条件随机场其实是一种特殊的马尔可夫随机场。在图像分割领域,运用CRF比较出名的一个模型就是全连接条件随机场(DenseCRF)

你可能感兴趣的:(图像处理)