语义分割模型

计算机视觉中另一个关键任务就是图像语义分割,语义分割不仅仅是把物体简单的用矩形框圈出来,还将目标物体的每个像素都做了标记,分别用不同的颜色表示了不同的物体像素,从而达到了目标在语义级别的区分。作为图像分析与处理的核心技术之一,语义分割在街景分析中也体现了优势,可以当做自动驾驶设备的核心方式,同时在无人机中,也可以判断着陆点。目前,语义分割的网络和编码解码网络结构类似,开始时利用与编码器类似的识别模型完成图片的预训练,如VGG、残差网络等,随后将预训练的结果输入到解码网络,不同的解码网络可以实现不同目标物体的语义分割任务,解码网络的主要区别就在于特征是怎样实现映射的,比如跳跃连接、金字塔池化等方式。实现了将低分辨率的特征投射 到高分辨率的像素空间后,从而使特征变得能够进行判断,完成了图像在像素层面的识别工作。

在路面裂缝语义分割方面,裂缝的分割时,卷积神经网络判断的不是整体的信息,而是从单个像素上对图像语义进行区分,判断该像素是否是裂缝以及属于哪一类的裂缝。这种方法检测不方便,对裂缝块大小比较敏感,由于是单个像素的判断,所以空间关系没有得到很好的利用,裂缝的检测结果往往是不连贯的,所以效果并不明显。

语义分割网络在进行训练时,有强监督学习过程和弱监督学习过程。

语义分割的强监督学习过程在搭建预测模型时,需要许多的训练实例,并且每个训练实例中都有一个标签,标签中含有真实的输出指示。由此可见,想要得到一个有标签的数据集是十分困难的,特别是在语义分割的任务中,要求数据集中的每个像素都要有标记,使数据集的制作成本变得十分昂贵。针对数据集难以制作或得到的问题,找到降低获取数据集难度的途径变得越来越迫切。直到生成对抗网络的产生,这个问题才得以缓解。从网络的名称可知,这个网络可以生成图像,并且生成图片的分辨率也是十分高的,从而许多研究者把生成对抗网络运用到了图像语义分割领域。在语义分割中,生成对抗网络可以将数据集变得更充实,从而可以向分类器提供更加多种多样的训练样本。

语义分割的弱监督学习过程包括为三个种类,通过生成对抗网络中的生成器产生新的训练样本的方法,也可以当做是弱监督学习过程。弱监督学习过程的种类如下:一、不完全监督,这种学习过程使用的训练集不是都有标签的,带有标签的数据集通常只有一部分,剩下的数据是什么也没有的。二、不精确监督,这种训练集在制作的时候,标签在边缘部分的描述并不准确,属于粗粒度标签。三、不准确监督,这种训练集使用的一部分标签可能包含错误的信息,也就是说数据集中的标签并不都是准确的。

语义分割模型_第1张图片

你可能感兴趣的:(视觉检测,自动驾驶,汽车)