十三 动手学深度学习v2计算机视觉 ——语义分割

文章目录

  • 分割
    • 图像分割
    • 语义分割
    • 实例分割

分割

图像分割指的是使用边界、色彩梯度等特征对图像进行划分,但只能是进行划分,算法并不对划分出的部分有语义上的理解;
而随着计算能力提高以及卷积神经网络的发展,能够理解分割后图像语义的算法逐渐出现,能够理解语义的图像分割,称为语义分割。
实例分割(Instance Segmentation)和语义分割(Semantic Segmentation)是计算机视觉中两个不同但相关的任务,它们的主要区别在于对图像中像素的标注方式。

图像分割

图像分割指的是使用边界、色彩梯度等特征对图像进行划分,此时比较火的算法有Ostu、FCM、分水岭、N-Cut等,这些算法一般是非监督学习,分割出来的结果并没有语义的标注,换句话说,分割出来的东西并不知道是什么。
语义分割

语义分割

随着卷积神经网络的发展,对图像理解能力大大增强,算法逐渐可以对分割出来的部分进行分类,即对分割结果进行语义标注,称为语义分割,常用的方法有U-Net等。
语义分割的目标是为图像中的每个像素分配一个语义类别标签,从而将图像划分为不同的语义区域。

输出

对于每个像素,模型给出一个类别标签,表示该像素属于图像中的哪一类物体或场景。通常使用不同的颜色来可视化不同的类别。

实例分割

实例分割的任务是在语义分割的基础上更进一步,不仅要标注像素的语义类别,还要将同一类物体中的不同实例进行区分。对于每个像素,除了给出类别标签外,还需要为每个属于同一类的物体实例分配一个唯一的标识符。 实例分割在需要区分图像中同一类别物体的不同实例的场景中非常有用,如多目标跟踪、机器人视觉等。

语义分割关注的是将图像中的每个像素标记为属于哪个语义类别,而不考虑同一类别内的不同实例。实例分割在语义分割的基础上引入了实例的概念,要求不仅标记语义类别,还要为同一类别内的不同实例分配唯一标识符。

你可能感兴趣的:(动手学深度学习,深度学习,计算机视觉,人工智能)