深度学习之语义分割算法(入门学习)

深度学习之语义分割算法(入门学习)_第1张图片

>>>深度学习Tricks,第一时间送达<<<

目录

 写在前面

一、前言

二、深度学习的图像分割分类

1.语义分割

2.实例分割

3.全景分割

三、语义分割的基本原理

四、语义分割的常用运算及评价指标

关于算法改进及论文投稿可关注并留言博主的CSDN

>>>一起交流!互相学习!共同进步!<<<


‍ 写在前面 ✨

小海带近期对语义分割算法比较感兴趣,今后会不断学习以及更新深度学习图像分割领域的知识,感兴趣的小伙伴可以一起讨论交流哇!关于计算机视觉以及YOLO算法改进方面也会偶尔更新一下下,需要代码咨询的小伙伴可以随时给小海带留言喔 ~

一、前言

语义分割初认识——语义分割 (Semantic segmentation) 是指将图像中的每个像素链接到类标签的过程。这些标签可能包括人、车、道路、建筑、花、家具等等。

二、深度学习的图像分割分类

深度学习的图像分割按分割目的可分为语义分割、实例分割以及全景分割三类:

1.语义分割

语义分割(Semantic Segmentation)是对图像中每个像素进行分类,从而将图像分割成几个含有不同类别信息的区域。

2.实例分割

实例分割(Instance Segmentation)是在语义分割的基础上将同类物体中的不同个体的像素区分开。

3.全景分割

全景分割(Panoptic Segmentation)则是语义分割和实例分割的结合。不同于实例分割只对图像中的物体进行检测和分割,全景分割是对图中的所有物体包括背景都进行检测和分割。

深度学习之语义分割算法(入门学习)_第2张图片

 语义分割、实例分割和全景分割三者的区别

三、语义分割的基本原理

基于卷积神经网络的语义分割模型是语义分割的主要方法。

语义分割的原理可概括为:以尺寸为{\color{Green} }H\times W\times 3{\color{Yellow} }的RGB图像作为语义分割模型的输入,其中H代表图像的高,W代表图像的宽,3代表RGB三个颜色通道。语义分割模型对输入交替进行卷积操作、池化操作以及上采样操作,从而得到尺寸为H\times W\times N的输出,其中N代表分类的类别数。在输出的空间维度H\times W上的每一个元素都是含有N个数值的一维向量,若其中的第i个数值最大,则表示该元素对应的像素更可能属于第i类。通过选出每个向量中最大值对应的类别数,可将该输出转变为尺寸为H\times W\times 1的逐像素标签。进一步对每一类像素标签用特定的颜色表示,即可得到输入图像的语义分割结果。

四、语义分割的常用运算及评价指标

语义分割模型会对输入图像交替进行卷积运算、池化运算、以及转置卷积运算,从而将输入图像转变为逐像素标签。在模型的训练过程中,需要依据损失函数来不断更新模型参数,语义分割任务中常用的损失函数是交叉熵损失函数。语义分割任务采用mIoU(mean Intersection over Union)这一指标来衡量语义分割模型的分割性能。

学习内容来源于:​入门|深度学习中的语义分割

关于算法改进及论文投稿可关注并留言博主的CSDN

>>>一起交流!互相学习!共同进步!<<<

你可能感兴趣的:(语义分割算法,人工智能,深度学习,学习)