综述:基于深度学习的语义分割-以及源代码

综述:基于深度学习的语义分割

[email protected]

综述:基于深度学习的语义分割-以及源代码_第1张图片

语义分割示例

什么是语义分割?

深度学习和计算机视觉社区中的大多数人都知道什么是图像分类:我们希望我们的模型告诉我们图像中存在单个对象或场景。分类是非常粗糙和high-level的。

许多人熟悉目标检测,在其中我们试图通过在图像周围绘制边界框然后对框内的内容进行分类来对图像中的多个对象进行定位和分类。目标检测是mid-level,mid-level有一些非常有用且详细的信息,但是由于我们只是绘制边界框而并没有真正了解对象形状,因此它仍然有些粗糙。

语义分割是这三种中最富含信息的,我们希望在其中分类图像中的每个像素,就像您在上面的gif中看到的一样! 在过去的几年中,这完全是通过深度学习来完成的。

在本指南中,您将学习语义分割模型的基本结构和工作原理,以及所有最新和最先进的方法。

如果您想自己尝试模型,可以下载语义分割源码,其中包含本指南中许多模型的TensorFlow测试代码!

基本结构

我将向您展示的语义分割模型的基本结构存在于所有最新方法中!这使得实现不同的模型非常容易,因为几乎所有模型都具有相同的底层主干,设置和流程。

U-Net模型很好地说明了这种结构。模型的左侧代表为图像分类训练的任何特征提取网络。其中包括VGGNet,ResNets,DenseNets,MobileNets和NASNets等网络!您可以使用任何您想要的模型。

选择分类网络以进行特征提取时要注意权衡。使用非常深的ResNet152可以使您获得很高的

你可能感兴趣的:(计算机视觉综述,计算机视觉,生物模式识别)