深度理解机器学习13-CNN的应用领域

CNN非常适合具有空间结构的数据。具有空间结构的数据类型的示例有声音、图像、视频和文本。在自然语言处理中,CNN用于各种任务,如句子分类。一个例子是情感分类的任务,其中句子被分类为属于预定的类别组。

面部识别

深度理解机器学习13-CNN的应用领域_第1张图片

 

大多数社交网站都使用CNN来检测人脸,然后执行标记等任务。

物体检测

深度理解机器学习13-CNN的应用领域_第2张图片

 

CNN同样能够检测图像中的物体。有几种基于CNN的架构用于检测物体,其中最受欢迎的是R-CNN(Region CNN)。一个R-CNN的工作原理是应用选择性搜索来找出区域,然后使用CNN进行分类,一次一个区域。

图像字幕

深度理解机器学习13-CNN的应用领域_第3张图片

 

该任务包括为图像创建文本描述。执行图像字幕的一种方法是用循环神经网络(RNN)替换第二部分中的全连接层。

语义分割

深度理解机器学习13-CNN的应用领域_第4张图片

 

语义分割是将图像分割成更有意义的部分的任务。图像中的每个像素被分类为属于某个类别。一个可以用来执行语义分割的结构是一个全卷积网络(Fully Convoluted Network,FCN)。FCN架构在两个方面与前一个略有不同:它没有全连接层,并且具有上采样。上采样是使输出图像更大的过程,最好与输入图像大小相同。

CNN 的价值:

  1. 能够将大数据量的图片有效的降维成小数据量(并不影响结果)

  2. 能够保留图片的特征,类似人类的视觉原理

CNN 的基本原理:

  1. 卷积层 – 主要作用是保留图片的特征

  2. 池化层 – 主要作用是把数据降维,可以有效的避免过拟合

  3. 全连接层 – 根据不同任务输出我们想要的结果

CNN 的实际应用:

  1. 图片分类、检索

  2. 目标定位检测

  3. 目标分割

  4. 人脸识别

  5. 骨骼识别

维基百科版本

在深度学习中,卷积神经网络(CNN或ConvNet)是一类深度神经网络,最常用于分析视觉图像。

CNN使用多层感知器的变体设计,需要最少的预处理。它们也被称为移位不变或空间不变人工神经网络(SIANN),基于它们的共享权重架构和平移不变性特征。卷积网络被启发由生物工艺在之间的连接图案的神经元类似于动物的组织视觉皮层。个体皮层神经元仅在被称为感受野的视野的受限区域中对刺激作出反应。不同神经元的感受野部分重叠,使得它们覆盖整个视野。

与其他图像分类算法相比,CNN使用相对较少的预处理。这意味着网络学习传统算法中手工设计的过滤器。这种与特征设计中的先前知识和人力的独立性是一个主要优点。

它们可用于图像和视频识别,推荐系统,图像分类,医学图像分析和自然语言处理。

你可能感兴趣的:(深度学习,深度学习,cnn,计算机视觉)