什么是 CNN? 卷积神经网络? 怎么用 CNN 进行分类?(2)

参考视频:https://www.youtube.com/watch?v=E5Z7FQp7AQQ&list=PLuhqtP7jdD8CD6rOWy20INGM44kULvrHu

视频4:CNN 中 stride 的概念

什么是 CNN? 卷积神经网络? 怎么用 CNN 进行分类?(2)_第1张图片
如上图,stride 其实就是 ”步伐“ 的概念。

默认情况下,滑动窗口一次移动一步。而当 stride = 2 时,则一次移动两步,垂直移动和水平移动都是。

当我们提高 stride 的值的时候,卷积操作产生的特征图的 size 会成倍减少,如下图:
(stride = 2)

什么是 CNN? 卷积神经网络? 怎么用 CNN 进行分类?(2)_第2张图片

具体请看 1:47

当使用 padding 的时候,卷积产生的 特征图的 大小通过下面公式计算

什么是 CNN? 卷积神经网络? 怎么用 CNN 进行分类?(2)_第3张图片

视频5:max pooling in CNN

max pooling 在做的事情如下图
什么是 CNN? 卷积神经网络? 怎么用 CNN 进行分类?(2)_第4张图片
如上图,滑动窗口提取出窗口中的最大值,放进新图里

一般而言,stride 的值和滑动窗口的边长是相等的

什么是 CNN? 卷积神经网络? 怎么用 CNN 进行分类?(2)_第5张图片

如上图,这有两个好处:
1.减少图像大小,减少 computational cost
2.锐化图的特征,加强图的特征 (因为它保留了最大值)

关于锐化特征,更明显的例子如下图
什么是 CNN? 卷积神经网络? 怎么用 CNN 进行分类?(2)_第6张图片

使用 max pooling layer 时,输入有多少张图,输出就有多少张图,如下图

什么是 CNN? 卷积神经网络? 怎么用 CNN 进行分类?(2)_第7张图片

实际上,我们并不总是使用 max pooling layer。因为 max pooling layer 会减少图的 size。

使用 Max pooling layer 的地方通常只在 卷积层 后面

需要注意的是,max pooling layer 里并不涉及参数,所以它这块地方并不需要训练

除了 max pooling layer 外,还有 average pooling 等等,看需求

下图是一个总结
什么是 CNN? 卷积神经网络? 怎么用 CNN 进行分类?(2)_第8张图片
视频6:CNN 里的 fully connected layer 全连接层

全连接层其实就是 simple neural network,被用来做分类

下图是个更好的解释

什么是 CNN? 卷积神经网络? 怎么用 CNN 进行分类?(2)_第9张图片
如上图,卷积层提取原图的特征,(随后有可能经过 max pooling layer 来减少图的大小,以及锐化特征)。接着产出的图被展开,作为后面的全连接层的输入。随后就是一个用于分类的神经网络。

需要注意的是,全连接层的输出层的神经元数量,和我们要分的类别的数量是相等的。

此外,全连接层中的 ”边“ (权重矩阵) 是需要被训练的。

如下图,是总结
什么是 CNN? 卷积神经网络? 怎么用 CNN 进行分类?(2)_第10张图片

你可能感兴趣的:(搞明白,CNN,卷积神经网络,卷积神经网络)