CNN

卷积神经网络(Convolution Neural Network)

基于全连接层和CNN的神经网络示意图

基于全连接的神经网络
基于CNN的神经网络

全连接的局限性

由于全连接所有数据会被拉平成1维数据,数据的"形状"会被忽视掉,所以无法利用与形状相关的信息.
而卷积层会以原始维度(图像就是3维)接收输入数据,同样以3维形式输出到下一层,因此有可能正确理解图像的形状数据.

卷积运算

卷积运算

带偏置的卷积运算

其中滤波器(Filter)又称"核"

填充

幅度为1的填充

幅度为1的填充(padding),表示在输入矩阵周围填充1像素的'0',填充后矩阵变成(6,6)的形状.填充的主要目的是为了使输出数据的形状和输入数据一致

步幅

步幅为2的卷积运算

应用滤波器窗口的间隔变为2个元素.

已知填充和步幅,输入形状和输出形状的关系

假设输出大小为(H,W),滤波器大小为(FH,FW),输出大小为(OH,OW),填充为P,步幅为S,则存在以下关系

三维数据的卷积运算

三维数据的卷积运算.png

三维数据卷积运算过程

单个滤波器,最后输出通道数为1的特征图

N个滤波器,最后输出通道数为N的特征图

带偏置的卷积运算处理流

池化层

池化是缩小高、长方向上的空间的运算.下图展示了步幅为2的Max池化,即每次从2*2的目标区域中获取最大值的操作,一般来说初花的窗口大小会和步幅设定成相同的值.池化对微小的数据偏差具有鲁棒性.


窗口为2*2,步幅为2的Max池化

你可能感兴趣的:(CNN)