神经网络基础之卷积、池化详解

文章目录

  • 一、卷积
    • 1、计算公式
    • 2、参数详解
    • 3、多图片通道数卷积核运算
  • 二、池化
    • 1、池化作用
    • 2、池化参数
    • 3、池化分类
  • 三、卷积与池化总结


一、卷积

内容上:卷积核大小【黄色部分大小,3*3】、卷积核内数值[ [1,0,1],[0,1,0],[1,0,1] ]、卷积核的数量
计算方式:从左往右,从上往下的扫描 + 对应元素相乘后相加
神经网络基础之卷积、池化详解_第1张图片

1、计算公式

输入图片的尺寸:一般用 n * n 表示输入的image大小。
卷积核的大小:一般用 f * f 表示卷积核的大小。
填充(Padding):一般用 p 来表示填充大小。
步长(Stride):一般用 s 来表示步长大小。
输出图片的尺寸:一般用 o 来表示。

计算公式如下:(当不为整数时,向下取整)
在这里插入图片描述

2、参数详解

卷积核:一般为 2 * 2、3 * 3、5 * 5 。卷积核的大小决定特征提取时的感受野。
Padding

  • 常用的两种padding:
    (1)valid padding( p=0):不进行任何处理,只使用原始图像,不允许卷积核超出原始图像边界。
    (2)same padding( p=1):进行填充,允许卷积核超出原始图像边界,并使得卷积后结果的大小与原来的一致(str=1时)。

  • valid padding 就是不够就不够了,卷积核扫描多少就是多少;same padding 要求把所以位置都要进行卷积操作,所以当不够时外围用0填充一圈。

  • 使用valid padding卷积后的输出取决于输入w、核大小f、和步长s;使用same padding卷积后的输出 只取决于步长( 步长为2则输出为 o/2,步长为3则输出为 o/3

Stride:步长,作为主要影响因素决定卷积后输出图像的大小
卷积核的数量:决定输出图像数量的多少,即生成图像的通道数(核数=通道数)。这里指内部运算时图像的通道数,要与输入图像的通道数(彩色输入图像的通道数=3)区分开。

神经网络基础之卷积、池化详解_第2张图片

3、多图片通道数卷积核运算

多张图像时,不同图片与各卷积核运算后对应相加,生成卷积核数的通道数。多张图像就是之一个batchsize数量的图像。


二、池化

1、池化作用

  • 前提:池化层也称下采样层。在图像中,相邻像素倾向于具有相似的值,因此通常卷积层相邻的输出像素也具有相似的值。这意味着,卷积层输出中包含的大部分信息都是冗余的。

  • 作用

    • 会压缩输入的特征图,从而降低图像的分辨率
    • 一方面减少了特征,导致了参数减少,进而简化了卷积网络计算时的复杂度;另一方面保持了特征的某种不变性(旋转、平移、伸缩等)。

简而言之,池化就是去除杂余信息,保留关键信息,减小图像的分辨率

2、池化参数

:只有框架,没有核参数
核大小:size
padding类型:取整方式为padding valid
步长:stride

3、池化分类

池化操作主要有两种,一种是平均池化(Average Pooling),即对邻域内的特征点求平均;另一种是最大池化(Max Pooling),即对邻域内的特征点取最大。

池大小为2的最大池层的示例:


三、卷积与池化总结

对比 池化 卷积
作用 减少计算量、降低分辨率 提取特征
通道数 不改变通道数 卷积核数决定通道数
池化核只是框架,没有参数 卷积核有参数
取整方式 padding valid padding same
步长stride 步长为2的池化每运算一次图像分辨率减半 步长为3的卷积图像运算后的分辨率是否变化取决于padding类型和本身图像大小

卷积与池化补充

  • 当池化stride为2时,每经过一次池化,图像的分辨率(大小)减半 16 * 16 --> 8 * 8
  • 卷积由于采用填充操作一般是不改变图像分辨率的,所以卷积stride大小与分辨率无关
  • 每个batchsize数量的输入图像进行卷积运算时,不同图片与各卷积核运算后对应相加,生成卷积核数的通道数
  • 同一层的卷积核内的参数时相同的,卷积核的数量决定了隐藏层输入图像(特征图)的数量(通道数)
  • 关于卷积核的填充p,要么是 1,要么是 0
  • 卷积后计算输出图像大小公式如下:
    在这里插入图片描述

有表达不当之处,欢迎大佬们指正

参考:
https://zhuanlan.zhihu.com/p/77471866
https://blog.csdn.net/Dontla/article/details/104119887
https://blog.csdn.net/Dontla/article/details/104119887

你可能感兴趣的:(神经网络,计算机视觉,深度学习)