一文读懂深度学习中常见的卷积操作

卷积

卷积是一种数学运算,在信号处理、图像处理等领域有着广泛的应用。它通过两个函数f和g生成第三个函数,这个新函数表示其中一个函数(通常称为卷积核或滤波器)相对于另一个函数的位置变化时两者的重叠程度。在深度学习领域,尤其是在卷积神经网络(CNNs)中,卷积被用来从输入数据(如图像)中提取特征。

1.普通卷积

在计算机视觉中,卷积通常指的是二维卷积,用于处理图像等二维数据。卷积过程涉及一个称为卷积核(或滤波器)的小矩阵,该矩阵在输入数据(如图像)上滑动,并与每个位置的相应区域进行点乘后相加,生成新的数值作为输出的一部分。这一过程可以形象地理解为用一个“放大镜”在图像上滑动,每次只关注图像的一小部分,通过特定的计算方式(即卷积操作)来生成一个新的、代表了原图像某些特征的输出图像。

一文读懂深度学习中常见的卷积操作_第1张图片

2D卷积的具体步骤包括:
  1. 选择卷积核:根据需要提取的特征类型选择合适的卷积核。卷积核的大小通常较小,比如3x3或5x5。

  2. 卷积核滑动:将卷积核放置在输入数据的一个位置,通常是左上角,然后按指定的步长(Stride)水平和垂直方向移动。

  3. 计算卷积:在每个位置,卷积核与覆盖的输入数据对应元素相乘,所有乘积相加得到一个值,该值成

你可能感兴趣的:(深度学习,人工智能,计算机视觉,图像处理)