MobileNets

一、图像工程基础

        1.卷积

对图像的识别或者是分类需要提取图像中的某些特征,卷积可以完成工作。例如在一张灰度图像中每个像素都是一个数字。方便说明,可以简化为6*6的数值阵列,如下:MobileNets_第1张图片

提取其特征则需要一个filter,这里可以是一个3*3的数值阵列。如果想提取其边缘特征,可以使用下面的filter:

MobileNets_第2张图片

而卷积运算则是在6*6中选取3*3大小的阵列与filter对应的数字相乘后相加得到一个值。

如果从6*6的左上角遍历到右下角便可得到一个新的4*4的阵列。

MobileNets_第3张图片======>MobileNets_第4张图片

         2.填充

在上述运算过程中,原来的6*6中边上的数字参与运算的次数会比中间的数字少,会造成图像边缘数据信息丢失。而且在某些时候并不希望图像像素越来越少(6*6 --> 4*4)。所以在原6*6的基础上再上下左右再填充一列,使其拓展成8*8,经过3*3的filter的卷积形成6*6的结果。

        3.卷积步长

上述卷积默认使用的步长为1,即蓝色部分向右和向下只移动一格。在某些情况下,步长可以指定为其他值。步长也会影响结果的大小和运算成本。

一般的,n*n  的原始数据,使用  f*f  大小的filter,填充为  p,步长为  s,则结果大小为(\frac{n+2p-f}{s}+1) *(\frac{n+2p-f}{s}+1)

 

 

你可能感兴趣的:(图像处理)