VGG16网络结构修改全连接层可以实现输入图像尺寸的限制

A:   VGG16标准模型为啥要指定现在输入图像的尺寸224*224?

Q:因为权重文件的参数数量是提前预设好了的,如果改变输入图像的尺寸,那么在最后一层卷积层的输出就不是7*7*512 ,全连接层为1*1*4096  所需参数个数为 7*7*512*4096+4096   

对224x224x3的输入,最后一层卷积可得输出为7x7x512,如后层是一层含4096个神经元的FC,则可用卷积核为7x7x512x4096的全局卷积来实现这一全连接运算过程。

它把特征representation整合到一起,输出为一个值。


这样做,有一个什么好处?就是大大减少特征位置对分类带来的影响。

举个简单的例子:


从上图我们可以看出,猫在不同的位置,输出的feature值相同,但是位置不同。

对于电脑来说,特征值相同,但是特征值位置不同,那分类结果也可能不一样。

这时全连接层filter的作用就相当于

喵在哪我不管,我只要喵,于是我让filter去把这个喵找到,

实际就是把feature map 整合成一个值,这个值大,有喵,这个值小,那就可能没喵

和这个喵在哪关系不大了,鲁棒性有大大增强。

因为空间结构特性被忽略了,所以全连接层不适合用于在方位上找Pattern的任务,比如segmentation。
全连接层中一层的一个神经元就可以看成一个多项式,

我们用许多神经元去拟合数据分布

但是只用一层fully connected layer 有时候没法解决非线性问题,

而如果有两层或以上fully connected layer就可以很好地解决非线性问题了

 

参考 https://blog.csdn.net/m0_37407756/article/details/80904580?depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1&utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1
————————————————
版权声明:本文为CSDN博主「向阳+」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/m0_37407756/article/details/80904580

 

你可能感兴趣的:(VGG16网络结构修改全连接层可以实现输入图像尺寸的限制)