深度学习优化技巧1——输入图像大小尺寸不一致

输入图像大小尺寸不一致

先来看一个问题:对于传统的CNN(如AlexNet和VGG),当网络训练好后输入的图像尺寸必须是固定值,同时网络输出也是固定大小的vector or matrix。如果输入图像大小不定,这个问题就变得比较麻烦。有2种解决办法:

(1)从图像中crop一部分传入网络
(2)将图像warp成需要的大小后传入网络
深度学习优化技巧1——输入图像大小尺寸不一致_第1张图片
两种办法的示意图如图14,可以看到无论采取那种办法都不好,要么crop后破坏了图像的完整结构,要么warp破坏了图像原始形状信息。
(3)roi pooling
这是faster-rcnn中用的技巧。有待进一步解释。

  • List item

你可能感兴趣的:(深度学习,深度学习,计算机视觉,神经网络)