如何实现任意尺寸图像分类的全卷积网络介绍-代码实现

在本文中,我们将学习如何在不使用计算量大的滑动窗口方法的情况下对任意大小的图像执行图像分类。这篇文章是为熟悉使用卷积神经网络进行图像分类的人而写的。

让我们首先澄清一个关于卷积神经网络 (CNN) 的大误解。

卷积神经网络不需要固定大小的输入

如果您曾经使用 CNN 进行图像分类,您可能会裁剪和/或调整输入图像的大小以适应网络所需的输入大小。

虽然这种做法很常见,但使用这种方法有一些限制。

  1. 分辨率损失:如果您有一张带有狗的大图像,但只覆盖了图像的一小部分,那么调整图像大小会使图片中的狗变得太小,以至于无法正确分类图像。
  2. Non-square aspect ratio:通常图像分类网络是在方形图像上训练的。如果输入图像不是正方形,则从中心获取正方形区域,或者使用不同的比例调整宽度和高度的大小以使图像正方形。在第一种情况下,我们可能会错过不在图像中心的重要特征,而在第二种情况下,由于缩放不均匀,图像信息会失真。
  3. 昂贵的滑动窗口方法:为了缓解上述问题,您可以从图像中裁剪重叠窗口,

你可能感兴趣的:(深度学习开发实践系列,分类,网络,深度学习)