对Fast R-CNN指出Spp-net不能fine tune的一些理解

  最近在阅读目标识别相关的论文,在Fast R-CNN论文中发现了这么一段:对Fast R-CNN指出Spp-net不能fine tune的一些理解_第1张图片
  说的是Rbg大神认为何凯明大神提出的SPP-net不能fine-tune全连接层前面的卷积层网络,百思不得其解,以下是我继续阅读论文后的一些看法:
  无论是在RCNN还是SPP-net中,都是将经过proposal区域框出来的ROI直接处理,无论是直接过svm+bbx regression还是经过ROIPooling等等,这样无疑是打乱了各个图片的proposal,而每个ROI区域的感受野有时可以达到一张原图大小。假设每张图64个ROI,共两张图片,最后有可能相当于处理了64*2共128张图片,这大大增加了计算和存储的开销。
  而在本文中Rbg大神指出,他们采用了mini_batch的处理方法,一个mini_batch只处理2张图片,每张图片选64个ROI区域,这些ROI共享同一个计算和存储资源。
  假设只处理一个ROI区域而其恰好可以感受一整张图片的话,这样和处理一张包含64个ROI区域的特征图差了整整64×的速度,这是令人欣喜的。
  基于此种原因,作者Rbg指出,我们速度快,结合全文指出,我们测得准,综上,我们牛。

你可能感兴趣的:(深度学习,目标检测,计算机视觉)