SPPNet: Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
Abstract通过空间金字塔的使用,能够输入任意大小的图像而不需要裁剪,这样避免了因为裁剪而带来的损失.其次通过卷积计算整个图像的特征图,然后使用proposal映射特征图提取特征进行后续预测边界框,使得目标检测的速度比R-CNN提升很多倍.1.Introduction流行的CNN输入都是固定大小的图片,对于任意大小的图片,当前的解决方法是:1.裁剪:这容易导致区域不包括完整的目标2.扭曲:导致