MetaAnchor: Learning to Detect Objects with Customized Anchors

本文依旧是旷视科技的作品,旷视的工作一直紧贴实际,直面问题和方法的灵魂。

本文解决的是Anchor的设置策略不好把握的问题。YOLOv2的指导策略是Anchor与目标的的IOU尽可能大,RetinaNet设置denseAnchor,S3FD(人脸检测,Shifeng Zhang )的策略是,保证每个样本都有足够数量、且相同数量的anchor匹配)。文本检测中,RRPN的策略也是让尽可能多的目标有IoU>0.5的匹配anchor。这些经验性的规则有一定好处,他们都是站在GT样本的角度考虑的。

本文换位思考,站在anchor的角度思考,发现每种形状的anchor有自己的一套参数,这造成了很多不便,1. anchor变多后,参数量变大。2. anchor独立参数,每个anchor分配的样本比较少。3.训练好后,anchor的配置就固定下来了,不能任意更改。

对anchor分类回归的网络参数肯定与anchor的大小信息绑定,在这个限制下,如何使得上述三个问题解决好呢?作者提出的策略,首先,将网络参数由anchor大小信息预测来获得,这样,可以将不同形状的anchor需要学的东西从网络权重转化为:预测网络权重的网络的网络权重,并且,从各自大小anchor分别学,变成了统一去学,简化了网络参数。由于此时随意更改anchor数量后,需要学的参数不变,所以也固定了网络参数数量,同时,所有样本同时参与这组参数的学习,提高参数的泛化性能来使得各种大小anchor的预测能力互相提升。也让测试时可以随意更改anchor配置,适当增强了跨数据集的能力。

MetaAnchor: Learning to Detect Objects with Customized Anchors_第1张图片
image.png

你可能感兴趣的:(MetaAnchor: Learning to Detect Objects with Customized Anchors)