IoU-aware Single-stage Object Detector for Accurate Localization
网络的结构如下:采用FPN结构,Backbone是RetinalNet,分成了P3~P7共5个Layer,分别训练不同尺寸的Box.每个Layer对应的Head有2个分支,包括一个单独的分支用来预测分类,另一个分支用来预测两部分,一部分是Box坐标的回归,另一部分是GTBox和Anchor之间的IOU,这也是这篇论文的主要创新点,FasterRCNN等方法是对Anchor进行分类,与GTBox的I