Fatser R-CNN:Towards Real-Time Object Detecion with Region Proposal Networks--2015论文笔记

1.Introduction

  我们基于一个ideao : convolutional feature maps can also be used for generating region proposals.所以在此基础上,我们增加了两个额外的conv layers : 1)encode eacher map position into a short feature vector.(把每一个feature map的位置都encode成一个短的特征向量) 2)在每一个feature map的position上都输出一个objectness score,然后再为k个region proposals去回归边界。

Fatser R-CNN:Towards Real-Time Object Detecion with Region Proposal Networks--2015论文笔记_第1张图片

在每一个sliding-window 的位置都会同时产生k个region proposals,所以在reg layer就会有4k个对应于k个boxs的坐标。cls layer会产生2k个scores计算每一个proposal的object/not-object的概率。每一个anchor都是在sliding window的中心,都和scale和纵横比有关。在这篇paper中我们用三个不同的scales和aspect ratio,所以k=9 at each sliding position。如果一个feature map的size是WxH那么总共会产生WHk个anchors

loss-function:

 

 

你可能感兴趣的:(Fatser R-CNN:Towards Real-Time Object Detecion with Region Proposal Networks--2015论文笔记)