ROIs

Faster RCNN中的ROI是单层金字塔,只含有一个层,每层窗口分块不一样。

ROI输入为n个region在原始图片的坐标, [n, r, c, h, w],r,c为某个region的左上角坐标,h, w为高宽。

在ROI层会根据每个region的r,c,h,w来生成其对应的映射特征,因为每个region的特征映射最终连接到FC层,故每个region输出的映射特征尺寸是一样的,所以在ROI层,只需根据region的尺寸,用window pooling生成相应的比例!

你可能感兴趣的:(ROIs)