faster-rcnn笔记

1、框架

输入图片->生成候选区域->特征提取->分类->位置精修

2、输入尺寸

  1. 原图尺度:原始输入的大小。不受任何限制,不影响性能。
  2. 归一化尺度:输入特征提取网络的大小,在测试时设置,源码中opts.test_scale=600。an
    chor在这个尺度上设定。这个参数和anchor的相对大小决定了想要检测的目标范围。
  3. 网络输入尺度:输入特征检测网络的大小,在训练时设置,源码中为224*224。

3、RPN网络

RPN的核心思想是使用CNN卷积神经网络直接产生Region Proposal,使用的方法本质上就
是滑动窗口(只需在最后的卷积层上滑动一遍),因为anchor机制和边框回归可以得到多尺
度多长宽比的Region Proposal。
RPN网络也是全卷积网络(FCN,fully-convolutional network),可以针对生成检测建议
框的任务端到端地训练,能够同时预测出object的边界和分数。只是在CNN上额外增加了2个
卷积层(全卷积层cls和reg)。
①将每个特征图的位置编码成一个特征向量(256dfor ZF and 512d for VGG)。
②对每一个位置输出一个objectness score和regressedbounds for k个region proposal,
即在每个卷积映射位置输出这个位置上多种尺度(3种)和长宽比(3种)的k个(3*3=9)区
域建议的物体得分和回归边界。
RPN网络的输入可以是任意大小(但还是有最小分辨率要求的,例如VGG是228*228)的图
片。如果用VGG16进行特征提取,那么RPN网络的组成形式可以表示为VGG16+RPN。

你可能感兴趣的:(深度学习)