【论文学习记录】R-FCN

在目标识别领域中,存在这样一个矛盾:分类任务要具有位置不敏感性,而检测任务要具有位置敏感性。

为缓解这一矛盾,作者提出的R-FCN网络。

【论文学习记录】R-FCN_第1张图片

 

 和Faster R-CNN一样,R-FCN也是基于region proposal的两级检测架构。但是为了减少计算量,作者把使用的后端网络ResNet-101的average pooling layer去掉,把前面的100层卷积层放在前面共享权重的subnetwork中,然后添加一层1 x 1 x 1024的卷积层,使该层的输出维度变成1024。在共享卷积层的最后一层网络上再接上一个卷积层。

【论文学习记录】R-FCN_第2张图片

R-FCN也使用了RPN,用于训练和生成proposal。Faster R-CNN的ROI pooling layer直接对ROI进行分块池化,输出用于分类和回归的特征向量。而R-FCN则是将每一个ROI划分成k x k个网格,池化输出每个网格的位置得分,再通过投票的方式得到ROI最后的特征向量,共k x k x (C + 1)维,C维类别数, +1是背景。这就是Position-sensitive score maps。

【论文学习记录】R-FCN_第3张图片

 每个类别都会产生k x k个score maps。

【论文学习记录】R-FCN_第4张图片

【论文学习记录】R-FCN_第5张图片

R-FCN的损失函数也是多目标损失,既有分类的损失,也有定位的损失。

 

你可能感兴趣的:(深度学习)