Scale-aware Fast R-CNN for Pedestrian Detection

Scale-aware Fast R-CNN for Pedestrian Detection
(Scale-aware Fast R-CNN进行行人检测)
本篇论文对Fast R-CNN进行了改进,利用训练阶段得到的scale-aware权值将一个large-scale sub-network和small-scale sub-network合到一个统一的框架中。一个object proposal的高度用来估计这两个sub-network的scale-aware权值。

1.引言
(1)尺度问题在目标检测中仍是待解决的一个问题;
(2)行人检测有许多的小尺度物体:

Scale-aware Fast R-CNN for Pedestrian Detection_第1张图片

小尺度物体实例与大尺度物体实例在外观特点上非常不同。
2.Scale-aware Fast R-CNN
(1)总体思想:通过scale-aware权值将Large-scale子网络和Small-scale子网络结合在一起。
  总体结构图:

Scale-aware Fast R-CNN for Pedestrian Detection_第2张图片

(2)Scale-aware Fast R-CNN的输入是:整张图像和图像的object proposals,论文中使用ACF detector生成object proposals;
(3)网络结构:
  Scale-aware Fast R-CNN for Pedestrian Detection_第3张图片
(4)Scale-aware weight:
o 对于一个bounding box/proposal,用它的高度来表示行人的尺度,可以通过输入object proposal的高度来计算large-scale sub-network输出和small-scale子网络输出的权值;
o 假设为大尺度网络的权值,表示小尺度网络的权值,给定一个输入object proposal的高度是,大尺度子网络的权值通过公式(1)进行计算:
          Scale-aware Fast R-CNN for Pedestrian Detection_第4张图片
        其中表示boundinig box的平均高度,是一个系数。
o 大尺度网络权值与小尺度网络权值之和为1,小尺度网络的权值通过公式(2)进行计算:
      
(5)优化:
o 每个子网络有两个输出层,一个输出层输出在个类别上的分值分布score distribution,另一个输出层输出在K个类别上的regression offsets:
o 最后的分值计算:
o 最后的加权bounding box regression offsets计算:
 
o 每个object proposal的多任务损失(Multi-task Loss):
 


 

你可能感兴趣的:(目标检测(Object,Detection))