Pedestrian Detection: The Elephant In The Room论文阅读笔记

    这篇论文,记录了作者做的各种实验,不是通过各种技巧策略来提高性能,而是通过各种数据集的交叉试验验证对比来发现较好的试验结果,通过试验发现总结真理。

对行人检测最近的方法做了介绍:

    首先介绍传统的行人检测方法。

    然后介绍深度学习的方法:基于R-CNN的行人检测,基于RPN+PB的。

    然后介绍这两年的方法,ALF,CSP,MGAN,其中ALF是基于SSD的anchor-based,MGAN 是基于蒙版的可见区域指导网络,CSP是anchor-less的。

关于行人检测的数据集包括:三类。

    第一类是用于视频监控的数据集有:Town Center,USC,DaimlerDB,INRIA,FTH,TUDBrussels,

    第二类用于自动驾驶的数据集:KITTI,Caltech,CityPersons,ECP,

    第三类是web爬取的数数据集:WiderPerson,WiderPedestrian,CrowdHuman

    其中第三类的数据集数量和多样性,密集性都比前两个大,第二类处于中间位置,第一类最小

评价标准:

    MR-2,表示log False Positive每张图片的平均损失率,取值范围为[0.01,1],False Positive表示预测为假实际为真。

baseline:

    用Cascade R-CNN作baseline,此外还用到HRNet,ResNeXt等

实验部分

    作者用来几张表来表达他们做的试验:如下图所示,首先在数据集Caltech上,用不同的方法来训练,test出结果,然后在数据集city person上,最后在数据集ECP上,

然后又做了如下实验,如下图所示,训练和预测在不一样的数据集上进行,观察结果,可以看到性能降低一半多,而在city person上训练在Caltech上预测结果和在Caltech上训练预测差不多原因是city person的多样性密集型大于Caltech数据集。


又做了如下的实验:如下图所示,Table 8 上显示前两行数据差不多,是因为city person和ECP数据集都用相似的相机记录的,ECP比city person数据集多样性和密集型大,所以数据差不多

    

Table 9 表示在CrowdHuman数据集上训练在Caltech上与预测的效果比在Caltech上训练预测效果更好一倍

Table 10 做的实验是巡视是数据集整合,预测在CP数据集上,效果好一点。

你可能感兴趣的:(Pedestrian Detection: The Elephant In The Room论文阅读笔记)