DenseBox算法

1 提出了基于FCN、end2end的多任务目标检测模型,能直接回归目标出现的置信度及其相对位置;---- 在15年做到end2end还是挺厉害的,fast rcnn当时还需要依赖SS、EdgeBox等proposals提取方法,frcnn刚提出不久,通过RPN提proposals达到训练的end2end;DenseBox就做到了end2end,且联合了目标landmark的多任务,要知道联合人脸landmark的mtcnn发表于16年(虽然在mtcnn、DenseBox之前已经有很多multi-task的人脸检测方案);另外对比CVPR2015年大红大紫的FCN,DenseBox在15年初就已完成目标检测中FCN思想的引入,也真是很厉害了;---- OverFeat(ICLR2014)也引入了FCN的思想;

2 为提高小尺度目标的召回率,如fig 3中conv3_4、conv4_4,在网络中引入了上采样操作,将两层的特征融合以得到更大尺度的feature map输出;-----要知道将多层特征金字塔融合来预测bbox的思路发扬光大的FPN,发表于CVPR2017;

3 使用了OHEM做负样本的难例挖掘;----- OHEM可是在CVPR2016获得oral,当然了,难例挖掘在SVM等机器学习方法中早就被使用到了,不过DenseBox就能有这么巧妙的设计,也是相当之厉害;

4 论文中提到了DenseBox因使用图像金字塔,需要若干秒才能处理一张图像是,速度很慢,但后来对DenseBox做了优化后,DenseBox2可以做到了实时检测;---- 一个重要的优化就是:将多层图像金字塔改为类似SSD的多层特征金字塔;

你可能感兴趣的:(目标检测,计算机视觉)