一,论文:
1,OverFeat:《OverFeat:Integrated Recognition, Localization and Detection using Convolutional Networks》 CVPR 2014
2,RCNN:《Rich feature hierarchies for Accurate Object Detection and Segmentation》 CVPR 2014; 《 Region-Based Convolutional Networks for Accurate Object Dectecion and Segmentation》 PAMI 2015
3,SPP-Net:《Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition》ECCV 2014
4,Fast RCNN:《fast R-CNN》ICCV 2015
5,Faster RCNN:《Faster R-CNN towards real-time object detection with region proposal networks》NIPS 2015
6,YoLo:《 You Only Look Once》CVPR 2016;《YOLO9000 Better, Faster, Stronger 》CVPR 2017
7,SSD:《Single Shot MultiBox Detector》ECCV 2016
8,基于CNN的目标检测模型比较:《Speed/accuracy trade-offs for modern convolutional object detectors》CVPR 2017
9,提取Proposals方法比较:《What makes for effective detection proposals》 TPAMI 2015
10,Mask R-CNN:《Mask R-CNN》CVPR 2017
11,R-FCN:《R-FCN:Object Detection via Region-based Fully Convolutional Networks》NIPS 2016
12,FPN:《Feature Pyramid Networks for Object Detection》CVPR 2017
13,Cascade CNN:《A Convolutional Neural Network Cascade for Face Detection》CVPR 2015
14,R-CNN对小目标的检测:《R-CNN for Small Object Detection》ACCV 2016
二,网络资料:
1,CSDN博客专栏,深度学习RCNN系列详解:http://blog.csdn.net/column/details/ym-alanyannick.html
截至目前,该专栏共12篇博文,内容包括:OverFeat(1), RCNN(3),SPP-Net(1), Fast RCNN(1), Faster RCNN(2), YOLO(1), FCN(1), SSD(1), R-FCN(1)。脉络清晰完整,内容较为全面。
2,CSDN知识库,深度学习-深度学习应用-图像检测专栏:http://lib.csdn.net/deeplearning/knowledge/1726
作为CSDN的知识库,该专栏内容较为丰富,不仅有原理介绍,还有部分介绍实验配置经验的文章,但可能因为是网站自动归类,会有一些不相关的被归入,如将固态硬盘SSD的文章归入了目标检测SSD算法中。另一个遗憾虽然主要算法都覆盖了,但是没有按照上面博客专栏那样按RCNN系列的发展脉络进行排序,有点东一榔头西一棒槌的感觉。
3,知乎,深度学习调参实验室专栏,目标检测系列:https://zhuanlan.zhihu.com/qianxiaosi
截至目前,该专栏只有7篇文章,其中目标检测系列的只有5篇,内容包括:Selective Serach, RCNN,SPP-Net, Fast RCNN, Faster RCNN。这篇文章都不算太长,适合入门,但若要了解更多细节,上面的博客更好。
4,zhwhong的个人博客,内容包括RCNN、SPP-Net、Fast RCNN、Faster RCNN、R-FCN、YOLO、YOLO2、SSD、NMS,内容清晰完整,在借鉴他人博客的基础上有自己的补充:http://zhwhong.ml/2017/02/24/Detection-CNN/
5,简书,讲OverFeat的一篇文章,写的不错:http://www.jianshu.com/p/6d441e208547,理解OverFeat需要了解全卷积网络(Fully Convolution Network):http://blog.csdn.net/taigw/article/details/51401448
6,英文博客,纲领性介绍R-CNN,Fast R-CNN, Faster R-CNN: https://www.zybuluo.com/zhenni94/note/164543
7,liujun-st的CSDN博客,介绍YOLO和SSD,非常细致,http://blog.csdn.net/ben_ben_niao/article/details/52014285
8,山世光博士在16年底的梳理:https://www.leiphone.com/news/201611/gZZuVDsRFNY51014.html,邬书哲博士进行了补充:https://www.leiphone.com/news/201611/KBudKA9B736wuKSr.html
9,R-CNN for Small Object Detection论文笔记,http://www.cnblogs.com/fangpengchengbupter/p/7654675.html
10,R-FCN可以参考博客:http://blog.csdn.net/kekong0713/article/details/69919093
R-FCN是2016年NIPS上的文章,主要思想是将用于分类的FCN应用到目标检测中来(FCN全称Fully Convolution Network,注意这里FC是全卷积,不是常说的fc层的全连接,FCN最大的优势恰恰在于没有fc层,参数大大减少速度大大提高)。分类需要用到FCN的平移不变性,但目标检测恰恰需要对位置敏感,作者提出了position sensitive score map以便能把目标的位置信息融合进ROI pooling,同时将进一步提高了共享参数的层数(可以理解为推迟了branches,增加了trunk长度,使更多的计算可以共享)。
11,FPN是2017年CVPR上的一篇,Ross和Kaiming两大牛参与,主要针对多尺度和小目标,设计一种结合利用深层特征语义信息和浅层特征尺度信息的方法。可以参考博客:http://blog.csdn.net/dcxhun3/article/details/59055974
12,Mask R-CNN是Ross和Kaiming两大牛在CVPR2017的另一力作,在实例分割、边界框目标检测和人物关键点检测这三个难点上都获得了较好的实验效果,可参考博客:https://www.leiphone.com/news/201703/QU1einPqSPJEffog.html