CVPapers 网址: http://www.cvpapers.com/
ICCV2013 Papers about Object Detection:
1. Regionlets for Generic Object Detection. Xiaoyu Wang, Ming Yang, Shenghuo Zhu, Yuanqing Lin .(暂无源码提供)
Website: http://www.xiaoyumu.com/project/detection
这篇文章提出了一种新的特征描述子——Regionlet描述子。该特征能很好的、灵活的描述目标,包括发生形变的目标。Regionlet特征描述子是由带检测窗口中的若干子区域的特征组合成一个一维向量来表示,这样做很好的刻画了目标的空间结构关系。Regionlet的选择也不是随便选取的,它是通过boosting算法在特征池中选取。下图显示了这篇文章的整体算法思路:(这篇文章的算法框架有点类似于Viola-Jones提出的人脸检测算法,只是提取的特征不同)
2. Efficient pedestrian detection by directly optimizing the partial area under the ROC curve. Sakrapee Paisitkriangkrai, Chunhua Shen, Anton Van den Hengel.(级联分类器的训练)
该文提出了一种新的策略——pAUC(the partial area under the ROC curve). 由于高效级联的分类器依赖于训练若干节点分类器,使得其在适当的误检率的情况下达到最大的检测率。因此,文章描述了一种新的集成学习方法,通过使用结构学习(Structured Learning)直接优化pAUC,使得其能在用户定义的误检率范围内达到最大的检测率。
3. Contextual Hypergraph Modeling for Salient Object Detection. Xi Li*, Yao Li, Chunhua Shen, Anthony Dick, Anton Van den Hengel.(关于显著目标检测的文章,显著目标检测是指在图像中将引起人注意的目标定位出来。)
Website : http://cs.adelaide.edu.au/~yaoli/?page_id=149
4. Discriminatively Trained Templates for 3D Object Detection: A Real Time Scalable Approach. Reyes Rios-Cabrera, Tinne Tuytelaars.
Website : http://www.cv-foundation.org/openaccess/content_iccv_2013/papers/Rios-Cabrera_Discriminatively_Trained_Templates_2013_ICCV_paper.pdf
该文在Hinterstoisser等人提出的基于模板的LINE2D/LINEMOD描述子的基础上做了2处改进:1)提出以区分式的形式来学习模板(将离线学习和在线学习结合起来);2)提出了一种基于级联式的快速检测。
5. Joint Deep Learning for Pedestrian Detection. Wanli Ouyang*, Xiaogang Wang.
Website: 1)http://www.ee.cuhk.edu.hk/~wlouyang/projects/ouyangWiccv13Joint/index.html
2) http://www.ee.cuhk.edu.hk/~wlouyang/ (主页)
(有代码,Matlab)
特征提取、形变处理、遮挡处理、分类,它们是行人检测的四个重要组成部分。现存的方法都是分别的学习和设计这些部分,这些组成部分之间的交互还没有被探索。这篇文章通过深度学习联合这些组成部分,最大化了它们的优势。通过深度学习框架,建立自动的、组成部分之间多交互的模型,使得其相较于当前最好的行人检测算法,精度提高了9%。下面是其原理图。
6. Learning Near-Optimal Cost-Sensitive Decision Policy for Object Detection. Tianfu Wu*, Song Chun Zhu .(目的是解决大量扫描窗口的检测耗时)
Website: http://www.stat.ucla.edu/~tfwu/project/DecisionPolicy_2013.htm
很多常用的检测器,如:AdaBoost,SVM,DPM等等,在大量的扫描窗口中需要计算Score functions,这需要大量的计算,因此在实际的应用中,除了检测精度外,我们还要考虑实时性。这篇文章描述了一个框架:学习一个接近最优且代码敏感的决策策略(即一个双边阈值)来执行早期的判断(拒绝or接受)。实验表明,在不影响检测准确度的情况下,该方法大大的提高了检测的速度。
7. An Human Co-detection and Labeling Framework. Jianping Shi* (CUHK), Renjie Liao (CUHK), Jiaya Jia (Chinese University of Hong Kong)(本监督训练——检测+标记)
Website: http://shijianping.me/codel/index.html
这篇文章提出了一个联合人体检测和标记(贴标签)的框架。首先,利用基于变形部件模型的人体检测器来检测可能的人体目标;然后利用匹配分类器得到可信度较高的人体目标。这样,检测器和匹配分类器在一起就构成了一个半监督联合训练的框架。流程图如下:
8. Coherent Object Detection with 3D Geometric Context from a Single Image. Jiyan Pan* , Takeo Kanade (利用3D上下文信息辅助目标检测)
Website: http://www.cv-foundation.org/openaccess/content_iccv_2013/papers/Pan_Coherent_Object_Detection_2013_ICCV_paper.pdf
9. Random Forests of Local Experts for Pedestrian Detection. Javier Marin* , David Vazquez , Jaume Amores, Antonio Lopez, Bastian Leibe
Website: http://www.cv-foundation.org/openaccess/content_iccv_2013/papers/Marin_Random_Forests_of_2013_ICCV_paper.pdf
这篇文章提出了利用随机森林组合多个Local Experts来进行行人检测,提出的方法利用基于块的描述(如:HOG、LBP)。并提出了如何利用该方法生成一个级联的分类器以保证准
确率不降低的情况下,提高检测速度。(该方法有点类似于组合Part-Based检测器的方法)
10. From Subcategories to Visual Composites: A Multi-Level Framework for Object Detection. Tian Lan* (Simon Fraser University), Leonid Sigal, Michalis Raptis (Disney Research Pittsburgh), Greg Mori (Simon Fraser University )
11. Alternating Regression Forests for Object Detection and Pose Estimation .
Website :http://lrs.icg.tugraz.at/pubs/schulter_iccv_13.pdf
提出了一种新的回归算法(Alternating Regression Forests, ARFs),通过优化一个全局的损失函数来学习一个随机森林。将这种方法应用与目标检测和姿态估计。
CVPR2013 Papers about Object Detection:
12. Robust Multi-Resolution Pedestrian Detection in Traffic Scenes. Junjie Yan, Xucong Zhang, Zhen Lei, Dong Yi, Shengcai Liao, Stan Li
Website :
http://www.cv-foundation.org/openaccess/content_cvpr_2013/papers/Yan_Robust_Multi-resolution_Pedestrian_2013_CVPR_paper.pdf
13. Detection Evolution with Multi-Order Contextual Co-occurrence. Chen Guang, Yuanyuan Ding, Jing Xiao, Tony Han
提出了一种结合多级上下文描述与Deformable part models相结合的方法。
14. Fast, Accurate Detection of 100,000 Object Classes on a Single Machine. Thomas Dean, Jay Yagnik, Mark Ruzon, Mark Segal, Jonathon` Shlens, Sudheendra Vijayanarasimhan.
(Best CVPR2013 Paper)
Website:
http://static.googleusercontent.com/media/research.google.com/zh-CN//pubs/archive/40814.pdf
这篇文章利用Locality-sensitive hashing(LSH)来替代点乘核操作,能够高效的采样过滤器的响应。为了显示该技术的高效性,他们将其应用到100,000个deformable-part model的估计中,耗时低于20s。
15. Learning Structured Hough Voting for Joint Object Detection and Occlusion Reasoning. Tao Wang, Xuming He, Nick Barnes
Website : http://www.cvwang.com/projects/cvpr13
这篇文章提出了一种结构霍夫投票的方法用于室内遮挡环境下的目标检测。首先,它扩展霍夫假设空间到目标位置和它的可视化模型,并设计一种新的得分函数来积累投票用于目标检测和遮挡预测。另外,这篇文章还探索了目标和它周围环境之间的联系,构建了一个基于RGB-D数据集的深度编码的目标上下文模型。它设计了一种层次上下文描述,并允许目标和背景中的图像块对目标假设进行投票。
ECCV2012 Papers about Object Detection:
16. Object Co-detection. Yinzge Bao (U of Michigan at Ann Arbor), Yu Xiang (University of Michigan), Silvio Savarese (The University of Michigan - Ann Arbor)
Website :
1) http://sitemaker.umich.edu/bao/home
2) http://cvgl.stanford.edu/projects/codetection/index.htm
这篇文章引入了一个新的问题:联合目标检测(object co-detection)。
总结 :从上面这些文章可以看出,目前目标检测的研究方向是:1)新的特征描述子的挖掘;2)一个好的级联分类器的训练;3)在大量滑动窗口下的检测算法改进;4)基于Part-Model(或结构信息)的目标检测应用;5)深度学习应用到目标检测中;6)充分利用上下文信息;7)深度信息(RGBD)辅助检测;8)多种策略的组合(如:joint deep learning for pedestrian detection)。