从CVPR2013看计算机视觉研究的三个趋势



H. Jiang and J. Xiao. A Linear Approach to Matching Cuboids in RGBD Images. In CVPR 2013. [ pdf]

2) 中层patch的分析会是一个热点
在局部特征很难具有足够的描述力的情况下,中层特征的提取和分析就显得更加重要。在ECCV 2012年 CMU的 Saurabh Singh 提出了中层patch的想法,提取的patch包含更加丰富的信息,至少是目标部件级别的,而不是没有任何语义信息的局部描述。SIGGRAPH2012那篇注明的文章,“What makes Paris look like Paris?”。
Unsupervised Discovery of Mid-Level Discriminative Patches Saurabh Singh, Abhinav Gupta, Alexei A. Efros. In ECCV, 2012.
Carl Doersch, Saurabh Singh, Abhinav Gupta, Josef Sivic, and Alexei A. Efros. What Makes Paris Look like Paris? In SIGGRAPH 2012. [ pdf]
在今年的CVPR中,也有不少关于从场景中学习mid-level parts的文章
Blocks that Shout: Distinctive Parts for Scene Classification. Mayank Juneja, Andrea Vedaldi, CV Jawahar, Andrew Zisserman. In CVPR, 2013. [ pdf]
Representing Videos using Mid-level Discriminative Patches. Arpit Jain, Abhinav Gupta, Mikel Rodriguez, Larry Davis. CVPR, 2013. [ pdf]
Part Discovery from Partial Correspondence. Subhransu Maji, Gregory Shakhnarovich. In CVPR, 2013. [ pdf]
3) 深度学习以及特征学习也在蓬勃上升时期
tombone是这么说的。ms Google的每一个人现在都在做深度学习。这到底能解决所有的视觉问题吗?很怀疑。但是,深度学习的兴起让每一个研究者都想参与其中。换句话说,如果你不知道 Geoff Hinton 是谁,你就out了。
对于这个问题,我觉得在慢慢具备海量数据处理能力的今天,深度学习确实是解决问题的一个很好的途径。但是,另一方面,我们也不能寄希望于一个万能的模型,如果有人想指望将训练图像扔进某个非常NB的分类器里面,就能得到自己想要的结果,那也是不现实的。计算机视觉中的很多困难我觉得不光是计算效能的问题,而且我们对其认识的还不够。一个视觉算法的效果好不好,不光取决于模型,更重要的是前端的特征。
因此,深度学习必须结合好的特征学习,才是解决问题的王道。

你可能感兴趣的:(从CVPR2013看计算机视觉研究的三个趋势)