computer vision的前景



AI这个领域,最近又开始大放光彩--此为背景。

AI曾经辉煌过,我们的老师在给我们讲AI的时候都是站在云上飘的,但是现实是残酷的,尽管deep blue玩chess玩得不错,但这毕竟是一个具有open表的游戏,说白了,这不算严格意义上的智能。AI大师们最初的很多语言,例如造出翻译机之类的,最后都不了了之了。最后,AI分成了若干个小领域,computer vision算是一个,或者说模式识别吧,然后例如machine learning, natural language processing等都算是分支领域。Computer vision算是做得非常成功的,当然我在这里所谓的computer vision比较狭隘,就是需要学习的computer vision。如果算进来传统的computer vision如三维重建等,那就更成功了。其它领域尽管都paper成堆,但是,都算是举步维艰。近年来,一道光芒划过夜空,古老的Neural Networks再次震撼了所以跟AI相关的人,Google将Hinton大将收入麾下之后,所有的大个头,都急转deep learning,也包括我们的Baidu,直接将实验室叫做了deep learning lab。这篇文章我不想谈deep learning,我觉得我也没有谈这个的资质,我还在皮毛级。我只想说说在此背景下computer vision的发展,主要根据CVPR2013的一些文章说一点自己的看法。

1,deep learning必然成为主流,这个势头已经挡不住了,今年主要的文章有:

Yi Sun, Xiaogang Wang,Deep Convolutional Network Cascade for Facial Point Detection

Fei Chen, Huimin Yu, Roland Hu, Xunxun Zeng,Deep Learning Shape Priors for Object Segmentation

  • Yann LeCun骨灰级人物也去做了一个talk,http://sunw.csail.mit.edu/

    .........在此不一一列举

  • 2,RGBD的东西越来越多,自从有了Kinect后,RGBD数据愈来愈多,所以出现了很多相应的识别啊分类啊,定位啊之类的。例如:

    W. Choi, Y.W. Chao, C. Pantofaru, S. Savarese. "Understanding Indoor Scenes Using 3D Geometric Phrases"  [pdf]

3,寻求一种中级的表达,这个听起来有点抽象。简单举个例就如poselet,图像特征是底层的表达,但是我们需要的是高级的信息,这中间如果加一个桥梁过度就好了,所以就有了很多中级的表达。今年很多文章都用到了poselet,还有几篇我觉得非常有意思的文章,如:

Ke Chen, Shaogang Gong, Tao Xiang, Chen Change Loy,Cumulative Attribute Space for Age and Crowd Density Estimation (PDF),这篇文章简单有效,非常值得一看。

Matthias Dantone, Juergen Gall, Christian Leistner, Luc Van Gool,Human Pose Estimation using Body Parts Dependent Joint Regressors (project) ,这篇文章其实有点deep learning的思想在里面,将第一层的结果作为一种中级表达输入到下一层的forest去,简单的思想,但是非常有效。

Sketch Tokens: A Learned Midlevel Representation for Contour and Object Detection. Joseph J. Lim, C. Lawrence Zitnick, and Piotr Dollar. CVPR 2013. [ pdf ] [code@github]

4,回归原始的趋势。也许是受到了deep learning的启发,大家都在朝着最初的那些大师们所定的方向回归,比如,最火的action recognition,大概有几十篇文章吧,虽然仍然是各种高级的feature的比较多,但是已经出现了一个信号,今年有出奇多的文章在做human pose estimation,这个古老但是太困难的问题,然后也出现了一篇根据human pose estimation来进行action recognition的文章,在20多年前,那时候的researchers其实也想这么做,最后发现human pose estimation实在太难了,所以就绕道了,绕了半天现在又有绕回去的趋势。


以上是我自己的一个简单总结,有很多文章可能离我的领域太远我也没有怎么关注,我会陆续的补充相应类别下的文章,也希望感兴趣的同学提出见解。



本文引用地址: http://blog.sciencenet.cn/blog-941987-708762.html   

你可能感兴趣的:(Vision,Computer,深度学习)