https://yongyuan-workbench.rhcloud.com/%E8%AE%A1%E7%AE%97%E6%9C%BA%E8%A7%86%E8%A7%89cv-%E5%9C%88%E5%AD%90-2/
作机器视觉和图像处理方面的研究工作,最重要的两个问题:其一是要把握住国际上最前沿的内容;其二是所作工作要具备很高的实用背景。解决第一个问题的办法就是找出这个方向公认最高成就的几个超级专家(看看他们都在作什么)和最权威的出版物(阅读上面最新的文献),解决第二个问题的办法是你最好能够找到一个实际应用的项目,边做边写文章。 做好这几点的途径之一就是利用网络资源,利用权威网站和专家们的个人主页。
依照下面目录整理:
[1]研究群体(国际国内) [2]专家主页 [3]前沿国际国内期刊与会议 [4]搜索资源 [5]GPL软件资源
用来搜索国际知名计算机视觉研究组(CV Groups):
paper毕竟是死的, 写paper的人才是活的. 那么我现在研究一下cv圈的格局, 按师承关系,借鉴前人, 我总结a tree stucture of cv guys:
David Marr
----->Shimon Ullman (Weizmann)
----->Eric Grimson (MIT)
----->Daniel Huttenlocher (Cornell)
----->Pedro Felzenszwalb (Chicago)
Thomas Binford (Stanford)
----->David Lowe (UBC)
----->Jitendra Malik (UC Berkeley)
----->Pietro Perona (Caltech)
----->Stefano Soatto (UCLA)
----->Fei-Fei Li (Princeton)
----->Jianbo Shi (UPenn)
----->Yizhou Yu (UIUC)
----->Christoph Bregler (NYU)
----->Serge Belongie (UCSD)
----->Alyosha Efros (CMU)
Andrew Blake (Microsoft Research Cambridge)
----->Andrew Zisserman (Oxford)
----->Andrew Fitzgibbon (Microsoft Research Cambridge)
----->Roberto Cipolla (Cambridge)
----->Alan Yuille (UCLA)
(UK这个学派的师承关系不太清楚, 这是我听说加上自己猜测的. 事实上, 几个非常优秀的researcher如Vladimir Kolmogorov虽然不是Andrew Blake的学生, 但是也属于这个学派. )
Thomas Huang (UIUC)
----->Yong Rui (Microsoft Research Redmond)
----->Nebojsa Jojic (Microsoft Research Redmond)
----->Ying Wu (Northwestern University)
----->Hai Tao (UCSC)
----->Yuncai Liu (SJTU)
(Huang这个系的人太多, 而且很怪的是, UIUC的web上信息不全, 在此仅列出我知道的.)
此外, 还有Takeo Kanade等非常有名的大牛, 囿于篇幅, 不一一列举. 从上得知, 加州派基本占了cv的半壁江山.
Jitendra Malik, UC Berkeley
Pietro Perona, Caltech
Serge Belongie, UCSD
Jianbo Shi, UPenn
Stefano Soatto, UCLA
Fei-Fei Li, Princeton
William Freeman, MIT
Trevor Darrell, MIT
Simon Baker, CMU
Yanxi Liu, CMU
Songchun Zhu, UCLA
Alan Yuille, UCLA
Yi Ma, UIUC
Michael Black, Brown
Carlo Tomasi, Duke
Ramin Zabih, Cornell
Shree Nayar, Columbia
Rama Chellappa, Maryland
Steve Seitz, University of Washington
Andrew Zisserman, Oxford, UK
Andrew Fitzgibbon, Microsoft Research Cambridge, UK
Roberto Cipolla, Cambridge, UK
Jean Ponce, INRIA, France
Cordelia Schmid, INRIA, France
Bill Triggs, LEAR, France
Yair Weiss, Hebrew University, Israel
Anat Levin, Hebrew University, Israel
Michal Irani, Weizmann, Israel
Luc van Gool, University of Leuven/ETH Zurich, Czechic
Harry Shum, MSRA
Xiaoou Tang, MSRA/CUHK
Jian Sun, MSRA
Steve Lin, MSRA
Yasuyuki Matsushita, MSRA
Zhouchen Lin, MSRA
Long Quan, HKUST 香港科技
Chi-Keung Tang, HKUST
按研究方向分分, 应该更合理一些。
现在计算机视觉, 计算机图形图像, 机器学习开始融合到一起了吧。
J. Malik,Zhu Songchu偏segmentation;
D. Lowe, S. Ullman, Poggio 偏于从生物视觉的启发来研究视觉;
Zisserman, Schmid, Lowe研究局部特征;
Luc Van Goo, Long Quanl三维重建;
Perona, Li Feife, Freeman视觉i学习, 物体分类;
还有运动分析, 视觉跟踪,纹理分析.............
MIT的Brain & Cognitive Science Dept和CSAIL里面聚集了一帮人,有的作low level有的作mid level to high level的。他们的工作是值得关注的。
当然说视觉还是要从伟大的David Marr开始。Tomaso Poggio, Richard Whitman是Marr的同事,传承了其理念,一直往下走。Poggio最近几年比较重点的工作放在他那个hierarchical model上。
T. Poggio的第一个PhD学生是Christof Koch (kLab at Caltech)。哦,顺便说一下Koch的另外一个导师是Valentino Breitenberg——同样是影响了一个时代的大人物。Koch研究重点兴趣在consciousness上,在Nature上的很多文章体现了他的研究思想。不过他们也做不少初级的视觉问题,诸如attention。
Koch比较知名的弟子比如Laurent Itti和Li Feifei。
Richard Whitman 年纪比较大了,个人不是很关注他现在做的东西。不过他所在的Perceptual Science Group,是一个非常有影响力的地方,这个组其他大家比较熟悉的老师有Aude Oliva和EH Adelson。Adelson最著名的一个事儿是色彩恒常相关的视错觉,93年发在Science上的那篇。
关于Oliva,前面的帖子错了,她不是Poggio的学生,这家伙和Torralba是老乡,同在法国念书,主要从心理学那条路子开始做,成名之役是hybrid image,和Antonio Torrralba一起搞的。这个Hybrid Image 其实80年代就有了,但是最开始从心理学方向上探讨,没有非常有影响力的文章。后来开始靠谱作自然图像统计,得到Gist theory,当然这个illusion本身后来转投SIGGRAPH,其影响是深远的。嗯,这个和CV关系不大。
Perceptual Science Group出了不少牛人,他们的alumni list可谓超豪华阵容:Yair Weiss, Josh Tenenbaum, Pawan Sinha, Bill Freeman……
这里的期刊大部分都可以通过上面的专家们的主页间接找到
1.国际会议 2.国际期刊 3.国内期刊 4.神经网络 5.CV 6.数字图象 7.教育资源,大学 8.常见问题
现在,国际上计算机视觉方面的三大国际会议是ICCV, CVPR和ECCV,统称之为ICE。
ICCV的全称是International Comference on Computer Vision。ICCV两年一次,与ECCV正好错开,是公认的三个会议中级别最高的。
ECCV的全称是Europeon Conference on Computer Vision,是一个欧洲的会议。
CVPR的全称是Internaltional Conference on Computer Vision and Pattern Recogintion国际计算机视觉与模式识别会议。这是一个一年一次的会议,举办地在美国。
ICIP的全称是International Conference on Image Processing
BMVC的全称是British Machine Vision Conference
ICPR的全称是International Conference on Pattern Recognition
以计算机视觉为主要内容之一的国际刊物也有很多,如:
International Journal of Computer Vision
IEEE Trans. On PAMI http://www.computer.org/tpami/index.htm
IEEE Transactionson Image Processing http://www.ieee.org/organizations/pubs/transactions/tip.htm
Pattern Recognition http://www.elsevier.com/locate/issn/00313203
Pattern Recognition Letters http://www.elsevier.com/locate/issn/01678655
IEEE Trans. on Robotics and Automation,
IEEE TPAMI
IEEE TIP
CVGIP Computer Vision. Graphics and Image Processing,
Visual Image Computing,
IJPRAI(International Journal of Pattern Recognition and Artificial Intelligence)
众所周知,computer vision(cv) 存在ICCV/CVPR/ECCV三个顶级会议, 它们档次差不多,都应该在一流会议行列, 没有必要给个高下。 有些us的人认为ICCV/CVPR略好于ECCV,而欧洲人大都认为ICCV/ECCV略好于CVPR, 某些英国的人甚至认为BMVC好于CVPR。简言之, 三个会议差不多, 各有侧重和偏好。
笔者就个人经验浅谈三会异同, 以供大家参考和讨论。 三者乃cv领域的旗舰和风向标,其oral paper (包括best paper) 代表当年度cv的最高水准, 在此引用Harry Shum的一句话, 想知道某个领域在做些什么, 找最近几年此领域的proceeding看看就知道了。 ICCV/CVPR由IEEE Computer Society牵头组织, ECCV好像没有专门负责的组织。 CVPR每年(除2002年)都在美国开, ECCV每两年开一次,仅限欧洲, ICCV也是每两年一次, 各洲轮值。 基本可以保证每年有两个会议开, 这样研究者就有两次跻身牛会的机会。
就录取率而言, 三会都有波动。 如ICCV2001录取率>30%, 且出现两个人(华人)各有三篇第一作者的paper的情况, 这在顶级牛会是不常见的 (灌水嫌疑)。 但是,ICCV2003, 2005两次录取率都很低, 大约20%左右。 ECCV也是类似规律, 在2004年以前都是>30%, 2006年降低到20%左右。 CVPR的录取率近年来一直偏高,从2004年开始一直都在[25%,30%]。最近一次CVPR2006是28.1%, CVPR2007还不知道统计数据。 笔者猜测为了维持录取paper的绝对数量, 当submission少的时候录取率偏高, 反之偏低, 近几年三大会议的投稿数量全部超过1000, 相对2000年前, 三会录取率均大幅度降低, 最大幅度50%->20%。 对录取率走势感兴趣的朋友,可参考 http://vrlab.epfl.ch/~ulicny/statistics/(CVPR2004的数据是错的),http://www.adaptivebox.net/research/bookmark/CICON_stat.html.
显然,投入cv的人越来越多,这个领域也是越来越大, 这点颇不似machine learning一直奉行愚蠢的小圈子主义。另外一点值得注意, ICCV/ECCV只收vision相关的topic,而cvpr会收少量的pattern recognition paper, 如finger print等, 但是不收和image/video完全不占边的pr paper,如speech recognition等。 我一个朋友曾经review过一篇投往CVPR的speech的paper, 三个reviewer一致拒绝, 其中一个reviewer搞笑的指出, 你这篇paper应该是投ICASSP被据而转投CVPR的。 就topic而言, CVPR涵盖最广。 还有一个没有验证过的原因导致CVPR录取率高: 很多us的researcher不愿意或没有足够的经费到us以外的地方开会, 故CVPR会优先接收很多来自us的paper (让大家都happy)。
以上对三会的分析对我们投paper是很有指导作用的。 目前的research我想绝大部分还是纸上谈兵, 必经 read paper -> write paper -> publish paper -> publish paper on top conferences and journals流程。 故了解投paper的一些基本技巧, 掌握领域的走向和热点, 是非常必要的。 避免做无用功,选择切合的topic, 改善presentation, 注意格式 (遵守规定的模板), 我想这是很多新手需要注意的问题。 如ICCV2007明文规定不写summary page直接reject, 但是仍然有人忽视, 这是相当不值得的。
自动化学报、计算机学报、软件学报、电子学报,中国图象图形学报,模式识别与人工智能,光电子激光,精密光学工程等。
神经网络-Neural Networks Tutorial Review
http://hem.hj.se/~de96klda/NeuralNetworks.htm
ftp://ftp.sas.com/pub/neural/FAQ.html
Image Compression with Neural Networks
http://www.comp.glam.ac.uk/digimaging/neural.htm
Backpropagator's Review
http://www.dontveter.com/bpr/bpr.html
Bibliographies on Neural Networks
http://liinwww.ira.uka.de/bibliography/Neural/
Intelligent Motion Control with an Artificial Cerebellum
http://www.q12.org/phd.html
Kernel Machines
http://www.kernel-machines.org/
Some Neural Networks Research Organizations
http://www.ieee.org/nnc/
http://www.inns.org/
Neural Network Modeling in Vision Research
http://www.rybak-et-al.net/nisms.html
Neural Networks and Machine Learning
http://learning.cs.toronto.edu/
Neural Application Software
http://attrasoft.com
Neural Network Toolbox for MATLAB
http://www.mathworks.com/products/neuralnet/
Netlab Software
http://www.ncrg.aston.ac.uk/netlab/
Kunama Systems Limited http://www.kunama.co.uk/
Annotated Computer Vision Bibliography
http://iris.usc.edu/Vision-Notes/bibliography/contents.html
http://iris.usc.edu/Vision-Notes/rosenfeld/contents.html
Lawrence Berkeley National Lab Computer Vision and Robotics Applications
http://www-itg.lbl.gov/ITG.hm.pg.docs/VISIon/vision.html
CVonline by University of Edinburgh
The Evolving, Distributed, Non-Proprietary, On-Line Compendium of Computer Vision, www.dai.ed.ac.uk/CVonline
Computer Vision Handbook,
www.cs.hmc.edu/~fleck/computer-vision-handbook
Vision Systems Courseware
www.cs.cf.ac.uk/Dave/Vision_lecture/Vision_lecture_caller.html
Research Activities in Computer Vision
http://www-syntim.inria.fr/syntim/analyse/index-eng.html
Vision Systems Acronyms
www.vision-systems-design.com/vsd/archive/acronyms.html
Dictionary of Terms in Human and Animal Vision
http://cns-web.bu.edu/pub/laliden/WWW/Visionary/Visionary.html
Metrology based on Computer Vision
www.cranfield.ac.uk/sme/amac/research/metrology/metrology.html
6.Digital Photography 数字图像
Digital Photography, Scanning, and Image Processing
www.dbusch.com/scanners/scanners.htm l
7.Educational Resources, Universities 教育资源,大学
Center for Image Processing in Education
www.cipe.com
Library of Congress Call Numbers Related to Imaging Science by Rochester Institute of Technology
http://wally2.rit.edu/pubs/guides/imagingcall.html
Mathematical Experiences through Image Processing, University of Washington
www.cs.washington.edu/research/metip/metip.html
Vismod Tech Reports and Publications, MIT
http://vismod.www.media.mit.edu/cgi-bin/tr_pagemaker
Vision Lab PhD dissertation list, University of Antwerp
http://wcc.ruca.ua.ac.be/~visielab/theses.html
INRIA (France) Research Projects: Human-Computer Interaction, Image Processing, Data Management, Knowledge Systems
www.inria.fr/Themes/Theme3-eng.html
Image Processing Resources
http://eleceng.ukc.ac.uk/~rls3/Contents.htm
Publications of Carsten Steger
http://www9.informatik.tu-muenchen.de/people/steger/publications.html
8.FAQs(常见问题)
comp.dsp FAQ
www.bdti.com/faq/dsp_faq.htm
Robotics FAQ
www.frc.ri.cmu.edu/robotics-faq
Where's the sci.image.processing FAQ?
www.cc.iastate.edu/olc_answers/packages/graphics/sci.image.processing.faq.html
comp.graphics.algorithms FAQ, Section 3, 2D Image/Pixel Computations
www.exaflop.org/docs/cgafaq
Astronomical Image Processing System FAQ
www.cv.nrao.edu/aips/aips_faq.html
http://sal.kachinatech.com/
http://cheminfo.pku.edu.cn/mirrors/SAL/index.shtml 北京大学
Google输入:computer vision 或computer vision groups可以获得很多结果
网络资源:
CVonline http://homepages.inf.ed.ac.uk/rbf/CVonline/视觉研究组列表
Computer vision test Image http://www.cs.cmu.edu/~cil/v-images.html卡内基梅隆标准图片库
视觉论文搜索:Paper search
http://www.researchindex.com
http://www.ph.tn.tudelft.nl/~klamer/cppima.html
Cppima 是一个图像处理的C++函数库。这里有一个较全面介绍它的库函数的文档,当然你也可以下载压缩的GZIP包,里面包含TexInfo格式的文档。
http://iraf.noao.edu/
Welcome to the IRAF Homepage! IRAF is the Image Reduction and Analysis Facility, a general purpose software system for the reduction and analysis of astronomical data
http://entropy.brni-jhu.org/tnimage.html
一个非常不错的Unix系统的图像处理工具,看看它的截图。你可以在此基础上构建自己的专用图像处理工具包。
http://sourceforge.net/projects/
这是GPL软件集散地,可以搜索IP库。
国内