作者:KnowingAI知智
链接:https://www.zhihu.com/question/323644172/answer/715321371
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
说到计算机视觉,首屈一指的大牛必然是 David Marr(1945-1980)。
20 世纪 70 年代,身为神经系统学家的 Marr,将神经心理学与人工智能的知识相结合,提出了具有跨时代意义的「计算视觉理论」,标志着计算机视觉成为一门独立学科。
在 Marr 看来,视觉的主要功能是「从视网膜成像的二维图像,恢复三维物体的表面形状」,也就是「三维重建」。他还提出了一系列关于「三维重建」的计算理论与方法。
为了纪念 Marr 对计算机视觉领域做出的开拓性贡献,计算机视觉领域的最高荣誉「马尔奖」以他的名字命名。在两年一度的 ICCV(国际计算机视觉大会,The International Conference on Computer Vision)上,「马尔奖」会被授予最优秀论文的撰写者。
Marr 著作颇丰,不过年代所限,如今 Marr 的许多猜想都已被证明并不正确。他的理论由其学生归纳总结为一本《vision》,感兴趣可以找来看看。
寻找「大牛」可以从计算机视觉领域的顶级会议入手。
能够在这些顶级会议中担任主席、评委,或是多篇论文被采纳的学者,都是值得学习的「前辈」。
除了前文提到的 ICCV,还有 CVPR(计算机视觉及模式识别会议,IEEE Computer Vision and Pattern Recognition)、ECCV(欧洲计算机视觉会议,European Conference on Computer Vision)等等。
(关于图像领域的顶会,这里有一篇回答可供参考:图像领域有哪些高级期刊与顶会? )
如:
1.Takeo Kanade(金出武雄)
卡耐基梅隆大学计算机科学和机器人研究所教授,计算机视觉泰斗,美国工程院院士。专注于目标跟踪、人脸检测和 3D 场景分析等方向的研究,跟踪算法 KLT 中的「K」指的就是他。Kanade 曾在 1990 年获马尔奖,此外,他还持有数十项专利。
2.Andrew Zisserman
英国牛津大学教授,视觉测量组主任。曾于 1993 年、1998 年和 2003 年 3 次获得马尔奖。著有计算机视觉经典书籍《Multiview Visual Geometry》,同时也是著名深度学习网络:VGGNet(Visual Geometry Group Net)的编写者之一。
3.David Lowe
英属哥伦比亚大学计算机科学系教授,1988 年获马尔奖,专注于目标识别、人类视觉计算模型等方面的研究。1999 年,David 发明的著名图像处理算法 SIFT 算法(scale-invariant feature transform),一度成为最流行的图像特征点检测方法,被广泛应用于物体识别和图像分类等领域。
4.Paul Viola
在人脸检测方面极具影响力的科学家,2003 年获马尔奖。在 2001 年的 CVPR 上,他与 Micheal Jones 联合发表的论文《Rapid object detection using a boosted cascade of simple features》,极大程度地影响了当时的学者,让其中的 boosting cascade 算法已被广泛应用于学术界和工业界。
5.Andrew Blake
曾获 2 次 ECCV 最佳论文奖和 1 次马尔奖。专注于图像分割、目标跟踪及人体姿态跟踪方面的研究。著名的 Active Shape Model(主动形状模型)就是由他参与发明的算法「Active Contours」演变而来。
6.Luc Van Gool
比利时荷语天主教鲁汶大学教授,瑞士苏黎世联邦理工学院教授,计算机视觉实验室主任,1998 年获马尔奖。他在 SIFT 算法的基础上,开发出了更加先进的 SURF 算法(speed up robust feature)。
7.David Forsyth
美国伊利诺伊大学厄巴纳-香槟分校教授,2019 ICCV 大会主席,1993 年获马尔奖,与 Jean Ponce 合著的《Computer Vision:A Modern Approach》堪称计算机视觉经典教材。
8. 朱松纯
著名计算机视觉华人学者,现为美国加州大学洛杉矶分校统计系与计算机系教授,UCLA 计算机视觉、认知、学习与自主机器人中心主任,2019 年 CVPR 主席。朱松纯曾获 1 次马尔奖,在场景理解、视觉常识推理等方面做出了重要贡献。
9.Marc Pollefeys
苏黎世联邦理工学院教授,2019 年 ICCV 大会主席,对摄像机自标定方面做出了杰出贡献。他与另外两名学者在一期 IJCV(计算机视觉国际期刊,International Journal of Computer Vision)上发表的文章《Self-Calibrationand metric reconstruction inspite of varying and unknown intrinsic camera parameters》,被称为摄像机自标定方面最经典的论文之一,他也因此在 1998 年获马尔奖。
10.Larry Davis
美国马里兰大学教授,2019 年 CVPR 大会主席。其最著名的研究成果为 W4 实时监控系统——最早能够进行户外人体检测和行为分析的实时视频监控系统。
11.Phillip Torr
英国牛津大学教授,2019 年 CVPR 大会主席,曾于 1998 年获马尔奖,现为自动驾驶公司 FiveAI 的首席科学顾问。
12.Kyoung Mu Lee
首尔大学教授,国际 CV 社区十分活跃的韩国学者,2019 ICCV 大会主席,领域著名期刊 TPAMI 副主编。
13.Gerard Medioni
2020 年 CVPR 大会主席,曾与他人合著《Emerging Topics of Computer Vision》、《多媒体系统:算法、标准和工业实践》等经典学术书籍。
有些「大牛」与顶级会议的联系没有那么「密切」,但顺着计算机视觉的发展脉络和阵地,你依然能发现他们。
如:
1.Jitendra Malik
斯坦福大学教授,其研究工作集中在轮廓检测、图像/视频分割、图形匹配等方面,在边缘检测、图像分割和形状匹配方面拥有杰出贡献。Malik 的学生中人才济济,华人学者史建波就出自他的门下,还包括 Alexie Efros、Paul Debevec、Yair Weiss 等优秀学者。
2.David Murray
英国牛津大学教授,Active Vision 实验室主任,PTAM 算法(Parallel tracking and mapping)的发明者。他还是上文提到的 Philip Torr,Andrew Davison 的 PhD 导师。
3.Andrew Davison
英国帝国理工学院教授,机器视觉组及 Dyson 机器人实验室主任,专注于 SLAM 领域的研究,对 MonoSLAM、SLAM++等成果的问世做出了极大的贡献。
4.Vijay Kumar
宾夕法尼亚大学教授,Vijay Kumar 实验室主任,在无人机领域有很高的建树。
5.Daniel Cremers
德国慕尼黑工业大学教授、计算机视觉组主任。同样为无人机领域的优秀学者,还是 LSD-SLAM 算法的发明者之一。
6.Richard Szeliski
其所著的《Computer Vision: Algorithms and Applications》(计算机视觉:算法与应用)同样是计算机视觉非常经典的入门教材。
再补充一些知名华人学者~
1. 黄煦涛
伊利诺伊大学厄巴纳-香槟分校(UIUC)Beckman 研究院图象实验室主任,美国国家工程院院士。专注图像处理、模式识别、计算机视觉和人机交互等方面的研究工作,并发明了预测差分量化,培养了诸多优秀学生。
2. 史建波
宾夕法尼亚大学计算机与信息科学教授,在图像分割方面有极高的成就。2000 年,史建波与他人在期刊 PAMI 上联合发布的文章《Normalized cuts and image segmentation》突破性地将图论方法应用于聚类和图像分割,使之成为了主流研究方法,极大程度上推动了图像分割,乃至整个计算机视觉领域的发展。
3. 李飞飞
斯坦福大学教授、人工智能实验室与视觉实验室主管。创办了著名的 ImageNet 竞赛。从 2010 年至 2017 年,一年一度的竞赛吸引了众多优秀的学者,也见证了图像识别算法的飞速发展,2017 年,获奖算法的识别准确率甚至达到了高于人类水平的 97.3%。
李飞飞还曾获 2018 年「影响世界华人大奖」,在不太关注 AI 领域的人中亦有相当的知名度。
4. 汤晓鸥
香港中文大学信息工程系主任,在人脸识别方面拥有极高的成就。
2009 年,汤晓鸥团队的论文在 CVPR 上获得年度「最佳论文奖」,是 CVPR 自创办起的 25 年来首次获奖的亚洲论文。IJCV 第一位华人主编;2014 年,由汤晓鸥团队发布的 GaussianFace 算法,在全球最权威的人脸识别数据库 LFW 上的准确率为 98.52%,首次超越人类水平。
当然他还有另外一个身份:商汤科技创始人。
5. 吴郢
美国西北大学教授、计算机视觉实验室主任。曾获美国青年教授的最高荣誉:美国国家科学基金「事业奖」,并在手势识别和目标跟踪方面取得了优秀成果。
6. 孙剑
旷世科技首席科学家,主要研究方向为人脸识别、计算摄影学和基于深度学习的图像理解 。自 2002 年起在 SIGGRAPH、CVPR 等顶级会议上发表超过 100 篇学术论文,两次获得 CVPR 最佳论文奖。其团队开发的深度残差网络(ResNet)对图像识别领域有着广泛影响。
7. 贾佳亚
香港中文大学教授,腾讯优图实验室科学家。主要研究方向为计算机视觉、图像处理、模式识别等,在图像滤波、图像稀疏处理、多频段图像信号融合等方面做出了巨大贡献。
希望有所帮助~