*“IJCV 亚洲之夜”嘉宾合影
雷锋网导读:CVPR 2017 期间,国际计算机视觉顶级期刊 IJCV 举办了“IJCV 亚洲之夜”宴会。IJCV 首位华人主编汤晓鸥教授,邀请了 CV 领域的海内外知名亚洲学者如沈向洋、李飞飞、张正友、金出武雄等,与大家分享对亚洲 CV 学术实力崛起的观点、自己职业生涯中经历的那些事,以及对年轻人的寄语。一起来看看他们都说了些什么。
计算机视觉领域的顶级会议 CVPR,正在夏威夷火奴鲁鲁召开。夜夜笙歌的小岛上,突然多了批面容稳肃的计算机科学家,其中不乏亚洲面孔的顶级 CV 学者。
都有哪些海内外闻名的亚洲学者?
举几个例子:
微软全球执行副总裁、人工智能与全球研发负责人沈向洋;
谷歌云首席 AI/ML 科学家、斯坦福副教授兼 AI 实验室负责人李飞飞;
IJCV 创始主编、CVPR 创始主席之一的卡耐基·梅隆大学教授金出武雄(Takeo Kanade);
前 IJCV 主编、东京大学教授 Katsushi Ikeuchi;
ICCV 2019 大会主席、TPAMI 副主编、首尔大学教授 Kyoung Mu Lee;
CVPR 2017 程序委员会主席、宾夕法尼亚州立大学教授刘燕西;
CVPR 2017 程序委员会主席、西北大学教授吴郢。
而上述学者,均于 24 日晚聚到了会议中心旁举行的 IJCV 宴会——“IJCV 亚洲之夜”。一同出席的,还有两位今年的 CVPR 大会主席:
微软研究院首席科学家张正友,以及马里兰大学教授 Rama Chellapa。
本次 IJCV 宴会由微软研究院、商汤科技以及中国联通赞助。主持宴会上讲座的,是中科院深圳先进技术研究院副院长、香港中文大学教授汤晓鸥。
这些 CV 大牛在宴会上分别进行了简短讲座。作为受邀媒体,雷锋网(公众号:雷锋网)也出席了本次晚宴,并将各位亚洲学者的讲话要旨进行了整理。但首先,对于不熟悉 IJCV 的读者,我们先来介绍一下 IJCV 是什么,以及今晚宴会的意义。
在计算机视觉领域,不得不提两个殿堂级的学术期刊:IJCV 和 TPAMI。
后者全称为 《IEEE模式分析与机器智能汇刊》。IJCV 则是 “International Journal of Computer Vision” 的缩写,即《计算机视觉国际期刊》。它们与 "ICE" 顶会(ICCV、CVPR、ECCV)一道,代表了 CV 界的最高学术水平。
可惜的是,尽管 CV 研究经历了多年爆炸式增长,华人学者也已占据半壁江山,作为 CV 领域的顶级期刊,IJCV 却从来未有华人担任主编。
现在,这个情况终于发生了改变——雷锋网了解到,国内 AI 学者中极具声望的汤晓鸥教授,已当选为 IJCV 历史上的首位华人主编——至此,顶级 CV 学术期刊的最高评审桌上,终于有了来自中国的声音。
顺便说一句,这已经不是汤晓鸥教授第一次受到学界瞩目:
其发明的人脸识别技术 Gaussian Face/Deep ID,是世界上第一个超过人眼识别能力的计算机算法;
2009 年,他摘得 CVPR 最佳论文奖——是 CVPR 历史上首篇获此奖项的亚洲论文。
出任 ICCV 2009 程序委员会主席,ICCV 2019 大会主席。
汤晓鸥教授用他惯有的幽默为大会开场:
“今晚宴会的关键词不是 IJCV,也不是亚洲,更不是夜晚,而是龙虾。我在波士顿 MIT 读书时,经常去一家小海鲜店,那里波士顿大龙虾减价时只卖 2.99 元一斤,很便宜,我总买一只当晚餐,很好吃。前几周在北京,我在酒店点了麻辣小龙虾,发现一只小龙虾要 20 元 RMB,相当于 3 美元一只。相当于美国当年大龙虾的价钱了,于是我决定在夏威夷开会期间请大家吃大龙虾宴。争取把机票钱省回来”
而亚洲力量的崛起,是“IJCV 亚洲之夜”宴会讲座上当之无愧的主题。
在汤晓鸥教授的欢迎致辞后,沈老师首先回忆了微软亚洲研究院作为中国计算机科学界“黄埔军校”、将人才输送至中国大半个科技圈的传奇历史——尤其是其视觉计算组,沈老师和汤晓鸥教授先后担任其负责人。而曾在微软亚洲研究院视觉计算组做研究的人,很多已是分散在世界各地的顶尖学者与研究员。
接下来,沈向洋老师简单盘点了亚洲在世界顶级 CV 会议中越来越大的影响力:
不算澳大利亚,1990 年至 2019 年,共有五场 ICCV 已在/将在亚洲举办:ICCV 1990 和 2009 在日本,ICCV 1998 在印度,2005 年在中国,2019 年将到韩国举办。
在 CVPR 三十多年的历史中,组委会中也不乏顶尖亚洲学者的身影。
但这显然不是终点。沈向洋老师强调帮助、培养年轻一辈学者、研究员的重要性,使得亚洲 CV 社区不断壮大:
“我们应该把 ACCV 发展到 ICCV/CVPR/ECCV 的层次。”
“亚洲 CV 社区应当有更多的合作,我们需要更多地参与亚洲计算机视觉协会。”
作为 IJCV 的上任主编,Katsushi Ikeuchi 教授与大家分享了他所整理的几组 IJCV 数据,以及对真正的“人工智能”的看法。
Katsushi Ikeuchi
在 IJCV 的录取的论文中,约一半来自欧洲,三分之一来自亚洲,剩下的一小半来自北美。而北美的学者里,又有相当一部分来自亚洲。
但这不是最有意思的——最有趣的是谁读了这些论文。如上图,Katsushi Ikeuchi 教授向大家展示,在 IJCV 论文的总下载次数中,北美占 20%,欧洲仅占 23%,而亚洲足足占到了 49%——这在一定程度上解释了为什么近几年亚洲的 CV 乃至深度学习研究进步如此之快。而如此规模的论文研习基础,这也让人对亚洲学界的人才储备保持乐观。以此看来,亚洲 CV 以至深度学习研究的崛起,不但是进行时,还将有充足的动能保持高速发展。
最后,对于大众想象中具备自我意识的终极 AI,以及对此的担忧;Katsushi Ikeuchi 表示,我们需要研究如何塑造 AI 的灵魂,让其成为哆啦A梦式的人类之友,而不是对我们恶意敌对的智能体。
随后分享的,是德高望重的金出武雄教授。在场的许多大牛,包括李飞飞,都与金出教授有过传道解惑之谊,受到其很大的影响。
身为 IJCV 两位创始主编之一,金出教授说道:“我想告诉大家一个小窍门,怎么搞出一个影响力的学术期刊”。
这个“小窍门”,是创刊之初就出奇严苛的 IJCV 论文录取规则和标准。
当时,作为一家新诞生的期刊, IJCV 不但坚持所有论文在其首发,还以极高的评审标准让不少抱着试一试心态投递的论文被拒。很快,在 IJCV 上发表论文就成了一件很有说服力的事;它也迅速成为 CV 领域影响力最大、质量最高的两家期刊之一。
Rame Chelleppa 是 CVPR 2017 的三位大会主席之一,他首先向青年学者们科普了 CVPR 的历史沿革,然后对其学术道路上的各位引路人表示了感谢。
1983 年以前,CVPR 还不叫这个名字,而是“PRIP”。这个名字从 1977 年 PRIP 大会创立一直沿用到了 1982 年。当年,PRIP 的重心有三个:图像处理、模式识别以及 CV。后来 CV 的角色越来越凸显,促使大会转型为 CVPR。
他表示,自己并不喜欢“人工智能”这个名词,AI 应该指代的是“增强智能”——“AI equals to augmented intelligence”。绝大多数的 AI 研究并不是在人为创造什么全新存在,而是谋求增强人类的能力,成为佐助我们进行决策的工具。
Kyoung Mu Lee 教授是国际 CV 社区非常活跃的韩国学者,不但是 TPAMI 副主编,还将担任 2019 ICCV 大会主席。另外,首尔大学和微软亚洲研究院合作拿下了 ACM Multimedia 2018 的承办权。大会将于 2018 年 10 月 22 至 26 日在首尔举办,Kyoung Mu Lee 将出任大会主席,微软亚研的梅涛老师将出任大会程序委员会主席。
Kyoung Mu Lee 教授还与在座的亚洲学者分享了韩国 CV 社区与会议的情况:
KCCV,即韩国计算机视觉大会自 2014 年开始举办,参会人员超过 350 人。
去年七月,韩国计算机视觉协会 KCCV 成立。
讲座伊始,李飞飞老师重申了牛顿的那句名言:“我只是站在巨人的肩膀上”,向计算机科学领域的无数先辈致敬,表示自己只是站在巨人肩膀上的一名学生。
随后,飞飞老师对在职业道路上获得的支持、以及给予支持的人们表示了感谢——包括启发良多的朱松纯教授,提携照顾自己的黄煦涛教授,提供了许多宝贵建议的沈向洋老师,以及支持 ImageNet 的李凯教授。飞飞老师还对相信自己、在研究中付出的学生们表达了感谢,尤其是邓嘉和李佳。邓嘉在无人愿意参与 ImageNet 项目情况下,凭着对飞飞老师的信任接下这一任务,ImageNet 应当归功于他。而李佳追随李飞飞老师换了三所学校、不得不进行三次博士资格入学考试。
另外,李飞飞老师还列举了一个让在座亚洲学者心情振奋的数字,展示 CV 领域亚洲力量的崛起:
在本届 CVPR,有超过半数的录取论文,其第一作者是亚洲人。
这是一个堪称标志性的事件。
飞飞老师讲话完整版请见雷锋网此前报道。
张老师同样对职业生涯中给予自己支持的导师与前辈,表示了感激,包括 Oliver Faugeras、Nicholas Ayache 与 Thomas Huang。
当谈及自己的第一篇论文,他表示,现在回头再看这篇文章,当时自己英文写作的语法存在很多问题,感到有些汗颜。但这篇论文仍被第二届 ICCV 收录,他开玩笑说:“或许那个年代的人比较宽容”。他以此鼓励如今的青年学者,以更积极的心态看待自己的不足。
回顾研究生涯,张老师表示自己做课题比较慢,并不多产,通常两年才发布一篇研究论文,连续多年均是如此(如下图)。而在两年时间内,自己就扎下去只专心做一个课题。虽然产量不大,但凭借多年苦心钻研倒也获得了同行的认可。借此,张老师对现在的青年 CV 研究员说出了自己的肺腑之言:
“要静得下心,要沉得住气。”
选一个自己打心眼儿里对它有信心、感兴趣并且有价值的课题,不断做下去,想着把它做成。
这些话很简单,但知易行难。若真能十几年如一日坚持下去,当无愧"学者“二字。
吴老师讨论了一个很有意思的话题——“Asian blind”,这是现有论文引用范式造成的,无法通过姓名在 reference 和 citation 中辨识亚洲作者的问题。
众所周知,现有的主流论文引用格式均只露出作者的姓。随便举个例子,下面是某篇论文采用哈佛标准的索引:
Zhang, W., Lin, Z. and Tang, X. (2009). Tensor linear Laplacian discrimination (TLLD) for feature extraction. Pattern Recognition, 42(9), pp.1941-1948.
注意到作者的名只有首字母了吗?仅通过姓的拼音和名的首字母,很难一看看出这个人是谁。比如,“Zhang” 可能是“张”也可能是“章”,但姓张的实在很多,CV 圈也不少,“Zhang, W.”提供的作者身份信息实在有限。这一方面是中国的许多姓太古老,导致大姓横行。另外,现有的论文引用格式在当年由西方学者制定,而欧洲语言姓名的情况与中国正好相反:重名的特别多,比如 John、Jack、William、Edward 等等。
因此,吴老师提议采用一种新的论文引用格式,对作者人名用全称。对此,作为宴会主持人的汤老师表示了赞同。
刘老师本是电气工程与物理学专业出身,博士才转向计算机专业。她非常强调跨学科学习背景带来的好处——“它山之石,可以攻玉”
让雷锋网记者印象最深刻的,是刘老师向大家播放的一则鲀鱼(Puffer fish)建造沙堡的短记录片。
鲀鱼的沙堡
出于吸引雌性的动机,雄鲀鱼会在交配季节不眠不休花费一周的时间,在海底的沙床建造出这样一座令人叹为观止、仿若遵循某种自然规律的图案,作为与伴侣共度春宵的爱巢(视频的油管地址见这里)。鲀鱼大概是自然界最出色的工程师与艺术家,在它身上,科学与艺术,工程与美,实现了完美的协调。
或许,计算机科学与 AI 技术,也能实现这一点?
本文作者:三川
本文转自雷锋网禁止二次转载,原文链接