作者|光谱
邮箱|[email protected]
在今年的计算机视觉顶级学术会议 CVPR 上,华人再次成为最大赢家。
包括经典论文、最佳论文、最佳学生论文和年轻学者奖等几大奖项,全部由华人包揽,并且论文类奖项还都是华人第一作者!
不仅如此,根据主席团的介绍,来自中国的作者在本次 CVPR 投稿论文中占了足足四成,并且投稿最多的前五家机构当中,就有四家国内顶尖大学!
CVPR 一直是华人研究员施展拳脚的舞台,不过这次已经不能用收获颇丰来形容了——他们和各自的作品,在本次 CVPR 2020 上大放异彩,堪比夜空中最亮的星。
01.最佳论文奖
CVPR 每年都会颁发多个奖项,其中最佳论文奖 (Best Paper Award)是压轴奖项,颁发给评委会认为今年所有接收论文当中质量最高的王者级论文。
今年 CVPR 2020 的最佳论文奖,颁发给了 Unsupervised Learning of Probably Symmetric Deformable 3D Objects from Images in the Wild. 第一作者为牛津大学视觉几何组博士生吴尚哲,本科毕业于香港科技大学,曾在商汤、腾讯优图、Google AI 实习。简单来说,这篇论文提出了一种新的方法 Photo-Geometric Autoencoding:只用一张人脸图像,可靠地“还原”(实际上是生成)高质量的三维人脸模型。稍微具体来说,这种方法在无监督的前提下,对一张照片采用多个 encoder-decoder 网络进行拆解,生成深度图、光照图、视角等多个维度的图片,组合渲染,重构出三维人脸模型。
除了真人头像之外,写实绘画,甚至抽象作品里的人脸也可以重建,看起来有点惊悚,不过对于这个模型来说还是足以证明其实力的:也可以对视频进行实时重建:
当然,掺点猫进来才会火:
作者也提供了一个 demo 的在线网站 https://bit.ly/30KfQWB,你可以自己上传一张照片试试效果。不过不知道是不是这个模型对亚洲脸型的识别能力差点意思,把我的人脸重建的不是很像……
02.最佳学生论文奖
最佳学生论文奖颁发给那些第一作者是学生身份的优秀论文。
CVPR 2020 的最佳学生论文奖,颁发给了加拿大 Simon Fraser University 团队的 BSP-Net: Generating Compact Meshes via Binary Space Partitioning 一文。
第一作者该校图形和视觉实验室的博士生 Zhiqin Chen,本科毕业于上海交通大学计算机系。
作者 Chen 同学的 Twitter 简介自己是一名重度游戏上瘾者。他的这篇论文 BSP-Net 正是如此,利用了游戏开发中经常用到的一个3D计算机图形概念,叫做二叉空间分割 (Binary Space Partitioning, BSP)。
简单来说,BSP 就是把一个复杂形状(二维或三维)的物体,在形状和对应的数据上分割细化成树状结构。这样,游戏能够快速生成和渲染由大量多边形组合成的物体和场景——这项技术最早被《雷神之锤》、《德军总部3D》和《毁灭战士》都采用过,在碰撞侦测、光线追踪等众多游戏技术当中有着大量运用。
作者基于 BSP 开发的这个神经网络 BSP-Net,主要功能和设计方向是自动生成最少的多边形,合成外形尽量完美、真实的三维物体。
对同一个二维或者三维图形物体进行重建,和此领域其它神经网络模型相比,BSP-Net 所用的多边形数量显著更少,镶嵌效果更好。
而这在某些专门的应用领域或许能派上大用场,比如游戏——可以减少占用计算资源耗用,还能渲染更多的物体。这并不是说 BSP-Net 的重建效果是最完美的,正如前面提到,它的主要方向是降低多边形数量,同时达到预期的效果。
你可以到项目网页 https://bsp-net.github.io/ 上查看关于这篇论文的概括介绍、口述演讲和更多细节。
03.经典论文奖
这个奖项全名 PAMI Longuet-Higgins Prize,旨在奖励那些发布时间已经超过十年,但对后世研究者的工作仍然具有突出的指导和启发意义的经典论文。
这一奖项(两个名额的其中之一)同样被华人第一作者的论文拿下:来自当时在布朗大学读 PhD,后来辗转哈佛大学、英伟达,现在在谷歌工作的高级研究员 Deqing Sun. 论文:Secrets of Optical Flow Estimation and Their Principles.
这篇论文在 CVPR 2010 上首次发布,当时只是一篇 poster 论文。它讲的是光流法测算,也就是和观察者的运动所造成的观测目标、表面或边缘运动有关的一个概念。比如某人观测到某物体向右上方移动,如何判定这种相对位移是观测对象还是观测者在动,便是光流法测算需要解决的问题。
这个概念在模式识别、计算机视觉和其它图像处理领域都非常重要,是视频压缩、物体识别和追踪、机器人导航等领域的关键底层技术。
而这篇十年前的论文,通过大量建模、测试等工作,解答了许多光流法测算相关的问题,从数学/机器学习的角度分析了当代光流法测算能够取得准确结果的理由,哪些技巧好用,哪些没用,并且延展到如何利用这些新增的知识继续改进测算技巧,开发出新的模型。
CVPR 2020评审团认为,回顾十年前来看,这篇论文对后世研究的积极影响最为重大,所以颁发了经典论文奖给它。
同时,Deqing Sun 也和 Google Research 的 Jon Barron(Pixel 手机的背景虚化、HDR+、人像模式以及Google Glass 重要开发者)共同荣获本届 CVPR 的年轻学者奖 (PAMI Young ResearcherAward)
04.中国研究员继续大放异彩
照例,主席团成员在这次线上大会开场阶段介绍了本届 CVPR 的投稿论文作者和机构情况。
由于新冠疫情影响,CVPR 2020 从原本的线下会议,一度想要变成线上线下混合,最后失败,只能完全转为线上,注册参会者只有7,000人左右,比去年有所降低。
不过在论文投稿方面,大会还是继承了越办越好的传统,投稿论文数量增加了29%,作者数量增加了20%。最终接收论文也有1,467篇,较去年有所提升,占总投稿数量的四分之一;Oral 论文比例5.7%。
来自中国作者和/或中国机构的论文占了最大的比例。大会数据统计,来自中国的作者占到了四成,远超美国22.7%。
更重要的是,中国作者/机构的论文不仅数量多,质量也很高,不仅如前面提到的,斩获最佳论文、最佳学生论文和经典论文三大奖,在各奖项提名名单里也占了绝大多数。
按照归属机构统计作者发现,中国大学在前十当中占了七名,前五当中占了四名!
它们分别是:清华大学(第一,340人)、上海交大(第三,287人)、北大(第四,232人)、浙大(第五,216人)、中科大(第七、180人)、北航和西电(并列九、十名、各138人)。
去年 CVPR 的大奖同样属于华人团队。
CVPR 2019 最佳论文得主 CMU 辛书冕和团队通过提取优先、零碎和非直接的光学信息,能够隔着障碍物还原出另外一边非视距内物体的样貌。大会评价称:“该论文在非视距重建(也即看到拐角背后)上作出了杰出的贡献。这是一篇理论优美且具有启发价值的论文,扩展了计算机视觉可能性的边界。”
最佳学生论文奖颁发给了 UCSB 王鑫和团队,他们开发的自我监督学习模型可以让机器人遵守自然语言指令序列进行视觉导航,对应论文在去年所有投稿文章中得分排名第一。
经典论文奖则毫无悬念地颁给了斯坦福邓嘉和李飞飞团队的 ImageNet 论文。ImageNet 作为一个大规模的标注图像数据库,为后世研究者提供了极大的便利,促进了计算机视觉技术的进步。
往期精彩文章推荐
长按关注
品玩官方公众号
科技创新者的每日必读