新智元报道
来源:CVPR 2020
编辑:新智元编辑部
CVPR Best Paper终于来了!
受疫情影响,今年 CVPR 改为线上会议。北京时间6月16日晚11:30,大家期待已久的计算机视觉和模式识别领域的「奥斯卡」 CVPR 2020 开幕式正式线上举行。涵盖了 Oral Session Program、Tutorials、Workshops 和 DoctoralConsortium 等一系列活动。
缅怀首位华人CVPR程序主席,成立Thomas S. Huang纪念奖
本届CVPR开篇特意缅怀了一代CV宗师、84岁华人计算机视觉泰斗Thomas S. Huang(黄煦涛)。
他是华人计算机视觉史上的关键人物,首位担任CVPR程序主席(1992)的华人。老先生一生桃李满天下,备受崇敬,为华人CV领域留下丰厚的学术遗产,
黄煦涛在图像处理、模式识别和计算机视觉领域作出了开创性研究贡献,其中包括多维数字滤波器的设计和测试、数字全息摄影、文件和图像的压缩技术,以及人脸、手、躯干3D建模、分析和可视化、多模态人机界面、多媒体数据库等。
黄煦涛教授发明了预测差分量化(PDQ)的两维传真(文档)压缩方法,该方法已发展为国际G3/G4FAX压缩标准;在多维数字信号处理领域中,提出了关于递归滤波器的稳定性的理论;建立了从二维图象序列中估计三维运动的公式,为图象处理和计算机视觉开启了新领域。此外,他的研究小组还实现了基于语音识别和可视手语分析以控制显示的系统。
缅怀视频中,收录了有关黄教授在90年代中期的一些珍贵影像资料。
PAMITC执行委员会已经批准设立计算机视觉领域的Thomas S. Huang纪念奖,从2021年开始每年在CVPR上颁发。
获奖者将由PAMITC奖励委员会选出,类似于罗森菲尔德奖,并将给出相同的奖金。
入选者必须是博士,且毕业10年。委员会将根据研究、服务和指导情况综合评选出获奖者。其他细节将在CVPR2021之前公布。
获奖论文大赏,最佳论文和最佳学生论文一作均为华人
下面重头戏来了,获奖论文环节!
最佳论文:Unsupervised Learning of Probably Symmetric Deformable 3D Objects from Images in the Wild
最佳论文提出了一种无需外部监督即可从原始单视图图像中学习3D变形对象的方法。该方法基于自动编码器,该自动编码器将每个输入图像分解为深度,反射率,视角和照明。为了在无监督的情况下解构这些组件,作者使用了以下事实:许多对象类别至少在原则上具有对称结构。
作者通过光照的推理来利用底层对象的对称性,即使外观由于阴影而不对称。接着通过预测对称概率图来建模可能(但不一定)对称的对象,并与模型的其他组件联合起来进行端到端的学习。实验表明该方法可以从单视图图像中非常准确地恢复人脸,猫脸和汽车的3D形状,而无需任何监督或预先设定的形状模型。
人脸重建效果
论文:
https://arxiv.org/abs/1911.11130
代码:
https://github.com/elliottwu/unsup3d
项目主页:
https://elliottwu.com/projects/unsup3d/
(有Demo,可上传图片体验)
最佳论文一作Shangzhe Wu,是来自牛津大学视觉几何组的二年级学生,由 Andrea Vedaldi 教授指导获得了 Facebook 研究所的全额奖学金。在 HKUST 读本科期间,曾与Chi-Keung Tang教授和Yu-Wing Tai 教授合作研究图像翻译 / 生成,现在主要的研究方向为无监督 / 自监督的3D 理解。Shangzhe Wu曾于2017年11月 -2018年2月,在腾讯优图实验室做机器学习实习生。
最佳学生论文: BSP-Net: Generating Compact Meshes via Binary Space Partitioning
BSP-Net:通过二叉空间分割生成紧凑网络
这篇论文的角度十分新颖,从多边形网格入手,基于计算机图形学的经典空间数据结构Binary Space Partitioning(BSP)来设计了一个BSP-Net。这个网络可通过凸分解来学习表示3D形状,并且不受监督,因此训练不需要进行凸形分解。BSP-Net的重建质量有很大的优势,并且很容易能够进行参数设置。
论文一作是来自Simon Fraser University的博士一年级学生Zhiqin Chen,师从张皓教授,从事计算机图形学相关的研究,主要研究方向是几何建模和机器学习。Chen于2017年从上海交通大学本科毕业,于2019年从Simon Fraser University硕士毕业。
论文:
https://arxiv.org/abs/1911.06971
代码:
https://github.com/czq142857/BSP-NET-original
项目主页:
https://bsp-net.github.io/
此外,PAMI青年研究者奖的两位获得者是:Jon Barron & Deqing Sun
Deqing Sun本科毕业于哈尔滨工业大学电子与信息工程专业,后在香港中文大学获得硕士学位,并在布朗大学获得了博士学位。他曾是英伟达高级研究科学家,现为谷歌高级研究员。
经典论文奖,也授予了Deqing Sun,Stefan Roth和Michael J. Black的Secrets of Optical Flow Estimation and Their Principles,发表于2010年。
中国学者占四成!诺亚方舟实验室田奇位列华人高产榜榜首
从录取论文作者来看,中国学者的贡献在此届CVPR确实是熠熠生辉。
CVPR大会程序主席刘策公布,今年CVPR论文中国作者占CVPR 2020总作者总人数的39.2%,在各个国家中位列第一。
从大学/机构来看,来自清华大学的作者人数最多,排名第一。此外上海交通大学,北京大学,浙江大学贡献位居前10。
其中根据Aminer统计,来自华为诺亚方舟实验室的田奇位列华人榜首,共有24篇论文入选。
在一作华人学生榜单中,香港科技大学的周磊以5篇入选论文位列第一。
中国厂商展现实力,商汤62篇,华为、百度、腾讯、阿里表现不俗
在国内,包括百度、腾讯、旷视、华为、虎牙等在内的诸多国内科技公司,也纷纷战绩斐然。
国内公司论文入选情况:(如有遗漏,欢迎补充)
商汤科技及联合实验室共有62篇论文入选,其CVPR 2020录用论文在多个领域实现突破,包括对抗式生成模型、三维点云理解与分析、训练加速与模型量化、视频理解与分析、网络结构搜索等。
华为视觉研究团队此次为业界贡献了 34 篇论文,其中包括 7 篇oral论文。
3 百度共有22篇论文入选,比去年的17篇增加了5篇,有进步涉及主题涵盖人脸检测&识别、视频理解&分析、图像超分辨、及自动驾驶中的车辆检测、场景实例级分割等领域。
4 腾讯优图17篇论文入选,腾讯被收录的论文涵盖类比学习、人脸识别、物体检测、行人重识别等前沿领域等。
5 阿里巴巴共有16篇论文入选,涵盖3D视觉、目标检测以及频域图像处理等领域研究成果。
6 旷视今年入选16篇,比去年的14篇有进步,论文的作者中我们也看到了印奇、范浩强等熟悉的名字。
7 京东数科也中选了8篇,在去年中选7篇的数量上有所增加。
8 快手一共6篇,其中一篇一作,作者是罗切斯特大学的快手实习生Haichuan Yang,也是刘霁老师的学生。
9 虎牙也有1篇论文入选。
参会人数有所减少,论文作者和数量均大幅增加
相比去年,今年参会人数约为7000人,较去年有一定的减少。
超过3600评审审阅了超过1.8万稿件,工作量增加了21%。在此也向各位评审道一声辛苦了!
今年的resigtered和valid submissions均比去年有显著增长。
最终提交的有效论文数为5865篇,接收的论文数为1467篇,接受率仅为25%。入选的论文中,参加oral presentation的有335篇。
在如此激烈角逐下,获奖的论文能脱颖而出,足以体现论文的含金量之高。
下面的词云很直观的看出今年的CV领域的主流趋势。其中Transfer (learning)和Robotics可以看做是今年的两匹黑马了。
组委会成员
这届大会主席是 Gerard Medioni(南加州大学 & 亚马逊研究负责人,Amazon Go),Ramin Zabih(康奈尔大学)和 Terry Boult(科罗拉多斯普林斯分校)
Gerard Medioni
程序主席是刘策(谷歌 & MIT)、Greg Mori(加拿大西蒙弗雷泽大学),Kate Saenko(波士顿大学)和 Silvio Savarese(斯坦福大学)。
谷歌近70篇入选,实力霸榜
目前,谷歌已有近70篇论文在本届CVPR会议被接收,微软51篇,Facebook37篇,英伟达15篇全部入选。
谷歌在各家企业中拔得头筹,近70篇论文涵盖了计算机视觉许多热门领域,包括图像识别、神经网络、自动驾驶和语义分割等。
并且,谷歌将各类计算机视觉技术应用到实际的场景中,例如更新了Google Photos和Image Search中基于内容的搜索等。
谷歌就有一篇名为《RetinaTrack: Online Single Stage Joint Detection and Tracking》简述了如何进行车辆的多目标跟踪。该论文介绍了一种名为RetinaTrack的方法,通过对Waymo开放数据集的评估,证明了该方法在更少的计算量下能够很好的完成跟踪任务。
微软在这次会议中也表现出色,一共有51篇论文入选,涉及领域包括生物学、虚拟现实、图像识别和模式识别等。
其中备受关注论文为《Face X-Ray for More General Face Forgery Detection》。这篇论文描述了一种有助于防止换脸图像被滥用工具。这项技术与现有方法不同,它能够准确检测未知图像,即不论什么算法合成的,在不进行针对性的训练的情况下也可以进行检测。
同为人工智能巨头的Facebook AI也在计算机视觉的许多重要领域推动着先进的技术发展,此次中标论文就包括了核心分割任务,架构搜索,转移学习和多模态学习。几篇著名的论文提出了推理常规2D图像中显示的3D对象的新方法。
例如《End-to-end View Synthesis from a Single Image》这篇论文就提出了一种新的方法,可以从缩小图像生成新颖的视图。初始开源程序的代码允许在测试时给定看不见场景的片段图像的情况下,合成场景的新视图。
表现抢眼的还有英伟达。英伟达在今年以计算机视觉领域的一系列开创性研究为特色,从模拟动态游戏环境到搜索医学影像,15篇论文都强调创新性。
《Analyzing and Improving the Image Quality of StyleGAN》这篇论文主要介绍了StyleGAN的升级版——StyleGAN2,这个模型重点修复artifacts问题,并进一步提高了生成图像的质量。
参考链接:
http://cvpr2020.thecvf.com/
部分数据和截图来自Aminer
https://www.aminer.cn/conf/cvpr2020/roster
备注:CV
计算机视觉交流群
分享讨论最前沿的计算机视觉技术,欢迎扫码加群。
OpenCV中文网
微信号 : iopencv
QQ群:805388940
微博/知乎:@我爱计算机视觉
网站:www.52cv.net
在看,让更多人看到