ICCV 2019 | 中国力量出彩,亮风台最新成果入选

10月27日至11月2日,ICCV 2019在韩国首尔举办。ICCV 由 IEEE 主办,每两年召开一次,与计算机视觉模式识别会议(CVPR)和欧洲计算机视觉会议(ECCV)并称计算机视觉方向的三大顶级会议。

本届ICCV热度空前。据官网数据显示,本届ICCV注册参会人数再创新高,超过7000人,是2017年ICCV的2倍,投稿数达到4303篇,是上届的2倍,共收录1075篇,接收率为25%,较上届略有下降。

ICCV 2019 | 中国力量出彩,亮风台最新成果入选_第1张图片

可以看出在这个全球有极大影响的计算机视觉顶会上,AI热情继续倍速增涨。尽管参与人数更多,投稿论文更多,接受率降低,但中国力量依旧出彩。

ICCV 2019官方统计,接收论文按国家分属:中国第一、美国第二,德国第三。中国有超过350篇论文入选,美国则超过310篇,第三名的德国不到50篇,中国入选论文超过美国

但如果算上身处其他国家的华人,华人力量的影响力还不止于此。根据学术头条统计,在本届ICCV接收的1077篇论文中,一作是华人的论文有523篇,占比48.6%,接近一半。

ICCV 2019 | 中国力量出彩,亮风台最新成果入选_第2张图片

本次大会入选论文中,中国企业界成果亮眼。数据显示,商汤科技加上其联合实验室,共有57篇论文入选,包括Oral11篇,华为诺亚方舟实验室发表(或联合发表)了 19 篇论文,其中两篇工作为Oral。此外,百度、腾讯、旷视等AI公司也颇有斩获。其中,亮风台基于图形匹配的可变形表面跟踪算法成果《Deformable Surface Tracking by Graph Matching》被选为大会论文。

该论文中的新算法提出了一种基于图的方法,能够充分探索可变形表面的结构信息,以提高跟踪性能。

团队提出的这种新颖的基于图的方法,能够充分探索可变形表面的结构信息,以提高跟踪性能和效率。所提出的方法通过图结构之间的成对投影误差解决了特征对应和形状恢复问题,并采用软匹配松弛来提高计算效率。与现存先进算法进行广泛比较,实验结果表明,新方法可以对不同类型纹理的曲面实现稳健的跟踪结果,并且在跟踪精度和计算效率方面一般优于其他算法。

基于图的可变形表面目标的跟踪算法,主要贡献在三个方面:

1.通过软匹配松弛和精心设计的候选匹配滤波策略,将图模型和图匹配引入到可变形表面跟踪中;

2.设计统一的优化框架,探索局部外观,空间关系和变形模型的全部信息,以获得准确的形状重建;

3.构造了一个带有注释的新的真实世界数据集,用于在不同类型的纹理的情景中评估可变形表面跟踪算法。

事实上,这并不是亮风台今年首次在国际顶会上斩获佳绩。

2019年6月19-6月20日,在美国加州举行的计算机视觉方向世界三大顶级会议之一CVPR 2019上,亮风台两篇论文被选为大会论文。

ICCV 2019 | 中国力量出彩,亮风台最新成果入选_第3张图片

其中,亮风台解决投影仪光学补偿问题的投影AR算法研究最新成果《End-to-end Projector Photometric Compensation》入选CVPR 2019 Oral Presentation环节。数据显示,今年有超过 5165 篇的大会论文投稿,最终录取1299 篇,而Oral Presentation的入选率只有提交论文的5%左右。

在这篇AR投影新算法成果论文中,贡献主要有以下几点:

1. 亮风台首次将投影仪光学补偿问题阐述为一个端到端的深度学习问题,然后构造一个新颖的CNN网络,即CompenNet来隐式地学习这个复杂的补偿函数。

2. 首次提出一个独立于设备和实际投影的数据库和评价基准,今后类似的工作可以在这个评价基准上统一比较,而不需要复现该研究中使用的设备和实际投影,以前的工作是没有这样的评价基准的。

3. 提供了一个预训练的方法,将预训练好的CompenNet迁移到新的投影屏幕和硬件设置上,只需要拍摄少量的采样图片就可以媲美甚至超过从零开始训练CompenNet和传统方法,这样可以大量的节省采样图拍摄时间和训练时间。

新方法在基准测试中得到了仔细的评估,结果表明,我们提出的解决方案在定性和定量指标上都优于现有技术水平。

ICCV 2019 | 中国力量出彩,亮风台最新成果入选_第4张图片

图1. (a) 正常光照下的具有纹理和颜色的投影屏幕。(b) 投影仪投射的图片(也是我们想要看到的效果)。(c) 相机拍摄到的,没有补偿的投影结果,即将(b)直接投影到(a)上。(d) 我们模型计算出的补偿图。(e) 相机拍到的补偿后的效果,即将(d)投影到(a)上。比较(c)和(e),我们看到明显提升的效果和细节

可以预见,该成果将成为投影AR技术应用落地提供重要的技术基础。

亮风台入选CVPR 2019的另一篇论文《LaSOT: A High-quality Benchmark for Large-scale Single Object Tracking》为全球目前最大单目标跟踪数据集LaSOT。

视觉跟踪是计算机视觉中最重要的问题之一,其应用领域包括视频监控、机器人技术、人机交互等。随着跟踪领域的巨大进步,人们提出了许多算法,在这一过程中,跟踪评测集对客观评估起到了至关重要的作用。LaSOT的推出,也是希望为行业提供一个大规模的、专门的、高质量的基准,用于深度跟踪训练和跟踪算法的真实评估。

ICCV 2019 | 中国力量出彩,亮风台最新成果入选_第5张图片

图1:常用跟踪数据集统计示意图。包括OTB-2013、OTB-2015、TC-128、NUS-PRO、UAV123、UAV20L、VOT-2014、VOT-2017和LaSOT。圆直径与数据集的总帧数数成比例。所提出的LaSOT比所有其他基准都要大,并且专注于长期跟踪。

这篇论文主要有以下几项贡献:

1. LaSOT包含1400个视频,每个序列平均2512帧。每一帧都经过仔细检查和手动标记,并在需要时对结果进行目视检查和纠正。这样,可以生成大约352万个高质量的边界框注释。

此外,LaSOT包含70个类别,每个类别包含20个序列。

2. 与之前的数据集不同,LaSOT提供了可视化边界框注释和丰富的自然语言规范,这些规范最近被证明对各种视觉任务都是有益的,包括视觉跟踪。这样做的目标是鼓励和促进探索集成视觉和语言功能,以实现强大的跟踪性能。

3. 为了评估现有的跟踪器,并为将来在LaSOT上的比较提供广泛的基准,团队在不同的协议下评估了35个具有代表性的跟踪器,并使用不同的指标分析其性能。

2012年成立以来,亮风台一直在致力于计算机视觉和人机交互等底层技术的研发,在国内外AR/AI顶级学术会议和期刊上发表论文 200+ 篇,刷新世界纪录10+次。

在200+篇论文成果中,亮风台屡次创造佳绩,比如:

2015年,亮风台跨年龄人脸验证在Morph和FGNet上取得国际领先结果(CVPR)。

2016年,亮风台图匹配算法在Willow、CMU House等多个数据库上取得最优结果(ECCV)。

2017年,混合RNN和CNN的跟踪算法在OTB100、VOT2015和TC128上取得了全球已知最好成绩。

2018年,亮风台基于约束置信度的鲁棒跟踪算法(CCM),在UCSB和TMT中刷新了最好成绩(ICRA)。

目前,亮风台也在不断加强与学术界、产业界的技术合作,成立美图&亮风台实验室 、华中科技大学&亮风台增强现实联合实验室、华南理工大学&亮风台联合实验室等系列实验室,战略合作 陈天桥雒芊芊临床转化中心 ,同时和清华大学、北京大学、中科院、北京交通大学等十余所高校合作“产学研”,共同扩宽AR及相关技术的边界。

从2D到3D,从几何理解到语义理解的过渡是当前计算机视觉领域的重点,亮风台一直在致力于此方向的技术研发,以寻求技术边界突破,并推进AR在商业化过程中优化升级。

进一步了解论文请查看:

1.论文《End-to-end Projector Photometric Compensation》

论文下载:

https://arxiv.org/pdf/1904.04335.pdf

补充材料:

http://www.dabi.temple.edu/~hbling/publication/CompenNet_sup.pdf

源代码:

https://github.com/BingyaoHuang/CompenNet

2.论文《Deformable Surface Tracking by Graph Matching》

论文下载:

https://www3.cs.stonybrook.edu/~hling/publication/deformable%20surface-19.pdf

数据集:

https://www3.cs.stonybrook.edu/~hling/data/DeSurT.rar (~2G)

3.论文《LaSOT: A High-quality Benchmark for Large-scale Single Object Tracking》

LaSOT主页:https://cis.temple.edu/lasot/

数据集下载:

https://cis.temple.edu/lasot/download.html

算法测评和工具包:

https://cis.temple.edu/lasot/results.html

论文:https://arxiv.org/abs/1809.07845

你可能感兴趣的:(AI)