第六届全国计算机学科博士后论坛,大会 | 「2018 第六届全国计算机学科博士后论坛」今天召开,鹏城实验室博士后工作站挂牌...

黄正能教授讲道,现在生活中有大量的摄像头、海量的视觉数据,深度学习的发展也带来了分类识别、检测追踪、语义分割、人体姿态识别等等技术成果,在交通、渔业都有诸多应用。那么未来还能做什么?我们目前的检测、分割仅仅是了解真实世界的第一步,未来还需要信息的融合,比如不同摄像头之间信息的融合、不同模态数据之间的融合,构成对世界更大范围的了解。

黄正能教授介绍了在这一思想引导下的自己团队在七个方面的工作。一,多人人体姿态识别与时序追踪中如何克服检测误差、遮挡;二,三维物体空间定位中,如何追踪人体运动做相机自动校正;三,车辆的三维空间追踪,他们的方法在 CVPR 2018 AI City 竞赛拿到 Track 1 & 3 第一名;四,跨摄像头的人、车追踪,无视角交叠,这个任务的难点在于真实世界中无法学习不同摄像头间的差异;五,移动的摄像头画面的物体追踪,需要每一帧做重新定位,可以用在汽车摄像头导航、无人机自我定位;六,多个移动摄像头信息融合,场景3D地图还原;七,移动摄像头的多人姿态追踪三维空间定位。结论,实时感知、通讯、计算和控制实现之后可以形成完整回路;深度学习是一个起点,但完善解决问题并不能直接依靠端到端方案。

第二位讲者是澳大利亚悉尼大学陶大程教授,他的报告主题是「AI at Dawn -opportunities and challenges」。

第六届全国计算机学科博士后论坛,大会 | 「2018 第六届全国计算机学科博士后论坛」今天召开,鹏城实验室博士后工作站挂牌..._第1张图片

澳大利亚悉尼大学陶大程教授

陶大程教授首先指出,人脸检测技术虽然现在常见,但实际上也只是逐步发展到了今天。他举了一个 1000 人的自拍合影的照片,人脸检测技术所能正确检测出的脸的数目实际上逐年增加,而目前最先进的也只能检测到九百多张脸。人机协作解决当前的人工智能技术所无法完善解决的问题应当是未来的方向。

在多年的研究中,陶大程教授团队的技术也从基于手工特征的人体姿态检测,进化到了基于深度学习的检测、追踪、姿态识别、表情检测、距离估计、像素分割、风格转换。陶大程教授在报告中介绍的自己的工作包括:物体识别中整合优化 proposal region 提高准确率;球场多人检测追踪;单视角深度重建,从结合手工特征到基于深度学习但并不是直接微调预训练模型的方法;快速非负矩阵分解;多视角学习看作是多次平面投影之后回到立体空间中物体的重建;带有标注噪声的学习。对于 GANs 相关的研究,陶大程教授提到图像在数据空间的分布是有许多的结构限制的,而 GANs 一般只能学习到部分数据模式,为了尝试改善 GANs 的表现大家也引入了各种不同的 loss function,有各自的表现,陶大程教授团队的 Evolution GANs 集成了多种不同的 loss function,得到了优秀的表现;他们也研究了深度学习的泛化问题,发现随着网络层数的增加,泛化误差成指数下降(而不是一般认为的上升);还有推理和机器人模仿运动。

你可能感兴趣的:(第六届全国计算机学科博士后论坛)