引言
10月1号到5号,2018 IEEE/RSJ International Conference on Intelligent Robots and Systems (2018 IROS)在西班牙马德里举行。我非常有幸能够参加此次会议并且展示我们的论文成果,在此非常感谢于超学姐和乔飞老师。这是我的第一篇国际学术论文,几天安排的满满的会议确实让我收获许多,因此觉得有必要记录一下。
下面我将首先介绍在会议上听的一些talk,然后是一些有趣的参展公司,最后是一些个人体验。由于我的主要研究兴趣在机器人的感知上(偏cv,例如SLAM,语义理解),因此我听的报告也多和这方面相关。第一次参会没有太多经验,现在只能靠回忆和照片来记录,有些流水账,还请各位谅解。
讲座
1. Ambarella公司的talk非常精彩,也让我非常惊叹。talk的名字是 “High-resolution low power platform for efficient computer vision on cars”。他们的产品主要是用于高清图像(4K)的预处理,可以做到实时的双目calibration。用4k双目图像甚至可以做到200米的深度信息提取(跟LiDAR没差了),现场播放的三维点云效果还是非常惊艳的,而且最重要的是还能实时输出,工程上可以说是做的非常牛了。
2. 下面这个是TUM的工作,主要是关于语义建图。利用2D分割结果和深度图,以及场景中的各种平面信息可以把三维语义地图建的更完整更好,同时由于是以Incremental方式建图的,所以可以做到实时。在交谈过程中,她也提到目前对于检测到回环后的地图更新没什么太好的办法,并且也没想好怎么利用这个语义地图。。。建图质量还是会受到2D图像分割质量的影响的。
3. 下面是一个我非常非常喜欢的工作:Semantic Mapping with Simultaneous Object Detection and Localization,来自密歇根大学某大牛学姐。他们对语义地图的建立不像上一个那样(或者很传统那样)把三维重建的稠密地图直接贴个标签,而是用一个个向量(物体的位置和概率)来代表场景中的物体。个人认为这种对语义地图的表达方式对于机器人来说可操作性更好一点,因为可以知道场景中具体有哪些物体以及他们的位置。
针对每个物体向量存在的概率,作者用粒子滤波和CRF来更新。基本的思想是利用不同帧之间的同一物体在空间位置的一致性来更新物体存在的置信度。用概率来表示物体存在的置信度的好处就是,即使机器人即使一段时间内没有识别出这个物体,这个物体还是一定概率和粒子的形式再场景中存在的。
4. 这是我随便听的一个关于Soft Robot的讲座,介绍了很多首尔大学软体机器人组的工作,看起来还是非常有趣非常强的。教授也介绍了一些设计的基本思路:设计软体机器人材料的minimal energy path。听着很有道理的样子但是后来却发现,还是不知道应该怎么设计minimal energy path啊。。不过看他们展示的demo已经后来的讨论,他们好像很喜欢用一种特殊的纹路结构,不过名称我忘了。。
5. 下面这个工作是用增强学习做的机器人导航,把场景中的地图划分成几个小区域,然后给机器人喂rgb图和目标地点的图像,机器人就可以自己去找了。。还挺有意思的。
6. 下面这个是港科沈老师组的了,今年best paper。大体意思应该是给VIO里面的图像-imu时间戳误差加个优化变量,然后给一起优化了。。
7. 下面是港科刘明老师组的工作,也是best paper。利用室内灯光进行低功耗低成本的定位,想法很新奇。
8. MIT的一个工作,用多个相机解决雨雪天气、强反光情况下的物体遮挡问题。不过其实主要是针对路标、指示灯这种有明显平面结构的物体做图像增强,因为它的原理也就是利用多相机多视图几何来计算平面法线,从而区别出背景和噪点(雨雪)。相机越多增强效果越好(显然),貌似最少五个才能达到比较满意的结果。。计算量应该也很大吧。。
9. 下面这个也是图像增强的工作,利用雾的物理模型和一些增强手段起到图像去雾效果。
10. 一种更精确的雷达SLAM方法,算是对LOAM的改进。大体意思是把点云中属于地面的和不属于地面的点云分开来,提取不同的特征分别去做匹配。
11. 2D雷达SLAM算法,认为室内场景有很多直线,所以多加了一个约束来优化,从而达到更加精确的定位。
12. 下面这个工作也是基于2D激光雷达的。由于2D激光雷达只有平面信息,所以像桌子这样的障碍物可能就探测不到。于是作者就利用大量数据集训练,给2D雷达数据就可以猜出3D情况下哪里有障碍物。当时问了作者,如果桌子的角和门框特别相近怎么办,这样桌子其实是障碍但是门框不是,作者没有给出什么满意的回答。。
13. 这个工作是利用双目相机模仿人眼实现VR效果,同时还加入了对头部运动速度模型的预测从而补偿掉传输延迟,防止人产生眩晕。跟我之前做过的一个项目有点相似。。很有意思。
14. 利用地面边缘信息来帮助视觉SLAM定位的方法。大致思路也是用深度学习提取比较好的特征然后做匹配,优化。。
15. 定义了一个轮式机器人运动轨迹的“舒服度”,然后提出了一个(应该是对人类来说)最舒服的轨迹规划方法。
16. 马里兰大学的一个工作,利用世界中物体的对称(尤其人造物体)信息来做点云的语义分割和补全。他把生活中常见物体分为 轴对称 和 旋转对称 这个思想还是挺不错的。并且也同时提出了如何检测这个对称性的方法。
17. 这个印度小哥的工作很意思。利用2D激光雷达和一个舵机,来产生3D点云。最终的目的是要让点云分布的均匀。。。可以说想法很独特了。