论文名:FAST-LIVO: Fast and Tightly-coupled Sparse-Direct LiDAR-Inertial-Visual Odometry
单位:香港大学 火星实验室
论文下载:https://arxiv.org/abs/2203.00893
代码地址:https://github.com/hku-mars/FAST-LIVO
录用:IROS2022
方法亮点:首先,系统采用Lidar、IMU和相机的紧密耦合方案,这提供了一个直接而高效的视觉惯性导航(VIO)子系统。该系统能最大限度地重用激光惯性导航(LIO)子系统中构建的点云地图,增强了数据处理和地图构建的能力。其次,该系统不仅支持多线旋转激光雷达,还兼容新兴的扫描方式,包括完全不同的固态激光雷达技术。这种兼容性使系统更为灵活和适应性强。最后,该系统能够在INTEL和ARM处理器上实时运行,展示出能以低计算成本处理高挑战性环境的巨大潜力。这表明它不仅高效,还具备广泛的适用性和经济效益。
论文名:DM-VIO: Delayed Marginalization Visual-Inertial Odometry
作者单位:TUM Daniel Cremers组
项目主页: http://vision.in.tum.de/dm-vio
论文:https://vision.in.tum.de/_media/research/vslam/dm-vio/dm-vio.pdf
开源地址: https://github.com/lukasvst/dm-vio
录用:2022 Robotics and Automation Letters (RA-L)
该方法亮点:首先,该方法在多种应用场景中展现出了卓越的稳定性,如无人机、手持设备以及汽车,显著扩展了单目方法的适用范围。其次,它成功解决了IMU在初始化时无法有效恢复绝对尺度的问题,其性能甚至超越了当前最先进的sota双目+IMU方法。此外,这一开源代码具有高度的可扩展性,能够轻松地添加新的因素,如GPS和轮式里程计等。最后,延迟边缘化的思想不仅适用于多种场景,而且在某些情况下,其单目VIO效果甚至超过了性能最佳的sota双目VIO方法。这一成果为寻求创新思路的研究者提供了新的启示。
名字:DSOL: A Fast Direct Sparse Odometry Scheme
作者单位:宾夕法尼亚大学
论文地址:https://arxiv.org/pdf/2203.08182.pdf
代码地址:https://github.com/versatran01/dsol
录用:ICRA 2022
本方法亮点:
系统在连续帧之间采用了逆合成对齐方法,这是一种先进的图像对齐技术,能够提高图像处理的精度和效率。
在处理图像时,系统不仅仅使用上一个关键帧进行跟踪,而是利用整个时间窗口内的数据,这种方法可以更全面地利用可用信息,从而提高跟踪的稳定性和准确性。
提出了一种比传统的SDSO(Stereo Direct Sparse Odometry)更有效的双目光度BA(Bundle Adjustment)公式。这一公式的改进使得光度校正和空间定位更为精确。
系统极大地简化了DSO(Direct Sparse Odometry)的关键帧创建和删除标准,使得关键帧的管理更加高效,减少了计算负担。
该系统实现了高度并行化,有效地利用了可用的计算资源。这种并行化不仅提高了处理速度,使得系统能够以更高的帧速率处理图像,而且在快速运动的环境中能够获得更好的性能。
论文:CT-ICP: Real-Time Elastic LiDAR Odometry with Loop Closure
单位:巴黎文理研究大学
论文地址:https://arxiv.org/pdf/2109.12979.pdf
代码:https://github.com/jedeschaud/ct_icp
录用:ICRA 2022
本文亮点:
该激光里程计算法基于帧中连续性和帧间不连续性原理,实现了一种灵活的测距和定位方法。这种方法有效地平衡了连续性和不连续性的处理,以提高算法的准确性和可靠性。
系统利用存储在稀疏体素结构中的稠密点云来构建局部地图。这种基于稠密点云的地图构建方式提供了高精度的空间信息,有利于更精确的导航和定位。
将未知图后端和快速闭环检测集成到一起,构成了一个完整的SLAM系统。这种集成不仅提高了系统的运算效率,还增强了其对环境变化的适应能力。
论文名:BoW3D: Bag of Words for Real-time Loop Closing in 3D LiDAR SLAM
论文:https://arxiv.org/pdf/2208.07473.pdf
代码:https://github.com/YungeCui/BoW3D
作者单位:中科院、国防科大
录用:IEEE Robotics and Automation Letters (RA-L)
本方法亮点:
该系统能够实时进行闭环检测,这是一种关键的功能,可以即时识别并纠正地图中的重复区域。实时闭环检测对于维持SLAM系统的稳定性和准确性至关重要。
系统设计允许闭环检测与在线操作中的后续闭环优化过程共同工作。这种集成提高了系统的动态适应性,使得它能够在运行过程中不断优化和更新地图数据。
通过这些技术,系统能够显著消除导航过程中的漂移现象,极大地提高了3D雷达SLAM系统的整体准确性。这种漂移消除对于长期自主导航和精确地图构建尤为关键。
论文名:LT-Mapper: A Modular Framework for LiDAR-Based Lifelong Mapping
机构:韩国科学院
代码:https://github.com/gisbi-kim/lt-mapper
录用:ICRA 2022
该方法亮点:
系统将长期(lifelong)建图问题划分为几个连续的子问题,采用逐个解决的策略。这种方法使得复杂的建图问题更易于管理和解决。
其中,多区域SLAM的应用能够处理轨迹文件中存在的误差。这意味着变化检测过程不需要非常精准,从而简化了系统的运行要求。
系统采用的初始对齐地图变化管理机制显著降低了内存占用和计算复杂度。这种高效的资源管理对于长期运行的系统来说至关重要。
系统能够在大尺度点云地图中自动分离噪声和物体,这是对点云处理技术的一个重要进步。
在具有大时间差异(从日到年)的真实数据上,该系统表现出色。这表明其在处理长期动态环境变化方面具有卓越的能力。
该研究可以作为城市空间理解等应用的核心引擎。这种广泛的应用潜力使其成为了一个重要的技术里程碑。
论文名:Dense Depth Priors for Neural Radiance Fields from Sparse Input Views
作者单位:慕尼黑工业大学,Google研究院
论文:https://arxiv.org/abs/2112.03288
主页:https://barbararoessle.github.io/dense_depth_priors_nerf
代码:https://github.com/barbararoessle/dense_depth_priors_nerf
收录:CVPR 2022
该方法亮点:
该技术首先使用从运动结构(Structure from Motion, SFM)预处理步骤获得的稀疏深度数据来估计相机姿态。这一步骤为后续的深度图构建提供了关键的初始数据和参考。
其次,技术中应用的深度补全过程将这些稀疏点转换为稠密深度图,并估计出相应的不确定性。这种转换使得深度信息更加完整和准确。
该技术利用稠密深度图和不确定性估计来指导NeRF的优化过程。这种指导使得NeRF优化更加高效和目标明确。
仅使用18至36幅图像,该方法就能实现高效的室内场景重建。这一点显示了其在数据利用效率上的显著优势。
随着该方法的普及,它将NeRF在场景重建上的商业应用推向了一个新的阶段。这意味着在实际应用中,如影视制作、虚拟现实等领域,该技术将提供更高效、更精确的场景重建解决方案。
论文:MobileNeRF: Exploiting the Polygon Rasterization Pipeline for Efficient Neural Field Rendering on Mobile Architectures
单位:Google研究院、西蒙菲莎大学
项目:https://mobile-nerf.github.io
开源代码:https://github.com/google-research/jax3d/tree/main/jax3d/projects/mobilenerf
该方法亮点:
与当前最先进(state-of-the-art, SOTA)算法相比,这一算法在保持同等输出质量的情况下,速度快出十倍。这一显著的速度提升为用户提供了更流畅且高效的体验。
算法设计节省了大量内存,这使得它可以在有限的内存和功耗条件下的集成GPU上运行。这种高效的内存管理使得算法更加适用于资源有限的设备。
该方法可以在网页浏览器上运行,并且兼容所有设备。这种兼容性和易用性使得它可以方便地被广泛应用于不同的平台和环境。
用户可以实时操控重建的物体和场景。这种实时互动能力提供了一种引人入胜且灵活的用户体验,极大地增强了其应用的吸引力。
论文名:Neural 3D Scene Reconstruction with the Manhattan-world Assumption
单位:浙大、康奈尔大学
项目主页:https://zju3dv.github.io/manhattan_sdf/
代码链接:https://github.com/zju3dv/manhattan_sdf
论文链接:https://arxiv.org/abs/2205.02836
收录:CVPR2022 oral
该方法亮点:
这种新颖的场景重建方法融合了曼哈顿世界约束和隐式神经表达。曼哈顿世界约束和隐式神经表达结合在一起。
该方法设计了一种新型的损失函数(loss),用于联合优化3D空间中的场景几何和语义。这种优化策略使得方法能够重建出精确且完整的平面结构。
除了重建精确的平面结构外,这种方法还能在保持非平面区域细节的同时,实现高质量的场景重建。这表明该方法在处理复杂场景时具有较好的适应性和精确度。
然而,该方法的一个局限性在于,曼哈顿世界假设主要适用于人造环境。在自然或非人造环境中,该假设的适用性可能会降低,导致重建效果不尽如人意。
论文名称:NICE-SLAM:Neural Implicit Scalable Encoding for SLAM
作者单位:State Key Lab of CAD&CG, Zhejiang University, ETH Zurich,Lund University ,
MPI for Intelligent Systems, Tübingen, University of Amsterdam, Microsoft
论文地址: https://arxiv.org/abs/2112.12130
项目主页: https://pengsongyou.github.io/nice-slam
代码: https://github.com/cvg/nice-slam
录用:CVPR 2022
该方法亮点:
这种方法通过引入分层场景表示,有效地结合了多级局部信息。它利用预先训练的几何先验进行优化,使得这种表示能够在大型室内场景中进行细节重建。这种多层次的信息整合为复杂场景的细节重建提供了强大的支持。
方法的核心在于分层的、基于网格的神经隐式编码。这与传统的全局神经场景编码相比,支持局部更新,更适合应用于大型场景的重建。这种分层和局部化的方法不仅提高了重建的灵活性,还使得处理过程更加高效。
该方法在确保精细重建和高精度跟踪的同时,还实现了运行速度的加快和计算量的减少。这一点对于需要实时处理大量数据的场景重建尤为重要,因为它能够在保证质量的同时提高效率。