【AI视野·今日Robot 机器人论文速览 第二十九期】Mon, 14 Feb 2022

AI视野·今日CS.Robotics 机器人学论文速览
Mon, 14 Feb 2022
Totally 10 papers
上期速览✈更多精彩请移步主页

【AI视野·今日Robot 机器人论文速览 第二十九期】Mon, 14 Feb 2022_第1张图片

Daily Robotics Papers

SafePicking: Learning Safe Object Extraction via Object-Level Mapping
Authors Kentaro Wada, Stephen James, Andrew J. Davison
机器人需要对象级别的场景理解来操作对象,同时推理对象之间的接触、支持和遮挡。给定一堆对象,对象识别和重建可以识别对象实例的边界,为对象如何形成和支撑堆提供重要线索。在这项工作中,我们提出了一个系统,SafePicking,它集成了对象级映射和基于学习的运动规划,以生成从一堆中安全地提取被遮挡的目标对象的运动。规划是通过学习一个深度 Q 网络来完成的,该网络接收对预测姿势的观察和一个基于深度的高度图以输出运动轨迹,训练以最大化安全度量奖励。我们的结果表明,姿势和深度感知的观察融合为模型提供了更好的性能和鲁棒性。

Overhead Image Factors for Underwater Sonar-based SLAM
Authors John McConnell, Fanfei Chen, Brendan Englot
同时定位和映射 SLAM 是任何自主水下航行器 AUV 的关键能力。然而,当使用低成本传感器时,稳健、准确的状态估计仍然是一项正在进行的工作。我们建议使用广泛可用且通常免费的先验信息开销图像来增强典型的低成本传感器包。给定 AUV 的声纳图像和部分重叠的全局参考俯视图像,我们建议使用卷积神经网络 CNN 生成合成俯视图像,预测声纳图像内容的上述表面外观。然后,我们使用这个合成的俯视图将我们的观察结果注册到提供的全局俯视图上。注册后,变换作为一个因子引入到位姿 SLAM 因子图中。我们使用最先进的模拟环境对一系列基准轨迹进行验证,并使用所提出的方法定量地显示机器人状态估计的准确性提高。我们还展示了真实 AUV 现场部署的定性结果。

Parametrized motion planning and topological complexity
Authors Michael Farber, Shmuel Weinberger
在本文中,我们研究了参数化运动规划算法,该算法为各种运动规划问题提供了通用且灵活的解决方案。此类算法旨在在各种外部条件下运行,这些外部条件被视为参数并用作算法输入的一部分。继续最近的一篇论文,我们进一步研究了参数化拓扑复杂性的概念。我们详细分析了在欧几里得空间中存在多个障碍物的情况下控制一群机器人的问题,这为我们提供了一个自然的激励示例。我们提出了一种明确的参数化运动规划算法,可以解决任意数量的机器人和障碍物的运动规划问题。该算法是最优的,它对于任何奇数都具有最小的拓扑复杂度。

STEP: State Estimator for Legged Robots Using a Preintegrated foot Velocity Factor
Authors Yeeun Kim, Byeongho Yu, Eungchang Mason Lee, Joon ha Kim, Hae won Park, Hyun Myung
我们提出了一种新的腿式机器人状态估计器,STEP,通过一种新的预集成足部速度因子来实现。在预积分的足部速度因子中,不采用通常的防滑假设。相反,通过利用从立体相机获得的身体速度,可以观察到末端执行器的速度。换句话说,可以估计预集成的末端执行器的姿势。我们方法的另一个优点是它消除了接触检测步骤的必要性,这与典型方法不同。

Concurrent Training of a Control Policy and a State Estimator for Dynamic and Robust Legged Locomotion
Authors Gwanghyeon Ji, Juhyeok Mun, Hyeongjun Kim, Jemin Hwangbo
在本文中,我们提出了一个运动训练框架,其中控制策略和状态估计器同时训练。该框架由一个输出所需关节位置的策略网络和一个输出机器人状态估计值的状态估计网络组成,例如基础线速度、足高和接触概率。我们利用快速模拟环境来训练网络,并将训练后的网络转移到真正的机器人上。训练有素的策略和状态估计器能够穿越各种地形,例如小山、滑盘和崎岖不平的道路。

Cyclops: Open Platform for Scale Truck Platooning
Authors Hyeongyu Lee, Jaegeun Park, Changjin Koo, Jong Chan Kim, Yongsoon Eun
本文介绍的 Cyclops 是一个开放的研究平台,适用于所有想要验证自动驾驶重型车辆队列领域的新想法和方法的人。该平台由多辆 1 14 规模的半挂车、一个规模试验场以及相关的计算、通信和控制模块组成,这些模块可以在试验场上实现自动驾驶。每辆车的感知系统由基于激光雷达的目标跟踪系统和车道检测控制系统组成。前者是保持与前车的差距,后者是通过转向控制将车辆保持在车道内。车道检测系统针对卡车队列进行了优化,其中前置摄像头的视野由于与前车的小间隙而受到严重限制。该平台特别适合验证安全关键情况的缓解策略。实际上,嵌入式模块采用了单纯形结构来测试各种故障安全操作。我们说明了一个场景,其中摄像头传感器在感知系统中出现故障,但车辆以降低的能力运行以平稳停止。

Factored World Models for Zero-Shot Generalization in Robotic Manipulation
Authors Ondrej Biza, Thomas Kipf, David Klee, Robert Platt, Jan Willem van de Meent, Lawson L. S. Wong
随着对象数量的增加,具有许多对象的环境的世界模型面临状态组合爆炸,可能的排列数量呈指数增长。在本文中,我们学习使用对象因子世界模型来概括机器人拾取和放置任务,该模型通过确保预测与对象的排列等价来对抗组合爆炸。以前的对象因子模型要么因无法对动作建模,要么因无法计划复杂的操作任务而受到限制。我们建立在最近用于训练对象因子世界模型的对比方法的基础上,我们将其扩展到模拟连续机器人动作并准确预测机器人拾取和放置的物理特性。为此,我们使用图神经网络的残差堆栈,在其节点和边缘神经网络中接收多个级别的动作信息。至关重要的是,我们的学习模型可以对训练数据中未表示的任务进行预测。也就是说,我们展示了对新任务的成功零样本泛化,模型性能仅略有下降。此外,我们表明,我们的模型集合可用于使用启发式搜索计划涉及多达 12 个拾取和放置动作的任务。

Nonprehensile Manipulation of a Stick Using Impulsive Forces
Authors Aakash Khandelwal, Nilay Kant, Ranjan Mukherjee
考虑了使用间歇冲击力在三维空间中非抓握操纵棍子的问题。目标是在围绕垂直轴旋转对称的一系列配置之间调整摇杆。摇杆的动力学由五个广义坐标和三个控制输入来描述。在两个连续的旋转对称配置之间,动态可以方便地由杂耍者参考系中的庞加莱图表示。与所需的杂耍运动相关的轨道的稳定是通过稳定 Poincar 地图上的固定点来实现的。 Impulse Controlled Poincar Map 方法用于稳定轨道,数值模拟用于证明从任意初始配置收敛到所需的杂耍运动。

Multi-Modal Fusion for Sensorimotor Coordination in Steering Angle Prediction
Authors Farzeen Munir, Shoaib Azam, Byung Geun Lee, Moongu Jeon
模仿学习用于学习感觉运动协调,以端到端方式进行转向角预测,需要专家演示。这些专家演示与环境感知和车辆控制数据相结合。传统的基于帧的 RGB 相机是用于获取环境感知数据的最常见的外部感知传感器模式。当用作学习端到端横向控制的单一模式时,基于帧的 RGB 相机已经产生了可喜的结果。然而,传统的基于帧的RGB相机在光照变化条件下的可操作性有限,并且受到运动模糊的影响。事件相机为基于帧的 RGB 相机提供补充信息。这项工作探索了基于帧的 RGB 和事件数据的融合,通过预测转向角来学习端到端横向控制。此外,来自事件数据的表示如何与基于帧的 RGB 数据融合有助于预测自动驾驶车辆的横向控制。为此,我们提出了 DRFuser,一种用于学习端到端横向控制的新型卷积编码器解码器架构。编码器模块在基于帧的 RGB 数据和事件数据以及自注意力层之间分支。此外,这项研究还为我们自己收集的数据集做出了贡献,该数据集由事件、基于帧的 RGB 和车辆控制数据组成。在我们收集的数据集、Davis Driving 数据集 DDD 和 Carla Eventscape 数据集上对所提出方法的有效性进行了实验评估。

Learning the Pedestrian-Vehicle Interaction for Pedestrian Trajectory Prediction
Authors Chi Zhang 1 , Christian Berger 1 1 Department of Computer Science and Engineering, University of Gothenburg, Gothenburg, Sweden
在本文中,我们研究了行人和车辆之间的交互,并提出了一种新的神经网络结构,称为行人车辆交互 PVI 提取器,用于学习行人车辆交互。我们在顺序方法长短期记忆 LSTM 模型和非顺序方法卷积模型上实现了所提出的 PVI 提取器。我们使用 Waymo 开放数据集,其中包含带有行人和车辆注释的真实城市交通场景。对于基于 LSTM 的模型,我们提出的模型与 Social LSTM 和 Social GAN 进行了比较,使用我们提出的 PVI 提取器将平均位移误差 ADE 和最终位移误差 FDE 分别降低了 7.46 和 5.24 。对于基于卷积的模型,我们提出的模型与 Social STGCNN 和 Social IWSTCNN 进行了比较,并且使用我们提出的 PVI 提取器将 ADE 和 FDE 分别降低了 2.10 和 1.27。

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页


pic from pexels.com

你可能感兴趣的:(机器人,Papers,机器人,抓取,导航,robotics,robot)