【AI视野·今日Robot 机器人论文速览 第二十五期】Fri, 1 Oct 2021

AI视野·今日CS.Robotics 机器人学论文速览
Fri, 1 Oct 2021
Totally 26 papers
上期速览✈更多精彩请移步主页

【AI视野·今日Robot 机器人论文速览 第二十五期】Fri, 1 Oct 2021_第1张图片

Daily Robotics Papers

Coverage Control in Multi-Robot Systems via Graph Neural Networks
Authors Walker Gosrich, Siddharth Mayya, Rebecca Li, James Paulos, Mark Yim, Alejandro Ribeiro, Vijay Kumar
本文通过多机器人系统开发了一种分散式移动传感器覆盖方法。我们考虑这样一种场景,一组具有有限传感范围的机器人必须定位自己,以有效地检测以不同重要性区域为特征的区域中的感兴趣事件。为此,我们为通过图神经网络实现的机器人开发了分散控制策略,该网络使用机器人间通信来利用非本地信息进行控制决策。通过在多跳邻居之间明确共享信息,与不进行通信且仅利用每个机器人可用的本地信息的经典方法相比,分散式控制器实现了更高的覆盖质量。

Modeling Interactions of Autonomous Vehicles and Pedestrians with Deep Multi-Agent Reinforcement Learning for Collision Avoidance
Authors Raphael Trumpp, Harald Bayerlein, David Gesbert
可靠的行人防撞缓解 PCAM 系统是安全自动驾驶汽车 AV 的重要组成部分。车辆行人交互的顺序性质,即一个代理的即时决定直接影响另一个代理的后续决定,是一个经常被忽视但很重要的方面。在这项工作中,我们将相应的交互序列建模为马尔可夫决策过程 MDP,该过程通过深度强化学习 DRL 算法解决,以定义 PCAM 系统的策略。模拟驾驶场景基于 AV 作为 DRL 代理在城市街道上行驶,面对试图穿越的未标记人行横道上的行人。由于模拟行人的真实穿越行为具有挑战性,因此我们引入了两个级别的智能行人行为 虽然基线模型遵循预定义的策略,但我们的高级模型通过将行人定义为第二个 DRL 代理来捕捉持续学习和人类行为中的内在不确定性,即,我们引入了深度多智能体强化学习 DMARL 问题。根据代理碰撞率和由此产生的交通流效率,对具有不同智能行人行为水平的 PCAM 系统进行基准测试。在此分析中,我们的重点在于评估观察噪声对代理决策的影响。

Real Robot Challenge using Deep Reinforcement Learning
Authors Robert McCarthy, Francisco Roldan Sanchez, Kevin McGuinness, Noel O Connor, Stephen J. Redmond
本文详细介绍了我们在 2021 年真实机器人挑战赛第一阶段的获胜作品,这是一项挑战,三指机器人必须沿着指定的目标轨迹携带一个立方体。为了解决阶段 1,我们使用了一种纯粹的强化学习方法,该方法需要机器人系统或一般机器人抓取方面的最少专业知识。基于稀疏目标的奖励与 Hindsight Experience Replay 结合使用,以教导控制策略将立方体移动到所需的 x 和 y 坐标。同时,采用基于密集距离的奖励来教导策略将立方体提升到所需的 z 坐标。在转移到真实机器人进行评估之前,该策略在域随机化的模拟中进行训练。尽管在这种转移后性能往往会变差,但我们训练有素的策略可以通过使用有效的捏手沿着目标轨迹成功地提升真实的立方体。

Coordination of two robotic manipulators for object retrieval in clutter
Authors Jeeho Ahn, ChangHwan Kim, Changjoo Nam
我们考虑通过两个不允许上手抓取的机械手从密闭空间中检索目标物体的问题。如果其他可移动障碍物遮挡了目标,则应重新定位多个物体以清除到达目标物体的路径。使用两个机器人,可以通过同时执行搬迁任务来有效地完成搬迁。

Fly Out The Window: Exploiting Discrete-Time Flatness for Fast Vision-Based Multirotor Flight
Authors Melissa Greeff, Siqi Zhou, Angela P. Schoellig University of Toronto Institute for Aerospace Studies, University of Toronto Robotics Institute, Vector Institute for Artificial Intelligence
当前基于快速视觉的飞行控制设计往往依赖于高速率、高维和完美的状态估计。由于不完美的传感和状态估计漂移和噪声,这在现实世界环境中具有挑战性。在这封信中,我们提出了一种替代控制设计,它通过利用离散时间平坦度来绕过对状态估计的需要。据我们所知,这是第一项证明离散时间平坦性适用于多旋翼动力学的欧拉离散化的工作。这允许我们仅使用输入和输出信息的窗口来设计控制器。我们在模拟中强调如何在控制设计中利用这一特性可以为噪声输出测量提供鲁棒性,其中估计高阶导数和完整状态可能具有挑战性。尽管可能有噪声的高速实时位置估计,但基于快速视觉的导航需要高性能飞行。

Predicting Like A Pilot: Dataset and Method to Predict Socially-Aware Aircraft Trajectories in Non-Towered Terminal Airspace
Authors Jay Patrikar, Brady Moon, Jean Oh, Sebastian Scherer
在非塔式空域操作飞机的飞行员依靠他们的态势感知和先验知识来预测其他代理的未来轨迹。这些预测以其他代理过去的轨迹、代理代理的社会互动和环境背景(例如机场位置和天气)为条件。本文提供了一个数据集 textit TrajAir ,它捕获了区域机场周围非塔式航站楼空域中的这种行为。我们还提出了一个基线社会感知轨迹预测算法 textit TrajAirNet,它使用数据集来预测所有代理的轨迹。该数据集在 8 个月内收集了 111 天,包含 ADS B 转发器数据以及相应的 METAR 天气数据。数据被处理以用作与其他公开可用的社交导航数据集的基准。据作者所知,这是第一个 3D 社交航空导航数据集,从而为自主航空引入了社交导航。 textit TrajAirNet 结合了社交导航中最先进的模块,以在具有动态上下文的静态环境中提供预测。 textit TrajAir 数据集和 textit TrajAirNet 预测算法都是开源的。

Linear Differential Games for Cooperative Behavior Planning of Autonomous Vehicles Using Mixed-Integer Programming
Authors Tobias Kessler, Klemens Esterle, Alois Knoll
已经提出了多个代理的协同规划作为自动车辆的战略和运动规划的一种有前途的方法。通过考虑每个代理的意图,自我代理可以将未来与人类驾驶车辆的交互纳入其规划中。该问题通常被表述为多代理游戏,并使用在离散化动作或状态空间上运行的迭代算法来解决。即使收敛到纳什均衡,结果通常也只是次优的。在本文中,我们为一组交互代理定义了一个线性微分博弈,并使用混合整数规划将其求解为最优。方向的分离公式允许我们制定线性约束以防止代理与代理碰撞,同时保留车辆模型的非完整运动特性。软约束解释了预测错误。然后,我们定义了一个联合成本函数,其中合作因素可以在利他、合作和利己行为之间进行调整。我们研究合作因素对解决场景的影响,其中代理之间的交互是成功解决它们所必需的。然后在赛车场景中评估该方法,在该场景中我们展示了该公式在闭环后退地平线重新规划方式中的适用性。

A Generalized Kalman Filter Augmented Deep-Learning based Approach for Autonomous Landing in MAVs
Authors Pranay Mathur, Yash Jangir, Neena Goveas
已经提出了使用基于 GPS、视觉和基于基准标签的方案的各种组合的微型飞行器 MAV 自主着陆系统。着陆是 MAV 执行的一项关键活动,GPS 分辨率低、相机图像质量下降、基准标签不符合要求的规格以及环境因素带来了挑战。 MAV 着陆的理想解决方案应考虑到这些挑战以及可能导致计划外移动和着陆的操作挑战。大多数方法并不试图解决这个一般问题,而是着眼于至少具有一个明确定义的参数的受限子问题。在这项工作中,我们提出了一个使用两阶段训练机制的通用端到端着陆点检测系统,该系统对着陆点没有预先假设。

The Artificial Intelligence behind the winning entry to the 2019 AI Robotic Racing Competition
Authors Christophe De Wagter, Federico Paredes Vall s, Nilay Sheth, Guido de Croon
机器人技术是人工智能 AI 进步的下一个前沿,因为机器人运行的现实世界代表了一个巨大、复杂、连续的状态空间,具有固有的实时性要求。目前机器人技术的一项极端挑战是自主无人机竞赛。人类无人机赛车手可以以高达 190 公里/小时的速度飞过复杂的赛道。实现与自主无人机相似的速度意味着在资源方面的极端限制下解决人工智能中的基本问题。在本文中,我们展示了首个 AI Robotic Racing AIRR Circuit 的获胜解决方案,该比赛由四场比赛组成,所有参赛队伍都使用同一架无人机,但访问权限有限。我们方法的核心灵感来自人类飞行员如何将赛车门的嘈杂观察与他们对无人机动力学的心理模型相结合,以实现快速控制。我们的方法主要关注具有高效深度神经分割网络和主动视觉的门检测。此外,我们为稳健的状态估计和基于风险的控制做出了贡献。这使我们能够在上一场比赛中达到 9.2m s 的速度,这是之前自动无人机比赛无法比拟的。尽管我们的解决方案是最快和最强大的,但它仍然输给了最好的人类飞行员之一 Gab707。

Unified Data Collection for Visual-Inertial Calibration via Deep Reinforcement Learning
Authors Yunke Ao, Le Chen, Florian Tschopp, Michel Breyer, Andrei Cramariuc, Roland Siegwart
视觉惯性传感器在机器人领域有着广泛的应用。然而,良好的性能通常需要不同的复杂运动例程来准确校准相机内在和传感器间外在。这项工作提出了一种新颖的公式来学习要在机器人手臂上执行的运动策略,以自动收集数据,以联合校准内在和外在。我们的方法使用无模型的深度强化学习对校准过程进行紧凑的建模,以推导出一种策略,该策略指导拿着传感器的机械臂的运动,以有效地收集可用于相机内部校准和相机 IMU 外部校准的测量值。给定当前姿势和收集的测量值,学习策略生成优化传感器校准精度的后续转换。模拟和真实机器人系统的评估表明,我们的学习策略生成了有利的运动轨迹,并有效地收集了足够的测量值,从而产生所需的短路径长度的内在和外在参数。

Terrain-Aware Foot Placement for Bipedal Locomotion Combining Model Predictive Control, Virtual Constraints, and the ALIP
Authors Grant Gibson, Oluwami Dosunmu Ogunbi, Yukai Gong, Jessy Grizzle
本文借鉴了双足控制文献中的三个主题,以实现高度敏捷的地形感知运动。通过地形感知,我们的意思是机器人可以使用由最先进的映射和轨迹规划算法提供的地形坡度和摩擦锥信息。该过程首先从 Cassie 3D 双足机器人的完整动力学中抽象出来,这是其质心动力学的精确低维表示,由角动量参数化。在分段平面地形假设下,并消除关于机器人质心的角动量项,质心动力学变为线性并具有四维。质心动力学的四步水平模型预测控制 MPC 提供步到步的脚放置命令。重要的是,我们还包括间隔为 10 毫秒的步内动态,以便可以在 MPC 公式中强加对机器人进化的现实地形感知约束。 MPC的输出通过虚拟约束的方法直接在Cassie上实现。

Learning Material Parameters and Hydrodynamics of Soft Robotic Fish via Differentiable Simulation
Authors John Z. Zhang, Yu Zhang, Pingchuan Ma, Elvis Nava, Tao Du, Philip Arm, Wojciech Matusik, Robert K. Katzschmann
软机构的高维性和流体结构相互作用的复杂物理学使软机器人的 sim2real 差距特别具有挑战性。我们的框架允许在真实硬件中对复合双压电晶片弯曲结构的动态行为进行高保真预测,以接近测量不确定度的精度。我们通过学习机器人的材料参数和流体动力学,用我们的可微模拟工具解决了这一差距。我们展示了一个经过实验验证的快速优化管道,用于通过可微模拟从准静态和动态数据中学习材料参数和流体动力学。我们的方法确定了用于创建我们三种不同鱼类机器人设计的各种软有机硅弹性体和硬质缩醛共聚物的物理上合理的杨氏模量。对于这些机器人,我们提供了比分析模型更可微且更稳健的推力估计,并且我们在各种驱动信号下的动态实验中成功预测了毫米精度的变形。虽然我们专注于水下软体机器人的特定应用,但我们的框架适用于任何气动软体机构。

Uncertainty Estimation of Dense Optical-Flow for Robust Visual Navigation
Authors Yonhon Ng, Hongdong Li, Jonghyuk Kim
本文提出了一种新颖的密集光流算法,以解决地面或空中机器人的单目同时定位和映射 SLAM 问题。密集光流可以有效地提供车辆的自我运动,同时能够避免与潜在障碍物的碰撞。现有的工作没有充分利用光流的不确定性,最多是各向同性的高斯密度模型。我们估计了光流的完全不确定性,并提出了一种基于统计马哈拉诺比斯距离的新八点算法。

Grounding Predicates through Actions
Authors Toki Migimatsu, Jeannette Bohg
代表抽象状态的符号,例如洗碗机中的盘子或桌上的杯子,允许机器人通过隐藏高级规划不必要的细节来进行长期推理。当前用于学习识别视觉数据中的符号状态的方法需要大量标记的训练数据,但由于图像中谓词的组合数量,手动注释此类数据集的成本高得令人望而却步。我们提出了一种通过利用已知的动作前后条件自动标记大规模视频活动数据集中符号状态的新方法。这种自动标记方案只需要以动作标签的形式进行弱监督,该标签描述了每个视频中演示的动作。我们将我们的框架应用于现有的大规模人类活动数据集。我们训练谓词分类器以在对象边界框提示时识别对象之间的符号关系,并达到 0.93 的测试准确率。

Safety Assurances for Human-Robot Interaction via Confidence-aware Game-theoretic Human Models
Authors Ran Tian, Liting Sun, Andrea Bajcsy, Masayoshi Tomizuka, Anca D. Dragan
人机交互安全方法的一个突出挑战是降低其保守性,同时保持对人类行为变化的鲁棒性。在这项工作中,我们建议机器人在评估人机交互的安全性时使用人类行为的信心感知博弈论模型。通过将人和机器人之间的影响以及人类的理性视为未观察到的潜在状态,我们可以简洁地推断出人类遵循博弈论交互模型的程度。我们利用这个模型来限制安全验证期间可行的人工控制集,使机器人能够自信地在线调节其安全监视器的保守性。在模拟人类机器人场景和消融研究中的评估表明,将信心意识博弈论模型注入安全监控器可以实现安全高效的人类机器人交互。

Guaranteed Rejection-free Sampling Method Using Past Behaviours for Motion Planning of Autonomous Systems
Authors Thomas T. Enevoldsen, Roberto Galeazzi
本文提出了一种新颖的基于学习的采样策略,可保证在有偏差和均匀条件下对自由空间进行无拒绝采样。利用执行重复性任务的自治系统过去配置的数据来估计自由空间区域的非参数概率描述,其中可能找到运动规划问题的可行解决方案。

Unsupervised Domain Adaptation for LiDAR Panoptic Segmentation
Authors Borna Be i , Nikhil Gosala, Daniele Cattaneo, Abhinav Valada
场景理解是自动驾驶汽车在环境中安全导航的关键任务。深度学习的最新进展可以从 LiDAR 数据中准确地重建周围环境的语义。然而,这些模型在配备不同 LiDAR 设置的车辆上部署时遇到了很大的领域差距,这大大降低了它们的性能。由于记录和手动标记新数据的过程昂贵且繁琐,因此无法为每个新设置微调模型。因此,无监督域适应 UDA 技术对于填补这一领域空白并在新传感器设置上保持模型的性能至关重要,而无需额外的数据标记。在本文中,我们提出了 AdaptLPS,这是一种用于 LiDAR 全景分割的新型 UDA 方法,它利用特定于任务的知识并考虑了扫描线数量、安装位置、强度分布和环境条件的变化。我们通过采用两种互补的域适应策略(基于数据和基于模型)来解决 UDA 任务。虽然基于数据的适应通过处理原始 LiDAR 扫描以类似于目标域中的扫描来减少域差距,但基于模型的技术指导网络提取代表两个域的特征。

Real-Time Tactile Grasp Force Sensing Using Fingernail Imaging via Deep Neural Networks
Authors Navid Fallahinia, Stephen Mascaro
本文介绍了一种仅通过视觉实时估计人类指尖施加的 3D 触觉力的新方法。引入的方法完全基于单目视觉,不需要任何物理力传感器。因此,它是可扩展的、非侵入性的,并且很容易与其他感知系统(如身体姿势估计)融合,使其成为需要力感测的 HRI 应用的理想选择。引入的方法由三个主要模块组成:用于检测和跟踪每个单独手指的手指跟踪、用于保留图像中空间信息的图像对齐以及用于从图像中的着色模式估计 3D 力的力模型。该模型已通过实验实施,结果表明,对于沿所有三个方向的整个力水平范围,最大 RMS 误差为 8.4。

Language-Aligned Waypoint (LAW) Supervision for Vision-and-Language Navigation in Continuous Environments
Authors Sonia Raychaudhuri, Saim Wani, Shivansh Patel, Unnat Jain, Angel X. Chang
在视觉和语言导航 VLN 任务中,实体代理遵循自然语言指令在 3D 环境中导航。此任务中的一个挑战是如何处理代理偏离参考路径的路径场景。先前的工作基于从代理的位置到目标的最短路径来监督代理,但这种面向目标的监督通常与指令不一致。此外,先前工作采用的评估指标并没有衡量代理能够遵循多少语言指令。

Game and Simulation Design for Studying Pedestrian-Automated Vehicle Interactions
Authors Georgios Pappas, Joshua E. Siegel, Jacob Rutkowski, Andrea Schaaf
目前的跨学科研究探索了安全虚拟环境中的行人自动驾驶车辆交互。我们首先介绍该领域的现代工具,然后提出设计和开发一种新的应用程序,以促进行人观点研究。我们进行了三步用户体验实验,参与者在各种场景中使用应用程序前后回答问题。虚拟中的行为结果,尤其是当有后果时,往往能够很好地模拟现实生活以做出设计选择,我们获得了有关人类车辆交互的宝贵见解。我们的工具似乎开始提高参与者对自动驾驶汽车及其能力和局限性的认识,这是克服公众对自动驾驶汽车不信任的重要一步。

Semantic Dense Reconstruction with Consistent Scene Segments
Authors Yingcai Wan, Yanyan Li, Yingxuan You, Cheng Guo, Lijin Fang, Federico Tombari
在本文中,提出了一种从 RGB D 序列重建密集语义 3D 场景的方法,以解决高级场景理解任务。首先,每个 RGB D 对都基于相机跟踪主干一致地分割成 2D 语义图,该主干将对象标签以高概率从全扫描传播到相应的局部视图。然后从输入的 RGB D 序列逐步生成未知环境的密集 3D 网格模型。受益于 2D 一致语义段和 3D 模型,提出了一种新颖的语义投影块 SP Block,以从不同视图的 2D 段中提取深度特征量。此外,语义卷从点云编码器融合为深层卷,以进行最终的语义分割。

Emergency Vehicles Audio Detection and Localization in AutonomousDriving
Authors Hongyi Sun, Xinyi Liu, Kecheng Xu, Jinghao Miao, Qi Luo
使用中的紧急车辆比所有其他车辆拥有先行权。因此,所有其他车辆都应该采取适当的行动,让带有主动警报器的紧急车辆。由于这项任务需要人类驾驶员的耳朵和眼睛之间的合作,因此它还需要音频检测作为全自动驾驶车辆基于视觉的算法的补充。在城市驾驶场景中,我们需要知道紧急车辆的存在以及它们与我们的相对位置来决定适当的行动。我们提出了一个新颖的系统,从收集真实世界的警报器数据到仅使用两个具有成本效益的麦克风部署模型。我们能够分别为每项任务实现有希望的性能,特别是在关键的 10m 到 50m 距离范围内,以应对我们的自我车辆的大小约为 5m 长和 2m 宽。确定警报器存在的召回率为99.16,中值和平均角度绝对误差分别为9.64和19.18,在该范围内的中值和平均距离绝对误差分别为9.30m和10.58m。

Decentralized Role Assignment in Multi-Agent Teams via Empirical Game-Theoretic Analysis
Authors Fengjun Yang, Negar Mehr, Mac Schwager
我们提出了一种基于经验博弈论的方法,让作为团队一部分的机器人通过利用其对团队结构的知识,在不与团队成员明确沟通的情况下选择其在团队中的角色。为此,我们将角色分配问题表述为动态博弈,并从经验博弈论分析中借用工具来分析此类博弈。基于这个博弈论公式,我们为每个机器人提出了一个分布式控制器,以动态地决定要扮演的最佳角色。我们在协作平面操作场景的模拟中演示了我们的方法,其中每个代理在每个时刻从一组反馈控制策略中进行选择。

Explanation-Aware Experience Replay in Rule-Dense Environments
Authors Francesco Sovrano, Alex Raymond, Amanda Prorok
人类环境通常受明确和复杂的规则集的监管。将强化学习 RL 代理集成到这样的环境中会促进学习机制的发展,这些机制在规则密集和异常缠身的环境中表现良好,例如在受管制的道路上自动驾驶。在本文中,我们提出了一种通过将经验缓冲区划分为基于每个解释标记的集群来组织经验的方法。我们提出了与模块化规则集和 9 个学习任务兼容的离散和连续导航环境。对于具有可解释规则集的环境,我们通过将状态转换分配到标有解释的集群中,将基于规则的解释转换为基于案例的解释。这使我们能够以课程和任务为导向的方式对体验进行采样,重点关注事件的稀有性、重要性和意义。我们将这个概念标记为 Explanation Awareness XA。我们使用集群内和集群间优先级执行 XA 体验重放 XAER,并引入 XA 兼容版本的 DQN、TD3 和 SAC。

Subdimensional Expansion Using Attention-Based Learning For Multi-Agent Path Finding
Authors Lakshay Virmani, Zhongqiang Ren, Sivakumar Rathinam, Howie Choset
多代理路径查找 MAPF 为多个代理从各自的起点到目标位置查找无冲突路径。 MAPF 具有挑战性,因为联合配置空间相对于代理的数量呈指数增长。在 MAPF 规划器中,基于搜索的方法,例如 CBS 和 M,通过采用动态耦合策略有效地绕过维度诅咒,首先以完全解耦的方式规划代理,其中代理之间的潜在冲突被忽略,然后代理要么遵循它们单独的计划或耦合在一起以计划解决它们之间的冲突。一般来说,要解决的冲突数量决定了这些规划器的运行时间,现有的大部分工作都集中在如何有效地解决这些冲突上。在这项工作中,我们采取不同的观点,旨在通过改进每个代理的个人计划来减少冲突的数量,从而提高整体搜索效率。通过利用 Visual Transformer,我们开发了一个基于学习的单代理规划器,它为单个代理进行规划,同时关注地图的结构和可能发生冲突的其他代理。然后,我们通过将这种基于学习的单代理规划器与 M 集成来开发一种称为 LM 的新型多代理规划器。我们的结果表明,对于可见和不可见的地图,与 M 相比,LM 需要解决的冲突更少,因此运行速度更快,成功率更高。我们凭经验表明由 LM 计算的 MAPF 解决方案接近最优。

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页


pic from pexels.com

你可能感兴趣的:(机器人,Papers,机器人,机器手,抓取,路径规划,SLAM)