【AI视野·今日Robot 机器人论文速览 第三十一期】Fri, 15 Apr 2022

AI视野·今日CS.Robotics 机器人学论文速览
Fri, 15 Apr 2022
Totally 14 papers
上期速览✈更多精彩请移步主页

【AI视野·今日Robot 机器人论文速览 第三十一期】Fri, 15 Apr 2022_第1张图片

Daily Robotics Papers

An Integrated Design Pipeline for Tactile Sensing Robotic Manipulators
Authors Lara Zlokapa, Yiyue Luo, Jie Xu, Michael Foshey, Kui Wu, Pulkit Agrawal, Wojciech Matusik
传统的机器人机械手设计方法需要大量、耗时和手动试错才能产生可​​行的设计。在此过程中,工程师经常花时间重新设计或重塑组件,因为他们发现机器人操纵器的更好拓扑结构。触觉传感器虽然有用,但由于其庞大的外形尺寸,通常会使设计复杂化。我们提出了一个集成设计流程,以简化带有针织手套状触觉传感器的机器人机械手的设计和制造。提议的管道允许设计人员通过应用预定义的图形语法规则来组装一组模块化的开源组件。最终结果是一个直观的设计范例,允许在几分钟内创建新的机械手虚拟设计。我们的框架允许设计人员通过基于笼的几何变形来微调机械手的形状。最后,设计人员可以选择用于添加触觉感应的表面。机械手设计完成后,程序会自动生成用于制造的3D打印和编织文件。

GelSight Fin Ray: Incorporating Tactile Sensing into a Soft Compliant Robotic Gripper
Authors Sandra Q. Liu, Edward H. Adelson
为了适应不断变化的环境并确保人机交互的安全,机器人应该具有顺从和柔软的特性,以及感知周围世界的能力。即便如此,由于其可变形的结构,将触觉感应结合到柔软的顺应机器人(如 Fin Ray 手指)中仍然很困难。不仅需要修改框架为视觉传感器留出空间,从而实现复杂的触觉感应,机器人还必须保持其原始的机械兼容特性。然而,为柔软的手指添加高分辨率触觉传感器是困难的,因为许多传感器手指(例如基于 GelSight 的手指)是刚性的,并且在传感区域的变化仅来自触觉接触而不是手指顺应性的假设下起作用。传感软机器人手指需要能够将其整体本体感受变化与其触觉信息分开。为此,本文介绍了 GelSight Fin Ray 的新颖设计,它既体现了被动适应其抓取的任何物体的能力,又具有执行高分辨率触觉重建、物体方向估计以及剪切和扭转标记跟踪的能力。军队。拥有这些功能,可以让柔软且顺从的机器人执行更多需要感应的操作任务。手指能够成功执行的一项此类任务是厨房任务酒杯的重新定向和放置,这对于外部视觉传感器来说很难做到,但对于触觉感应却很容易。

Sim-to-Real 6D Object Pose Estimation via Iterative Self-training for Robotic Bin-picking
Authors Kai Chen, Rui Cao, Stephen James, Yichuan Li, Yun Hui Liu, Pieter Abbeel, Qi Dou
在本文中,我们提出了一种迭代自训练框架,用于从 sim 到真实 6D 对象姿态估计,以促进具有成本效益的机器人抓取。给定一个垃圾箱拾取场景,我们建立了一个逼真的模拟器来合成大量的虚拟数据,并用它来训练一个初始姿态估计网络。然后,该网络扮演教师模型的角色,为未标记的真实数据生成姿势预测。通过这些预测,我们进一步设计了一个全面的自适应选择方案来区分可靠的结果,并将它们用作伪标签来更新学生模型,以便在真实数据上进行姿态估计。为了不断提高伪标签的质量,我们通过将训练好的学生模型作为新教师来迭代上述步骤,并使用细化的教师模型重新标记真实数据。我们在公共基准和我们新发布的数据集上评估我们的方法,分别实现了 11.49 和 22.62 的 ADD S 改进。

Blending Primitive Policies in Shared Control for Assisted Teleoperation
Authors Guilherme Maeda
运动原语具有适应机器人状态变化的特性,同时保持对原始策略的吸引力。因此,我们通过考虑与原始策略的状态偏差是由用户输入引起的,来研究使用原语作为混合机制。当原语从用户输入中恢复时,它隐含地融合了人类和机器人策略,而不需要它们的权重,称为仲裁。在本文中,我们采用动态运动原语 DMP,这使我们能够避免多次演示的需要,并且速度足够快,可以实现大量实例化,每个实例对应于人类意图的每个假设。介绍了有关实现多个目标和动态避障的辅助远程操作任务的用户研究。

NASA/GSFC's Flight Software Core Flight System Implementation For A Lunar Surface Imaging Mission
Authors Mohammed Eleffendi, Daniel Posada, M. Ilhan Akbas, Troy Henderson
随着新的临界点技术提供了重返月球进行研究和探索的可能性,人们对重返月球进行研究和探索的兴趣有所增加。其中一项举措是 NASA 的 Artemis 计划,该计划计划在 2024 年之前将人类送回月球表面并研究月球表面的水沉积物。该计划还将作为一个实践运行,以计划派遣人类探索火星的后勤工作。为了让人类安全返回月球,需要多项技术进步和关于月球表面性质的多样化知识。本文将讨论 EagleCam 的飞行软件的设计和实现,这是一个 CubeSat 相机系统,基于 NASA 戈达德太空飞行中心开发的免费开源核心 Flight System cFS 架构。 EagleCam 是由 Intuitive Machines 开发的商业月球有效载荷服务 Nova C 着陆器运送到月球的有效载荷。相机系统将捕捉执行月球着陆的航天器的第一第三人称视角,并收集其他科学数据,例如羽流与表面的相互作用。完整的系统由 CubeSat 和将弹出它的部署程序组成。

Federated Learning for Vision-based Obstacle Avoidance in the Internet of Robotic Things
Authors Xianjia Yu, Jorge Pe a Queralta, Tomi Westerlund
深度学习方法彻底改变了移动机器人技术,从用于增强态势感知的高级感知模型到通过强化学习的新颖控制方法。本文探讨了联邦学习在移动机器人分布式系统中实现机器人物联网协作的潜力。为了证明这种方法的有效性,我们在不同的室内环境中部署了轮式机器人。我们分析了联邦学习方法的性能,并将其与具有先验聚合数据的传统集中式训练过程进行比较。我们展示了跨异构环境的协作学习的好处以及从模拟到真实知识转移的潜力。我们的结果证明了 FL 和 sim 对基于视觉的导航的实际传输具有显着的性能优势,此外还通过将计算保持在边缘来实现 FL 的固有隐私保护性质。

GloCAL: Glocalized Curriculum-Aided Learning of Multiple Tasks with Application to Robotic Grasping
Authors Anil Kurkcu, Cihan Acar, Domenico Campolo, Keng Peng Tee
由于需要大量数据并确保学习过程中的安全性,机器人领域对应用深度强化学习具有挑战性。课程学习在样本高效深度学习方面表现出良好的表现。在本文中,我们提出了一种名为 GloCAL 的算法,该算法基于根据评估分数对任务进行聚类,为代理创建学习多个离散任务的课程。从性能最高的集群中,识别出代表集群的全局任务,用于学习全局策略,该策略会转移到随后形成的新集群,而集群中的剩余任务则作为本地策略进行学习。我们的 GloCAL 算法的功效和效率与 EGAD 数据集中具有不同对象复杂性和抓取难度的 49 个对象的抓取学习领域中的其他方法进行了比较。

MARF: Multiscale Adaptive-switch Random Forest for Leg Detection with 2D Laser Scanners
Authors Tianxi Wang, Feng Xue, Yu Zhou, Anlong Ming
对于基于 2D 激光的任务,例如人员检测和人员跟踪,腿部检测通常是第一步。因此,它在确定人员检测和人员跟踪的性能方面具有重要意义。然而,许多腿部检测器忽略了不可避免的噪声和激光扫描的多尺度特性,这使得它们对点云的不可靠特征敏感,进一步降低了腿部检测器的性能。在本文中,我们提出了一种多尺度自适应开关随机森林 MARF 来克服这两个挑战。首先,自适应开关决策树被设计为使用噪声敏感特征进行加权分类,使用噪声不变特征进行二元分类,这使得我们的检测器对噪声具有更强的鲁棒性。其次,考虑到二维点云的稀疏性与激光束长度成正比的多尺度特性,我们设计了一种多尺度随机森林结构来检测不同距离的腿。此外,所提出的方法使我们能够从点云中发现比其他方法更稀疏的人腿。因此,与具有挑战性的移动腿数据集上的其他最先进的腿检测器相比,我们的方法显示出改进的性能,并在低计算笔记本电脑上以 60 FPS 的速度保留了整个管道。

Approximating Constraint Manifolds Using Generative Models for Sampling-Based Constrained Motion Planning
Authors Cihan Acar, Keng Peng Tee
在任务约束下进行基于采样的运动规划具有挑战性,因为配置空间中的零测量约束流形使得拒绝采样即使不是不可能也非常低效。本文提出了一种基于学习的采样策略,用于约束运动规划问题。我们研究使用两个众所周知的深度生成模型,条件变分自动编码器 CVAE 和条件生成对抗网络 CGAN 来生成满足样本配置的约束。我们使用以约束参数为条件的生成模型来逼近约束流形,而不是预先计算的图。这种方法允许在线有效地绘制满足样本的约束,而无需修改可用的基于采样的运动规划算法。我们根据采样精度和采样分布的覆盖范围来评估这两个生成模型的效率。

Control-oriented meta-learning
Authors Spencer M. Richards, Navid Azizan, Jean Jacques Slotine, Marco Pavone
实时适应对于控制在复杂、动态环境中运行的机器人至关重要。自适应控制律甚至可以赋予非线性系统良好的轨迹跟踪性能,前提是任何不确定的动力学项都可以通过已知的非线性特征进行线性参数化。然而,通常很难先验地指定这些特征,例如旋翼飞机上的空气动力干扰或机械臂与各种物体之间的相互作用力。在本文中,我们转向使用神经网络的数据驱动建模,从过去的数据中离线学习具有这些非线性特征的内部参数模型的自适应控制器。我们的主要见解是,我们可以通过闭环模拟中面向控制的元学习特征更好地准备控制器进行部署,而不是使用面向回归的特征元学习来拟合输入输出数据。具体来说,我们以闭环跟踪模拟为基础学习器,以平均跟踪误差为元目标来元学习自适应控制器。

Observability Analysis of Visual-Inertial Odometry with Online Calibration of Velocity-Control Based Kinematic Motion Models
Authors Haolong Li, Joerg Stueckler
在本文中,我们使用具有基于速度控制的运动学运动模型的立体相机分析了视觉惯性里程计 VIO 的可观察性。以前的工作表明,在一般情况下,在 VIO 系统中全局位置和偏航是不可观测的,此外,如果没有旋转,滚动和俯仰也变得不可观测。我们证明,通过整合平面运动约束,滚动和俯仰变得可观察。

Copiloting Autonomous Multi-Robot Missions: A Game-inspired Supervisory Control Interface
Authors Marcel Kaufmann, Robert Trybula, Ryan Stonebraker, Michael Milano, Gustavo J. Correa, Tiago S. Vaquero, Kyohei Otsu, Ali akbar Agha mohammadi, Giovanni Beltrame
新技术和能力的现实世界部署可能令人生畏。例如,最近的 DARPA Subterranean SubT Challenge 旨在通过为期三年的开发推动推进机器人平台和自主能力。虽然多代理系统传统上部署在允许进行受控测试的受控和结构化环境(例如仓库)中,但 SubT 挑战针对的是各种类型的未知地下环境,这些环境在发生故障时会带来机器人丢失的风险。在这项工作中,我们介绍了一个受视频游戏启发的界面、一个自主任务助手,并在具有挑战性的环境中使用异构多代理系统进行测试和部署。

Accelerated Policy Learning with Parallel Differentiable Simulation
Authors Jie Xu, Viktor Makoviychuk, Yashraj Narang, Fabio Ramos, Wojciech Matusik, Animesh Garg, Miles Macklin
深度强化学习可以生成复杂的控制策略,但需要大量的训练数据才能有效工作。最近的工作试图通过利用可微分模拟器来解决这个问题。然而,诸如局部最小值和爆炸消失的数值梯度等固有问题阻止了这些方法普遍应用于具有复杂接触丰富动力学的控制任务,例如经典 RL 基准中的人形运动。在这项工作中,我们提出了一种高性能的可微分模拟器和一种新的策略学习算法 SHAC,即使在不平滑的情况下也可以有效地利用模拟梯度。我们的学习算法通过平滑的批评函数缓解局部最小值问题,避免通过截断的学习窗口消失梯度爆炸,并允许许多物理环境并行运行。我们在经典的 RL 控制任务上评估我们的方法,并显示在样本效率和挂钟时间方面比最先进的 RL 和基于可微分模拟的算法有显着改进。

A Study of Causal Confusion in Preference-Based Reward Learning
Authors Jeremy Tien, Jerry Zhi Yang He, Zackory Erickson, Anca D. Dragan, Daniel Brown
通过基于偏好的奖励学习来学习机器人策略是一种越来越流行的定制机器人行为的方法。然而,近年来,越来越多的轶事证据表明,从偏好中学习奖励函数容易产生虚假的相关性和奖励游戏或黑客行为。虽然在直接从状态映射到动作的强化学习和模仿学习方法中,对因果混淆和奖励游戏行为有很多轶事、经验和理论分析,但我们在学习奖励函数的背景下提供了对因果混淆的第一个系统研究从偏好。为了促进这项研究,我们确定了一组三个偏好学习基准域,当从成对轨迹偏好的离线数据集中学习一个简单的到达域、一个辅助喂养域和一个抓痒域时,我们观察到了因果混淆。为了深入了解这种观察到的因果混淆,我们提出了一个敏感性分析,探讨了不同因素的影响,包括训练数据的类型、奖励模型容量和特征维度对从偏好中学习到的奖励的稳健性的影响。我们发现有证据表明,从成对轨迹偏好中学习奖励对虚假特征和增加的模型容量高度敏感且不鲁棒,但对训练数据的类型不敏感。

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页


pic from pexels.com

你可能感兴趣的:(机器人,Papers,机器人,机械手,自动驾驶,抓取,路径规划)