AI视野·今日CS.Robotics 机器人学论文速览
Fri, 5 Jan 2024
Totally 11 papers
上期速览✈更多精彩请移步主页
Machine Learning in Robotic Ultrasound Imaging: Challenges and Perspectives Authors Yuan Bi, Zhongliang Jiang, Felix Duelmer, Dianye Huang, Nassir Navab 本文回顾了智能机器人超声超声成像系统的最新进展。我们首先介绍机器人超声成像中常用的机器人机制和控制技术及其临床应用。随后,我们重点关注机器学习技术在机器人超声检查师开发中的部署,强调旨在增强这些系统智能的关键发展。实现自主行动推理的方法分为两类:依赖隐式环境数据解释的方法和使用显式解释的方法。在整个探索过程中,我们还讨论了实际挑战,包括与医疗数据稀缺性、深入了解所涉及的物理方面的需要以及有效的数据表示方法相关的挑战。 |
AERIAL-CORE: AI-Powered Aerial Robots for Inspection and Maintenance of Electrical Power Infrastructures Authors Anibal Ollero, Alejandro Suarez, Christos Papaioannidis, Ioannis Pitas, Juan M. Marredo, Viet Duong, Emad Ebeid, Vit Kratky, Martin Saska, Chloe Hanoune, Amr Afifi, Antonio Franchi, Charalampos Vourtsis, Dario Floreano, Goran Vasiljevic, Stjepan Bogdan, Alvaro Caballero, Fabio Ruggiero, Vincenzo Lippiello, Carlos Matilla, Giovanni Cioffi, Davide Scaramuzza, Jose R. Martinez de Dios, Begona C. Arrue, Carlos Martin, Krzysztof Zurad, Carlos Gaitan, Jacob Rodriguez, Antonio Munoz, Antidio Viguria 大型基础设施很容易因老化、环境影响和大量使用而老化。通过定期检查和维护确保其安全对于防止严重影响公共安全和环境的事件至关重要。这在电力网络的背景下尤其重要,电力网络虽然对于能源供应至关重要,但也可能是森林火灾的根源。智能无人机有可能彻底改变检查和维护,消除人类操作员的风险,提高生产力,减少检查时间并提高数据收集质量。然而,目前空中机器人技术的大多数方法和技术主要是在室内试验台或严格控制条件下的室外环境中进行试验的,并且始终在人类操作员的视线范围内。此外,这些方法和技术通常是孤立评估的,缺乏全面的集成。本文介绍了第一个结合了各种创新空中机器人的自主系统。该系统专为超出视线范围的大范围检查而设计,具有用于维护任务的空中机械手,并包括用于在高处工作的操作员的支撑机制。 |
How Do Pedestrians' Perception Change toward Autonomous Vehicles during Unmarked Midblock Multilane Crossings: Role of AV Operation and Signal Indication Authors Fengjiao Zou, Jennifer Harper Ogle, Patrick Gerard, Weimin Jin 阻碍行人广泛接受自动驾驶汽车的主要障碍之一是他们对自动驾驶汽车的理解有限。本研究采用虚拟现实 VR 为行人提供一个身临其境的环境,以便在无标记的中路多车道交叉口期间与自动驾驶汽车互动并理解自动驾驶汽车。对各种自动驾驶汽车驾驶行为进行建模,以显示带有黄色信号指示的谈判行为或带有蓝色信号指示的不让行行为。本文旨在研究自动驾驶汽车行为和信号、行人过去行为等各种因素对行人对自动驾驶汽车感知变化的影响。 VR 实验前后,参与者完成了评估他们对自动驾驶汽车看法的调查,重点关注态度和系统有效性两个主要方面。 Wilcoxon 签名排名测试结果表明,在 VR 实验之后,行人对自动驾驶汽车的整体态度评分和对自动驾驶系统有效性的信任度均显着提高。值得注意的是,对黄色信号表现出更大信任的个人更倾向于对自动驾驶汽车表现出更高的态度分数,并增强他们对自动驾驶系统有效性的信任。这表明黄色信号灯的设计让行人对与自动驾驶汽车的互动更有信心。此外,与那些具有更积极的过路行为的行人相比,表现出更积极的过路行为的行人不太可能改变对自动驾驶汽车的看法。 |
Enabling Digitalization in Modular Robotic Systems Integration Authors Daniella Tola 将机器人系统集成到生产线中是一个耗时的过程。在数字化时代,新技术的研发对于改进集成流程至关重要。众多挑战,包括缺乏标准化以及复杂的利益相关者关系,使机器人系统集成的过程变得复杂。该过程通常包括机器人系统的获取、集成和部署。本论文重点关注有助于自动化和简化机器人系统集成的三个领域。在与采集相关的第一个领域,演示了基于约束的配置器,它解决了机器人设备之间的兼容性挑战,并使配置过程自动化。这降低了集成不兼容设备的风险,并减少了配置阶段对专家的需求。在与集成相关的第二个领域中,研究了可互操作的建模格式(统一机器人描述格式 URDF),并进行了详细分析,揭示了显着的不一致和关键的改进。这种格式广泛用于机器人的运动学建模和 3D 可视化,并且其模型可以跨仿真工具重复使用。改进这种格式使广泛的用户受益,包括机器人工程师、研究人员和学生。在与部署相关的第三个领域,探索了机器人系统的数字孪生DT,因为它们可以提高效率并减少停机时间。对 DT 进行了全面的文献综述,并开发了模块化机器人系统的案例研究。这项研究可以加速 DT 在机器人行业的采用。 |
Mobile ALOHA: Learning Bimanual Mobile Manipulation with Low-Cost Whole-Body Teleoperation Authors Zipeng Fu, Tony Z. Zhao, Chelsea Finn 从人类演示中进行的模仿学习在机器人技术中表现出了令人印象深刻的表现。然而,大多数结果都集中在桌面操作上,缺乏一般有用任务所需的移动性和灵活性。在这项工作中,我们开发了一种用于模仿需要全身控制的双手移动操作任务的系统。我们首先推出 Mobile ALOHA,这是一种用于数据收集的低成本全身远程操作系统。它通过移动底座和全身远程操作界面增强了 ALOHA 系统。然后,我们使用 Mobile ALOHA 收集的数据执行监督行为克隆,并发现与现有静态 ALOHA 数据集的协同训练可以提高移动操作任务的性能。每项任务进行 50 次演示,协同训练可将成功率提高多达 90 倍,使 Mobile ALOHA 能够自主完成复杂的移动操作任务,例如炒虾和上菜、打开两门壁柜存放沉重的烹饪锅、呼叫并进入电梯,并使用厨房水龙头轻轻冲洗用过的锅。 |
On Time-Indexing as Inductive Bias in Deep RL for Sequential Manipulation Tasks Authors M. Nomaan Qureshi, Ben Eisner, David Held 在解决复杂的操纵任务时,操纵策略通常需要学习一组不同的技能来完成这些任务。这组技能通常是多模态的,每个技能可能具有截然不同的动作和状态分布。标准深度策略学习算法通常将策略建模为具有单个输出头确定性或随机性的深度神经网络。这种结构需要网络学习在内部模式之间切换,这可能导致样本效率较低和性能较差。在本文中,我们探索了一种简单的结构,有利于许多操作任务所需的技能学习。具体来说,我们提出了一种策略架构,可以在固定的时间内顺序执行不同的动作头,从而能够学习基本技能,例如伸手和抓握。 |
ODIN: A Single Model for 2D and 3D Perception Authors Ayush Jain, Pushkal Katara, Nikolaos Gkanatsios, Adam W. Harley, Gabriel Sarch, Kriti Aggarwal, Vishrav Chaudhary, Katerina Fragkiadaki ScanNet 等当代 3D 感知基准的最先进模型使用和标签数据集提供了 3D 点云,这些点云是通过感测的多视图 RGB D 图像的后处理获得的。它们通常在域中进行训练,放弃大规模 2D 预训练,并优于以 RGB D 多视图图像为特征的替代方案。使用姿势图像的方法与后处理的 3D 点云的方法之间的性能差距让人更加相信 2D 和 3D 感知需要不同的模型架构。在本文中,我们挑战了这一观点,并提出了 ODIN Omni Dimensional INstance 分割,这是一种可以分割和标记 2D RGB 图像和 3D 点云的模型,使用在 2D 视图内和 3D 跨视图信息融合之间交替的转换器架构。我们的模型通过所涉及标记的位置编码来区分 2D 和 3D 特征操作,该编码捕获 2D 补丁标记的像素坐标和 3D 特征标记的 3D 坐标。 ODIN 在 ScanNet200、Matterport3D 和 AI2THOR 3D 实例分割基准上实现了最先进的性能,在 ScanNet、S3DIS 和 COCO 上实现了具有竞争力的性能。当使用感测到的 3D 点云代替从 3D 网格采样的点云时,它的性能大大优于以前的所有工作。当在可指导的具体代理架构中用作 3D 感知引擎时,它为对话基准的 TEACh 动作设定了新的技术水平。 |
Direction of Arrival Estimation Using Microphone Array Processing for Moving Humanoid Robots Authors Vladimir Tourbabin, Boaz Rafaely 近年来,人形机器人的听觉系统受到越来越多的关注。该系统通常通过麦克风阵列来获取周围的声场。然后使用各种方法处理阵列采集的信号。广泛应用的方法之一是到达方向估计。传统的到达方向估计方法假设在估计期间阵列固定在给定位置。然而,对于安装在移动人形机器人上的阵列来说,情况不一定如此。如果没有适当考虑阵列运动,可能会在估计的到达方向上引入显着的误差。当前的论文提出了一种考虑运动的信号模型。基于该模型,提出了两种处理方法。第一个补偿机器人的运动。第二种方法适用于周期性信号,并利用运动来将性能提高到超出固定阵列的水平。提供了数值模拟和实验研究,证明运动补偿方法几乎消除了与运动相关的误差。 |
Inherently robust suboptimal MPC for autonomous racing with anytime feasible SQP Authors Logan Numerow, Andrea Zanelli, Andrea Carron, Melanie N. Zeilinger 近年来,自动驾驶等应用对高性能控制器的需求不断增长,推动了针对特定控制问题的优化例程的开发。在本文中,我们提出了一种高效的不精确模型预测控制 MPC 策略,用于具有固有鲁棒性的自主微型赛车。我们依赖于一种可行的顺序二次规划 SQP 算法,该算法能够生成可行的中间迭代,以便求解器可以在任意次数的迭代后停止,而不会危及递归的可行性。通过这种方式,我们提供了一种计算次优但可行的解决方案的策略,其计算足迹远低于基于局部最优解决方案计算的最先进方法。在对终端集和系统可控性属性的适当假设下,我们可以说,对于影响系统动态的任何足够小的扰动,可以保证递归可行性。我们在模拟中验证了所提出策略的有效性,并将其部署到自动微型赛车的物理实验中。仿真和实验结果都表明,与采用提前终止而不提供可行解的策略相比,使用可行的 SQP 方法,可以通过适度的额外计算工作来获得可行解。 |
Estimating continuous data of wrist joint angles using ultrasound images Authors Yo Kobayashi, Yoshihiro Katagi 超声波成像最近被引入作为联合运动估计的传感接口。使用超声图像作为估计方法有望提高辅助设备和人机界面的控制性能。本研究旨在使用超声图像估计连续的腕关节角度。具体来说,在实验中,在伸展屈曲运动期间获得关节角度信息,并获取相关肌肉的超声图像。利用从超声图像获得的特征,使用多元线性回归模型来估计关节角度。使用来自超声图像的光流获得的特征点的坐标被用作多元线性回归模型的解释变量。每个参与者都对模型进行了每次试验的训练和测试,以验证估计的准确性。结果显示,所有试验的估计精度的平均值和标准差为均方根误差 RMSE 1.82 pm 0.54 deg,决定系数 R2 0.985 pm 0.009。 |
Perceptions of Humanoid Robots in Caregiving: A Study of Skilled Nursing Home and Long Term Care Administrators Authors Rana Imtiaz, Arshia Khan 随着人口老龄化的加剧和医护人员短缺的加剧,研究其他照顾老龄化人口的方法的必要性也随之增加。其中一种方法是使用人形机器人来照顾 65 岁以上人群的社交、情感和身体健康。了解熟练的长期护理院管理员对人形机器人在护理方面的看法至关重要,因为他们的见解影响着机器人的实施及其对居民福祉和生活质量的潜在影响。作者对 269 名疗养院管理人员进行了调查,以了解他们对在疗养院设施中使用人形机器人的看法。数据经过编码,结果显示,高管们热衷于探索其他护理途径,例如机器人技术,以增强疗养院照顾居民的能力。定性分析揭示了在疗养院中集成人形机器人的不同观点。虽然承认提高参与度和员工支持等好处,但对成本、对人类互动的影响以及对机器人有效性的怀疑仍然存在。这凸显了复杂的财务、技术和人力障碍,并强调了战略实施的必要性。 |
Chinese Abs From Machine Translation |
Papers from arxiv.org
更多精彩请移步主页
pic from pexels.com