AI视野·今日CS.Robotics 机器人学论文速览
Fri, 4 Jun 2021
Totally 12 papers
上期速览✈更多精彩请移步主页
Towards Learning to Play Piano with Dexterous Hands and Touch Authors Huazhe Xu, Yuping Luo, Shaoxiong Wang, Trevor Darrell, Roberto Calandra Virtuoso以激情,诗歌和非凡的技术能力扮演钢琴。由于Liszt说,Virtuoso必须呼唤气味和开花,并呼吸生活的气息。可以播放钢琴的最强大的机器人基于专门的机器人手钢琴和硬编码计划算法的组合。与此同照说,在本文中,我们展示了代理商如何直接从机器可读音乐分数学习,以便在模拟钢琴上使用强化从划痕来玩模拟钢琴的钢琴。我们展示了RL代理商不仅可以找到正确的关键位置,而且还可以处理各种有节奏,体积和指法,要求。我们通过使用触摸增强奖励和新颖的任务课程来实现这一目标。我们通过仔细研究实现这种学习算法的重要方面来得出结论,并且可以在这个方向上潜在地阐明光线。 |
Traversing Steep and Granular Martian Analog Slopes With a Dynamic Quadrupedal Robot Authors Hendrik Kolvenbach, Philip Arm, Elias Hampp, Alexander Dietsche, Valentin Bickel, Benjamin Sun, Christoph Meyer, Marco Hutter Moon和Mars等天体主要由松散,颗粒状土壤覆盖,令人难以置信的地形致力于穿越轮式机器人系统。在这里,我们在动态行走的四轮车机器人SpaceBok上展示了陡峭的颗粒状斜坡上的实验工作。为了适应具有挑战性的环境,我们开发了被动式自适应平面脚和优化的软硬垫,以减少沉陷和增加平面和倾斜颗粒土的牵引力。单足实验表明,即使在高度可折叠的土壤ES1上,每个脚110cm2的大表面积为110cm2降低到可接受的水平。与Grouser更少的设计相比,实施多个12mm蜂窝刀片在粒状介质上增加了22至66的牵引力。与地形调整行走控制器一起,我们验证了MARS模拟斜坡上的第一次静态和动态运动,最多25个测试用。我们评估了点和平面脚之间的性能以及关于稳定性安全性,速度和能耗的静态和动态Ga。我们表明,动态Gaits比静态Gaits更有效,但陡峭斜坡上有风险。我们的测试还透露,当斜坡倾斜接近由于剪切引起的土壤S内摩擦角度时,平面脚的能量消耗大大增加。由于其过度的沉陷,点脚尺寸较小,而且又易于无缘无故和绊倒。我们展示并讨论了基于我们的研究结果的安全和节能全球路径规划策略,以便在火星上访问陡峭地形。 |
Simultaneous Multi-View Object Recognition and Grasping in Open-Ended Domains Authors Hamidreza Kasaei, Sha Luo, Remo Sasso, Mohammadreza Kasaei 在人类为中心的环境中工作的机器人需要知道场景中存在哪种物体,以及如何掌握和操纵不同情况下的各种对象,以帮助人类在日常任务中。因此,对象识别和抓握是此类机器人的两个关键功能。最先进的最先进地应对对象识别并掌握两个单独的问题,同时都使用可视输入。此外,在训练阶段之后,机器人的知识是固定的。在这种情况下,如果机器人面临新的对象类别,则必须从头开始重新培训,并在没有灾难性干扰的情况下结合新信息。为了解决这个问题,我们提出了一个深入的学习架构,增强了内存能力,以处理开放的目标识别和同时抓握。特别地,我们的方法将物体的多视图作为输入,并共同估计像素明智的掌握配置以及作为输出的深度和旋转不变表示。然后通过元主动学习技术使用所获得的表示用于开放的对象识别。我们展示了我们在对象之前从未见过的方法的能力,并在模拟和真实世界设置中使用非常少数的例子快速学习新的对象类别。 |
The dynamic effect of mechanical losses of transmissions on the equation of motion of legged robots Authors Youngwoo Sim, Joao Ramos 由于其关节中的摩擦,工业机械手不会在其自身的重量下坍塌。虽然这些机制对于挑选和地方的刚性控制和地方的僵硬控制有效,但它们不适合必须迅速调节与环境互动的腿机器人。然而,由于致动器和传输中的机械损耗,不存在度量来量化机器人的性能下降。本文提供了一种基本配方,它利用变速器的机械效率来量化动力损耗在整个机器人系统动态的机械传输中的影响。我们定量表现出直观的事实,即机器人的表观惯性在存在关节摩擦的情况下增加。我们还表明,采用高齿轮比和低效变速器的机器人可以静态维持更大的外部负载。我们预计此处展示的框架将为设计可以有效地与世界有效互动的下一代腿机器人提供基本工具。 |
Drivers' Manoeuvre Modelling and Prediction for Safe HRI Authors Erwin Jose Lopez Pulgarin, Guido Herrmann, Ute Leonards 作为机器人和车辆等自治机器开始执行涉及人类用户的任务,确保它们之间的安全相互作用成为一个重要问题。从人体机器人交互的翻译方法将HRI研究转换为人类和其他高度复杂机器之间的相互作用。半自动车辆可以帮助推进在需要人类互动的情况下使用这些机器。一种方法涉及了解人类意图和决策,以估计人类的目前以及在与机器人互动时的近期行动。这个想法起源于心理学理论的心理概念,这已经广泛地探索了机器人,最近探索了自主和半自动车辆。在这项工作中,我们探讨了如何在通过组合来自人类运动,车辆状态和人类输入的数据来执行行动之前预测人类意图。方向盘,踏板。基于经常性神经网络模型的数据驱动方法用于对当前的驾驶操纵和预测要执行的未来操纵。状态转换模型与固定的一组手动使用,以在实时应用程序期间标记记录的数据。使用不同座椅偏好的驱动器进行培训和测试模型,实现了驾驶专业知识和臂长度精度,并召回超过95用于机动识别和86用于机动预测,预测时间窗为已知和未知的测试对象多达1秒的预测时间窗口。与我们之前的结果相比,未知测试对象的性能提高和机动预测,而不知道当前的操纵。 |
Curiosity-based Robot Navigation under Uncertainty in Crowded Environments Authors Kuanqi Cai, Weinan Chen, Chaoqun Wang, Shuang Song, Max Q. H. Meng Fellow, IEEE 移动机器人在日常生活中变得越来越受欢迎。在大规模和拥挤的环境中,如何使用本地化精度安全地导航是一个关键问题。为了解决这个问题,我们提出了一种基于好奇的框架,可以考虑人类舒适,本地化不确定性,人群以及去目标的成本来找到有效的路径。三部分涉及拟议的框架距离评估模块,信息丰富的地区的好奇心,以及拥挤地区的好奇消耗。提出了富裕地区信息的好奇心的增益,以引发机器人接近本地化参考标志性标志。为了保证人类舒适,同时与机器人共存,我们提出了宽敞的区域的好奇地区,以绕过人群并保持机器人和人类之间的适当距离。评估在一个非结构化环境中进行。结果表明,我们的方法可以找到一个可行的路径,可以考虑定位不确定性,同时避免拥挤的区域。 |
Learning and Executing Re-usable Behaviour Trees from Natural Language Instruction Authors Gavin Suddrey, Ben Talbot, Frederic Maire 国内和服务机器人有可能改变卫生保健和小规模制造等行业,以及我们生活的家园。但是,由于这些机器人的各种任务,预计这些机器人将完成,请从满足每个可能用户的需求的盒子解决方案中提供通用,这显然是棘手的。为了解决这个问题,因此,机器人必须能够在运行时学习如何完成新的任务,但还必须通过用户的需求来告知这些任务的解决方案。在本文中,我们展示了如何与自然语言指示结合使用的自然语言指导,以提供一种强大而模块化的控制架构,以指示自主代理学习和执行新型复杂任务的稳健和模块化控制架构。我们还展示了如何使用我们的方法生成的行为树可以推广到新颖的场景,并且可以在将来的学习剧集中使用,以创造日益复杂的行为。我们对现有的自然语言指令进行验证这项工作,展示了我们在解决玩具问题的模拟机器人的方法中的应用,以及两个不同的现实世界机器人平台,分别完成了块排序场景,以及巡逻情景。 |
Towards Robust GNSS Positioning and Real-time Kinematic Using Factor Graph Optimization Authors Weisong Wen, Li Ta Hsu 全球导航卫星系统GNSS是完全流行的来源之一,用于为自主系统提供全球参考定位。然而,由于来自建筑物的信号反射和阻塞,GNSS定位的表现在城市峡谷中受到严重挑战。鉴于GNSS测量是高度环境依赖性和时间相关的事实,用于GNSS定位的传统滤波方法不能同时探讨历史测量之间的时间相关性。结果,基于过滤的估计器对意外的异常值测量敏感。在本文中,我们介绍了一种基于因子图的GNSS定位和实时运动RTK的配方。制定的因子图框架有效地探索了伪奇,载波相位和多普勒测量的时间相关性,并导致GNSS接收器的非最小状态估计。使用基于滤波的估计器相比,使用在挑战城市峡谷中收集的数据集进行评估所提出的方法的可行性,并获得了基于滤波的滤波器的定位精度。 |
Robot in a China Shop: Using Reinforcement Learning for Location-Specific Navigation Behaviour Authors Xihan Bian, Oscar Mendez, Simon Hadfield 机器人需要能够在多个不同的环境中工作。即使在执行类似的任务时,也应该部署不同的行为以最适合当前环境。在本文中,我们提出了一种新的导航方法,它被视为多任务学习问题。这使得机器人能够在不同环境中学习在视觉导航任务中表现不同的,同时还在环境中学习共享的专业知识。我们在两种模拟环境以及真实世界数据中评估了我们的方法。我们的方法允许我们的系统通过26次训练时间收敛,同时也增加了准确性。 |
Three-agent Time-constrained Cooperative Pursuit-Evasion Authors Abhinav Sinha, Shashi Ranjan Kumar, Dwaipayan Mukherjee 本文考虑了三个代理人,追求者,追求者和后卫的追求逃避情景。我们为逃避者和后卫团队设计合作指导法,以防止攻击者的避难所。与差分游戏不同,最佳控制配方和其他启发式方法,我们提出了一种新颖的视角,使用时间约束指导方法为避难者后卫团队设计有效的非线性反馈控制法。避难所通过提供自己作为诱饵来诱使追捕者在碰撞过程中。与此同时,防守者通过对参与持续时间进行控制来保护避难所免受追求者。根据使命的性质,后卫可能会选择采取侵略性或防御性姿态。这种考虑扩大了所提出的方法在各种三种代理运动规划场景中的适用性,如飞机防御,资产保护,搜索,监控和安全运输。我们使用固定的时间滑模控制策略来设计Evader防御者团队的控制法和非线性有限时间干扰观察者,以估算追求的机动。最后,我们在各种接合几何形状下展示了对良好性能的模拟,从而巩固了所提出的设计的功效。 |
LiMIIRL: Lightweight Multiple-Intent Inverse Reinforcement Learning Authors Aaron J. Snoswell, Surya P. N. Singh, Nan Ye 多种意图逆钢筋学习MI IRR寻求找到奖励功能,以合理化不同但未标记的意图的演示。在最受欢迎的期望最大化EM框架中,用于学习概率MI IRL模型,我们基于在特征空间中的演示的前群体群体基于上部群集的热门启动策略。我们的理论分析表明,这种温暖的启动解决方案产生了近乎最佳的奖励集合,只要行为模式满足温和的分离条件。我们还提出了一种MI IRL性能指标,可以推广流行的预期价值差异措施,直接评估对地面真理奖励集合的学习奖励。我们的公制优雅地解决了通过Min Cost Flow Buildulation配对的难以使用的学习和地面真理奖励,并且有效地计算。我们还开发了一个允许更全面的算法评估的MI IRL基准测试问题。在这个问题上,我们发现我们的MI IRL温暖的启动策略有助于避免劣质的本地最小值奖励集合,从而提高行为聚类。我们广泛的敏感性分析表明,在各种环境下,学习奖励合奏的质量得到改善,包括我们理论假设不一定保持的情况。最后,我们通过在驾驶员GPS轨迹的大型真实世界数据集中发现不同的驾驶风格来证明我们的方法的有效性。 |
Necessary conditions for feedback stabilization and safety Authors Matthew D. Kvalheim, Daniel E. Koditschek Brockett S的条件产生了一种测试,以确定是否可以通过连续,纯度依赖反馈来确定系统是否稳定一些操作点。然而,对于许多真实世界的系统,人们希望稳定比单一要普通的套装。人们还希望通过制造障碍和其他危险集排斥来控制这样的系统。 |
Chinese Abs From Machine Translation |
Papers from arxiv.org
更多精彩请移步主页
pic from pexels.com