Uber的AI研发开放式教育课程,训练自己的机器人跨越障碍

在你遇到障碍之前,你必须学习爬行,在你读威廉莎士比亚之前,你需要知道字母表。任何教育工作者都知道掌握任务的分步课程计划的重要性。

现在,优步人工智能实验室(UberA)Lab)的研究人员设计了一种算法,该算法提出了自己的课程,用于教授模拟机器人以跨越困难的地形倒。因为它提供了完全靠自己生成机器学习的多样化和不断扩展的课程的潜力。该算法有一天可以帮助自动驾驶车辆在紧急情况下作出反应,这将带领Uber自动驾驶领域往前走一大步。

在机器学习的常规实践中,研究人员识别特定问题,然后专注于寻找或设计算法以实现最佳性能。然而,有时候,我们不仅仅想解决已知问题,因为未知问题也很重要。这些可能是暴露(和解决)关键的边缘情况(尤其,在安全应用中),但它们也必不可少,其解决方案可以帮助在更具挑战性的问题上取得进展。这样,Uber正在探索的算法是:

不断创造两个问题,并增加复杂性和多样性的解决方案。

开放性研究,提供了自我生成的课程和许多其他课程的好处:在最好的情况下,它可以无限期地继续在挑战的辐射树中产生新的任务,以及能够解决这一日益多样化和复杂的挑战的代理人。

开放式研究的最初灵感之一是自然进化,它发明了近乎永恒的天文复杂性。进化实际上是一个开放式的过程,在一次运行中创造了地球上所有形式的生命,这个过程仍在继续。值得注意的是,人类智能的产生就在这一个过程中。

近日发布的Paired Open-Ended Trailblazer(POET)的计划,将这些想法结合起来,明确地将这一系列研究推向新的任务,为他们优化解决方案,以及在任务之间转移代理以实现其他无法获得的进步。

首先提出了一系列独特的地形,每个地形都由一个由计算机控制的代理居住。只使用两条腿和一个类似激光的测距仪,代理自学走路。

经过一段时间的练习,人工智能调整挑战难度:有时使其更容易,有时更难。它可能使沟渠更宽,树桩更高,或地面更不均匀。

或者,偶尔换一个不同的助行器,看看在一个地形上学到的技能是否会对另一个地形有所帮助。这种障碍课程的变异和交换在敏捷的道路上创造了一系列不可预测的踏脚石。

使用POET,机器人步行者最终可以覆盖在没有早期课程的情况下无法学习的困难地形。更重要的是,POET比一个简单地增加地形难度的程序更好,而不需要尝试许多间接路径。POET的迂回学习路线一次又一次得到了预期效果。比如,在一个例子中,一个机器人蹲下来走路,直到遇到一个有树桩的世界,不得不学会直立行走; 它后来又回到了一个平坦的世界,并且一直保持行走,比以前更快地完成了这个过程。

研究人员表示,有一天,POET可以帮助现实生活中的机器人解决许多复杂的任务,甚至让自动驾驶汽车学会处理程序员没有考虑过的课程计划中的紧急情况,既可以展示独特的边缘情况,也可以展示解决方案。

在开放式的方式中,POET同样可以生产出迷人的新型软机器人对于独特的挑战,它发明只有软机器人才能解决。在更实际的层面上,它可以生成自动驾驶的模拟测试课程,甚至可以想到更奇特的应用,例如发明新的蛋白质或化学过程,其执行解决各种应用领域中的问题的新功能。如果存在任何可能存在多种变化的问题空间,POET可以通过它开辟道路。

我是科技人文关怀员,智能美学风向标,欢迎关注公众号id:get2ins,共同探讨。

欢迎在文末评论区留下您的真知灼见。:)

你可能感兴趣的:(Uber的AI研发开放式教育课程,训练自己的机器人跨越障碍)