在学者的眼中,未来的工业自动化很大程度上需要人类与机器人进行高效率的协作。然而,由于环境的复杂度和人类动作的随机性,机器人系统与机器学习算法的设计一直面临很大挑战。伯克利人工智能研究所(BAIR)近日撰文介绍了旗下机械系统控制实验室(MSC)开发的安全机器人交互系统,可以显著减少人机协作过程中问题的发生几率。
工厂机器人的实用化
现代工厂中的主要劳动力是人类和机器人。出于安全考虑,工厂通常会将机器人限制在金属笼中,以将人类和机器人分开,然而这一行为限制了生产线的生产力和灵活性。近年来,人们开始想要移除网箱,这样可以使人类和机器人合作,以建立真正的人机共存的工厂。制造商想要建立一条结合了人类的灵活性和机器人的生产力的有弹性的生产线。工业联合机器人的潜在好处是很大的,例如,他们可以加入人类和机器人同时工作的有弹性的生产线上,在这条生产线上机器人和人类会合作处理工件,工人也会自行部署 AGV(automated guided vehicles,自动导引运输车)来缓解工厂物流压力。在未来的工厂中,人机交互的情况会变得越来越多。与在结构化和确定性环境中工作的传统机器人不同,联合机器人要在非结构化和随机的环境中运行。在这之中的根本问题在于该如何确保联合机器人在不确定的动态环境中高效安全地运行。本文中,我们将介绍 MSC(http://msc.berkeley.edu/)实验室开发的安全的机器人交互系统。
图 1. 人与机器人合作的未来工厂。
现有的解决方案
包括 Kuka、Fanuc、Nachi、Yaskawa、Adept 和 ABB 在内的机器人制造商都在努力解决这个问题。也发布过一些安全的协作机器人或联合机器人,如 FANUC(日本)的 CR 系列(http://robot.fanucamerica.com/products/robots/collaborative-robot-fanuc-cr-35ia.aspx),Universal Robots(丹麦)的 UR5(http://www.universalrobots.com/GB/Products.aspx),Rethink Robotics(美国)的 Baxter(http://www.rethinkrobotics.com/products/baxter/),Kawada(日本)的 NextAge(http://singularityhub.com/2011/12/09/a-drop-in-solution-for-replacing-humanlabor-kawadas-nextage-robot/)和 Pi4_Robotics GmbH(德国)的 WorkerBot(http://spectrum.ieee.org/automaton/robotics/industrial-robots/pi4-workerbot-is-one-happy-factory-bot)等等。然而,这些产品的关注点都在于机器人本身的安全,如机械设计、制动和低等运动控制等方面。但在机器人与人类进行交互行为的安全性方面仍需不断探索,而这一行为也是机器人智能化(包括感知能力及高等行为的规划与控制等)的重点。
技术挑战
从技术上讲,设计工业联合机器人的行为极具挑战性。为了使工业联合机器人人性化,它们应该具备收集环境数据并分析这些数据的能力,以适应不同的任务和不同的环境,机器人还应能根据工人的需要自动调整。例如,在下图所示的人机协同组装过程中,机器人应该能够预测,一旦工人将两个工件放在一起时需要工具来固定组件。那么机器人应该能够拿到工具并交给工人,同时避免碰到工人。
图 2. 人与机器人协作组装工件。
为了实现这样的行为,我们在技术上的挑战在于:(1)人类行为的复杂性;(2)在不损失效率的情况下保证安全。人类运动的随机性给系统带来的巨大的不确定性难以保证机器人的安全和效率。
安全的机器人交互系统与实时非凸优化
MSC 实验室开发的安全的机器人交互系统(RSIS,robot safe interaction system)建立了一种设计机器人行为的方法,可以在人机交互过程中在保证安全的同时保证效率。
由于机器人需要与人类长期进行交互行为,让机器人模仿人类行为是很自然的。人类因有意识的思考或条件反射而发生互动行为。例如,前方发生追尾时后车司机会本能地踩刹车。然而,经过短暂的考虑后,司机可能会加速切入另一条车道以避免连锁追尾。前者是短期的安全反应行为,而后者需要计算当下的情况,例如,是否有停车的空间,是否有换车道的空位,换车道和马上停车哪个比较安全等。
现在有一种模拟了这种行为的并行计划和控制体系的结构,该结构包括长效规划器和短效规划器。长效规划器(效率控制器)强调效率,解决了低采样滚动时域优化中的长期最优控制问题。短效控制器(安全控制器)通过基于效率控制器规划轨迹解决高采样率的短期最优控制问题来解决实时安全问题。这种并行架构也解决了不确定的问题,长效规划器根据其他人最有可能的行为做出计划,短效规划器在短时间内考虑几乎所有的其他人可能的行动,以确保安全。
图 3. 机器人安全交互系统中的并行计划与控制体系结构。
然而,集成环境下的机器人运动规划问题具有高度的非线性和非凸性,因此难以实时解决。为了确保机器人对环境变化能做出即时的响应,该实验室开发了实时计算的快速算法,例如用于长效优化的 CFS(convex feasible set)算法和用于短效优化的 SSA(safe set algorithm)算法。这些算法在假设原始非凸问题具有凸目标函数的情况下,通过凸化来实现更快的计算,但是这样的处理限制在非凸情况下。CFS 通过迭代求解可行域中凸子集下的子问题。问题解的序列将会收敛到一个局部最优。CFS 比一般的非凸优化求解器(如 SQP(sequential quadratic programming)和 ITP(interior point method))迭代次数更少,运行速度更快。另一方面,SSA 使用不变集的思想将非凸状态空间约束转化为凸控制空间约束。
图 4. 在 CFS 算法中凸化的例子。
利用并行计划器和优化算法,机器人可以安全地与环境交互,并高效地完成任务。
图 5. 运动的实时计划与控制。
面向通用智能:安全高效的机器人协作系统(SERoCS,Safe and Efficient Robot Collaboration System)
我们现在在 MSC 实验室中研究 RSIS 的高级版本,这是一个安全高效的机器人协作系统(SERoCS, http://msc.berkeley.edu/research/serocs.html),它得到了国家科学基金会(NSF)的支持(Award#1734109 https://www.nsf.gov/awardsearch/showAward?AWD_ID=1734109&HistoricalAwards=false)。除了在人机交互(HRI,human-robot interactions)过程中安全地规划和控制运动的算法外,SERoCS 还包括用于环境监测的鲁棒的认知算法和保证人机协作安全的任务最佳规划算法。SERoCS 将显著扩大联合机器人的技能组合,防止或减少机器人和人类或机器人与机器人在运行过程中碰撞事故的发生,从而在未来可以实现和谐的人机协作。
参考资料
C. Liu, and M. Tomizuka,「Algorithmic safety measures for intelligent industrial co-robots,」in IEEE International Conference on Robotics and Automation (ICRA), 2016.
C. Liu, and M. Tomizuka,「Designing the robot behavior for safe human robot interactions」, in Trends in Control and Decision-Making for Human-Robot Collaboration Systems (Y. Wang and F. Zhang (Eds.)). Springer, 2017.
C. Liu, and M. Tomizuka,「Real time trajectory optimization for nonlinear robotic systems: Relaxation and convexification」, in Systems & Control Letters, vol. 108, pp. 56-63, Oct. 2017.
C. Liu, C. Lin, and M. Tomizuka,「The convex feasible set algorithm for real time optimization in motion planning」, arXiv:1709.00627.