论文阅读:MIT Cheetah 3: Design and Control of a Robust, Dynamic Quadruped Robot
结构方面,猎豹3采用一种新的腿部设计,除了扩大臀部和膝盖的运动范围外,还包括外展/内收自由度的本体感觉驱动。
控制器方面,猎豹3采用通用平衡和运动控制器,这些控制器嵌入到一个模块化的控制架构中,允许机器人通过反应性步态修改处理意外的地形干扰,而无需外部传感器或先验环境知识。
成果:高效性,具体体现:在多个步态中Cost of Transport (CoT)较低,在小跑(trotting)时最低 CoT为0.45。另外还具有盲目爬楼梯的能力。
总:猎豹3四足机器人平台是一种电力驱动的健壮机器人,能够在不确定的地形中进行无约束的3D移动。
DARPA机器人挑战赛(DRC)
Boston Dynamics[6]和IIT的HyQ四足动物[7]已经证明,液压执行器在大狗的腿部运动中的使用是成功的。这些机器人利用液压驱动系统在关节处输出巨大力的能力。
ETH的ANYmal[2]具有广泛的运动范围,通过使用串联弹性致动器(SEAs)在现实世界中完成自主任务。 SEAs 的特点是具有良好的冲击缓解特性,这对高速运动至关重要,并且具有出色的力控制能力。
麻省理工学院猎豹2号采用了一种定制的本体感知执行器设计,具有高度的冲击缓解、力控制和位置控制能力。这种设计使它能够自动跳过障碍物[3],并以6米/秒[8]的速度跳跃,但运动范围有限,限制了它在矢状面上的运动。
本文涵盖了设计和控制两个方面,从系统层面概述了MIT Cheetah 3强大、动态移动能力的重要组成部分。第二节介绍了主要的硬件平台设计注意事项。第三节描述了控制软件体系结构和组件。第四节显示了选定硬件实验的结果。最后,第五节讨论了机器人平台的含义以及未来的研究方向,这将使团队得以探索。
这里重点研究控制方面的内容,硬件设计内容简单浏览。
通过使用高扭矩密度电机和可反向驱动的单级行星齿轮减速器,以及低惯性腿,猎豹3机器人可以通过本体感知控制地面反作用力,而无需使用任何力传感器、扭矩传感器或关节或脚的串联合规性。
新型ab/ad执行器的运动范围超过±45◦, 而新的髋关节和膝关节设计允许机器人进行相同的向前、向后和翻转操作,并可能使用其腿完成简单的操作任务和移动
450瓦时的车载锂聚合物电池供电,提供大约2小时的运行时间,还可以加装电池以获得更长续航时间
分层的计算架构,使低级的腿部和运动控制能够以比运动控制更高的环路频率运行,并允许根据未来的感知、规划和导航任务的需要轻松扩展计算资源。
运动控制和状态估计由运动计算机处理: i7 CPU+Ubuntu Linux (kernel 4.1.33)
使用轻量级通信和编组(LCM)接收用户命令并记录数据[10]。LCM将允许用于视觉、规划和其他任务的其他计算机在未来轻松与移动计算机通信
腿部水平控制由基于ARM Cortex-A8的处理器执行。腿部控制器通过EtherCAT以1 kHz的频率与运动计算机通信,并在4 kHz时执行腿部水平控制任务,每个支腿控制器发送扭矩命令,并从每个支腿中的三个电机的无刷电机驱动器接收关节编码器测量值,这些电机以20 kHz采样率和400 Hz闭环带宽对电机执行电流控制。
用户向主计算机发送速度和转向命令以及一般可调参数。猎豹主控制计算机由三个主要部分组成:高级规划(绿色)、腿部和身体控制(红色)和状态估计(蓝色)。力和位置命令被发送到每条腿的微控制器,微控制器将电机命令转发给机器人。
猎豹的步态由一个基于事件的有限状态机(event-based finite state machine)定义,该状态机使用一个与腿无关的相位变量来安排名义接触和摆动阶段,这允许灵活的步态定义和它们之间的流体转换。
本文介绍了小跑Trotting、跳跃bounding和踱步pacing gaits步态。在腿部发生意外接触事件时,会修改此名义步态计划。
由于机器人不使用任何外部环境传感器,接触检测算法可能会融合编码器测量值、估计力和预期步态相位,以估计每条腿与物体接触的可能性[11]。
S-fai计划联系人 S-jian估计的联系人
定义以上两个布尔变量,用来使机器人可以区分正常操作、意外的早期接触和延迟错过的接触,以适当地调整其控制动作[11]。
机器人上使用的控制器利用简化的控制模型模板来优化足迹位置的地面反作用力。机器人的四肢较轻,与整个身体相比惯性较低。忽略腿部的影响,以规划来自站立脚的地面反作用力。
Cheetah 3控制器模型采用了一种常用的线性关系[12],[13],即机器人的平移加速度和身体角加速度ω,与作用在机器人四只脚上的力F之间的关系。控制器模型如下:
平衡控制器对重心和身体方向实施PD控制,同时确保脚力满足摩擦约束[12]。
PD控制律由下式给出:
期望角加速度反映了SO(3)上的PD控制,其中在期望和实际身体方向中,分别使用旋转矩阵Rd和R来描述,并且使用旋转的指数映射表示来获得方向误差[14],[15]。
平衡控制器的目标是解决腿力F的最佳分布,从而将近似的COM动力学驱动到以下给定的相应期望动力学:
由于控制器模型是线性的,控制器可以自然地表示为二次规划(QP)的解
上述公式反映了三个目标之间的折衷:将COM动态驱动到所需的值,最小化使用的力,以及惩罚当前QP解决方案和前一时间步的解决方案之间的偏差,F∗。矩阵S决定了控制旋转和平移运动的相对优先级,增益α>0和β>0决定了力归一化和解滤波的影响。约束条件CF≤0,以确保优化的力位于摩擦金字塔中,且法向力位于可行范围内;根据第III-A节所述的计划触点sφ,这些开关在支撑腿和摆动腿边界之间切换。
作为平衡控制器的替代方案,地面部队控制模块可以用模型预测控制器(MPC)代替,该控制器可以在更长的时间范围内分析轨迹结果。可以制定一种模型预测力规划方法来规划地面反作用力u,以最小化成本函数:
其中Qi和Ri是权重的半正定矩阵,Xi是机器人在时间步i的状态,包括位置,速度,方向和角速度,Xref 是机器人的理想状态,k是地平线的长度。
由于定向动力学具有非线性耦合效应,因此解决这个MPC是一个挑战。在最近的工作[17]中,基于时变近似的线性等式约束实现了近似动力学,使得MPC问题可以表述为二次规划。由此产生的控制器能够预测和计划飞行和欠驱动的周期。最佳力以30 Hz的频率更新,并直接发送到腿部控制器[17]。
使用Raibert启发式Raibert Heuristic[18]和捕获点公式Capture Point[19]中基于速度的反馈项的线性组合,从相应的臀部位置计算每个足迹位置。由于机器人没有外部环境传感器,因此足迹位置被投影到假定的地平面上。因此,根据以下公式,从机器人的臀部计算脚i在2D地平面上的台阶位置:
Tcφ是标称计划接触阶段(站姿)时间,z0是标称运动高度,phi提供相应髋关节i的位置。
带有前馈项的PD控制器用于计算关节力矩,以跟踪每只脚的笛卡尔摆动轨迹。前馈力在车载嵌入式PC上以1kHz的频率使用腿部动力学计算:
Ji是脚的雅可比矩阵雅各比矩阵,∧i是操作空间惯性矩阵,ai(ref)摆动轨迹的参考加速度,qi是关节构型的向量,Ci是科里奥利矩阵,Gi是重力产生的扭矩.
用于跟踪摆动轨迹的完整控制器为:
kP和kD是比例增益和微分增益的对角矩阵。笛卡尔PD控制器以4.5khz的速度在腿部控制器上运行
为了确保摆动腿PD控制器保持稳定,增益与腿的表观质量成比例,以保持大致相同的固有频率
Kp,j是Kp中的第j个对角线条目,ω des是期望的固有频率,Λjj是操作空间惯性矩阵中的第j个对角线项。
为了利用腿部运动的混合特性,定义了一个虚拟支撑多边形,以提供所需的CoM位置,该位置可推广到所有步态。通过预测接触模式切换,虚拟支撑多边形偏离接近接触阶段结束的腿部,并偏向即将着陆的腿部。该策略使机器人能够在步态过程中保持前进势头,同时使用选定的足迹位置创建平滑的参考轨迹,该轨迹自动适应在线立足点。
定义了一种基于阶段的方法,将每只脚的贡献分配给预测支持多边形,包括摆动中的脚。其目标是通过利用机器人的知识,设计一种知情的非线性相位相关加权策略,即哪些脚将是下一个起飞或着陆的脚,以及这些状态变化计划何时发生。根据接触和摆动阶段生成加权因子
Kcφ和K′cφ分别对应于计划接触和摆动阶段的自适应加权系数,Φ表示脚的总权重系数。大致上,这会通知机器人,腿越接近其接触阶段的中间,机器人就越有信心将腿作为支撑点,而腿越接近摆动阶段的中间,在不久的将来用于平衡的腿就越少。
使用基于相位的权重因子,为每条腿定义一组虚拟点。这些虚拟点提供了一种方法,可以连续加权每个支腿相对于其相邻支腿的预测相对可用性。在步态周期中,这些虚拟点在脚和相应的相邻脚之间的二维地面投影线之间滑动。每条腿,i∈ {FR ,FL, BR,BL}有两个虚点,由
上标表示顺时针指向相邻支腿(−), 或逆时针(+)
根据当前的脚位置,我们现在可以描述腿i的预测支撑多边形顶点
然后将所需的CoM位置作为这些加权虚拟支撑多边形顶点的平均值
为了让猎豹在没有视觉的情况下穿越楼梯和斜坡,我们使用每个足迹位置pi=(pxi,pyi,pzi)的测量值来近似行走表面的局部坡度,并调整机器人所需的姿势。特别是,行走曲面被建模为一个平面
系数a=(a0,a1,a2)T通过最小二乘问题的解获得
这将找到最适合收集每条腿最近接触点测量值的平面。请注意,px、py和pz包含每个支腿的数据,例如px=(px1、px2、px3、px4),而(WTW)†是WTW的摩尔-彭罗斯伪逆。估计的行走表面用于调整机器人的姿态,以适应不平坦的地形。
Cheetah 3通过两级传感器融合算法估计身体状态,该算法将身体方向估计与身体位置和速度估计分离。它首先使用IMU来估计方向。在这一阶段之后,它将加速计测量值与腿部运动学相融合,通过受[20]启发的程序来估计基础位置和速度。类似的两阶段方案最近也被用于HRP2类人机器人的状态估计,如[21]所述。
状态估计的第一阶段采用了使用IMU陀螺仪和加速计读数的方向滤波器[22]。该滤波器的主要思想是,陀螺仪提供高频方向动态的准确读数,而加速度计上存在重力偏差,使其能够在相对较低的频率下消除估计值的漂移。让方向估计0ˆRb作为身体相对于ICS的方向,过滤器根据
κ>0是一个校正增益,ωcorr是一个校正角速度,用于将加速度计读数ab与其重力偏差对齐
该项的去漂移时间常数可近似为κ−1.在实践中,κ在步态的高度动态部分被试探性地降低,其中||ab||k>>g
其中g是重力加速度,选择κref=0.1.该过程对消除俯仰和横摇漂移有效,然而,如果不使用视觉等外部感知信息进行融合,偏航时的误差积累是不可避免的[23]。
状态估计的第二阶段使用方向估计0ˆRb以及来自腿的运动学测量来估计基本位置和速度。与之前将该问题作为扩展卡尔曼滤波器提出的状态估计技术[20]不同,两阶段方法允许将该二次融合作为常规卡尔曼滤波器提出。这简化了滤波器的分析和调整,并保证滤波器方程在有限时间内不会发散。
在连续时间内,过程方程建模为
0pb表示身体的位置,0vb表示身体的速度,0ag=[0,0,−g] 重力加速度,0pi脚的位置,白噪声项wv和wpi表示加速计中的噪声和脚位置的任何变化。如[20]中所述,对脚位置的可变性进行建模,以考虑脚在站立时滑动的影响,或者也可以通过将脚上的过程噪声放大到较高水平来捕捉脚的摆动。将0ˆRbab+0ag视为系统的输入,这些方程表示一个线性时不变过程,因此适用于常规卡尔曼滤波。使用与[20]相同的程序,将连续时间模型转换为具有1ms时间步长的离散时间。
腿部运动学提供了每只脚和身体之间的相对位置向量的测量值,以确定每只脚的0ˆpb、0ˆvb和0ˆpi。让0prel(qi,0ˆRb)表示由运动学计算的相对脚位置,生成测量残差:
类似地,脚相对于身体的速度可以通过腿部角度、速度、身体方向和角速度来计算。该计算表示为0˙prel(qi,˙qi,0ˆRb,bωb)。假设每只脚都是固定的,这就提供了相关的测量残差:
最后,假设每只脚的接触高度hi与相关测量残差:
随机多变量高斯函数用于捕捉每个残差的测量误差。与脚部的过程噪声wpi类似,在摆动过程中,脚部 i 的测量协方差增加到一个较高的值,因此在该融合过程中,摆动腿的测量被有效地忽略。虽然空间允许充分开发,但残差在卡尔曼滤波器的创新步骤中使用,以提供0ˆpb、0ˆvb和0ˆpi的估计值,用于向平衡控制或MPC组件反馈。
在同一框架内控制不同动态步态的能力,利用猎豹的大范围运动设计增强的能力,以及在没有外部地形信息的情况下穿越楼梯的能力。
小跑是通过使用第III-C节所述的瞬时反应性QP控制器,以及第III-D节中描述的凸面MPC。只有通过使用凸面MPC才能进行跳跃和步态调整,因为它们需要对即将到来的飞行时间进行预测,以便在整个步态中保持平衡。
由于机器人地面反作用力控制规划独立于腿部配置,因此无论膝盖指向何处,都可能发生运动,如图6a所示。新设计结合了ab/ad自由度的强大定制电机,机器人获得了施加大侧向力的能力。机器人获得了一个改进的运动范围,允许图6b所示的夸张的偏航运动。此外,由于没有明确的前方或顶部,机器人能够在身体上方完全旋转腿。在腿部设计中使用链条使机器人能够全方位旋转膝关节,如图6c所示。在未来,这一点可以被利用,使机器人能够使用腿进行运动,以及与周围环境互动和执行任务。
使用第III-A节中提到的接触检测算法,可以检测到与楼梯等物体的意外碰撞,并通过基于事件的步态调度器修改摆动脚轨迹和平衡策略。一旦机器人感知到台阶,它会根据第III-G节调整姿势,并期望接触点位于估计的平面上。
为了进行测试,建造了一座7英寸(17.8厘米)高、11英寸(27.9厘米)长的楼梯。图7显示了机器人在爬楼梯实验中成功到达楼梯顶部平台的过程。
这种反应性感知和适应意外障碍的能力表明,机器人能够在不依赖精确感知和规划的情况下,稳健地操作和适应现实、无结构和不断变化的地形。
本文介绍了麻省理工学院猎豹3四足机器人作为一种新型的腿部机器人平台。MIT Cheetah 2相比,这款机器人的设计有所改进,具有更大的运动范围和全3D控制能力。在不使用外部传感的情况下证明的鲁棒性意味着它能够在执行控制策略之前,在不依赖环境知识的情况下,在具有挑战性的情况下成功移动。
通用控制体系结构允许使用任意数量的不同控制器,只需对软件或硬件进行最小的修改。一种新型非线性策略正则化模型预测控制框架(PR-MPC)的有希望的初步结果进一步扩展了当前控制器,通过使用简单的基于物理的启发式算法优化地面反作用力和足迹位置,使预测正则化[25]。该机器人将智能地决定在任何给定步态下脚的最佳位置,并利用其动力学进行稳态运动和干扰抑制。
虽然机器人目前通过接收用户输入的指令速度和转弯速度来运行,但将开发更高级别的路径规划器,以便在世界范围内实现自主操作。这种更高级别的规划器可以自然地集成到框架中,既可以作为路径规划器,也可以为增强控制器和状态估计提供信息。