轨迹跟踪—线性 MPC 控制算法

轨迹跟踪—线性 MPC 控制算法

在自动驾驶和无人车领域的路径规划常常被分为运动轨迹生成与车辆路径跟踪控制两个部分。传统的基于几何条件的跟踪算法如pure-pursuit由于没有考虑车辆运动学导致控制精度和稳定性等方面存在不足,因此目前大部分采用线性MPC控制算法,从而平衡控制精度与计算量。

本文首先介绍通用的MPC控制流程,对这一基于优化的控制理论有一定的认知。然后对常见的差速运动模型和自行车模型进行运动学分析,接着针对轨迹跟踪问题介绍如何将通用MPC算法应用至轨迹跟踪问题。最后基于开源代码对整体代码流程进行进一步的理解。

MPC控制算法

状态量 z z z:系统的状态(也可认为是系统输出量),通常可以构成一个空间,如车辆状态 ( x , y , θ ) T ∈ S E 2 (x,y,\theta)^T \in SE2 (x,y,θ)TSE2

控制量 u u u:系统的输入量,不同的系统模型有不同的控制参数

系统模型:描述系统输入与输出的精确关系,通常是非线性的关系。

采用增量的形式对系统模型进行表达:
z k + 1 = f ( z k ) + g ( u k ) z_{k+1} = f(z_k) + g(u_k) zk+1=f(zk)+g(uk)

线性系统模型:系统模型的线性化结果,用于近似求解,具有速度快、不会陷入局部极值的优势。
z k + 1 = A ∗ z k + B ∗ u k + C z_{k+1} = A * z_{k} + B * u_k + C zk+1=Azk+Buk+C
其中,矩阵 A , B A,B A,B的求解过程如下:

  1. 非线性模型离散化
    z k + 1 = z k + z k ˙ ( z k , u k ) d t z_{k+1}=z_{k} + \dot{z_k}(z_k, u_k)dt zk+1=zk+zk˙(zk,uk)dt
  2. z ˉ , u ˉ \bar{z},\bar{u} zˉ,uˉ位置进行泰勒展开
    z k + 1 = z k + ( z k ˙ ( z ˉ , u ˉ ) + ∂ z k ˙ ∂ z ( z k − z ˉ ) + ∂ z k ˙ ∂ u ( u k − u ˉ ) ) d t z_{k+1} = z_k + (\dot{z_k}(\bar{z},\bar{u}) + \frac{\partial \dot{z_k}}{\partial z}(z_k - \bar{z}) + \frac{\partial \dot{z_k}}{\partial u}(u_k - \bar{u}))dt zk+1=zk+(zk˙(zˉ,uˉ)+zzk˙(zkzˉ)+uzk˙(ukuˉ))dt
    z k + 1 = ( I + d t ∂ z k ˙ ∂ z ) z k + d t ∂ z k ˙ ∂ u u k + ( z k ˙ ( z ˉ , u ˉ ) − ∂ z k ˙ ∂ z z ˉ − ∂ z k ˙ ∂ u u ˉ ) d t z_{k+1} = (I+dt\frac{\partial \dot{z_k}}{\partial z}) z_k + dt\frac{\partial \dot{z_k}}{\partial u}u_k + (\dot{z_k}(\bar{z},\bar{u}) - \frac{\partial \dot{z_k}}{\partial z}\bar{z} - \frac{\partial \dot{z_k}}{\partial u} \bar{u})dt zk+1=(I+dtzzk˙)zk+dtuzk˙uk+(zk˙(zˉ,uˉ)zzk˙zˉuzk˙uˉ)dt
    因此有:
    A = ( I + d t ∂ z k ˙ ∂ z ) A=(I+dt\frac{\partial \dot{z_k}}{\partial z}) A=(I+dtzzk˙)
    B = d t ∂ z k ˙ ∂ u B=dt\frac{\partial \dot{z_k}}{\partial u} B=dtuzk˙
    C = ( z k ˙ ( z ˉ , u ˉ ) − ∂ z k ˙ ∂ z z ˉ − ∂ z k ˙ ∂ u u ˉ ) d t C=(\dot{z_k}(\bar{z},\bar{u}) - \frac{\partial \dot{z_k}}{\partial z}\bar{z} - \frac{\partial \dot{z_k}}{\partial u} \bar{u})dt C=(zk˙(zˉ,uˉ)zzk˙zˉuzk˙uˉ)dt
  3. 对于导数 ∂ z k ˙ ∂ z , ∂ z k ˙ ∂ u \frac{\partial \dot{z_k}}{\partial z},\frac{\partial \dot{z_k}}{\partial u} zzk˙,uzk˙,则需要根据具体模型得到。

目标函数:系统的期望状态,即当前控制系统最优的、理想的目标,采用最小化或最大化某个函数表达。
例如,对于轨迹跟踪问题:
1)跟踪的误差尽可能小
2)加速度尽量小,保证运动平滑
3)…

约束项:系统状态的先验约束(硬约束,一定不能违背的部分)
例如,
1)初始状态不变
2)满足线性模型
3)…

问题求解

问题:在满足约束条件的前提下,计算得到最优的控制量 u u u,使得目标函数最小。

具体来说就是将问题转换为二次规划问题即,

  1. 目标函数用状态量表达 + 线性模型表达成一个二次函数形式。
  2. 约束用状态量线性函数表达

由于模型被线性化,因此得到的目标函数总是一个多维二次函数,而约束条件为线性的。因此本问题可以直接采用二次规划的方法进行求解。具体可参考凸优化、数值优化等书籍。

具体的例子将在后续进行分析。

车辆运动学

自行车模型

状态向量
z = [ x , y , v , ϕ ] T z = [x,y,v,\phi]^T z=[x,y,v,ϕ]T

其中, x , y , ϕ x,y,\phi x,y,ϕ为车辆在世界坐标系下的位置及角度。 v v v为车辆当前的速度。
控制量
u = [ a , δ ] T u = [a, \delta]^T u=[a,δ]T

其中, a a a为车辆加速度,而 δ \delta δ为前轮转向角度

自行车模型如下图所示:
轨迹跟踪—线性 MPC 控制算法_第1张图片

根据几何关系有
v x = v cos ⁡ ( θ ) v_x=v \cos(\theta) vx=vcos(θ) v y = v sin ⁡ ( θ ) v_y=v \sin(\theta) vy=vsin(θ)
R = L tan ⁡ ( δ ) R = \frac{L}{\tan(\delta)} R=tan(δ)L
且有
ω = v R = v tan ⁡ δ L \omega=\frac{v}{R}=\frac{v \tan{\delta}}{L} ω=Rv=Lvtanδ

状态向量的导数
z ˙ = [ v cos ⁡ ( ϕ ) v sin ⁡ ( ϕ ) a v tan ⁡ δ L ] \dot{z} = \left[\begin{matrix} v \cos(\phi) \\ v \sin(\phi)\\ a \\ \frac{v \tan{\delta}}{L} \end{matrix}\right] z˙=vcos(ϕ)vsin(ϕ)aLvtanδ

因此有:
∂ z ˙ ∂ z = [ 0 0 c o s ( ϕ ) − v sin ⁡ ( ϕ ) 0 0 s i n ( ϕ ) v cos ⁡ ( ϕ ) 0 0 0 0 0 0 tan ⁡ δ L 0 ] \frac{\partial \dot{z}}{\partial z}=\left[\begin{matrix} 0 & 0 & cos(\phi) & -v \sin(\phi) \\ 0 & 0 & sin(\phi) & v \cos(\phi)\\ 0 & 0 & 0 & 0\\ 0 & 0 & \frac{\tan{\delta}}{L} & 0 \end{matrix}\right] zz˙=00000000cos(ϕ)sin(ϕ)0Ltanδvsin(ϕ)vcos(ϕ)00

∂ z ˙ ∂ u = [ 0 0 0 0 1 0 0 v L cos ⁡ 2 ( δ ) ] \frac{\partial \dot{z}}{\partial u}=\left[\begin{matrix} 0 & 0 \\ 0 & 0 \\ 1 & 0 \\ 0 & \frac{v}{L \cos^2(\delta)} \end{matrix}\right] uz˙=0010000Lcos2(δ)v

最终得到线性模型:
z k + 1 = A ∗ z k + B ∗ u k + C z_{k+1} = A * z_{k} + B * u_k + C zk+1=Azk+Buk+C

A = ( I + d t ∂ z k ˙ ∂ z ) = [ 1 0 c o s ( ϕ ) d t − v sin ⁡ ( ϕ ) d t 0 1 s i n ( ϕ ) d t v cos ⁡ ( ϕ ) d t 0 0 1 0 0 0 tan ⁡ δ L d t 1 ] A = (I+dt\frac{\partial \dot{z_k}}{\partial z})=\left[\begin{matrix} 1 & 0 & cos(\phi)dt & -v \sin(\phi) dt\\ 0 & 1 & sin(\phi)dt & v \cos(\phi) dt\\ 0 & 0 & 1 & 0\\ 0 & 0 & \frac{\tan{\delta}}{L} dt & 1 \end{matrix}\right] A=(I+dtzzk˙)=10000100cos(ϕ)dtsin(ϕ)dt1Ltanδdtvsin(ϕ)dtvcos(ϕ)dt01
B = d t ∂ z k ˙ ∂ u = [ 0 0 0 0 d t 0 0 v L cos ⁡ 2 ( δ ) d t ] B=dt\frac{\partial \dot{z_k}}{\partial u}=\left[\begin{matrix} 0 & 0 \\ 0 & 0 \\ dt & 0 \\ 0 & \frac{v}{L \cos^2(\delta)} dt \end{matrix}\right] B=dtuzk˙=00dt0000Lcos2(δ)vdt
C = ( z k ˙ ( z ˉ , u ˉ ) − ∂ z k ˙ ∂ z z ˉ − ∂ z k ˙ ∂ u u ˉ ) d t = [ v sin ⁡ ( ϕ ) ϕ d t − v cos ⁡ ( ϕ ) ϕ d t 0 − v δ L cos ⁡ 2 ( δ ) d t ] C=(\dot{z_k}(\bar{z},\bar{u}) - \frac{\partial \dot{z_k}}{\partial z}\bar{z} - \frac{\partial \dot{z_k}}{\partial u} \bar{u})dt=\left[\begin{matrix} v \sin(\phi)\phi dt\\ -v \cos(\phi)\phi dt \\ 0 \\ -\frac{v\delta}{L\cos^2(\delta)} dt \end{matrix}\right] C=(zk˙(zˉ,uˉ)zzk˙zˉuzk˙uˉ)dt=vsin(ϕ)ϕdtvcos(ϕ)ϕdt0Lcos2(δ)vδdt

差速模型

状态向量
z = [ x , y , ϕ ] T z = [x,y,\phi]^T z=[x,y,ϕ]T

其中, x , y , ϕ x,y,\phi x,y,ϕ为车辆在世界坐标系下的位置及角度。

控制量
u = [ v r , v l ] T u = [v_r, v_l]^T u=[vr,vl]T
分别为左轮速度 v l v_l vl和右轮速度 v r v_r vr
轨迹跟踪—线性 MPC 控制算法_第2张图片

状态向量的导数

z ˙ = [ v r + v l 2 cos ⁡ ( ϕ ) v r + v l 2 sin ⁡ ( ϕ ) v r − v l D ] \dot{z} = \left[\begin{matrix} \frac{v_r + v_l}{2}\cos(\phi) \\ \frac{v_r + v_l}{2} \sin(\phi)\\ \frac{v_r - v_l}{D} \end{matrix}\right] z˙=2vr+vlcos(ϕ)2vr+vlsin(ϕ)Dvrvl

因此有:
∂ z ˙ ∂ z = [ 0 0 − v r + v l 2 sin ⁡ ( ϕ ) 0 0 v r + v l 2 cos ⁡ ( ϕ ) 0 0 0 ] \frac{\partial \dot{z}}{\partial z}=\left[\begin{matrix} 0 & 0 & -\frac{v_r + v_l}{2} \sin(\phi) \\ 0 & 0 & \frac{v_r + v_l}{2} \cos(\phi) \\ 0 & 0 & 0 \\ \end{matrix}\right] zz˙=0000002vr+vlsin(ϕ)2vr+vlcos(ϕ)0

∂ z ˙ ∂ u = [ cos ⁡ ( ϕ ) 2 cos ⁡ ( ϕ ) 2 sin ⁡ ( ϕ ) 2 sin ⁡ ( ϕ ) 2 1 D − 1 D ] \frac{\partial \dot{z}}{\partial u}=\left[\begin{matrix} \frac{\cos(\phi)}{2} & \frac{\cos(\phi)}{2} \\ \frac{\sin(\phi)}{2} & \frac{\sin(\phi)}{2} \\ \frac{1}{D} & -\frac{1}{D} \\ \end{matrix}\right] uz˙=2cos(ϕ)2sin(ϕ)D12cos(ϕ)2sin(ϕ)D1

最终得到线性模型:
z k + 1 = A ∗ z k + B ∗ u k + C z_{k+1} = A * z_{k} + B * u_k + C zk+1=Azk+Buk+C

A = ( I + d t ∂ z k ˙ ∂ z ) = [ 1 0 − v r + v l 2 sin ⁡ ( ϕ ) d t 0 1 v r + v l 2 cos ⁡ ( ϕ ) d t 0 0 1 ] A = (I+dt\frac{\partial \dot{z_k}}{\partial z})=\left[\begin{matrix} 1 & 0 & -\frac{v_r + v_l}{2} \sin(\phi) dt \\ 0 & 1 & \frac{v_r + v_l}{2} \cos(\phi) dt\\ 0 & 0 & 1 \\ \end{matrix}\right] A=(I+dtzzk˙)=1000102vr+vlsin(ϕ)dt2vr+vlcos(ϕ)dt1
B = d t ∂ z k ˙ ∂ u = [ cos ⁡ ( ϕ ) 2 d t cos ⁡ ( ϕ ) 2 d t sin ⁡ ( ϕ ) 2 d t sin ⁡ ( ϕ ) 2 d t 1 D d t − 1 D d t ] B=dt\frac{\partial \dot{z_k}}{\partial u}=\left[\begin{matrix} \frac{\cos(\phi)}{2} dt & \frac{\cos(\phi)}{2} dt \\ \frac{\sin(\phi)}{2} dt & \frac{\sin(\phi)}{2} dt \\ \frac{1}{D} dt & -\frac{1}{D} dt \\ \end{matrix}\right] B=dtuzk˙=2cos(ϕ)dt2sin(ϕ)dtD1dt2cos(ϕ)dt2sin(ϕ)dtD1dt
C = ( z k ˙ ( z ˉ , u ˉ ) − ∂ z k ˙ ∂ z z ˉ − ∂ z k ˙ ∂ u u ˉ ) d t = [ v r + v l 2 sin ⁡ ( ϕ ) ϕ d t − v r + v l 2 cos ⁡ ( ϕ ) ϕ d t 0 ] C=(\dot{z_k}(\bar{z},\bar{u}) - \frac{\partial \dot{z_k}}{\partial z}\bar{z} - \frac{\partial \dot{z_k}}{\partial u} \bar{u})dt=\left[\begin{matrix} \frac{v_r + v_l}{2}\sin(\phi)\phi dt\\ -\frac{v_r + v_l}{2} \cos(\phi)\phi dt \\ 0 \end{matrix}\right] C=(zk˙(zˉ,uˉ)zzk˙zˉuzk˙uˉ)dt=2vr+vlsin(ϕ)ϕdt2vr+vlcos(ϕ)ϕdt0

算法流程

轨迹跟踪—线性 MPC 控制算法_第3张图片

将控制时间以 d t dt dt的间隔进行离散成 t 0 − t 3 t_0-t_3 t0t3四个时刻。根据上一次优化得到的控制量 u 0 − u 2 u_0-u_2 u0u2能够根据非线性模型预测得到四个时刻的状态即 x 0 − x 3 x_0-x_3 x0x3。并且由参考轨迹给出参考位置 x r e f , 0 − 3 x_{ref,0-3} xref,03

目标函数:

  1. 控制量尽可能小
    c o s t 1 = ∥ u 0 ∥ 2 + ∥ u 1 ∥ 2 + ∥ u 2 ∥ 2 cost_1 = \|u_0\|^2+\|u_1\|^2+\|u_2\|^2 cost1=u02+u12+u22

  2. 控制量的变化尽可能小
    c o s t 2 = ∥ u 1 − u 0 ∥ 2 + ∥ u 2 − u 1 ∥ 2 cost_2 = \|u_1 - u_0\|^2+\|u_2-u_1\|^2 cost2=u1u02+u2u12

  3. 中间状态均尽可能接近目标状态
    c o s t 3 = ∥ x r e f , 0 − x 0 ∥ + ∥ x r e f , 1 − x 1 ∥ + ∥ x r e f , 2 − x 2 ∥ cost_3=\|x_{ref,0} - x_0\|+\|x_{ref,1} - x_1\|+\|x_{ref,2} - x_2\| cost3=xref,0x0+xref,1x1+xref,2x2

  4. 结束状态尽可能接近目标状态(权重更大)
    c o s t 4 = ∥ x r e f , 3 − x 3 ∥ 2 cost_4=\|x_{ref,3} - x_3\|^2 cost4=xref,3x32

最终目标为加权和:
c o s t = w 1 ⋅ c o s t 1 + w 2 ⋅ c o s t 2 + w 3 ⋅ c o s t 3 + w 4 ⋅ c o s t 4 cost = w_1 \cdot cost_1 + w_2 \cdot cost_2 + w_3 \cdot cost_3 + w_4 \cdot cost_4 cost=w1cost1+w2cost2+w3cost3+w4cost4

约束条件:

  1. 满足线性模型 x t + 1 = A x t + B u t + C x_{t+1}=A x_t + B u_t + C xt+1=Axt+But+C
    x 1 = A 0 x 0 + B 0 u 0 + C 0 x 2 = A 1 x 1 + B 1 u 1 + C 1 x 3 = A 2 x 2 + B 2 u 2 + C 2 x_1 = A_0 x_0 + B_0 u_0 + C_0\\ x_2 = A_1 x_1 + B_1 u_1 + C_1 \\ x_3 = A_2 x_2 + B_2 u_2 + C_2 x1=A0x0+B0u0+C0x2=A1x1+B1u1+C1x3=A2x2+B2u2+C2
    其中, A 0 − 2 , B 0 − 2 , C 0 − 2 A_{0-2},B_{0-2},C_{0-2} A02,B02,C02分别为模型在 x ˉ 0 − 2 \bar{x}_{0-2} xˉ02处,分别进行泰勒展开计算得到。而 x ˉ 0 − 2 \bar{x}_{0-2} xˉ02则为根据上一次优化结果预测系统在 t 0 − 2 t_{0-2} t02时刻的状态。
  2. 控制量的变化小于最大允许值 ∣ u t + 1 − u t ∣ < m a x u ⋅ d t |u_{t+1}-u_t|ut+1ut<maxudt
  3. 初始状态始终保持不变 x 0 = x l a s t , 0 x_0=x_{last,0} x0=xlast,0
  4. 其他
    1. 最大、最小速度约束
    2. 最大控制量约束

求解:

c o s t = w 1 ⋅ c o s t 1 + w 2 ⋅ c o s t 2 + w 3 ⋅ c o s t 3 + w 4 ⋅ c o s t 4 = w 1 ⋅ ( ∥ u 0 ∥ 2 + ∥ u 1 ∥ 2 + ∥ u 2 ∥ 2 ) + w 2 ⋅ ( ∥ u 1 − u 0 ∥ 2 + ∥ u 2 − u 1 ∥ 2 ) + w 3 ⋅ ( ∥ x r e f , 0 − x 0 ∥ 2 + ∥ x r e f , 1 − x 1 ∥ 2 + ∥ x r e f , 2 − x 2 ∥ 2 ) + w 4 ⋅ ∥ x r e f , 3 − x 3 ∥ 2 \begin{aligned} cost = & w_1 \cdot cost_1 + w_2 \cdot cost_2 + w_3 \cdot cost_3 + w_4 \cdot cost_4 \\ =&w_1 \cdot (\|u_0\|^2+\|u_1\|^2+\|u_2\|^2) + \\ &w_2 \cdot (\|u_1 - u_0\|^2+\|u_2-u_1\|^2) + \\ &w_3 \cdot (\|x_{ref,0} - x_0\|^2+\|x_{ref,1} - x_1\|^2+\|x_{ref,2} - x_2\|^2) + \\ & w_4 \cdot \|x_{ref,3} - x_3\|^2 \end{aligned} cost==w1cost1+w2cost2+w3cost3+w4cost4w1(u02+u12+u22)+w2(u1u02+u2u12)+w3(xref,0x02+xref,1x12+xref,2x22)+w4xref,3x32

其中前两项为 [ u 0 , u 1 , u 2 ] T [u_0,u_1,u_2]^T [u0,u1,u2]T的二次函数,后面两项中有:
x 0 = x l a s t , 0 = c o n s t x 1 = A 0 x 0 + B 0 u 0 + C 0 = B 0 u 0 + C 0 ′ x 2 = A 1 x 1 + B 1 u 1 + C 1 = A 1 ( B 0 u 0 + C 0 ′ ) + B 1 u 1 + C 1 = A 1 B 0 u 0 + B 1 u 1 + C 1 ′ x 3 = A 2 x 2 + B 2 u 2 + C 2 = A 2 ( A 1 B 0 u 0 + B 1 u 1 + C 1 ′ ) + B 2 u 2 + C 2 = A 2 A 1 B 0 u 1 + A 2 B 1 u 0 + B 2 u 2 + C 2 ′ \begin{aligned} x_0 &= x_{last,0} = const \\ x_1 &= A_0 x_0 + B_0 u_0 +C_0 = B_0u_0 + C^{'}_0 \\ x_2 &= A_1 x_1 + B_1 u_1 +C_1 = A_1 (B_0u_0 + C^{'}_0) + B_1 u_1 +C_1 \\ &= A_1 B_0 u_0 +B_1 u_1 + C^{'}_1\\ x_3 &= A_2 x_2 + B_2 u_2 +C_2=A_2 (A_1 B_0 u_0 +B_1 u_1 + C^{'}_1) + B_2 u_2 +C_2 \\ &= A_2A_1B_0 u_1 + A_2 B_1 u_0 + B_2 u2 + C^{'}_2 \end{aligned} x0x1x2x3=xlast,0=const=A0x0+B0u0+C0=B0u0+C0=A1x1+B1u1+C1=A1(B0u0+C0)+B1u1+C1=A1B0u0+B1u1+C1=A2x2+B2u2+C2=A2(A1B0u0+B1u1+C1)+B2u2+C2=A2A1B0u1+A2B1u0+B2u2+C2

因此后面两项均同样为 [ u 0 , u 1 , u 2 ] T [u_0,u_1,u_2]^T [u0,u1,u2]T的二次函数,因此代价函数整体都是二次的,可直接采用二次规划算法进行求解。

你可能感兴趣的:(机器人,机器人,MPC,模型预测控制,轨迹跟随,无人车)