本课程由Apollo平台fuyiqun主讲,视频链接如下:现场录屏,另外有官方解析文章:直播回顾丨Apollo自动驾驶论坛①规划模块算法解析(本篇另增问答整理),视频官方PPT在此(可免费下载)。下面是随堂记录。
本文将为大家介绍Apollo规划模块(Planning)的算法解析,主要内容包括:
功能:基于预测的结果、路由模块(routing)的全局路线指引和地图信息,生成安全舒适的驾驶轨迹。
首先输入来自3个模块,包括Prediction、Chassis、Localization,目前Palnning模块是由这3个消息来触发的,触发之后我们会创建几个reader来读取Traffic Light和Routing信息,最后的输出是ADC Trajectory,也就是Planning的轨迹线。
在Apollo中,Planning的场景和任务管理是如何实现的?我们有一个双层的状态管理机,上层是一个场景管理器,叫做Scenario Manager,这里举了3个场景的例子,Pull Over、Parking、Junction,每个场景的配置文件/参数是不一样的。
有了场景之后,会基于不同的规划器(Planner)进行规划,Apollo中目前(20201219)有俩个Planner,一个是On Lane Planning Tasks(目前的主要规划方法),一个是Open Space Planning Tasks(泊车)。
On Lane Planning Tasks是默认的规划器,接下来重点介绍(Open Space Planning Tasks在GitHub有相关的论文和代码)。
有了规划器之后,会通过Path decision,把道路边界测出来。主要是通过不同脚本的task拆分完成的,比如Path decision,可以拆分成Lane Borrow和Lane Change。当decision做好之后,还会进行Path Planning。
有了轨迹后,可以再进行速度决策,速度决策也是通过小的task进行的。这里列了两个:
有了Speed decision之后,用Speed的Optimizer ,来进行速度的规划。
首先为什么要进行Frenet Frame?可以将笛卡尔坐标系下的运动状态进行了横纵向的分解。横向是指车辆l离我们的reference line的距离,纵向是沿着reference line走了多远,用s来表示。
通过这样的拆分,相当于把Planning降维了,可以大大的降低计算的复杂度。
介绍下reference line smoother是如何做的:我们会直接优化离散点位置,用QCQP来解优化点间曲率,这样的运算时间大概是10ms。具体Cost Function如上图:
上式的约束条件:
下面简单介绍下曲率限制的推导过程,另有一篇文章详细描述Apollo中的离散点平滑方法:
假设:
接下来我们可以进行计算:
∣ ∣ 2 P i − P i − 1 − P i + 1 ∣ ∣ ||2P_i-P_{i-1}-P_{i+1}|| ∣∣2Pi−Pi−1−Pi+1∣∣两个向量之间的差值约等于 2 ∗ ∣ ∣ P i − P i − 1 ∣ ∣ ∗ s i n ( θ i / 2 ) 2*||P_i-P_{i-1}||*sin(\theta_i/2) 2∗∣∣Pi−Pi−1∣∣∗sin(θi/2),又因为 θ \theta θ足够小,所以约等于 ∣ ∣ P i − P i − 1 ∣ ∣ ∗ θ i ||P_i-P_{i-1}||*\theta_i ∣∣Pi−Pi−1∣∣∗θi,再对 θ \theta θ进行曲率的转化,就可以变成 ∣ ∣ P i − P i − 1 ∣ ∣ 2 / R ||P_i-P_{i-1}||^2/R ∣∣Pi−Pi−1∣∣2/R,因为有最小的转弯半径,所以有了图中的不等式,也就是我们的约束条件。
有了约束条件我们就可以对原来的Loss Function进行求解。
接下来介绍下基于规则的路径和速度决策,即Path boundary和Speed boundary是如何生成的。
如图所示,存在这样一个场景:车辆在正常行驶,在它的前方停了一个障碍车。
这时,来看一下Path Bound Decision是如何做的。首先,车在起始状态时,会判断需不需要进行换道:
此算法Piecewise Jerk Path Optimization主要思想是将车辆横向位置运动当作一个三阶系统,应用模型预测的方法求解二次规划问题。这个方法的单帧运算时间大概是10ms。
上图为Piecewise Jerk Path Optimization的全貌,左边为状态空间,右边第一部分为Cost Function,第二部分是Cost Function的展开,最下方是限制条件。
详细为大家介绍下:
States
首先将车辆横向位置运动建模成三阶系统 l i → i + 1 ′ ′ ′ = l i + 1 ′ ′ − l i ′ ′ △ s l^{'''}_{i→i+1}=\frac{l^{''}_{i+1}-l^{''}_{i}}{△ s} li→i+1′′′=△sli+1′′−li′′,然后进行Multiple shooting formulation对 △ s △ s △s进行采样,最后对状态进行泰勒展开,得到的结果就是我们的状态空间。
Objectives
接下来讨论下Cost Function优化函数是如何得到的:
左边是优化函数,做优化的目的是让车辆可以保持安全、舒适的行驶,生成一个相对安全和舒适的轨迹。
其中:
表示车辆位置与boundary中心的距离, l i l_i li表示车辆偏离s的距离, l m i n i l^i_{min} lmini和 l m a x i l^i_{max} lmaxi表示boundary的左边界和右边界。
这俩部分,是出于对舒适性的考虑。 w l ′ ∗ ∑ i = 0 n − 1 l i ′ 2 w_{l'}*\displaystyle\sum^{n-1}_{i=0} l^{'2}_i wl′∗i=0∑n−1li′2表示速度, w l ′ ′ ∗ ∑ i = 0 n − 1 l i ′ ′ 2 w_{l''}*\displaystyle\sum^{n-1}_{i=0} l^{''2}_i wl′′∗i=0∑n−1li′′2表示加速度,可以理解成横向不要走的太快,方向盘也不要打的太猛。 w l ′ ′ ′ ∗ ∑ i = 0 n − 2 ( l i + 1 ′ ′ − l i ′ ′ △ s ) 2 w_{l'''}*\displaystyle\sum^{n-2}_{i=0} (\frac{l^{''}_{i+1}-l^{''}_{i}}{△ s})^2 wl′′′∗i=0∑n−2(△sli+1′′−li′′)2可以理解成Jerk(三阶系统的体现),即方向盘不要打的太猛,也不要总是左右的变化。
Constraints
因为车辆存在最小的转弯半径,所以我们要对车辆运动学进行限制。由于转弯半径是基于笛卡尔坐标系的,需要基于Frenet坐标系进行转换。
假设:
这样,可以将以下公式(该公式取于某文献,目前尚未找到)
简化为:
这里需要对曲率K进行最大限制,否则转弯半径会过小,导致无法转弯。
再把 K m a x K_{max} Kmax的约束 K m a x = t a n ( α m a x ) L K_{max}=\frac{tan(\alpha_{max})}{L} Kmax=Ltan(αmax)代入,可以得到最终的约束:
其中 L L L是指车身的长度。
Piecewise Jerk Speed Optimization算法的主要思想是将车辆纵向位置运动当做一个三阶系统,应用模型预测的方法求解非线性优化问题,单帧的运算时间大概是40ms。
图中依然是我们的算法全貌,左边是状态空间,右上为目标函数,然后是限制条件。
state
刚刚做Path Optimization时,变量是s和l,现在做Speed Optimization时,则变成t和s。然后我们先建模成三阶系统:
然后进行Multiple shooting formulation 对△t进行采样,生成状态空间。再对状态空间进行泰勒展开得到:
Objectives
接下来时速度规划的Cost Function,如左图,解释下每项的意义:
是指时间的Objective达到最小
后面三项依然时基于舒适性考虑的,第一项是横向的加速度,第二项是纵向的加速度,第三项是Jerk(加速度的变化是舒适性的重要考虑因素)。
图片属于free space,然后有一个限速,加速度和刹车有最大值,然后jerk也有限制,图片表示向心加速度的限制,也就是转弯时不要转太猛。
以上基本及时Planning模块最常用的规划器算法,随着Apollo版本的迭代,也出现了不用应用场景下的Planner,如Open Space Planner和Learning based Planning。
reference文件如下:
DL-IAPS_and_PJSO_A_PathSpeed_Decoupled_Trajectory.pdf
TDR-OBCA A Reliable Planner for Autonomous Driving in Free-Space Environment.pdf