planning decision making for autonomous vehicles阅读笔记

阅读笔记

  • Introduction
  • Vehicle dynamics and control
    • 2.1
    • 2.2
    • 2.3
  • end to end planning
    • 3.1
    • 3.2
  • behavior-aware planning
    • 4.1协作与交互
    • 4.2博弈论方法
    • 4.3概率论方法
    • 4.4局部可观测马尔科夫决策模型
    • 4.5基于学习的方法
  • verification and synthesis
  • 本文仅用于自己的阅读内容回顾,侵权必删

Introduction

简介部分文章首先说明了文章要关注的几个问题,然后将决策规划模块的实现分为了三种类别,第一种是传统的由感知、行为层、动作规划和反馈控制各个子模模块组成的“subsequent planning”;第二种是将行为层和动作规划合并的“behavior-aware planning”,第三种是将感知和控制完全整合为一个模块的“end to end planning”。

Vehicle dynamics and control

2.1

首先是传统的车辆动力学控制,在给定一个参考路径的情况下,PID,回馈线性化和mpc都经常使用,在面对高速与激进情况时,模型预测控制、非线性控制和反馈前馈控制也可以应对。但这些都要求对车辆模型有一个良好的定义。

2.2

介绍了平行自主权,即车辆辅助驾驶系统和驾驶员对车辆操纵权的三种存在方式。

2.3

现有的动作规划算法分为三类,(1)输入离散化空间信息,如栅格规划与道路一致原语(2)随机化的规划,如快速扩展随机树(RRT),这种方法有很高的计算消耗(3)约束优化和滚动时域控制。之后作者介绍了对于(2)(3)如何将道路规则融入进去。

end to end planning

3.1

传统的感知是对人为规定的一些指标进行检测,比如SIFT、BRISK、SURF等等,但他们往往难以更加通用地应用到环境之中。如今,在机器人领域,通过这些特征进行环境构图的SLAM十分流行,而其中激光雷达和视觉方案都有着不同的优势,而随着雷达成本的降低似乎激光雷达才是主流。对于大量存储这些多细节的地图似乎非常困难,因此矢量地图或许会更加有用。同时,对于高分辨率图像的语义划分也是一大难点。同时深度学习依赖数据的特性也让很多学者去尝试利用仿真环境来获得训练数据,针对感知中的不确定性问题也有学者尝试使用而蒙特卡洛方法与传感器融合的方案来解决。

3.2

介绍了一种通过之前的行为来为之后的图像做标注的方法,介绍了目前利用深度学习以及全卷积神经网络实现的各个案例,并介绍了利用仿真环境训练模型以及使用生成网络生成接近真实图像的方法

behavior-aware planning

4.1协作与交互

对于自动驾驶车辆,为了能够采取更加像人和被社会所接受的决策策略是十分重要的,然而由于决策过程是动态而且和多个动态物体有一定交互因此不确定性激增会导致决策过程变得异常艰难。为此有三个方法,寻找一个更好的对动态环境的描述,建立一个交互关系的模型,建立共同分布的模型。

4.2博弈论方法

即将车辆的决策过程看成一个和其他车辆之间的博弈过程,决策过程就变成了一个如何使自己的利益最大化的问题。然而随着车辆数量增多,互相之间的影响会以指数级的复杂度增长,因此利用蒙特卡洛树搜索、或者利用前驱任务确定搜索方向会被用到。也有人将此过程看为一个主从博弈模型,然而和决策树相比,尽管他的可行性可以被证实,但是速度和约束冲突的数量都并不理想。

4.3概率论方法

使用马尔可夫决策过程判断当前的驾驶环境并给出对应的决策策略,离散流形、粒子滤波预测其其他车辆状态,概率图模型、交互高斯过程

4.4局部可观测马尔科夫决策模型

很多问题都会被建模为POMDP模型,在这里一些条件并不会被直接被观测,而是被编码为为隐变量。但这种模型的建模时间很长,因此如何简化得到近似的模型成为了研究的热点。一些人会仅在预定的路径上进行建模,一些人选择将建模深度与速度进行权衡,一些人选择将变量离散化,一些人只关注部分车辆或者交通参与者,或者可以使用大量的域知识、在更加抽象的地图上进行决策过程、规定决策结果的数量、应用独立的行为预测模块、持续式POMDP权衡精度与时间的关系以及利用非参数化的强化学习都是解决这个问题所做出的尝试。

4.5基于学习的方法

这种方法是数据驱动的。常见的有支持向量机,由神经网络参数化的高斯混合模型。介绍了一个包含条件变分自动编码器的实例生成模型,逆优化控制与逆强化学习也备受关注。

verification and synthesis

相较于传统的功能性验证,形式验证更能验证一个系统的可行性和迁移性。

本文仅用于自己的阅读内容回顾,侵权必删

你可能感兴趣的:(论文精读,自动驾驶)