无人驾驶决策控制

近年来,随着人工智能和物联网技术的快速发展,无人驾驶汽车受到学术界、产业界极大关注,无人驾驶概念持续火热。从概念定义来看,智能驾驶汽车是一种自动化载体,能够部分或者全面代替驾驶员进行驾驶行为,无人驾驶汽车是智能汽车发展的最高形态。从原理角度看,无人驾驶控制系统模拟人类的驾驶方式,由传感器、控制器、执行器组成,对应感知、决策、执行三大功能模块。从技术角度看,无人驾驶在实现的过程中需要融合和运用多种技术,涉及到人工智能、云技术以及机器人技术等。任意两种技术的结合,都可算是广义无人驾驶概念的延伸,或是支撑无人驾驶技术的底层基础。

无人驾驶决策控制_第1张图片
图1 无人驾驶系统原理
无人驾驶决策控制_第2张图片
图2 无人驾驶核心技术元素
Google 无人驾驶技术通过“激光雷达为主+高精度地图+人工智能控制系统”实现。Google无人车依托 Google Map 多年来积累的各种道路交通数据以及街景数据提供最基本的数据支持;综合使用多种传感器,包括激光雷达(核心)、摄像头、毫米波雷达、超声波雷达、GPS、车轮位置传感器、速度传感器等进行环境感知及车身姿态感知;计算系统方面,配备 Google Chauffeur 人工智能控制系统,综合传感器信息,分析、计算得出决策控制指令。
Google 一方面基二自身在人工智能方面的技术积累;一方面大量收购AI创业公司,比如深度学习公司DeepMind、图片分析公司Jetpac、机器人公司Holomni、3D视觉系统公司Industrial Perception等,通过技术融合,提升技术能力。

无人驾驶决策控制系统的任务就是根据给定的路网文件、获取的交通环境信息和自身行驶状态,将行为预测、路径规划以及避障机制三者结合起来,自主产生合理驾驶决策,实时完成无人驾驶动作规划。狭义上来讲,包含了无人驾驶车的行为决策、动作规划以及反馈控制模块;广义上来讲,还紧密依赖上游的路由寻径、交通预测模块的计算结果。
路由寻径,属于全层路径规划,为无人驾驶汽车的自主驾驶提供方向性的引导,确定其依次需要通过的路段和区域序列,输出的结果严格依赖于高精度地图的绘制。
交通预测,任务是对感知所探测到的物体进行行为预测。要结合物理规律对物体做出预测,还需要结合物体和周边环境,以及积累的历史数据知识,对感知到的物体做出更为宏观的行为预测;
行为决策,任务是汇聚分析各种信息,做出行驶的决策,确定无人驾驶汽车应该进入什么行驶模式,比如路口左转模式、超车模式等;
动作规划,任务是将行为决策的宏观指令解释成一条带有时间信息的轨迹曲线,来给最底层的反馈控制来进行实际对车的操作;
反馈控制,任务是控制车辆尽可能遵循上游动作规划所输出的轨迹,通过控制方向盘转角以及前进速度实现。
无人驾驶决策控制_第3张图片
图3 无人驾驶决策规划系统组成
无人驾驶决策控制_第4张图片
图4 智能驾驶中任务规划结构
决策算法是核心竞争力,也是人工智能应用的重要场景。决策规划是自主驾驶系统智能性的直接体现,无人驾驶系统与ADAS系统的区别就在于是否具有自主的决策能力。目前各公司的传感器配置越来越趋同化,无人驾驶技术上的竞争会更多聚焦在决策环节,Google等公司的核心竞争力就体现在决策算法方面。
常见的决策规划体系结构有分层递阶式、反应式以及于者混合式。分层递阶式体系结构是一个串行系统结构,无人驾驶系统的各个模块之间次序分明,上一个模块的输出即为下一个模块的输入,当给定目标和约束条件后,系统根据即时建立的局部环境模型和已有的全局模型决定出下一步行动;反应式体系结构中的每个控制层都可以直接基于传感器的输入进行决策,突出“感知-动作”的特点,易于适应完全陌生的环境;混合式体系结构则结合上述两种方式的优点,在全局规划层次上,生成面向目标定义的分层递阶式行为,在局部规划层次上,生成面向目标搜索的反应式体系的行为分解。
无人驾驶决策控制_第5张图片
图5 基于功能和行为分解的混合决策体系结构
无人驾驶决策控制_第6张图片
图6 决策算法搭建和测试的不同路线
上述体系结构的不同,无人驾驶决策算法技术路线分为多个流派,主要有三大类:基于规则的经典机器人方向,基于深度学习的端对端无人驾驶技术以及因果推理方向。
单一基于规则的决策难以完全覆盖所有场景。基于规则的决策,是由人工使用 if-then规则覆盖所有可能的情况,对汽车的决策系统进行编程,告诉车辆在各种场景下应该怎么去做。这类方法难点在于很难创建全面的、能够覆盖到无人驾驶汽车可能遇到的所有场景的规则库,不够灵活;同时规则之间相于组合,能产生无数种可能,很难实现对系统的完整测试。
单一基于深度学习的端对端决策存在“黑箱”难题。端对端决策采用深度学习神经网络,训练 AI 根据具体的场景做出适宜的决策。这类方法有所谓“黑箱”问题,就是深度学习的解决方案中复杂的运算和处理都在端和端之间的通道内完成,决策过程是不透明的,系统一旦做出错误的判断,无法定位问题原因,也无法预测下一次会出现什么问题。
无人驾驶决策控制_第7张图片
图7 自动驾驶的端到端深度学习决策方案
因果推理决策机制是重要发展趋势。我们知道深度学习对感知有非常强的能力,可以理解各种复杂图像的含义,但是并不能把这种感知完美的转化为决策能力。原因在于深度学习,仅仅依赖于概率推理,也就是相关性。为了达到自动驾驶所需要的极高的安全性和可靠性,因果推理将是未来的发展趋势。因果推理使用贝叶斯网络,针对事件发生的概率以及事件可信度进行分类,具有模块化、透明性的优势
AI算法融合,助力“智能大脑”能力提升。在开放动态环境下的无人驾驶需要更强壮的AI,需要多种算法结合,将上述的三类决策机制融合。
一种提升的思路就是基于强化学习的决策框架,将深度学习包含关中。强化学习是强调如何基于环境而行动,以取得最大化的预期利益,是一种基于环境反馈而做决策的通用框架。理解强化学习有两个关键点:一只看重结果,不关心过程或者动机; 二对于每一次行为,及时奖惩,强化认知。Alpha Go在围棋人机大战中的里程碑式胜利,背后的强化学习算法功不可没。Google、Mobileye目前都在使用深度强化学习来研发无人驾驶决策控制。通过深度学习加强化学习的算法可以无限趋近于处理所有场景。在仿真模拟环境中,还可以通过强化学习做虚拟运行,获得最优的决策模型,产生模拟数据,促进决策算法成熟。
无人驾驶决策控制_第8张图片
图8 强化学习原理
无人驾驶决策控制_第9张图片
图9 强化学习的机器人运动控制
一种提升思路就是深度学习结合贝叶斯网络。贝叶斯网络的因果推理逻辑可以在一定程度上处理未知的极端情况,在无人驾驶车遇到陌生的驾驶场景时,能够对事实逻辑深入分析得出理性的决策控制指令。思路是将贝叶斯网络作为整个决策的顶层框架,利用贝叶斯网络的模块化,把深度学习系统作为一个子模块融入关中,专家系统作为另一个模块,这样的多重冗体构成了贝叶斯网络的子节点,将有效强化输出结果的可靠性;同时贝叶斯网络的透明性使得可以对整个决策的过程进行分析,定位问题。
无人驾驶决策控制_第10张图片
图10 贝叶斯网络原理
无人驾驶决策控制_第11张图片
图11 迁移学习原理
未来更进一步,无人车能实现继承和发展过去学到的知识,关键就是迁移学习。迁移学习是指在不同情况之间把知识进行迁移转化的能力,通过将在一个或多个源任务中学习到的知识进行迁移,用在相关的目标任务中以提高其学习性能。

你可能感兴趣的:(智能汽车)