无人驾驶车与环境的关系

本文以无人驾驶为例,简单的阐述《人工智能,一种现代方法》中对于Intelligent Agent的讲解。

一、无人驾驶汽车的组成

无人驾驶车,即一个智能agent,跟通用的agent定义一样,由三部分组成,感知,执行,环境。感知获取环境信息,通过执行指令反作用于环境。无人驾驶系统主要由感知,规划控制,地图,定位等组成。

感知:探测行人,车辆,红绿灯,车道线,交通标志等信息;
地图:一个比较火的概念是高精度地图,包含车道数,车道线位 置,直行或转向车道,道路限速,道路间的拓扑结构等定制信息;
定位:通过差分,激光或者视觉Slam进行cm级定位;
规划控制:定位当前位置,通过地图进行路径规划,生成油门、制动、转向控制量避开障碍物稳定快速的达到目标点。

二、无人驾驶评价
无人驾驶系统是否合理,可以从以下四个方面衡量:
1 衡量表现是否优秀的标准;
2 系统对于环境的先验知识;
3 无人驾驶系统能执行的动作;
4 无人驾驶系统感知到的环境序列;

简单地,如果一个无人驾驶系统,通过感知环境序列,在已有的先验知识的基础上,从可执行的动作中,决策出了表现优秀的行为,那么这个无人驾驶系统是合理的。
这个地方要注意合理和完美的区别,合理是满足约束的局部最优,完美是全局最优。全局最优在现实中几乎是不可能存在的。但是一个无人驾驶系统,仅仅通过先验知识进行决策是不够的,先验只是人们总结的部分case,不能够全面的描述变化的环境。系统在与环境的交互过程,习得经验,总结并从经验中学习,这是系统的自主性,对于一个智能驾驶系统相当的重要。

三、环境的描述
一个合理的系统首先是深入的了解需要解决的问题。需要解决的问题来自于任务环境,第一步得分析任务环境。
可从以下四个方面分析任务环境,无人驾驶为例:

1 性能表现:无人驾驶车的安全性,舒适型,经济型等;
2 外部环境:车,路,人,交通流等;
3 执行器:转向,加减速,转向灯,喇叭灯;
4 传感器:毫米波,激光雷达,摄像头,超声波灯;

可以从以下几个属性对环境进行描述:

1 可观测性:如果每时每刻,传感器都能获取全部的环境信息,特别是跟决策相关的所有信息,那么该环境是全部可观测的。否则,因为噪声和传感器的不准确(漏检,误检)丢失了部分环境信息,那么该环境是部分可观测的。无人驾驶环境是部分可观测的,这就需要做一些跟踪来维持对环境的认识。

2 单agent还是多agnet
环境中是否存在多个agent,多agent间的关系包括合作和竞争。

3 确定的还是随机的
如果可以通过当前的环境和执行的控制量来推断环境的下一个状态,那么该环境是确定环境,否则,环境是随机的。如果环境是部分可观测和随机的,那么该环境是不确定的。不确定的环境通过引入概率进行描述。

4 片段的还是连续的
上一次的感知序列对下一次的感知序列没有影响,相互独立的,那么环境是片段式的,否则是连续的。在无人驾驶中,做决策时,考虑多久的信息片段。

5 静态的还是动态的
这个很好理解,环境是否随时间变化。自动驾驶环境无时不刻不在变化。

6 连续的还是离散的
无人驾驶环境多少连续的,通过数字处理后离散化了。

7 已知的还是未知的
在已知的环境中,行动对应着结果,种瓜得瓜。

四、无人驾驶车的类型

无人驾驶车由硬件和软件组成。硬件包括车本身,传感器,执行器等,软件主要是算法程序。根据算法程序对感知的信息的反应方式,可以分成以下几类:

1 简单的应激行动
不考虑历史感知信息,只根据当前感知到的信息采取行动,跟人的很多条件反射类似,比如眨眼,膝跳反射等。特点是非常简单,但是智能有限。在无人驾驶程序中,可见到明显不够智能的例子很多:感知误检到一帧障碍物,车辆则会执行刹车动作。在感知信息不够准确,或者说是环境只部分可观测时,表现出来的性能不是让人特别满意。

2 基于模型的行动
通过对环境的跟踪可以缓解环境的部分可观测性带来的影响。怎么来做外部环境的跟踪呢,首先得知道他的变化规律,即给外部环境建立一个模型。自动驾驶车不仅要知道外部环境是怎么变化的,也要知道自己在控制量的作用下是如何运动的,比如车辆模型。基于外在和内在两个模型更好的做出合理的决策。

3 基于目标的行动
知道了内外部运行模型还不够,无人驾驶系统需要知道自己的目标是什么,比如,目的地在哪?只有知道了目标才不会南辕北辙。有了目的地,在路口的左右转才会有选择的依据。在无人驾驶系统中的路径规划。

4 基于效用的行动
很多导航软件可以根据距离最短,用时最少,红绿灯最少等指标选择路径。同样的,知道了目的地,也知道了外部环境的变化,无人驾驶车可以选择快速的达到目的地,也可以选择舒适平稳的达到目的地。设定一个效用标准可以帮助无人驾驶车做更合理的决策。

5 基于学习的行动
有老师教肯定好,在没有老师教的情况下,比如从学校毕业进入社会了,能教你的人寥寥无几,这个时候自学能力就特别重要。对于机器也是这样,能设定的先验知识和模型都是有限的,如何能从经验中自我学习才是检验一个系统是否真正智能的标准。一个能自我学习的系统可以由四个部分组成:评判器,学习器,问题产生器,行动选择器。学习器从评判器处获得反馈来调整行动选择器的决策。问题产生器的作用是建议行动选择器选择一些不一样的行动。这种行动是一种尝试,有点变异进化的味道。

你可能感兴趣的:(无人驾驶车与环境的关系)