apollo学习笔记二:定位与感知

定位

定位是指无人驾驶车准确知道自身确切位置的方法。
对于定位,车辆将其传感器识别的地标,与高精度地图上存在的地标进行对比,为了进行该对比,必须能够在其自身坐标系和地图坐标系之间转换数据,然后系统必须在地图上以十厘米的精度确定车辆的精确位置。

以下为几种常见的定位方法:

1.GNSSRTK

GNSSRTK,即GNSS+RTK
(1)GNSS为全球导航卫星系统(Global Navigation Satellite System)的简称,它是泛指所有的卫星导航系统,包括全球的、区域的和增强的,如美国的GPS、俄罗斯的Glonass、欧洲的Galileo、中国的北斗卫星导航系统,以及相关的增强系统,如美国的WAAS(广域增强系统)、欧洲的EGNOS(欧洲静地导航重叠系统)和日本的MSAS(多功能运输卫星增强系统)等,还涵盖在建和以后要建设的其他卫星导航系统。
以目前使用最广泛的GPS为例,GNSS分为三部分,卫星,控制站(监控和控制卫星),接收器。
apollo学习笔记二:定位与感知_第1张图片
(2)为减少GNSS不可避免的精度误差,采用RTK,即实时运动定位(Real - time kinematic)来减少误差。
RTK采用地面基站,每个基站知道自己精确的地理位置(Ground Truth),通过计算当前GNSS传输的结果计算误差,并用该误差对GNSS接收器得到的位置进行修正,以供其调整自身位置。
具体过程如图所示:apollo学习笔记二:定位与感知_第2张图片
(3)优缺点:
优点:可将精度精确到十厘米
缺点:
在某些情况下表现较差(如城市中的高楼阻碍或偏远地区的峡谷区域);
更新频率低,其10Hz的更新频率,无法快速更新位置信息,令高速移动的无人驾驶车处于危险之中。

2.惯性导航

(1)原理:由高中物理可知,在直线上,我们可以通过初始速度,初始位置,加速度来计算汽车在任何时间的车速和位置。
(2)应用于实际中:三轴加速计传感器可为我们提供汽车的加速度,陀螺仪可为我们提供车辆在坐标系中的位置。两者构成了惯性测量单元(IMU)的核心组成单元。
(3)优缺点:
优点:更新频率高,高达1000Hz,可提供接近实时的位置信息
缺点:存在运动误差,其误差随时间的增加而增加,需要更新其坐标系信息。

3.激光雷达定位

(1)利用激光雷达,采用点云匹配对汽车进行定位。针对同一对象在不同条件下获取的图像,因为激光扫描光束受物体遮挡的原因,不可能通过一次扫描完成对整个物体的三维点云的获取。因此需要从不同的位置和角度对物体进行扫描。三维匹配的目的就是把相邻扫描的点云数据拼接在一起。三维匹配重点关注匹配算法,常用的算法有最近点迭代算法 ICP和各种全局匹配算法。一旦最大限度降低了点云之间的误差,便可以将传感器得到的地图对应到高精度地图中。
(2)优缺点:
优点:高鲁棒性,一旦拥有高精度地图和可靠的传感器,便可以得到精确的位置
缺点:难以构建高精度地图并保持实时更新。

4.视觉定位

(1)利用摄像头获取图像,采用粒子滤波算法,与高精度地图进行比较,进行高精度定位。
(2)优缺点:
优点:摄像头种类多,图像易于获取
缺点:其高度依赖三维地图,需要构建三维地图

Apollo采用的基于GPS,IMU和激光雷达和高精度地图的定位方法,将GNSS定位和LiDAR定位通过卡尔曼滤波结合在一起,GNSS定位输出位置和速度信息,LiDAR定位输出位置和行进方向信息。卡尔曼滤波建立在两步预测测量周期之上,在Apollo中,惯性导航解决方案,用于卡尔曼滤波的预测步骤;GNSS和LiDAR定位,用于卡尔曼滤波的测量结果更新步骤。
apollo学习笔记二:定位与感知_第3张图片

感知

对于无人驾驶,感知即利用海量的传感器数据,,模仿人脑来理界这个世界。
感知包括四个核心任务:Detection,Classification,Tracking,Segmentation。
Detection(检测):找出物体在环境中的位置
Classification(分类):明确对象的具体分类
Tracking(跟踪):随时间的推移观察移动物体
Segmentation(语义分割):将图像中的每个像素与语义类别进行匹配
apollo学习笔记二:定位与感知_第4张图片

1.检测和分类

无人驾驶车需要在驾驶中需要检测许多不同的物体,汽车根据所感知的物体类型来确定路径和速度。
可使用CNN(卷积神经网络)来查找图像中的对象位置,对对象进行定位后,传给下一个CNN进行图像分类。或者采用单个CNN末端接上不同的“头”来分别进行检测与分类。
apollo学习笔记二:定位与感知_第5张图片

2.跟踪

跟踪(跨帧跟踪)可以解决以下问题:
(1)跟踪可解决遮挡问题,防止检测算法失效
(2)跟踪可以保留对象身份
跟踪的任务:
(1)确认身份,将在之前帧中检测到的所有对象与在当前帧中检测到的对象进行匹配,查找特征相似度最高的对象。
(2)预测对象,再确认身份后,我们可以使用对象的位置和速度,并结合预测算法,估计在下一个时间的位置,该预测可帮助我们识别下一帧中相应的对象

3.分割

语义分割依赖于一种特殊类型的CNN,即FCN(全卷积网络),FCN对图像进行像素级的分类,从而解决了语义级别的图像分割问题。与经典的CNN在卷积层使用全连接层得到固定长度的特征向量进行分类不同,FCN可以接受任意尺寸的输入图像,采用反卷积层对最后一个卷基层的特征图(feature map)进行上采样,使它恢复到输入图像相同的尺寸,从而可以对每一个像素都产生一个预测,同时保留了原始输入图像中的空间信息,最后奇偶在上采样的特征图进行像素的分类。apollo学习笔记二:定位与感知_第6张图片

apollo将ROI(感兴趣区域)过滤器应用于点云和图像数据,以缩小搜索范围并加快感知。然后通过检测网络反馈已过滤的点云,输出用于构建围绕对象的三维边界框,最后使用被称为检测跟踪关联的算法来跨时间步识别单个对象。
apollo运用YOLO网络来检测车道线和动态物体,其检测过程如图:apollo学习笔记二:定位与感知_第7张图片

感知传感器比较(摄像头,雷达,激光雷达)

apollo学习笔记二:定位与感知_第8张图片

你可能感兴趣的:(Apollo)