waymo数据集解析

waymo数据集介绍

2019年8月21日,谷歌母公司Alphabet旗下的自动驾驶公司Waymo在其博客公布了数据开放项目(Waymo Open Dataset),因为数据集中包含的信息比较多,以本次的training_0000.tar这个文件为例,就有20多G的大小,需要通过代码来进行解析。

官网下载地址:https://waymo.com/open/download/

官方数据格式解析:https://waymo.com/open/data/
代码地址:https://gitee.com/cmfighting/waymo_read

如下图所示,分为训练集和验证集,本次的任务主要是解析training_0000.tar,该文件解析成功之后其余的文件解析方式基本一致,所以关键在于对training_0000.tar的解析。

waymo数据集解析_第1张图片

waymo数据集解析

waymo数据集下载之后通过解压软件进行解压可以得到tfrecord格式的文件,以training_0000解压结果为例,解压之后可以得到24个tfrecord文件,一个tfrecord文件中包含20s的连续驾驶画面,具有199帧数据,是连续时间段的数据帧,一帧中包含了车上所有传感器的数据以及相应的label,连续镜头内容可以使得研究人员开发模型来跟踪和预测其他道路使用者的行为。

waymo数据集解析_第2张图片

考虑到无法进入实验室,这里的测试均是在具有nvidia显卡的win10笔记本上进行,具体配置如下

python3.6.10

tensorflow-gpu1.14.0

numpy 1.16.1

matplotlib

数据1-激光雷达数据

首先读出的数据是激光雷达数据,第一张图是自动驾驶车辆示意图,可以看到,在具有自动驾驶功能的车辆上分布着多个激光雷达扫描器,以waymo为例,这里的5个数据分别来自车身的顶部、左侧、右侧、正面和后部。

waymo数据集解析_第3张图片

数据2-范围图像

范围图像指的是球面坐标系中激光雷达点云。

waymo数据集解析_第4张图片

数据3-投影图像

这里是waymo中提供的比较特殊的一种数据形式,可以将激光雷达扫描到的点投射到数据一读取到的数据上,下图是将激光雷达扫描到的点投射到车辆正面拍摄的图像所得到的最终图像,可以看作是数据1和数据2的融合。


更多资料请查看这篇博客
https://blog.csdn.net/txb0504/article/details/105265624/

你可能感兴趣的:(目标检测,自动驾驶,tensorflow,机器学习)