双目测距系列(四)初识KITTI数据集

前言

  monodepth模型是基于KITTI数据集来训练的。为了能复现这个训练过程,从而为以后训练自己数据集奠定较好的基础,还是需要把这个数据集下载到本地,并成功训练。

  你能使用下面这条命令来下载raw KITTI数据集,但这个数据集很大,大约150多GB,而且里面提供的是外网链接,很难下载下来。建议看看国内有没有人把该数据集放到百度网盘上。

wget -i splits/kitti_archives_to_download.txt -P kitti_data/

我手头只有很少一部分该数据集(同事找的),让我们先一起认识下它大概的内容。

双目测距系列(四)初识KITTI数据集_第1张图片

数据集 

如上图所示,2011_10_03_drive_0027_sync和2011_10_03_drive_0034_sync是两段独立的数据集,里面结构完全一样。下面仅以2011_10_03_drive_0027_sync为例来讲解其内容。

双目测距系列(四)初识KITTI数据集_第2张图片

  KITTI数据集是一台载有4个摄像头,一台Velodyne 3D激光雷达以及一台GPS/IMU(导航设备,其品牌为OXTS)的车子行驶在道路所采集得到的数据集。 

  理解了这个,再回头看上面的图,就可以知道上面每个目录对应一个传感器所采集的数据。

1)4个sensor数据集

  子目录image_00/01/02/03里面都是对应4个sensor所拍的png照片。00和01对应的是左、右两个灰度摄像头,02和03对应另外两个左、右彩色摄像头。需要注意的是,左右两个摄像头的照片已经严格对齐了的。如下图所示:

2)velodyne_points

这个是雷达所采集数据集,都是bin文件,方便软件工具读取。有多少张照片,对应就有多少个bin文件。bin里面都是每个像素的实际坐标值(x,y,z,r)。由于雷达坐标系的x轴是向前的,所以其x值反映了深度。

3)oxts

它是导航设备获取的数据集,里面都为txt文件。每个照片对应有一个txt文件。里面的格式要看dataformat.txt。

标定参数值

说完了数据集,再来看看另外一部分(标定参数)。

1)calib_cam_to_cam.txt

它分别描述了4个摄像头的内参以及0和1,2和3之间的外参。如下所示,如果做过标定的话,应该不难理解。

双目测距系列(四)初识KITTI数据集_第3张图片

2)calib_imu_to_velo.txt

这个描述了导航坐标系到雷达坐标系的旋转和平移矩阵。

3)calib_velo_to_cam.txt

描述了雷达坐标系转换到摄像头坐标系。其实也只有R和T有用,delta_f和delta_c很少用。

 

 

 

 

你可能感兴趣的:(深度学习)