kitti数据集

关于3D object 官网: http://www.cvlibs.net/datasets/kitti/eval_object.php?obj_benchmark=3d

3D检测的数据集包含7481张训练图像和7518张测试图像以及对应的点云数据。

采集设备

KITTI数据采集平台包括2个灰度摄像机,2个彩色摄像机,一个Velodyne 3D激光雷达,4个光学镜头,以及1个GPS导航系统。为了生成双目立体图像,相同类型的摄像头相距54cm安装。由于彩色摄像机的分辨率和对比度不够好,所以还使用了两个立体灰度摄像机,它和彩色摄像机相距6cm安装。 彩色相机可以拍摄RGB图像。灰度相机可以拍摄更高对比度和更低噪声的图像。
所有的相机以10Hz的频率拍摄,同步于Velodyne雷达。
图像以以下方式进行存储:

  • ‘image_00’: 左校正(rectfied)灰度图像序列
  • ‘image_01’: 右校正灰度图像序列
  • ‘image_02’: 左校正灰度图像序列
  • ‘image_03’: 右校正灰度图像序列
    KITTI提供的数据中都包含三者的标定文件,不需人工转换。
    kitti数据集_第1张图片

激光数据

Velodyne 3D激光产生点云数据,以.bin(二进制)文件保存。data contains 4num values, where the first 3 values correspond to x,y and z, and the last value is the reflectance information.
Velodyne采集的点云数据存储在文件夹“velodyne_points”中,为了节省空间,所有数据都以N
4浮点矩阵的形式存储到二进制文件中
使用以下代码的文件:

	stream = fopen (dst_file.c_str(),"wb");
	fwrite(data,sizeof(float),4*num,stream);
    fclose(stream);

其中,4*num包括位置(x,y,z)和对应的强度信息。 (x,y,z)是在Velodyne坐标系下的。
所有扫描都按行对齐存储,这意味着前4个值对应于第一个测量值。由于每次扫描可能具有不同的点数,因此在读取时必须根据文件大小来确定。

关于传感器校准(Sensor Calibration)

calib_cam_to_cam.txt: 相机到相机之间的校准
calib_velo_to_cam.txt: 雷达到相机之间的校准
calib_imu_to_velo.txt: GPS/IMU到雷达之间的校准

关于标签Tracklet Labels

tracklet标签存储在XML中,可以使用用此开发工具包提供的源代码。
每个tracklet标签以一个包含长宽高的3D bounding box表示,且跨帧。
对于每个帧,我们都标记了在鸟瞰图中的位置和朝向。
此外,遮挡/截断(occlusion / truncation )信息以averaged Mechanical Turk label形式提供。

标签的种类有以下几种:

  - 'Car'
  - 'Van'
  - 'Truck'
  - 'Pedestrian'
  - 'Person (sitting)'
  - 'Cyclist'
  - 'Tram'
  - 'Misc'
其中,misc 代表所有其他的类,例如,“Trailers”或“segways”

评估标准

(evaluation benchmark)采用的是 The benchmark uses 3D bounding box overlap to compute precision-recall curves.
  目标检测需要同时实现目标定位和目标识别两项任务。其中,通过比较预测边框和ground truth边框的重叠程度(Intersection over Union,IoU)和阈值(e.g. 0.5)的大小判定目标定位的正确性;通过置信度分数和阈值的比较确定目标识别的正确性。以上两步综合判定目标检测是否正确,最终将多类别目标的检测问题转换为“某类物体检测正确、检测错误”的二分类问题,从而可以构造混淆矩阵,使用目标分类的一系列指标评估模型精度。

你可能感兴趣的:(3D物体检测)