kitti数据集label解析和可视化教程

kitti数据集label解析_hhhhhhzb的博客-CSDN博客_kitti数据集label其中第1列truck 表示图中出现了卡车(一共有’Car’, ‘Van’, ‘Truck’,‘Pedestrian’, ‘Person_sitting’, ‘Cyclist’, ‘Tram’,‘Misc’ or 'DontCare’这些类别,Don’t care 是没有3D标注的,原因是雷达扫不了那么远,即使可以视觉检测出来)第2列0.0表示其是否被截断的程度为0。(如果车在图片边缘,那么就有可能发生部分被截断的情况。用0-1 表示被截断的程度。)第3列0表示没有被遮挡。(0表示完全可见,1表示部分遮.https://blog.csdn.net/hhhhhhzb/article/details/117913706

KITTI数据集--参数_jilijilicao的博客-CSDN博客_kitti一、kitti数据集,label解析 16个数代表的含义:第1个字符串:代表物体类别'Car', 'Van', 'Truck','Pedestrian', 'Person_sitting', 'Cyclist','Tram',  'Misc' or  'DontCare'注意,’DontCare’ 标签表示该区域没有被标注,比如由于目标物体距离激光雷达太远。为了防止在评估过...https://blog.csdn.net/cuichuanchen3307/article/details/80596689?spm=1001.2101.3001.6650.1&utm_medium=distribute.pc_relevant.none-task-blog-2~default~CTRLIST~Rate-1-80596689-blog-117913706.pc_relevant_antiscanv2&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2~default~CTRLIST~Rate-1-80596689-blog-117913706.pc_relevant_antiscanv2&utm_relevant_index=2

KITTI自动驾驶数据集可视化教程_自动驾驶小学生的博客-CSDN博客_kitti可视化https://blog.csdn.net/cg129054036/article/details/119516704

Kitti数据集相应参数说明

1、数据的制作设备及一些参数说明:

​ 1)4路相机:

​ camera_0:左边灰度相机,参考相机

​ camera_1:右边灰度相机

​ camera_2:左边彩色相机

​ camera_3:右边彩色相机

​ 2)一个激光雷达:用于生成点云数据

​ 3)camera_0与camera_2、camera_1与camera_3的距离为0.06米

​ 4)camera_0与camera_1、camera_2与camera_3的距离为0.54米

​ 5)4路相机的高度都为1.65米

​ 6)激光雷达的高度为1.73米

​ 7)坐标系说明:

​ 相机坐标系: x = right, y = down, z = forward

​ 点云坐标系: x = forward, y = left, z = up

2、数据文件解释

2.1 label txt

​ 1)第1个值:代表类别,可以为['Car', 'Van', 'Truck','Pedestrian', 'Person_sitting', 'Cyclist','Tram', 'Misc' , 'DontCare']

​ 2)第2个值:代表物体是否被截断,从0到1浮动,0表示没被截断,1表示完全被截断,即超出图像范围

​ 3)第3个值:代表物体是否被遮挡,表示为整数0(完全可见)、1(小部分遮挡)、2(大部分遮挡)、3(完全遮挡)

​ 4)第4个值:代表物体的观察角度,可参考这篇博客的解释

​ 5)第5~8个值:代表物体的2D bounding box,分别为xmin、ymin、xmax、ymax

​ 6)第9~11个值:代表物体的高宽长(hwl)(单位:米)

​ 7)第12~14个值:代表3D bounding box的中心坐标(相机坐标系下)

2.2 point cloud file

一个bin文件为一张图像的相应点云,保存为Nx4的形式,4为(x, y, z, ref),x, y, z为相应的坐标(点云坐标系下),ref为反射率

2.3 calib txt

​ 1)P0:3x4,3x3为相机内参,最后一列为全0,对P0来说无意义

​ 2)P1:3x4,3x3为相机内参,该矩阵为校准后的camera_0相机坐标到camera_1图像坐标的映射

​ 3)P2:3x4,3x3为相机内参,该矩阵为校准后的camera_0相机坐标到camera_2图像坐标的映射

​ 4)P3:3x4,3x3为相机内参,该矩阵为校准后的camera_0相机坐标到camera_3图像坐标的映射

​ 5)R0_rect:3x3,参考坐标的校准旋转矩阵。校准是使多路相机的图像在同一个平面上

​ 6)Tr_velo_to_cam:点云坐标到参考坐标(即camera_0坐标系)的映射矩阵

示例:

​ 1、将label文件中的3D bounding box转换到图像坐标(以映射到左彩图为例):

​ y_image = P2 * R0_rect * R0_rot * x_ref_coord

​ 注:R0_rot为物体坐标到参考坐标的映射矩阵

​ 2、将点云坐标映射到图像坐标(以映射到左彩图为例):

​ y_image = P2 * R0_rect * Tr_velo_to_cam * x_velo_coord

参考连接:

1、博客https://medium.com/test-ttile/kitti-3d-object-detection-dataset-d78a762b5a4

2、kitti官方论文http://ww.cvlibs.net/publications/Geiger2013IJRR.pdf

 

你可能感兴趣的:(视觉检测,计算机视觉,深度学习)