Lift_splat_shoot代码解读

1.self.frustum:构建关于图像深度的像素点坐标,每个像素点对应预定义的离散化深度。size为(D,H,W,3)frustum[i,j,k,0]就是(i,j)位置,深度为k的像素的宽度方向上的栅格坐标,frustum[i,j,k,1]就是(i,j)位置,深度为k的像素的高度方向上的栅格坐标,frustum[i,j,k,2]就是(i,j)位置,深度为k的像素的深度方向上的栅格坐标。

2.geometry_points内置映射点。将每个预定义深度的像素点通过内外参矩阵转变到自车坐标系下

size为(B*N,D,H,W,3)
Lift_splat_shoot代码解读_第1张图片

3.effcientnet提取图像特征size为(B*N,D,H,W,64=C)得到了图像的点云特征

首先解释一下内置映射点是自己定义的且维度是BNDHW,而提取的图像特征维度64表示图像的64个不同特征,通过内置映射点可以将64个特征中的每一特征一次映射在鸟瞰图上对于相同位置XYZ(内置映射点3的含义)会映射到鸟瞰图同一位置然后可以通过cumsum进行求和以达到更好的效果

4.根据2.3.geom是图像栅格点到车身坐标的不同深度的坐标(X,Y,Z),而x是对深度进行了预测的图像特征点云

构建bev特征首先将geo平移取整过滤掉鸟瞰图格子外的点。

你可能感兴趣的:(计算机视觉,深度学习,人工智能)