Moving Object Segmentation in 3D LiDAR Data: A Learning-based Approach Exploiting Sequential Data

论文解读:Moving Object Segmentation in 3D LiDAR Data A Learning-based Approach Exploiting Sequential Data

  • 创新点
  • Abstract
  • Related Work
  • 具体方法
  • personal comment

创新点

在分割中引入了新的描述动态物体的特征 d k , i l d_{k, i}^{l} dk,il, d k , i l = ∣ r i − r i k → l ∣ r i d_{k, i}^{l}=\frac{\left|r_{i}-r_{i}^{k \rightarrow l}\right|}{r_{i}} dk,il=riririkl, r i k → l r_{i}^{k \rightarrow l} rikl是将第k帧的点云旋转至当前帧( l {l} l帧)时,第i个像素上的距离值。
相比于rangenet++ 本文主要在网络输入特征中加入输入有x y z r(距离值) e(反射率)n*d(前几帧当前像素点r的变化值)

Abstract

从3D Lidar 数据中分离出动静物体对于自动驾驶的相关工作十分有益,本文利用激光点云序列的投影图(Range image),经过CNN网络的处理,进行点云分割。本文的方法仅将点云划分为移动的和静态的物体。
声明:本文的方法可以仅通过激光点云的数据分割出点云中的动态障碍物;本文将前几帧帧的点云数据转化到当前帧,提高了分割的精度,实现了SOTA。

Related Work

具体方法

主要思路是:将多帧点云旋转到同一个坐标系下,如果一个物体是背景(静态),则每次激光扫到它,获得的距离r将会是不变的,而动态障碍物的相对距离r变化大(前几帧扫到车,车开走后,可能后几帧就扫描到背景)
Moving Object Segmentation in 3D LiDAR Data: A Learning-based Approach Exploiting Sequential Data_第1张图片

处理流程

如图所示,网络的输入分为两个部分:

  1. 当前帧点云的投影获得的Range image,(同rangenet++包含每个点的x,y,z,反射率,距离r,即每个点有五维数据)投影公式如下:
    ( u v ) = ( 1 2 [ 1 − arctan ⁡ ( y , x ) π − 1 ] w [ 1 − ( arcsin ⁡ ( z r − 1 ) + f u p ) f − 1 ] h ) \left(\begin{array}{l}u \\ v\end{array}\right)=\left(\begin{array}{c}\frac{1}{2}\left[1-\arctan (y, x) \pi^{-1}\right] w \\ {\left[1-\left(\arcsin \left(z r^{-1}\right)+\mathrm{f}_{\mathrm{up}}\right) \mathrm{f}^{-1}\right] h}\end{array}\right) (uv)=(21[1arctan(y,x)π1]w[1(arcsin(zr1)+fup)f1]h)
  2. 过去帧中的点云数据S0~S2,通过获得的定位数据,旋转(对齐)至当前帧的坐标系(即图中T矩阵)。做Range image 投影并计算出 d k , i l d_{k, i}^{l} dk,il作出residual image(Δr:range的变化值)

Moving Object Segmentation in 3D LiDAR Data: A Learning-based Approach Exploiting Sequential Data_第2张图片

current:当前帧的Range image j {j} j:过去第 j {j} j帧的residual image

作者认为,引入的前几帧的residual image可以帮助网络识别出动态物体,通知也考虑到一些移动较慢的物体在Residual image中不明显,所以引入的Residual image仅仅作为一个辅助判别的特征来区分动态的和静态的物体。

personal comment

个人愚见,欢迎评论区指点!

  1. 是否存在如下bug:即运动物体与本车相对静止,则相对距离r变化为0,d为0,被归类于静态物体?

你可能感兴趣的:(Lidar,Paper,自动驾驶,深度学习,计算机视觉)