特斯拉自动驾驶中的 OccupancyNetworks & NeRFs

  • 这篇文章是一些简单介绍,主要让读者意识到这些技术的巨大潜力,后续会更深入的详解

Occupancy Networks

我们知道特斯拉曾经发生过一些自动驾驶事故导致车毁人亡的事件,原因就是物体检测(Object Detection)的不稳定性或者说是基于Deep Learning或Machine Learning检测模型的不稳定性

不稳定的原因主要表现在以下方面:一、数据的长尾分布问题,极端样例(Corner Case)出现的概率非常小,但是根据大数定律在一个充分长的时间里Corner Case一定会发生,而在Corner Case样本很少时模型无法学习到检测这些物体。二、模型本身的不稳定性,这种不稳定表现在即便待学习的物体有大量的样本,那么也会出现无法检测的现象,这种现象叫Adversarial Attack(对抗攻击),甚至检测正确的样本修改一个像素也可能导致被检测的概率大幅下降。三、是分类(Classification)算法的局限性,分类算法只能分类训练数据内的有限类别,这会导致未见过类别(Unseen Category)的漏检问题。四、困难样本问题(Hard Sample),检测或分类在边界样例情况的不确定性

Object Detection vs Occupancy Networks
特斯拉自动驾驶中的 OccupancyNetworks & NeRFs_第1张图片

这里特斯拉的团队对物体检测算法作了改变,使用了Occupancy Networks去寻找Occupancy Volumes或Occupancy Grid,即三维空间中被物体占据的格点或空间,这个算法其实能很好的规避Corner Case问题,因为原有的长尾分布问题被改变了,这种算法其实内含了一个二分类问题,即分类该格点是否是存在障碍及其概率,该算法能有效规避物体边缘碰撞问题,具体可以看下面的文章A Look at Tesla’s Occupancy Networks

Neural Radiance Fields

Use of Descriptors with NeRFs特斯拉自动驾驶中的 OccupancyNetworks & NeRFs_第2张图片

Neural Radiance Fields ,NeRFs 即神经辐射场,这个算法和Occupancy Grid一脉相承,都是在解决如何准确的建模我们所处的三维空间,NeRFs 更进一步,建模的粒度也更细也更加真实,这个算法不仅可以用来建设高精度地图,也能建高分辨率物理空间模型。这两个技术能很好的弥补基于传统特征SLAM的一些缺点,个人觉得在机器人导航与环境交互的感知问题有巨大的意义。试想一下,如果我们能准确建立现实三维空间的模型,那么所有交互都可以在这样的虚拟三维空间中进行,那么不管汽车、机器人、人与环境的交互也将变得很方便了,这个其实也就变成了虚拟现实(Virtual Reality)技术,也可以构建所谓的万物交互元宇宙技术,相信在未来基于神经网络的各种技术能够解决自动驾驶与机器人导航等各种视觉感知问题

参考:

  1. Occupancy Networks: Learning 3D Reconstruction in Function Space
  2. NeRF: Neural Radiance Fields

你可能感兴趣的:(CV,自动驾驶,人工智能,机器学习,机器人,导航)