为什么说特斯拉在自动驾驶上比Waymo更占优势

https://www.toutiao.com/a6690749591517659655/

 

2019-05-14 13:25:33

商业分析师、记者和普通公众的大多数观点,似乎是Waymo在自动驾驶方面遥遥领先,而特斯拉相差很远。但当你研究神经网络的基本原理时,这种观点是没有意义的。

原文载于Medium,作者:Trent Eady

训练数据,是决定深度神经网络性能的基本因素之一。 (另外两个是网络结构和优化算法。)

作为通用原则,更多的训练数据能带来更好的性能。这就是为什么,我相信特斯拉拥有世界上最有前途的无人驾驶汽车项目,而不是Waymo。

为什么说特斯拉在自动驾驶上比Waymo更占优势_第1张图片

△可视化的特斯拉车队(图片由特斯拉提供)

特斯拉的车队中有大约50万辆,配备了特斯拉所说的全自动驾驶硬件。每天,特斯拉的车队行驶里程约为1500万英里,相当于Waymo车队有史以来的总体行驶里程。

每天1500万英里,一年就是54亿英里,比Waymo预计的一年总里程多200倍。而且,特斯拉的车队也在以每周大约5000辆的速度增长。

在以下三个关键领域,数据会产生影响:

  • 计算机视觉
  • 预测
  • 路径规划/驾驶策略

计算机视觉

计算机视觉中,一个重要的任务是目标检测(object detection)。有些东西,比如马,很少出现在路上。每当特斯拉遇到神经网络认为可能是一匹马(或者可能只是一个无法识别的阻碍道路的物体)的东西时 ,摄像头就会拍下照片,然后通过无线网络上传。

车辆每年行驶数十亿英里是有帮助的,因为你可以找到许多稀有物体的例子。显而易见的是,随着时间的推移,特斯拉在识别稀有物体方面,将比Waymo更出色。

对于普通物体来说,Waymo和特斯拉的瓶颈,很可能是花钱让人们手动给图片贴标签。捕捉更多的图像,要比付钱给人们贴标签容易。

但是对于稀有物体来说,Waymo的瓶颈可能在于首先要收集图像,而对于特斯拉来说,瓶颈可能仅仅是贴标签和开发软件,以便在合适的时间触发拍照功能。相比之下,特斯拉占据更有优势的地位。

在下面的这段视频中,特斯拉的人工智能总监安德烈·卡帕斯(Andrej Karpathy)解释了特斯拉是如何获取图像训练目标检测算法的:

视频地址:https://youtu.be/33K3id2xNAE

预测

预测,是提前几秒预测汽车、行人和骑自行车的人的动作和行为的能力。

Waymo顶尖工程师之一安东尼·莱万多夫斯基(Anthony Levandowski)最近写道,

“之所以没有人实现完全自动驾驶,是因为现在的软件还不足以预测未来。”

莱万多夫斯基声称,自动驾驶汽车的主要故障类别,是错误地预测了附近汽车和行人的行为。

特斯拉拥有大约50万辆汽车的车队,在这里是一个极好的资源。任何时候,特斯拉对汽车或行人做出错误的预测,特斯拉都可以保存数据快照,以备以后上传并添加到特斯拉的训练数据集中。

特斯拉或许能够上传由其计算机视觉神经网络生成的场景抽象表征(其中物体被视觉化为彩色编码的长方体形状,而像素级信息被丢弃) ,而不是上传视频。 这将从根本上降低上传这些数据的带宽和存储要求。

虽然用于训练目标检测的图像需要人工标记,而预测神经网络,可以仅仅通过事件的时间序列就可以学习过去和未来之间的相关性。什么行为先于什么行为,是任何记录(视频或抽象表征)所固有的。安德烈·卡帕斯在下面的视频片段中解释了这个过程:

视频地址:https://youtu.be/A44hbogdKwI

由于不需要人类给数据贴标签,特斯拉可以尽可能多地收集有用的数据来训练它的神经网络。

这意味着,它的训练数据集的大小将与它的总里程数相关联。

和目标检测一样,特斯拉相对于Waymo的优势,不仅仅在于预测常见行为的数据更多,还在于能够收集罕见情况下的罕见行为的数据,以便预测这些行为。

路径规划/驾驶策略

路径规划和驾驶策略,指的是汽车采取的行动:在限速时保持在车道的中心,变更车道,超车,在绿灯时左转,看到乱穿马路的人停车,等等。

制定一套包含汽车在任何情况下可能需要采取的每一个行动的规则,似乎极其困难。解决这个难题的方法之一就是让神经网络模仿人类的行为。这被称为模仿学习(imitation learning),有时也称为学徒学习(apprenticeship learning),或从示范中学习。

训练过程,类似于神经网络通过绘制过去和未来之间的相关性,来学习预测其他道路使用者的行为。

在模仿学习中,神经网络通过它所看到的(通过计算机视觉神经网络)和人类驾驶员所采取的行动之间的相关性,来学习预测人类驾驶员会做什么。

为什么说特斯拉在自动驾驶上比Waymo更占优势_第2张图片

△特斯拉自动驾驶演示的静止画面

模仿学习,最近获得了迄今为止最大的成功:AlphaStar。DeepMind使用了数百万人玩的星际争霸游戏数据库中的样本,来训练神经网络,使其能够像人类一样玩游戏。

这个网络学习了游戏状态和人类玩家行为之间的相互关系,从而学会了预测人类在面对特定游戏状态时会做什么。

仅通过这种训练,AlphaStar就达到了DeepMind预估的能力水平,在星际争霸的竞争排名中处于中等水平。随后,AlphaStar通过强化学习得到了增强,提升到了职业玩家水平。(自动驾驶汽车可能有也可能没有类似的增强——这就是另一个话题了。)

特斯拉正在将模仿学习应用到驾驶任务中,比如如何处理高速公路立交桥上的陡峭弯道,或者如何在十字路口左转。听起来,特斯拉计划将模仿学习扩展到更多的任务上,比如如何以及何时在高速公路上变更车道。在下面的这个视频片段中,卡帕斯描述了特斯拉如何使用模仿学习:

视频链接:https://youtu.be/v5l-jPsAK7k

与预测一样,上传汽车周围场景的抽象表征就足够了,而不用上传视频。 这将意味着更低的带宽和存储要求。

与预测一样,一旦数据上传,就不需要人工标记。由于神经网络是预测人类司机在给定世界状态下会做什么,它所需要的只是世界状态和司机的行为。模仿学习,本质上是预测特斯拉司机的行为,而不是预测特斯拉司机周围其他道路使用者的行为。与 AlphaStar 一样,所有需要的信息都包含在所发生事情的回放中。

根据卡帕斯关于预测超车的评论,特斯拉可以在无法正确预测前方车辆是否会驶入特斯拉车道时,来触发汽车保存这一场景。

类似的,当涉及路径规划或驾驶策略的神经网络,不能正确预测特斯拉实际的行为时,特斯拉可以捕获可以回放的数据。

埃隆·马斯克(Elon Musk)过去曾提到过这种能力(或类似的能力),尽管目前还不清楚它是否在特斯拉汽车上运行。

相反,当特斯拉处于自动驾驶状态,或即将到来半自动驾驶模式时,这可能会带来丰富的数据,其中系统做错了一些事情,然后人类司机迅速演示如何正确地执行此操作。

其他可能会捕捉回放的情况是:突然刹车或转弯,自动紧急刹车,撞车或碰撞警告等等,以及更复杂的机器学习技术,被称为异常检测( anomaly detection)。

如果特斯拉已经知道它想要捕捉什么,比如在十字路口左转,它可以设置一个触发器,在视觉神经网络看到交通灯和左转信号灯被激活,或者方向盘向左转时捕捉回放。

结论

由于拥有大约50万辆汽车,特斯拉在三个关键领域优于Waymo (及其它竞争对手):

  • 计算机视觉
  • 预测路径规划 / 驾驶策略

关于收集正确的数据,付钱给人们贴标签,或者付钱购买带宽和存储并不能消除这些优势。通过设计好的触发器,使用不需要人工标记的数据,以及使用抽象表征(回放)代替原始视频,这些问题都得到了解决。

商业分析师、记者和普通公众的大多数观点,似乎是Waymo在自动驾驶方面遥遥领先,而特斯拉相差很远。但当你研究神经网络的基本原理时,这种观点是没有意义的。

更重要的是,AlphaStar是复杂任务大规模模仿学习概念的一个证明。如果你怀疑特斯拉的方法是否正确,或者路径规划/驾驶策略是一个易于处理的问题,你必须解释为什么模仿学习适用于星际争霸而不适用于驾驶。

我预测,除非Waymo采取激进的行动,以增加其车队的规模——在未来1-3年,认为Waymo遥遥领先,特斯拉是远远落后的观点,将被广泛摒弃。

人们一直过于关注那些没有告诉我们系统稳定性的演示,非常有限的脱离指标,以及Google/Waymo与顶级机器学习工程师和研究人员的接触。

他们对训练数据的关注太少,特别是在Waymo没有足够的数据来做好识别稀有物体和行为方面。

为什么说特斯拉在自动驾驶上比Waymo更占优势_第3张图片

△特斯拉的驾驶模拟(图片由特斯拉提供)

模拟不是Waymo的优势,因为特斯拉(像所有自动驾驶公司一样)也使用模拟。更重要的是,模拟不能生成罕见的对象和行为,而这些对象和行为,是模拟的创造者无法预料或不知道如何精确建模的。

纯粹的强化学习,并不适用于AlphaStar,因为星际争霸的行动空间太大,不适合随机探索,无法找到好的策略。

所以DeepMind必须通过模仿学习来引导学习。这显示了一个假设的弱点,就像 AlphaGo Zero 一样,纯粹的模拟体验可以解决任何问题。

特别是遇到像开车这样的问题时,预测人类的行为是一个关键组成部分。预测人类行为需要关于现实世界的经验信息。

自动驾驶汽车领域的观察者,可能低估了特斯拉吸引顶尖机器学习人才的能力。一项针对技术人员的调查发现,特斯拉是旧金山湾区第二受欢迎的公司,仅次于Google。

调查还发现,特斯拉在全球最受欢迎公司中排名第四,仅次于排名第二的Google。 (Shopify 在全球排名第三,SpaceX 排名第一。)

值得注意的是,机器学习的基本进步通常是由学术界、 OpenAI 以及 Google、 Facebook 和 DeepMind的企业实验室公开分享的。

特斯拉能做什么和Waymo能做什么之间的差别可能没那么大。

两家公司最大的区别在于数据。随着特斯拉的车队增长到100万辆汽车,它每月的行驶里程将达到10亿英里,是Waymo每月100万英里行驶里程的1000倍。

这1000倍的差异,对特斯拉来说意味着对稀有物体的检测更精确,对罕见行为的预测更准确,以及在面对罕见情况时,能够更好地制定路径规划/驾驶策略。

自动驾驶的挑战更多的是处理0.001%包含罕见边缘情况的里程,而不是99.99%不引人注目的里程。

因此,能从这0.001% 的里程数中收集大量训练数据的公司,比那些不能的公司做得更好,是合情合理的。

你可能感兴趣的:(人工智能)