由于操作无人驾驶汽车的计算机要理解道路的规则,一些工程师认为,如果能从虚拟现实的环境中吸取经验教训,而不是开到大马路上学习,那就太好了。
丰田(Toyota)、优步(Uber)和Waymo等公司已经详细探讨了如何在加州山景城(Mountain View)、凤凰城(Phoenix)和其他城市的街道上测试自动驾驶汽车。众所周知的是,他们也在这些城市的计算机模拟环境中测试车辆。虚拟车配备了与真实产品相同的软件,花费数千小时培训数字化驾驶。
模拟驾驶是一种训练自动驾驶汽车的新方式,在运行过程中,自动驾驶汽车既不危及人身安全,又能把自己的缺陷展示出来。如果汽车在模拟驾驶过程中出错,工程师可以相应地调整软件,制定新的行为规则。近日,从谷歌剥离出来的自动驾驶汽车公司Waymo展示了他们道路模拟器的测试。
研究人员也在开发新方法,使汽车能够从这些模拟中主动学习新行为,更快地掌握技能,而不是依靠人类工程师写的代码。“模拟是一件了不起的事情。”丰田研究所(Toyota Research Institute)首席执行官吉尔·普拉特(Gill Pratt)说。该研究所也是一个人工智能实验室,正在探索这种虚拟训练,用于自动驾驶汽车和机器人。
在VR环境中,Waymo的无人驾驶汽车可以在同样的驾驶条件下,在同样的交叉路口进行数千次的驾驶练习
上述方法是机器学习加速自动驾驶汽车发展的大量努力之一。十年前,谷歌设计第一个自动驾驶汽车时,工程师们需要一行一行地敲代码构建大部分软件,仔细地编写一小段一小段的行为。但随着计算能力的进步,自动驾驶汽车制造商都能使用大量复杂的算法,这些算法可以自己学习任务,比如,在道路上识别行人,或者预测未来的事件。
“这就是为什么我们开发越来越快的原因,”卢克·文森特(LucVincent)说,他最近在优步的主要竞争对手Lyft公司开展了一个自动驾驶汽车的项目,“10年前,当谷歌开展自动驾驶研究时,这些东西还不存在。”
但算法自主学习仍然存在一些问题。最值得注意的是,这些算法通过主动分析,比任何人都能掌握更多信息,有时工程师很难对机器的行为进行审查,并理解它们为什么会做出特别的决定。在未来几年里,机器学习对于自动驾驶汽车领域的持续发展至关重要。
现在的自动驾驶汽车看起来并没有太多的自主权。经过10年的研发和测试,谷歌准备在亚利桑那州提供一些公共汽车。据最近的一份报告显示,谷歌母公司旗下运营的Waymo公司正准备在凤凰城附近推出出租车服务,与其他服务不同的是,这些出租车方向盘后没有配备应对意外的司机。这两天,Waymo的“真”自动驾驶汽车已经在凤凰城路测了。不过,这些出租车仍将受到严格控制。
目前,如果没有一个备用司机,任何自动驾驶汽车都可能被限制在满足一定条件的小区域内行驶,如街道宽阔,降水量少,行人相对较少的地方。它只能低速行驶,如果没有红绿灯或街道标志,在左转或并入主路时,会变得非常缓慢。
一些行业巨头相信这些汽车最终能在持续的开发和测试中处理更困难的情况,新的传感器可以提供更详细的关于周围世界的复杂情况以及给机器学习提供大量的数据经验。
Waymo和它的许多竞争对手已开始使用深度神经网络,复杂的算法可以通过分析数据来学习任务。例如,一个神经网络可以通过分析行人的图像,学会识别行人。这些算法也有助于识别街道标志和车道标志,预测下一步会发生什么,并计划前行路线等。
深度神经网络的问题在于,它需要相机、雷达和其他传感器收集大量数据,这些传感器可以记录真实世界的物体和路况。人类必须给这些数据贴上标签,识别行人、街道标志等。但无法将每一种情况的数据收集和标记下来。例如,事故数据就很难获得。此时虚拟现实就派上用场了。
最近,Waymo公司推出了一款名为Carcraft的道路模拟器。该公司表示,这个模拟器可以提供一种测试自动驾驶汽车的方式,而在现实世界中这种方式无法实施。该公司汽车在虚拟道路上花费的时间比真实环境中花费的要多得多。与其他公司一样,Waymo公司也在探索算法在这种模拟器中学习新行为的方法。
今年早些时候,在无人驾驶的情况下,测试软件使用一辆雷克萨斯运动型多功能车(Lexus suv)来绘制凤凰城的地图
普拉特表示,丰田已经在使用一种模拟路面的图像来训练神经网络,这种方法目前取得了可喜的进步。换句话说,模拟世界与物理世界非常相似,能可靠地训练操作汽车的AI系统。
道路模拟器的优点之一是研究人员能完全控制它。他们不需要花时间和金钱给图像贴上标签,何况还有可能贴错标签。普拉特解释说:“你知道每辆车的位置,你知道每个行人在哪里,你知道每个骑自行车的人在哪里,你知道天气如何。”
一些人正在探索一种更复杂的方法,叫强化学习。这是全球许多顶级人工智能实验室的一个主要研究领域,包括DeepMind(谷歌位于伦敦的实验室)、伯克利人工智能研究实验室和OpenAI(由特斯拉首席执行官埃隆·马斯克和其他公司创建的旧金山实验室)。这些实验室正在构建算法,允许机器通过大量试错在虚拟世界中学习任务。
DeepMind用这种方法制造的阿尔法狗系列,在围棋领域已没人能望其项背。现在,DeepMind和其他一些领先的实验室正在让他们的机器玩星际争霸之类的复杂视频游戏。这看起来有些随意。但是,如果机器能驾驭这些虚拟世界,它们就能驾驭现实世界。
例如,优步的研究人员正在训练他们的自动驾驶汽车操作系统玩一种流行的游戏《侠盗猎车手》(Grand Theft Auto),他们的目标是将游戏中学到的驾驶方法应用到现实世界的汽车上。下一步,他们也会在现实街景的模拟环境中训练系统。
普拉特说,消除虚拟和现实之间的差距并非易事。此外,公司还必须确保算法在学习的过程中不会学到意想不到的或有害的行为。这是人工智能研究人员的一大担忧。
出于这个原因和一些别的原因,丰田和Waymo这样的公司并没有单纯地围绕机器学习来建造自动驾驶汽车。他们还会用更传统的方式手动编写软件,以保证一些行为能够发生。例如,Waymo的汽车不只会在红灯前停车,工程师还编写了一个严格的规则,可以让汽车停下来。
但该行业正朝着应用更多机器学习的方向发展着。Waymo的工程副总裁德米特里•多尔戈夫(Dmitri Dolgov)表示,机器学习提供了一种更好的方式来训练汽车去做识别道路交通规则之类的任务。但更重要的是,当一辆车需要对周围的环境有更深入的了解时,自主学习这一点就变得更加重要了。
—完—
来源:nytimes
作者:Cade Metz
智能观 编译
想知道AI加教育领域有哪些最新研究成果?
想要AI领域更多的干货?
想了解更多专家的“智能观”?
请在对话界面点击“找找看”,去获取你想要的内容吧。