走向大模型、大算力、大数据:特斯拉与毫末的自动驾驶AI路径寻踪

走向大模型、大算力、大数据:特斯拉与毫末的自动驾驶AI路径寻踪_第1张图片

2022行至年终,各种年度总结也纷至沓来。要说最近的大事件,一定少不了:自动驾驶又双叒寒冬了。

大量“报忧不报喜”的新闻,说明2022年自动驾驶行业确实出现了一定程度的波动:激光雷达鼻祖德国ibeo和独角兽Argo.ai相继破产;不少自动驾驶公司传出裁员和组织架构调整,Waymo的估值大幅下跌,起火撞车等负面舆论不断……这些事件都引发了悲观情绪,让“寒冬说”显得有理有据。

但如果我们去仔细探究就会发现:第一,人工智能永远是在泡沫和寒冬中振荡,自动驾驶寒冬的论调其实早在几年前就出现了,但主机厂、科技企业、资本市场对自动驾驶的投入并没有冰封,参与者众多;第二,调整和波动也不一定就意味着悲观,寒冬期往往也是优胜劣汰,比如此次调整后很多厂商都将目光转向了L2级别的辅助驾驶技术,大浪淘沙始见金,这正是具有领先技术优势的AI公司展露生命力的时机。

更进一步,中美公司作为自动驾驶领域中AI技术的头部选手,其所面临的背景和挑战实际上也有差异,中国自动驾驶企业接下来走向何处,恐怕不能简单地依靠海外独角兽的境遇来判断。

所以,我们需要抛开情绪,回归事实,去对比一下,中美在自动驾驶技术模式上究竟有哪些异与同,开往春天的自动驾驶又需要穿越哪些障碍?

目前,以国外的特斯拉、国内的毫末智行等为代表的渐进式自动驾驶公司,都已经实现了乘用车辅助驾驶产品规模量产和商业化落地。前不久,毫末智行和特斯拉也相继举办了第六届HAOMO AI DAY、2022Tesla AI Day,公布了各自的最新产品和技术成果。

近日,毫末在其三周年内部信中新发布了其愿景“让机器智能移动,给生活更多美好”,这其实也透露出一个信号,那就是自动驾驶AI技术其实可以广泛复用在各种场景的机器人上。因此,自动驾驶的前景不言自明,所以,最终的关键就在于自动驾驶技术是否能抵达规模落地的终局?

深入对比两家在自动驾驶AI技术的探索,我们可以发现,两家正在积极拥抱以大数据、大算力、大模型为标志的自动驾驶3.0时代,同时在技术及产品等多个方面,也展现出中美自动驾驶发展模式的一些异同。

我们用一张图进行简单对比:

走向大模型、大算力、大数据:特斯拉与毫末的自动驾驶AI路径寻踪_第2张图片

可以看到,自动驾驶行业正在迎来一个深刻的产业之变,如何穿越寒冬、巩固王城,我们可以从这两家企业的技术探索的步履中找到线索。

走向大模型、大算力、大数据:特斯拉与毫末的自动驾驶AI路径寻踪_第3张图片

高阶自动驾驶“降维”

与智能辅助驾驶“升级”同时进行

无论媒体、企业还是大众,可能都被这一场突如其来的自动驾驶“寒冬”风波惊吓得不轻。但平静下来,会发现这场风波其实早有征兆。

一方面,L4及以上的自动驾驶技术非常困难,道路漫长,技术前景模糊,2019年初,时任Waymo首席执行官约翰·克拉夫奇克就曾公开表示“自动驾驶汽车可能永远无法在全路况条件下行驶”,算是预言了这场高阶自动驾驶技术的“寒冬”。

另一方面,商业化落地遥遥无期,让投入巨大的自动驾驶公司很难在短期内实现盈利,去年头豹研究院发布的一份研报就认为,Robotaxi模式是处在“伪概念”阶段,相关公司仍深陷“量产地狱”。

客观来说,对于高阶自动驾驶的质疑早已非一日之寒,而大量高阶自动驾驶的企业也开始主动“降维”,发力辅助驾驶。传统主机厂如福特和大众停止Argo AI的投入之后,转而集中资源做L2+高级驾驶辅助系统和L3自动驾驶系统的开发。一批优秀的L2级别自动驾驶相关企业开始蚕食传统博世、大陆、奥托立夫等公司的份额。而博世也投资了文远知行以展开乘用车的L2-L3级自动驾驶软件开发。

近年来,智能辅助驾驶与特定场景下的高阶自动驾驶商用车,展现出较强的商业化前景。特斯拉、毫末智行等都已实现了规模化量产,市场正在加速打开。

随着更多竞争者的加入,以及AI技术的发展,自动驾驶正在进入以大数据、大算力、大模型为标志的新时代,智能辅助驾驶也开始沿着以数据驱动的大数据、大模型技术路线进行升级。其中,特斯拉已经是特斯拉是进入自动驾驶3.0阶段的领跑者,中国自动驾驶企业如毫末智行也在加速冲刺。

走向大模型、大算力、大数据:特斯拉与毫末的自动驾驶AI路径寻踪_第4张图片

高阶自动驾驶“降维”与智能辅助驾驶“升级”同时发生,是产业转折期出现的新变化。总的来说,以渐进式路线作为核心战略的头部自动驾驶企业,破解了困扰自动驾驶的商业化难题,是比较值得关注的。

与此同时,中美自动驾驶的技术趋势、基础设施、政策引导、产业链情况也各有不同,所以尽管美国的特斯拉和中国的毫末智行,同为渐进式自动驾驶企业,但在进入3.0阶段,对于大数据、大算力、大模型的战略部署与落地应用,也出现了一定的差异。

以特斯拉和毫末智行为例,在核心战略与技术路线上是高度对齐的,都专注于渐进式技术路线,打造智能辅助驾驶产品,比如特斯拉的Autopilot、毫末智行的HPilot智能辅助驾驶产品,并积极推动自动驾驶3.0阶段的到来,在大数据、大模型、大算力这三大技术能力上做了大量工作。

简单形容双方的异同,就是前往同一目的地,但彼此会乘坐不同交通工具。接下来我们就分析一下二者的异同,可能对接下来自动驾驶行业的发展带来不少启发。

目的地一:

增强感知能力,大模型“出奇迹”

走向大模型、大算力、大数据:特斯拉与毫末的自动驾驶AI路径寻踪_第5张图片

自动驾驶技术架构与解决方案,需要同时包含感知、决策、执行这三部分。其中,传统的自动驾驶感知系统是由各类传感器组成的,包括激光雷达、毫米波雷达及各类摄像头。

特斯拉采用了纯视觉感知路线,即去掉毫米波雷达等感知器,完全依靠车载AI摄像头收集数据,作为自动驾驶算法的决策依据。这种模式的好处是,减少了激光雷达的使用,大大降低了自动驾驶汽车的整体造价,视觉方案对行人、交通标志标线等细节有很强的感知能力,成本优势明显,有助于商业化进展。但少了传感器的辅助,会影响到自动驾驶系统的可靠性。

中国城市场景更加复杂,毫末智行则采用视觉+雷达等多模态融合感知,其中视觉摄像头负责细节感知,而雷达传感器提供对环境距离、速度等的精准感知,这种方案为自动驾驶提供冗余感知,在可靠性、安全性上更胜一筹,更容易满足城市管理者及居民对自动驾驶的要求,减少事故发生率,对产业良性发展带来助益。

为此,毫末从第一性原理出发思考自动驾驶感知的最优落地方案,选择了“重感知”这一路线,在城市导航辅助驾驶场景,实现只依赖和人类驾驶员一样的普通导航地图而不依赖业界常用的高精地图,从而避免了高精地图覆盖范围、鲜度更新以及维护成本等挑战。

选择“重感知”路线的背后,其实是毫末更注重大模型算法的投入,即通过数据智能体系MANA建立强感知的时空理解能力,通过使用时序的transformer模型在 BEV 环视空间上构建实时局部空间,通过这种方式让车道线的感知输出更加稳定和准确。通过强大的实时感知能力,整个过程只需要普通导航地图里面的相对可靠的拓扑信息即可,最终让车辆像我们人类自己开车一样进行环境感知。

感知系统的发展进化,也使得数据规模不断提升,将高维数据抽象成感知能力,这就需要高效的AI模型,进行分析预测和控制,这也是自动驾驶系统的核心技术。

走向大模型、大算力、大数据:特斯拉与毫末的自动驾驶AI路径寻踪_第6张图片

总体来说,特斯拉和毫末智行都积极布局大模型的落地应用,将Transformer引入自动驾驶系统中,来提升AI模型效果,实现自动驾驶系统感知智能和认知智能的大幅优化,从而减少对高精度地图的依赖。

走向大模型、大算力、大数据:特斯拉与毫末的自动驾驶AI路径寻踪_第7张图片

特斯拉使用Transformer与CNN、3D模型等相结合,组成综合的神经网络系统,对汽车AI摄像头所采集的图像数进行跨时间的图像融合,来实现基于语言模型的车道线感知、基于向量空间的路径规划等功能。

走向大模型、大算力、大数据:特斯拉与毫末的自动驾驶AI路径寻踪_第8张图片

毫末智行从2021年7月开始,就启动了对Transformer的研究和落地尝试,也是中国第一家应用Transformer的自动驾驶公司。借助Transformer实时建模能力,对多模态融合感知数据进行数据前融合,搭建具有时序特征的立体场景,让自动驾驶系统具有强大实时感知能力,在城市环境中不依赖高精地图,也能应对道路模糊、复杂路口、环岛等道路感知挑战。比如毫末智行自研的BEV Transformer,就在城市道路上实现了多传感器融合车道线识别。

走向大模型、大算力、大数据:特斯拉与毫末的自动驾驶AI路径寻踪_第9张图片

此外,AI系统还需要在仿真环境中进行验证、训练和迭代,场景构建会直接影响到模型训练。特斯拉是基于虚幻4引擎渲染的仿真环境,来测试自动驾驶系统在极端情况、复杂环境中的效果。毫末智行则选择与阿里及德清政府合作,将真实交通流导入到仿真引擎中,用于路口场景的调试验证。二者的区别在于,特斯拉的虚拟仿真环境只用于复杂情况测试,训练效率高;毫末智行的真实仿真环境,对自动驾驶系统的现实表现提升帮助很大,但场景重复度比较高。

走向大模型、大算力、大数据:特斯拉与毫末的自动驾驶AI路径寻踪_第10张图片

目前来看,Transformer为代表的大模型,凭借对大数据优势的释放、强大的序列建模能力、全局信息感知能力,以及为算法开发提质增效等优势,正在成为自动驾驶企业的主流选择,而特斯拉、毫末智行也因为先行先试,取得了领先优势。

走向大模型、大算力、大数据:特斯拉与毫末的自动驾驶AI路径寻踪_第11张图片

目的地二:

降本增效,让大数据“纵享丝滑”

大模型需要海量数据的“喂养”,自动驾驶感知系统的升级使得数据规模激增。数据量一方面是自动驾驶企业的核心竞争力之一,另一方面也带来了标注、处理、分析、存储等压力和成本。因此,在自动驾驶3.0阶段,大数据的降本增效将成为自动驾驶企业的关键赛点。

走向大模型、大算力、大数据:特斯拉与毫末的自动驾驶AI路径寻踪_第12张图片

正如毫末智行CEO顾维灏所说:“样本标注的时间成本和金钱成本还是很高,我们需要有一种能够直接使用大量无标注数据的方法,这样才能更高效地发挥出毫末在数据规模方面的优势”。

特斯拉和毫末智行都很重视大数据的降本增效,不过,由于历史积累不同,双方的大数据解决方案也各有侧重。

走向大模型、大算力、大数据:特斯拉与毫末的自动驾驶AI路径寻踪_第13张图片

特斯拉发展较早,数据规模远远领先其他自动驾驶厂商,依靠数据引擎Data Engine,实现了数据验证、标注、训练、部署的闭环,充分发挥大数据的价值。不过,早期无监督学习尚不成熟,特斯拉也依赖人工标注与自动化标注同时进行,自建了超千人的数据标注团队,也难免会遇到人工标注效率低的问题。目前,特斯拉也在积极提高数据自动标注的质量和效率,引入无监督学习,来对海量道路信息进行标注。

走向大模型、大算力、大数据:特斯拉与毫末的自动驾驶AI路径寻踪_第14张图片

毫末智行创业初期,就很重视数据价值和数据效率,选择使用无数据标注的自监督学习,高效发挥出毫末在数据规模方面的优势。构造了一个增量式的学习训练平台MANA,通过标注过程的自动化,提高数据利用的效率。截至目前,数据智能体系MANA的学习时长已经超过40万小时。

走向大模型、大算力、大数据:特斯拉与毫末的自动驾驶AI路径寻踪_第15张图片

大数据的降本增效,直接影响到自动驾驶企业的商业化潜力。特斯拉和毫末智行依据各自的发展状况、先天基础、技术路线、产业环境,已经找到了各自的解法。

目的地三:

持续投入,让大算力“供给自由”

走向大模型、大算力、大数据:特斯拉与毫末的自动驾驶AI路径寻踪_第16张图片

基于大数据、大模型的自动驾驶系统,需要澎湃算力的支撑,算力因此成为决定自动驾驶系统天花板的关键要素。如何为自动驾驶汽车和系统提供源源不断的大算力,也是特斯拉、毫末智行等头部企业所重点布局的领域。

目前来看,特斯拉和毫末智行都采取了自研硬件+超算中心的解决方案。

硬件方面,端侧计算平台来满足自动驾驶系统对计算实时性、低延迟性的高要求,来保障实时分析决策和操作指令的及时执行。特斯拉FSD 1.0能够提供144 TOPS算力,能够满足L2/L3级别自动驾驶的需求;毫末智行推出的硬件计算平台小魔盒3.0,算力则达到了360 TOPS,为后续的软硬件升级留下了更多空间。

走向大模型、大算力、大数据:特斯拉与毫末的自动驾驶AI路径寻踪_第17张图片

通过云端算力处理大量回传数据,训练迭代算法模型,更具成本优势和性能优势,特斯拉和毫末智行也都开始建设智算中心,为自动驾驶大模型训练、大数据分析处理提供算力支撑。智算中心需要一定的建设周期,且投入较大,特斯拉由于布局更早,已经研发出了专门用于自动驾驶训练的云端AI芯片D1以及计算中心Dojo,其云端超算中心Dojo计划在2023年投入使用。

走向大模型、大算力、大数据:特斯拉与毫末的自动驾驶AI路径寻踪_第18张图片

毫末智行则是正在紧锣密鼓地推出中国自动驾驶公司的首个智算中心——毫末智算中心,率先开启了行业基础设施的探索和布局。毫末智算中心的核心目标是满足千亿参数大模型的训练需求,处理数据规模100万clips,整体训练成本降低200倍。大算力资源的持续投入,将使得数据训练和模型迭代实现“算力自由”。

走向大模型、大算力、大数据:特斯拉与毫末的自动驾驶AI路径寻踪_第19张图片

可以看到,大算力是一个时间工程,不是一朝一夕能够建立起竞争壁垒的,需要引起自动驾驶企业的高度重视,特斯拉、毫末智行这样先知先觉的发力者,则更有可能在接下来的自动驾驶市场竞争中占据优势身位。

走向大模型、大算力、大数据:特斯拉与毫末的自动驾驶AI路径寻踪_第20张图片

拨云见月:

自动驾驶商业化的半程风景

经过大模型、大数据、大算力的一路闯关,特斯拉和毫末智行最终殊途同归,都实现了成本更优基础上的规模化量产,展现出自动驾驶3.0阶段的商业化能力。

具体来说,特斯拉有着堪称“生产狂魔”的量产能力,依托高度自动化、模块化的超级工厂,使其电动汽车的市场占有率一骑绝尘。毫末智行也依托智能驾驶产品的规模化量产,以及智能驾驶产品流程化、异步并行开发的工程能力,实现了产品稳健迭代与交付,拿下中国量产自动驾驶第一名。

从这个角度看,尽管中美自动驾驶的AI技术路线在细节上有所不同,但根本目标都是一致的,那就是推动自动驾驶技术成长,让自动驾驶产业成为数字经济的核心支柱产业之一。而这个终极目标最需要的努力也是有共性的:

1.技术能力的强势崛起。毫末智行能够加速冲刺3.0时代,靠的是底层技术的厚积薄发,中国首个自动驾驶数据智能体系MANA,中国最大规模的认知智能场景库,让可行、可靠、可商用的自动驾驶成为现实,也让同赛道选手很难超越。

2.商业市场的广泛认可。领先的技术能力和产品基础,为毫末智行和特斯拉带来了市场的信任,又得以在场景中促进数据能力的迭代,从而能生产出更好的产品,形成良性循环,构筑了市场领先性。

3.无人区的自主探索。如果说,技术与市场都有发展参照物,那么自动驾驶作为一个与城市空间、社会经济生活深度结合的技术,也需要中国企业担负起一些新问题的探索,比如安全性的保障、参与自动驾驶法律法规行业标准、电动汽车的产业链共荣、低碳绿色的社会责任、东数西算工程的发展等,将自动驾驶技术的商业价值与社会价值进一步释放,毫末智行为代表的中国厂商正在路上。

在所谓的“寒冬”里,特斯拉和毫末为代表的自动驾驶企业反而踏上了开往春天的高速路。

2022年有一个特别打动我的场景,是毫末智行的董事长、CEO等高层都是亲自下场,跟技术团队一起,走在城市的一条条街道上路测,从白天走到黑夜,从白皮肤晒成了黑脸庞……这个画面说明,中国自动驾驶产业的路,只能由中国企业一步一个脚印地从土地里踩出来。

正是无数这样的步履,让我们相信,中国AI、中国企业,一定会在自动驾驶的舞台上不断抵达未来。

走向大模型、大算力、大数据:特斯拉与毫末的自动驾驶AI路径寻踪_第21张图片

你可能感兴趣的:(走向大模型、大算力、大数据:特斯拉与毫末的自动驾驶AI路径寻踪)