撰文 / 白鸥
编辑 / 沈洁
过去半年时间里,城市辅助驾驶上演了一场激烈的“竞速赛”。
2021年7月,特斯拉开始向美国用户推送具备城市NOA功能的FSD 9.0 Beta,这次号称升级幅度最大的测试版本彻底放弃了对雷达传感器的依赖,转向了纯视觉路线——尽管特斯拉对新版本的实际表现持谨慎态度,但对于整个自动驾驶行业依旧是一次“巨大挑战”。
10月,何小鹏在1024小鹏汽车科技日上抛出结论:“量产城市场景辅助驾驶+全栈闭环能力建成=(智能驾驶)下半场入场券”,在将高级驾驶辅助系统的下一个突破点锁定在城市场景的同时,将实现这一技术量产的时间点锁定在了2022年。
12月,在毫末智行首届HAOMO AI DAY上,毫末智行董事长张凯在其“十大预测”中提到“2022年是城市智慧领航辅助驾驶量产元年”,在现场展示了城市NOH的无间断路测视频后,表示将在2022年上半年正式发布这一功能。
时至2022年,自动驾驶的路线之争已经尘埃落定。在众多自动驾驶企业还在讨论技术落地场景时,特斯拉、毫末智行与小鹏已经先行一步,开始布局城市域辅助驾驶技术的量产,这不仅意味着乘用车领域辅助驾驶技术的渐进式发展路线已经被汽车行业所广泛认同,也预示着自动驾驶行业的乘用车领域高级辅助驾驶竞赛已经正式进入了城市场景。
城市辅助驾驶已然成为自动驾驶行业下半场的关键点,可几大主流汽车厂商的自动驾驶系统是如何布局的?想必这是很多人关心的问题。
01 城市场景:更重要,但更复杂更难解
据调研显示,高速场景只占到一个普通用户驾驶时间的10%,并不算特别高频,也并不太复杂的场景;然而在城市场景打通辅助驾驶,就能从90%的时间里“掘金”,车企才意味着可以获得进入自动驾驶的终局资格。
在竞争越发激烈的自动驾驶赛道中,越早规模布局城市场景,就能越早在整条赛道中取得先机。
特斯拉FSD 9.0 Beta城市路试
实现辅助驾驶在城市场景的落地,也是在高速场景后必须正视的难题。特斯拉、毫末智行与小鹏等提供的高速场景辅助驾驶系统已经先后实现量产,能够实现自主超车、自主变道、自主上下匝道等高阶驾驶辅助功能。
然而高速场景相对更封闭,而城市场景下复杂场景和出现corner case的几率要远高于前者,其行车方案不一定有全局最优解,反而更强调局部最优解的攻克,也就意味着同样的驾驶环境,自动驾驶可以选择很多种可能的解决方案;另外对长序时间维度的要求很高,车辆不仅需要做出当下的反应,还需要为接下来的一段时间做好规划,估算出位置空间、速度、加速度等诸多信息。
借助高精地图实现高速NGP功能的小鹏P7
对于自动驾驶行业来说,每一项技术的突破与落地都称得上是一次质变。从高速域进入城市域,辅助驾驶的难度、复杂度将是指数级提升。但庞大的用户需求与市场机会催促着自动驾驶企业加速研发城市驾驶辅助系统,以特斯拉、毫末智行、小鹏为代表的自动驾驶企业也先后交出了自己的答卷。
02 辅助驾驶的进击:路线不同但殊途同归
特斯拉在业界的独立特行不仅来自于其CEO,也来自于堪称头铁的技术路线。
搭载特斯拉最新Autopilot的车型不仅没有采用激光雷达,也没有采用高精度地图,其完全依赖车身四周 8 个摄像头提供的原始图像,视觉信息首先通过摄像头由FSD芯片交由AI神经网络技术进行识别、分析与运算,其中一部分算力由车端HW 3.0芯片承担,超过车端算力的则分摊至Dojo超级计算机。
对此,特斯拉将其解释为,“我们希望能够打造一个类似动物视觉皮层的神经网络连接,模拟大脑信息输入和输出的过程。就像光线进入到视网膜当中,我们希望通过摄像头来模拟这个过程。”
与特斯拉相比,小鹏与毫末智行采用“摄像头+激光雷达+高精地图”的技术路线便稳妥了许多。小鹏XPilot 3.5以高精地图为主导,视觉系统作为辅助,激光雷达作为冗余支持,加以30 TOP NVIDIA Xavier支持,不仅能够实现厘米级城市定位能力,还能并串联停车场、高速、城市道路等不同场景。
毫末智行则为最新上市的魏牌摩卡DHT-PHEV提供单板算力可达360TOP的自研域控制器“小魔盒3.0”,并依靠高精地图与5个毫米波、12个超声波、1个感知摄像头、4个环视摄像头组成的第一梯队级别的硬件配置,实现高速域与即将上线的城市域的辅助驾驶体验。
不论是纯视觉路线还是视觉+雷达+高精地图路线,各大自动驾驶企业在硬件层面的堆栈都是为了更高效地感知驾驶环境,从而获取、分析、计算数据——与特斯拉、小鹏类似,毫末智行同样将自动驾驶的发展核心聚焦在了数据。
对此,毫末智行CEO顾维灏表示,“数据是人工智能最大的驱动力,也是人工智能进步过程中最大的成本。自动驾驶产品的完善是个漫长的进化过程,就像是人在漫长的历史过程中,找到用最低能量消耗维持生命的方法,开发智力和积累经验进化人类文明。”——简而言之,毫末智行发现完善自动驾驶的前提并非是软硬件的无脑堆砌,而是收集并整理用户在驾驶过程中的所有有效数据。
基于这一理解,毫末并将其归纳为指引自动驾驶实现的方法论。在对海量用户累计行驶里程数据进行分析总结后,毫末得出了自动驾驶能力发展曲线:F=Z+M(X)。其中F代表产品力,Z代表毫末第一代产品,M是一个把数据转化为知识的函数,包括数据获取、表达、存储、传输、计算、验证,以及对成本和速度的影响,也就是毫末智行最核心的数据智能体系MANA。
毫末智行发布的中国首个自动驾驶数据智能体系MANA
基于数据智能MANA带来的坚实基础与前瞻性,同样要依靠量产车型提供的数据进行大规模采集、测试与验证,毫末智行虽然在起步阶段不及特斯拉与小鹏,其自动驾驶技术规划却更加系统全面,为乘用车辅助驾驶技术的数据领域提供了教科书式的学习模板:
在感知智能方面,同样搭配高精地图+摄像头+激光雷达的硬件组合,毫末智行为了提升融合感知效果,选择从摄像头和激光雷达的感知中间结果,经过Transformer的多模态融合映射到tensor space中,然后加入时序的特征进行时空融合,由此快速拉升感知能力,实现了1+1≥4的效果;
在认知智能方面,毫末智行认为认知需要具备安全、舒适、高效三大要素。
安全上,毫末拥有全栈自研安全认知模型CSS,其核心是自动驾驶系统不只局限在从纯机械的角度保证自己不主动犯错,而是充分考虑从数据中学习到的对其他交通参与者行为的理解和超时空的历史经验;在安全底线之上,从数据中学习舒适和更高效的量化标准,让自动驾驶算法可以更好地处理纷繁复杂的驾驶场景,制定更符合用户喜好的驾驶策略。并且通过自动化场景挖掘、强化学习、仿真引擎构建认知智能闭环系统,持续不断从海量人驾数据中提取知识,快速迭代车端认知算法能力;
在数据标注层面,毫末正在研究一种端到端的模拟学习,即以过往的事例为指导,从数字化的场景中得到具体的本车动作。这一过程中,所有的动作都已经在人们自己开车的过程中自己被标注。而毫末则挑选更符合要求司机的驾驶行为,在不同场景下持续的训练。同时,毫末实践了很多深度强化学习的方法,并构建了闭环自动标注系统,运用了无监督自动标注算法,大大提升了数据标注的效率,以适应大规模量产的需求;
在仿真能力层面,毫末智行将仿真系统比作“自动驾驶元宇宙”,通过在这个“元宇宙”中进行感知和认知的效果验证,大大提高了验证效率;
而在计算能力方面,除了毫末智行自研的单板算力可达360 TOP的“算力怪兽”ICU 3.0车端域控制器外,毫末智行也宣布将建立自己的超算中心,主要用于自动驾驶的数据处理、训练、推理和验证等需求。这也标志着中国自动驾驶将正式进入超算中心时代。
毫末乘用车智能驾驶产品路线图
数据智能MANA让毫末智行成为了中国首个宣布在自动驾驶领域,大规模研发落地数据智能体系的公司,而以MANA为核心,毫末智行最终将实现完整全栈自主闭环能力,构建更稳定、更安全、会学习的高阶辅助驾驶系统,并在城市NOH后,逐步实现全场景NOH能力。
03 谁能从数据中“掘金”,谁将赢得下半场入局之战
我们从毫末智行的技术实践看到,完善的数据智能体系是AI自动驾驶科技公司成功的基石。显而易见,在自动驾驶下半场的城市场景之战中,谁能高效低成本地挖掘数据价值,谁就能成为竞争的王者。
对此,国内知名投行中金公司《人工智能十年展望(二):边际成本决定竞争力,算法龙头主导格局优化》报告中指出,深度学习模型的准确性很大程度是数据驱动的,数据量大、质量高、多样性强很大程度上解决了训练过拟合的问题,是好模型的基础;
由于AI行业独特的数据反馈机制造就了行业的先发优势,当下处于AI大规模商业化落地的早期阶段,跑马圈地、抢占优质的大客户是AI行业关键竞争点——这不仅与毫末智行以数据智能MANA为核心,遵循降低成本、提高迭代速度的初衷相吻合,更肯定了毫末智行、特斯拉、小鹏们通过量产落地推动数据规模增长的技术路线,为自动驾驶行业指明了前进方向。
2022年,乘用车领域辅助驾驶规模量产之战已经开启,特斯拉、毫末智行、小鹏也以略有迥异的技术实践为自动驾驶行业带来了更多惊喜与可能,然而利用大模型与大规模数据升级自动驾驶算法、并以更高效、更低成本实现量产,已经成为整个自动驾驶行业的共识。
在这场竞赛中,作为成立仅两年多的创业型企业,随着城市辅助驾驶量产方案落地的日期临近,以数据智能为核心的毫末智行可以说是率先获得了同特斯拉、小鹏汽车这些主机厂一样的下半场竞赛的入场券。
城市辅助驾驶之战已然拉开序幕,谁能领先一步,让我们拭目以待。