自动驾驶系统为何要打上「思想钢印」?北京顺义闹市区里藏着毫末智行的谜底...

贾浩楠 发自 凹非寺
量子位 报道 | 公众号 QbitAI

城市领航辅助驾驶,已经是“现货”了。

北京顺义闹市区,11公里自动驾驶全程无接管:

明年上线交付,技术来自毫末智行,一家成立2年的自动驾驶公司。

这2年间,毫末以惊人的速度完成了产品量产上车,积累了400万公里真实路测里程,还刚刚融到近10亿元,晋身独角兽。

进展之快业内罕有,但是从何而来?

毫末智行AI DAY也许可以一探究竟。

毫末城市NOH顺义城区11公里无接管

NOH,是毫末智行的智能驾驶领航产品。

与乘用车上常见的辅助驾驶不同,NOH不再局限于简单的巡航、跟车、车道偏离预警这些功能,而是真正意义上给驾驶员减负。

自主规划线路、自主选择行驶策略、自主避让障碍、自主变换车道…

你更熟悉的,可能是覆盖高速路段的智能领航产品,因为高速场景边界条件更清晰简单,实现起来更容易。

毫末有勇气挑战城市路端,表现到底怎么样呢?

首先是红绿灯识别,确认可通行后进行无保护左转:

根据导航路线,下个路口即将右转时,NOH会互动提前主动变道:

主动避让违规横穿马路的行人:

还会主动避让加塞的车辆:

接下来是一连串高难度自主进出环岛动作,期间还完成了避让两轮电动车:

待转区也能准确识别并正确驶入驶出:

还有两个很有意思的细节,其中之一是车辆减速通过没有隔离带的路段:

这说明NOH对环境识别精准度很高。

另一个是车辆减速通过没有红绿灯的路口:

这样的策略表明毫末的NOH不是一味保守死板,在保证安全的条件下依然会兼顾通行效率。

在行业大部分玩家还在激烈争夺高速领航辅助驾驶落地时,毫末智行已经将NOH能力扩展到城市道路。

对于这样的效率,毫末智行解释说是因为他们给自动驾驶烙上了思想钢印

在这个思想钢印的信念之下,诞生了国内首个自动驾驶数据智能体系MANA

给自动驾驶烙上思想钢印

毫末智行数据智能技术体系MANA,中文名叫雪湖

命名来自《三体》,面壁者罗辑掉入冰封的湖面,从此参透黑暗森林法则,找到了打破三体威胁的规律,开启威慑纪元。

毫末以此命名,含义有从MANA开始,彻底领悟掌握自动驾驶的核心能力之意。

自动驾驶系统为何要打上「思想钢印」?北京顺义闹市区里藏着毫末智行的谜底..._第1张图片

而这就是数据驱动

特斯拉身先士卒,证明了巨量数据、超大算力、快速迭代的闭环能力对自动驾驶的重要性。

“数据驱动”这个概念,其实像黑暗森林法则,初闻之时感觉字字在理,却平平无奇,难以领会深意。

数据闭环的模型其实在各个自动驾驶公司都大同小异,核心无非就是“数据收集-训练-部署-再收集”的循环。

但实操起来却不是那么简单。

巨量数据涌进系统后,怎么处理?如何分类打标?怎么加快训练速度?验证测试是不是要在各种气候路况下重新跑一遍?

这些问题,成立刚满两年的毫末智行,悟了。

能让数据驱动真正形成闭环的条件不复杂,毫末把它们变成思想钢印,刻在自动驾驶研发之中。

自动驾驶系统为何要打上「思想钢印」?北京顺义闹市区里藏着毫末智行的谜底..._第2张图片

思想钢印命题只有一个,那就是:

研发、量产、落地,坚定低成本高速度

首先是低成本,包括数据收集、处理、AI模型训练、系统测试等环节。

其次是高速度,一一对应上面的各个环节。

其中,成本既有数据的传输、存储等人力财力成本,也有AI训练、测试时的时间成本。

不用说,成本越低当然数据获取就越多,模型迭代越快。

而高速度,则能保证巨量数据拿到手后紧紧有条按部就班,快速把数据优势转化成产品端的技术进步。

参透这两点,数据驱动才能爆发出巨大能量。

毫末智行建设的MANA数据智能体系,一切都是为这两个原则服务。

MANA包括了上面的所有思考点,由四个子系统组成:

自动驾驶系统为何要打上「思想钢印」?北京顺义闹市区里藏着毫末智行的谜底..._第3张图片

BASE包括了数据的获取,传输,存储,计算,以及新的数据分析和数据服务。

TARS是核心算法原型,用于感知、认知、车端建图、和验证的实践。

LUCAS则是对算法在应用场景上的实践,包括高性能计算、诊断、验证、转化等核心能力。

VENUS是数据可视化化系统,包括软件和算法的执行情况,对场景的还原,以及数据洞察等能力。

MANA不是一个软件,而是一个技术体系,其中包含众多子模块,它们一同构成了毫末智行的数据驱动能力,也是解释毫末业务飞速进展的关键。

MANA真的有魔力?

从数据本身的视角,可能更好理解。

首先,数据要被感知到。毫末智行自动驾驶方案目前核心的感知设备,是摄像头和激光雷达。

采集到的数据,首先通过一个ResNet网络计算基础数据,然后生成两个分支,一个是计算目标特征的FPN网络,可以分别计算车道线、路基、车辆、信号灯等等目标信息。

自动驾驶系统为何要打上「思想钢印」?北京顺义闹市区里藏着毫末智行的谜底..._第4张图片

另一个分支则用于free space(可行驶区域)生成和场景识别。

对于激光雷达点云图,则用pointpillar算法,首先把点云数据降维进行伪二维化,之后再用一般图像的方法进行计算。

两种数据源,采取过程融合,加入时序的特征,实现感知能力快速提高,能够更准确的刻画现实世界。

第二步,数据除了被感知,还要被系统认知,就是解决从客观世界到驾驶动作的映射。

自动驾驶系统为何要打上「思想钢印」?北京顺义闹市区里藏着毫末智行的谜底..._第5张图片

首先是表达特定场景下驾驶行为,可以从宏观上归纳出几个影响因素:天气、道路结构、交通参与者、交通流密度、彼此方位、主车路线、碰撞风险和碰撞时距。

然后从已有的数据中挖掘和表达这些属性,然后在进行聚类和分类,以找到更加舒适和高效的解决方案。

接着通过端到端模拟学习,以之前例子作为指导,得到具体的本车动作。

模拟学习,需要更大的数据样本,特别是标注好的数据,然后从数据中学习得到规律。

所以,问题关键就聚焦到到快速标注上。

自动驾驶系统为何要打上「思想钢印」?北京顺义闹市区里藏着毫末智行的谜底..._第6张图片

Tesla积累20亿公里数据,累计标注了60亿个物体,包括精准的3D信息、深度、速度。

同样的数据量按相同标准进行人工标注,所付出的时间和资金,没有哪个自动驾驶公司能承担。

所以毫末研发了一个高效标注系统,应用无监督自动标注算法,性能比市场上很多产品强1倍。

目前,毫末大部分数据处理是通过自动标注完成的。

进行到这一步,数据已经可以喂给算法进行训练,那么训练好的模型,如何验证效果?

尤其是在短时间对多个功能进行不同升级后,如果把所有版本依次拿到实车上跑一遍,然后再开发下一个版本…自动驾驶可能就永无实现之日了。

所以要把把验证工作放在仿真系统中进行。

自动驾驶系统为何要打上「思想钢印」?北京顺义闹市区里藏着毫末智行的谜底..._第7张图片

毫末智行将每一次路侧都还原为仿真中的“元宇宙”,同一场景下不同光照、不同天气,不同曝光条件都可在系统中调整,由此来模拟算法在不同工况下的表现。

至此,一组数据就完成了他们从被采集处理、成为训练素材、变成系统能力提升的全部使命。

MANA对于毫末智行的重要性,看到这里各位应该已经有了概念。

如果把数据比作燃料,那MANA就是能使燃料爆发出能量、推动整个系统运转的引擎。

而且,这部“引擎”不仅快,还经济实惠。

MANA要把毫末智行带向何方?

当然是速度更快的自动驾驶能力提升,和规模更大的量产落地。

怎么评价?

了解了MANA系统的来龙去脉,个中内涵…

也就能理解MANA之于毫末智行的承前启后意义,解释了毫末速度的真实原因,而且还是这家自动驾驶新晋独角兽今后战略规划的前提。

比如AI DAY上,毫末分享了对未来数据发展的判断。

未来几年,在智能汽车的推动下,人类存储的数据将发生结构性的改变。

影像数据会越来越多,而由于数据类型的转变,对计算的要求也将发生改变。

深度学习的计算能力会更日益重要,对算力要求也会快速增长。

所以,除了推出单板算力360T的自研算力平台,毫末也宣布筹建自己的超算中心

自动驾驶系统为何要打上「思想钢印」?北京顺义闹市区里藏着毫末智行的谜底..._第8张图片

等等,大模型、大数据、规模量产、自研算力平台、自建超算中心…

熟悉吗?

打通数据闭环的毫末,似乎走上了和特斯拉类似的路线。

核心原因还是在数据。

毫末智行CEO顾维灏,对于数据挖掘利用的“段位”,有独特的解读。

他认为,特斯拉的领先,归根结底是建立在十亿公里级的里程数据上。

一个自动驾驶公司建立一套数据闭环并不难,真正有含金量的是能在多大规模的数据上跑通数据闭环。

这既代表一家公司的当下的业务进展、技术能力,也预示了未来算法迭代的“加速度”。

而数据驱动,毫末的优势恰好在于获取的成本和效率。

毫末智行出自长城汽车集团旗下,客观上具备了将自动驾驶大规模量产的先天优势。

长城汽车6个子品牌,数十款车型,正在智能化转型关键窗口,更重要的,是这些车型过百万的年销量。

自动驾驶系统为何要打上「思想钢印」?北京顺义闹市区里藏着毫末智行的谜底..._第9张图片

事实也正是如此。

毫末智行AI DAY上,董事长张凯说,成立两年来,积累实际路测里程已达400万公里,产品已经搭载在长城坦克、WEY、哈弗等五款车型上。

3年内,毫末智能驾驶产品装机量会达到100万。

自动驾驶系统为何要打上「思想钢印」?北京顺义闹市区里藏着毫末智行的谜底..._第10张图片

而在即将到来的2022年,这个数字会迅速扩大至34款车型,具体装机量,据毫末估计可以达到30-40万辆之间。

对于毫末智行来说,产品装机量能以每年数十万辆的规模增长,带来的数据增量更是大部分新势力或自动驾驶公司很难实现的。

自动驾驶系统为何要打上「思想钢印」?北京顺义闹市区里藏着毫末智行的谜底..._第11张图片

而将智能驾驶套件以前装形式搭载在量产车上,毫末获取数据的成本,几乎就只有数据传输的通信成本。

实现低成本高效率的数据获取后,毫末的智能化发展路径、展现出的未来潜力,也越来越像业内的另一个关键玩家——

特斯拉。

瞄准量产乘用车,快速增加装机量、积累里程,在数据迭代中不断进化。

毫末也一样,在MANA拼图完整对外披露后,另一个议题也被问及——

如此规模的数据和模型训练,怎么搞?

顾维灏说,逢山开路遇水搭桥,最优解就是自建超算。

是的,如果你熟悉这个领域,或许还记得,特斯拉今年最核心的技术进展,来自自建超算。

自动驾驶系统为何要打上「思想钢印」?北京顺义闹市区里藏着毫末智行的谜底..._第12张图片

这是巧合?顾维灏认为不完全是。

因为毫末智行在实践后,恰恰证明了数据驱动是自动驾驶技术和核心和基础,任何自动驾驶研发都将遵循这一原则。

现如今,几乎所有自动驾驶玩家都意识到数据驱动的重要性,无一例外都渴望打通自己的“任督二脉”。

但是这其中,真正理解了“量产-成本-效率”内涵的玩家,真正有能力实践这个规律的“面壁者”,实际并不多。

而毫末智行,通过种种进展和成果,解释了何以发展神速、备受看好的原因。

自动驾驶系统为何要打上「思想钢印」?北京顺义闹市区里藏着毫末智行的谜底..._第13张图片

它有先天优势,还有后天的努力,并以“雪湖”为名实践的自动驾驶落地法则…

而在毫末智行之前,业内也没有过这样的速度:

最快的规模化数据闭环、最快的自动驾驶创业公司营收增幅、最快的量产自动驾驶方案上车交付,以及最快实现燃油车的智能驾驶,打破新势力们引以为豪的垄断。

所以如果之前,毫末智行的进展被以「毫末模式」视之,那现在更加值得注意的是「毫末速度」。

「毫末速度」代表了其实践成果,更体现了在愈加清晰的自动驾驶落地法则中,中国玩家基于中国路况给出的行业尺度。

你可能感兴趣的:(算法,大数据,编程语言,机器学习,人工智能)