2022 Tesla AI Day

AI DAY 2022核心信息:

2022 Tesla AI Day_第1张图片

Tesla Bot

2022 Tesla AI Day_第2张图片

1)“擎天柱(Optimus)” 核心:

  • 1)采用了与汽车相同的FSD(自动驾驶计算机),它的行走、动作、执行指令等,不是按照既定程序按部就班执行的,而是通过AI模型学习得来的。

  • 2)跟人一样,它感知世界的方式也是画面和声音,通过头部的摄像头采集周围视频,通过FSD视觉识别算法可识别出周围环境、分辨物体,并计算行走路线、抓取力度。注 如下图所示

2022 Tesla AI Day_第3张图片

​原型机明显更大且更粗犷一些,胸前的两个散热风扇很醒目。同时根据现场的演示来看,它的行走也显得有些“步履蹒跚”,直观上不如波士顿动力的双足机器人。

2)剖析内部细节

2022 Tesla AI Day_第4张图片

​上图为结构示意图,其中包括如下:

  1. 橙色是驱动装置

  2. 蓝色是主控

  3. 搭载了容量2.3kWh的电池包,系统电压52V,

  4. 主控板搭载特斯拉自研Soc、支持wifi、4G等模块。

  5. 全身有28个关节,也就需要28个驱动装置。

为了实现人一样自然的动作,特斯拉做了大量的开发。如 人在抓取、搬运时所需的力是不一样的,如果用力过猛可能会把手里的东西甩飞。因此,特斯拉针对每个关节所需的力量/扭矩,做了仿真建模,找到了各自关节/驱动器的最佳参数,并研据此发了6种专用电机,采用与特斯拉汽车电机同源的滚珠电机技术。

2022 Tesla AI Day_第5张图片

FSD最新进展

目前FSD Beta的用户已经超过了16万,注:不包括中国用户 O(∩_∩)O哈哈~

2022 Tesla AI Day_第6张图片

2022 Tesla AI Day_第7张图片

​1)无保护左转示例

在无保护左转时,即便没有危险,如果从行人面前近距离通过,可能会导致行人受到惊吓,或导致行人做出不可预料的动作。可见,减少“极限操作”对于车主和行人来说都是更好的。

2022 Tesla AI Day_第8张图片

注:“无保护左转”是在路口,没有交通信号灯指示下通过路口 场景,正常人类司机要想通过,也需要比较谨慎和控制好车速,因为涉及到路权问题。

FSD的策略则是从安全角度出发,提前预测行人及其他车辆的运动轨迹,找准时机来生成相对慢速但更高效的行车路线,慢速从行人身后通过。

注:这部分tesla基于上游提供3D BEV Vector Space+中间信息输出,来预测轨迹信息

2022 Tesla AI Day_第9张图片

2022 Tesla AI Day_第10张图片

2)如何实现效果

要实现这种效果,感知+规控+训练等,缺一不可。

2.1 感知

在感知方面,特斯拉提到了occupancy networks 模型的应用和进化。通过occupancy networks,可以让模型获得预测物体所占据空间的能力,并在BEV内生成由一个个“立方体”组成的环境。

2022 Tesla AI Day_第11张图片

2022 Tesla AI Day_第12张图片

​注:这方面技术在21年AI Day上,tesla已详细剖析过,重点是将8个视角时空视觉信息融合,输出3D的Vector Space。

2.2 规控

在规控中,重点有2方面进展

  1. 上游识别这些“立方体”都将刻意避开,不需要知道识别什么障碍物的前提下,主动做出避让动作。

  2. 据此识别道路坡度/曲率,可以让车辆根据实际道路情况提前预测加速/减速,进一步提高安全性和舒适度。

注:给大家分享下,当前21年AI Day上规控是如何做的,参考如下:

  1. 3D Vector Space&实时的路况信息

  2. 这些特征呗规划神经网络捕捉,了解当前车辆的位置状态

  3. 蒙特卡洛搜索树综合“安全、舒适、效率”给出未来10~15秒的最佳轨迹分布,系统根据轨迹分布再计算出详细的路线规划和控制数据,最终控制车辆执行

2.3 训练

在训练方面,由于需要处理大量视频数据,因此特斯拉专门开发了“Video Model”。

2022 Tesla AI Day_第13张图片

2022 Tesla AI Day_第14张图片

​它可以存储大量由用户采集的原始视频文件,并直接供给训练服务器。相比普通的存储服务器,

  • 可以让训练速度提升30%

  • 存储的文件更省空间(小了11%)

  • 读取速度也更快,最小每秒读写次数提升了4倍。

此外,特斯拉也在搞虚拟现实(仿真模拟)的自动生成。基于数字孪生,可以在虚拟世界中训练模型,据说效率比之前“提升了1000倍”。

2022 Tesla AI Day_第15张图片

​它的重要性在很多特定场景中都有体现。例如,自动驾驶在路口时的判断往往是有挑战性的,尤其是在路口有车辆时,系统需要判断这辆车是真的是“停止”还是在“低速行驶”。

2022 Tesla AI Day_第16张图片

​如果无法快速确认,就容易导致车辆的决策更谨慎,反映出来就是车辆在转弯或者路口时会主动减慢速度甚至停车。

那么,要对此进行改善,就需要进行大量的训练,以涵盖尽量多的情况。而对于这种特定场景,在虚拟世界中进行仿真模拟的效率就会更高。

2022 Tesla AI Day_第17张图片

Dojo超算

Dojo是专门用来进行模型训练的超级计算机,它往往要面对规模极大的模型,包含数以亿计的数据、参数,因此,保证高带宽、低延迟就成了关键。

1)提高算力

将25个D1芯片集成在一个“Tile”上,让每个“Tile”都具备54P算力和13.4TB/S对分带宽。

2022 Tesla AI Day_第18张图片

2)保证多个“Tile”间的通讯

开发了名为“Dojo接口处理器”的PCIE板卡,具备800GB/s内存带宽、32G高带宽内存、900TB/S TTP带宽,PCIE 4.0带宽为32G/s。

2022 Tesla AI Day_第19张图片

3) 提升运行效率

然后,特斯拉还将6个Tile、20片接口处理器组成一个托盘(Tray),而Dojo超算的每一个机柜(ExaPOD)则由至少两个托盘构成,有种套娃的感觉。

但这种方式显然是有效的,每台ExaPOD的训练性能都非常夸张,具备1.1E算力、1.3T高速内存、13TB高带宽内存,4台即相当72个GPU机柜的训练性能。

但这种方式面临一个问题:供电。

4) 供电

每个“Tile”内建25个D1芯片,而每颗芯片的功耗就高达400W,单25颗芯片的功耗即高达10kW。而每个托盘具备6个Tile和20片接口处理器,功耗直奔100+kW。为此,自研了功率密度非常高的垂直堆叠的电源模块,同时相比对外采购成本更低。

2022 Tesla AI Day_第20张图片

在AI DAY现场,展出了Dojo机柜的实物,可证明其研发已基本结束。

2022 Tesla AI Day_第21张图片

​第一台ExaPOD将于2023年Q1推出,那AI训练能力将会有更本质上的提升。

HW4.0

回顾21年 AI Day ,HW3.0 摄像头分辨率1280x960,每秒36帧,12bit色深【 显示器是8bit】,所以大家会想肯定要升级4.0了,在为下一代车载计算机硬件HW4.0做准备,但HW 4.0,它没有来。

不过我们是可以有更多期待,比如 7nm 的第二代 FSD 芯片?针对 Transformer 模型推理的特化架构?500万像素或800万像素的摄像头?或是前不久曝光的高分辨率雷达?

按照Tesla骚操作来看,可能在低调中进行,一旦曝光,那可能已经开始批量量产了,甚至已经批量装车。

你可能感兴趣的:(自动驾驶,人工智能,自动驾驶)