撰文 | 王艺
成立两年后,地平线机器人科技(以下简称地平线)带来了它的两款芯片产品。
12 月 20 日,地平线发布两款嵌入式人工智能视觉处理器——面向智能驾驶的征程(Journey)系列处理器和面向智能摄像头的旭日(Sunrise)系列处理器。两款处理器均基于高斯架构研发设计,提供「算法+芯片+云」的完整解决方案。
征程系列嵌入式人工智能芯片面向自动驾驶,具备同时对行人、机动车、非机动车、车道线、交通标志牌、红绿灯等多类目标进行精准实时检测与识别的处理能力,可支持 L2 级别的高级驾驶辅助系统(ADAS)。
基于征程处理器,地平线打造了一款面向后装市场的智能辅助驾驶系统,下图所示的黑盒子即为这款辅助驾驶系统的产品原型。
现场,余凯展示了征程处理器真正上路的视频。从视频中我们可以清晰地看到征程处理器对行人、车辆、指示牌等道路相关物体的识别情况。
旭日处理器面向智能摄像头,具备在前端实现大规模人脸检测跟踪、视频结构化的处理能力,着眼于智能城市、安防以及智能商业等人员密集场景。
余凯介绍,旭日支持最高 200 张人脸的同时识别,而在此之前,业内最好的解决方案最多仅能同时识别 30 张人脸。以下视频展示了旭日处处理器在地铁站、扶梯、拥挤的人行道等大人流场景下的识别能力。
以软件定义硬件
这两款芯片可以看作是地平线对计算机视觉的两个典型应用场景——自动驾驶及多对象人脸识别的分别布局。其背后的软件架构是一致的,都是地平线的第一代人工智能软件架构——高斯架构。
地平线认为,人工智能时代芯片企业突围的关键在于软硬件的深度结合。因此,地平线制定了软件架构的三步走战略,除了今年已经推出的高斯架构外,明年还将推出伯努利架构,并最终在 2019 年推出贝叶斯架构。
据地平线联合创始人、算法副总裁黄畅介绍,三种架构是层层递进的关系。
当前的高斯架构(1080p@30fps)能够支持每帧同时检测 200 个目标;伯努利架构(1080p@30fps)采用新型稀疏二值化神经网络结构,能够同时处理 6-8 路视频识别、预测、像素解析,并支持多传感器融合;贝叶斯架构(4K@30fps)能够支持 RNN 等复杂网络结构,支持蒙特卡洛决策搜索,能够同时处理 12 路视频,并能进行语义三维环境建模,支持动态路径规划。
现场,余凯展示了其基于伯努利架构的新一代道路物体识别系统,与当前普遍使用的解决方案不同,该系统不是以矩形框的形式对物体进行识别,而是能更精准地对物体进行像素点级的识别。以下视频所展示的是该系统在中关村道路上的实验结果。
两款芯片、三个大脑
基于此次发布的两款芯片,地平线相应推出了针对智能驾驶、智能城市、智能商业的「大脑」解决方案,并在发布会现场都进行了相应的技术展示。
其中,智能驾驶解决方案,通过对驾驶场景中的目标精确定位,为汽车打造自动驾驶的大脑,实现了车道偏离、车辆及行人碰撞预警等高级别辅助驾驶(ADAS)功能。在发布会现场,地平线搭建了模拟交通场景,让现场嘉宾和媒体进行实际体验行人检测,检测精准度高达 100%。据现场产品负责人介绍,在实际道路上,目前基于征程 1.0 的 ADAS 对车辆、行人、车道线、交通标志的检测准确率均大于 99%。
智能城市解决方案可在前端进行高性能、低功耗的人脸抓拍、识别与相关属性分析、视频结构化解析,可广泛运用于车站、学校、商业、楼宇、卡口等安防、泛安防领域。发布环节中,地平线现场展示了基于旭日 1.0 处理器的摄像头的实时人脸抓拍和识别能力,在现场复杂的灯光环境下、用移动的摄像头从几百人中准确的抓取识别出了演讲嘉宾——地平线首席芯片架构师周峰博士。并在场外展区设置了实时大规模人脸抓拍体验,能够同时抓拍百人以上。
智能商业解决方案,以人为中心进行线下商业运营数据的结构化,实现客流分析、人员 ID 管理、人货分析等,帮助商业运营体系更加有效地洞见商业运作的本质,指导商业营销,并提升商业运作的效率,进而提升消费者的购物体验,将生意变得简单易懂。现场地平线展示了该解决方案在某鞋店的实际使用案例,通过摄像头,能够实时识别顾客身份、喜好和在店内的行动轨迹。
除此之外,地平线也更新了解决方案背后的合作伙伴。
在智能驾驶领域,地平线与世界四大主要汽车市场的顶级 OEMs 及 Tier1 合作,致力于为汽车打造自动驾驶的大脑。在智能城市、智能商业方面,地平线的合作伙伴更多来自国内。发布会上,地平线公布了同奥迪、长安汽车、英特尔、龙湖地产、百丽等公司的合作。
「人人造芯」的时代
传统芯片厂商英特尔、英伟达之外,人工智能领域的初创公司如地平线、寒武纪、深鉴科技、启英泰伦、Kneron 等公司都在紧锣密鼓地推进芯片计划。
应用设备公司也急于分羹。华为、杭州国芯、比特大陆以及一些 IP 提供方正试图将一只脚踏入人工智能芯片领域。
曾经的人工智能软件算法公司也不甘示弱,从招聘启事来看,海康威视、云知声、云飞励天、依图科技、科大讯飞、甚至百度均有嵌入式人才需求。
与这些传统芯片厂商以及有其他业务支撑的公司相比,像地平线这样将全部身家押注在人工智能芯片上的初创公司们,面临着更严峻的形势以及成王败寇的命运。
但余凯对此似乎不太担心,他表示地平线是「面向应用的」,是「软硬件深度结合的」。此前,他也曾向机器之心分析称:
「现在的人工智能计算,通常情况下硬件平台利用率只有 30% 左右,其他都是空耗。所以如果做好软硬件适配,平台运转自然高效。我们的硬件利用率一般能够达到 98%,能够用原本的空耗做更加复杂的计算。」
另一方面,余凯认为未来地平线的业务模式灵活,IP 授权、芯片制造都可以讨论,细分领域的人工智能芯片与通用的人工智能芯片都会涉及。
但「造芯」之路也并非一片坦途。余凯介绍道,从芯片的制造工艺角度,人工智能专用芯片并不难,难点在于针对算法的架构设计。
以一个通用的深度神经网络芯片举例说明,需要兼具语音识别、语义理解、图像识别等功能,而每一功能又需要满足多种细分场景的需求,例如图像识别任务中又可以拆分成手势、车辆、行人,人脸等识别任务,因此需要不同的网络结构进行支撑,并互相配合形成一个尽可能通用、灵活的架构。
「考验的并不是芯片设计的能力,而是算法设计的能力。」余凯曾说。因此地平线将技术核心放在算法层面,针对深度神经网络,通过定点化、稀疏化,以及各种专用精简设计,未来能将芯片功耗控制在几百毫瓦,成本控制在 1 美金以内。
地平线还为自己定了「小目标」。余凯称,预计到 2020 年,地平线 BPU 将赋能上亿物联网智能感知终端。到 2025 年,将有 3000 万辆汽车内置地平线自动驾驶 BPU。