激光雷达点云分割、精细标注,Scale AI 发布自动驾驶数据集

By 超神经

内容概要:自动驾驶的赛道依然火热,除了技术方面的提升,对数据的需求也不断加大。近日,AI 标注公司 Scale AI 联合禾赛科技,发布了一个免费的激光雷达数据集,面向 L5 级自动驾驶的研究使用。

关键词:自动驾驶  激光雷达  数据集

又一个重磅的自动驾驶数据集来了!

近日,Scale AI 发布了激光雷达数据集 PandaSet,可用于训练自动驾驶模型,帮助推动 L5 级无人驾驶的发展。

激光雷达点云分割、精细标注,Scale AI 发布自动驾驶数据集_第1张图片

这是 Scale AI 和激光雷达制造商禾赛科技合作推出,结合了硬件和标注的优势,打造的高质量数据集,目前已面向全社会免费提供。

  专业收集和标注,公开可商用

PandaSet 是从硅谷的 2 条实际路线中收集,经过后期处理而得来。其中禾赛科技负责采集数据,Scale AI 则负责完成精细标注。

Scale AI 标注数据模拟展示

采集车辆的传感器套件主要包括 1 个机械 LiDAR(激光雷达),1 个固态 LiDAR,5 个广角摄像头,1 个长焦摄像头,板载 GPS / IMU,充分捕获了城区复杂多变的环境因素。

另一方面,Scale AI 的激光雷达点云分割(Point Cloud Segmentation)技术,可实现复杂目标物的高精度高质量标注,甚至包括烟尘、尾气、雨水等传统标注工具难以准确描述的目标物。

激光雷达点云分割、精细标注,Scale AI 发布自动驾驶数据集_第2张图片

带车道和边界的带标记点云分割示例

其中点云分割是根据空间几何和纹理等特征,对点云进行划分,使得同一划分内的点云拥有相似的特征,将扫描的画面中具体的物体标记出来,该技术在图像识别中已被大量使用。

Scale AI 表示,该数据集包括 48,000 多个摄像头图像,以及 16,000 个激光雷达扫描点云图像(超过 100 个 8 秒场景)。

它还包括每个场景的 28 个注释,大多数场景的 37 个语义分割标签。

由此得来的数据集,涵盖了 5 级自动驾驶中最具挑战性的驾驶条件,其中包括复杂的城市环境,密集的交通和行人,建筑物、绿化等设施,涵盖全天候照明条件,囊括多种天气状况。

激光雷达点云分割、精细标注,Scale AI 发布自动驾驶数据集_第3张图片

PandaSat 数据内容展示

正因如此,Scale AI 也称 PandaSet 是世界上最先进的激光雷达数据集。

此外,本次的数据集还有一个特色,就是 PandaSet 没有使用限制,是首个无条件供给商业使用的开放数据集。

 数据集背后的独角兽标注公司

面向自动驾驶高性能 AI 模型而言,PandaSet 是十分理想的训练数据集。而这背后的标注公司 Scale AI,也在近几年里凭借实力跻身硅谷 AI 独角兽。

随着硬件的进步,数据的采集质量越来越高,对数据进行准确的标注,成为了促进行业进步的一项关键,比如 ImageNet 的出现,就带动了深度学习的升空。

而 Scale AI 则是看准了这个时机。其创始人是仅仅 23 岁的华裔青年 Alexandr Wang。

激光雷达点云分割、精细标注,Scale AI 发布自动驾驶数据集_第4张图片

一脸稚气的 Wang 2019 年接受媒体采访

父母都是物理学家的的 Wang,很早就在编程竞赛中崭露头角,高中时就收到了科技公司的 Offer,过人的天赋也让他提前从 MIT 毕业,选择了去硅谷创业。

2016 年,年仅 19 岁的 Wang 与朋友 Lucy Guo 共同成立了 Scale AI,专注开发数据标注业务,打造专业的数据标注平台。

而这个举动在他看来,是行业里的一项刚需,「获取标签数据,是构建机器学习模型中最困难的部分。」

激光雷达点云分割、精细标注,Scale AI 发布自动驾驶数据集_第5张图片

Scale AI 完成的一项机械臂标记任务

2018 年,Scale AI 拿到了 1800 万美元 B 轮融资;2019 年收获了 1 亿美元的 C 轮融资,公司当前估值超过 10 亿美元。

而一些大的自动驾驶公司 Waymo、Uber、Lyft、Zoox 等,也正在采用 Scale 标注平台,用以开发复杂环境和极端气候下安全可控的自动驾驶技术。

所以这次将 PandaSet 完全开源允许商用,不知道又包含了 Scale AI 怎样的考虑。

  数据集有了,到底该怎么用

无论如何,本次发布的 PandaSet 数据集,对于研究自动驾驶的朋友来说,还是一项不错的福利,还等什么?赶快用起来吧!

 如何下载? 

数据集官方申请下载地址:

https://scale.com/resources/download/pandaset

 如何使用? 

贴心的合作伙伴 OpenBayes,提供了一套简单易用的方案云服务方案,如果你想要使用算力服务,推荐你们去试用一下,当前还有专属的福利哦!

OpenBayes 拥有大规模的超算集群,GPU 集群架构专针对矩阵计算设计,面向 AI 应用提供算力容器,而且上手非常简单,开箱即用。

PandaSet 数据集已经上传至 OpenBayes 后台,并支持直接调用。

目前 OpenBayes 的算力容器产品已经支持 TensorFlow、PyTorch、MXNet 等 CPU 和 GPU 环境下,不同版本、类型的标准机器学习框架和各种常用依赖。

激光雷达点云分割、精细标注,Scale AI 发布自动驾驶数据集_第6张图片

目前 OpenBayes 算力容器支持的标准库

并提供 CPU、NVIDIA T4、NVIDIA Tesla V100 等多种算力资源,无论是海量数据的集中训练,还是低功耗的模型常驻运行,都能轻松满足用户需求。

激光雷达点云分割、精细标注,Scale AI 发布自动驾驶数据集_第7张图片

从 CPU 到 T4 再到 V100,丰富的算力容器配置

OpenBayes 还支持脚本上传和 JupyterLab 编辑器在线编程然后进行模型训练。

激光雷达点云分割、精细标注,Scale AI 发布自动驾驶数据集_第8张图片

清晰简洁的执行过程

完整教程:https://openbayes.com/docs/quickstart/

 注册新用户,即可享受 GPU 算力

访问 openbayes.com,在官网首页点击立即注册,而且内测期间周周有赠哦,再也不用担心算力的问题啦!

激光雷达点云分割、精细标注,Scale AI 发布自动驾驶数据集_第9张图片

该数据集可在公共资源直接使用/下载

 活动说明 

访问 openbayes.com 

凭邀请码 【HyperAI】 注册新用户

即可享受

每周 600min 的 CPU + 300min NVIDIA T4 

的免费算力~

—— 完 ——

激光雷达点云分割、精细标注,Scale AI 发布自动驾驶数据集_第10张图片

扫描二维码,加入讨论群

获得更多优质数据集

了解人工智能落地应用

关注顶会&论文

回复「读者」了解更多

更多精彩内容(点击图片阅读)

激光雷达点云分割、精细标注,Scale AI 发布自动驾驶数据集_第11张图片

激光雷达点云分割、精细标注,Scale AI 发布自动驾驶数据集_第12张图片

你可能感兴趣的:(激光雷达点云分割、精细标注,Scale AI 发布自动驾驶数据集)