By 超神经
内容概要:自动驾驶的赛道依然火热,除了技术方面的提升,对数据的需求也不断加大。近日,AI 标注公司 Scale AI 联合禾赛科技,发布了一个免费的激光雷达数据集,面向 L5 级自动驾驶的研究使用。
关键词:自动驾驶 激光雷达 数据集
又一个重磅的自动驾驶数据集来了!
近日,Scale AI 发布了激光雷达数据集 PandaSet,可用于训练自动驾驶模型,帮助推动 L5 级无人驾驶的发展。
这是 Scale AI 和激光雷达制造商禾赛科技合作推出,结合了硬件和标注的优势,打造的高质量数据集,目前已面向全社会免费提供。
专业收集和标注,公开可商用
PandaSet 是从硅谷的 2 条实际路线中收集,经过后期处理而得来。其中禾赛科技负责采集数据,Scale AI 则负责完成精细标注。
Scale AI 标注数据模拟展示
采集车辆的传感器套件主要包括 1 个机械 LiDAR(激光雷达),1 个固态 LiDAR,5 个广角摄像头,1 个长焦摄像头,板载 GPS / IMU,充分捕获了城区复杂多变的环境因素。
另一方面,Scale AI 的激光雷达点云分割(Point Cloud Segmentation)技术,可实现复杂目标物的高精度高质量标注,甚至包括烟尘、尾气、雨水等传统标注工具难以准确描述的目标物。
带车道和边界的带标记点云分割示例
其中点云分割是根据空间几何和纹理等特征,对点云进行划分,使得同一划分内的点云拥有相似的特征,将扫描的画面中具体的物体标记出来,该技术在图像识别中已被大量使用。
Scale AI 表示,该数据集包括 48,000 多个摄像头图像,以及 16,000 个激光雷达扫描点云图像(超过 100 个 8 秒场景)。
它还包括每个场景的 28 个注释,大多数场景的 37 个语义分割标签。
由此得来的数据集,涵盖了 5 级自动驾驶中最具挑战性的驾驶条件,其中包括复杂的城市环境,密集的交通和行人,建筑物、绿化等设施,涵盖全天候照明条件,囊括多种天气状况。
PandaSat 数据内容展示
正因如此,Scale AI 也称 PandaSet 是世界上最先进的激光雷达数据集。
此外,本次的数据集还有一个特色,就是 PandaSet 没有使用限制,是首个无条件供给商业使用的开放数据集。
数据集背后的独角兽标注公司
面向自动驾驶高性能 AI 模型而言,PandaSet 是十分理想的训练数据集。而这背后的标注公司 Scale AI,也在近几年里凭借实力跻身硅谷 AI 独角兽。
随着硬件的进步,数据的采集质量越来越高,对数据进行准确的标注,成为了促进行业进步的一项关键,比如 ImageNet 的出现,就带动了深度学习的升空。
而 Scale AI 则是看准了这个时机。其创始人是仅仅 23 岁的华裔青年 Alexandr Wang。
一脸稚气的 Wang 2019 年接受媒体采访
父母都是物理学家的的 Wang,很早就在编程竞赛中崭露头角,高中时就收到了科技公司的 Offer,过人的天赋也让他提前从 MIT 毕业,选择了去硅谷创业。
2016 年,年仅 19 岁的 Wang 与朋友 Lucy Guo 共同成立了 Scale AI,专注开发数据标注业务,打造专业的数据标注平台。
而这个举动在他看来,是行业里的一项刚需,「获取标签数据,是构建机器学习模型中最困难的部分。」
Scale AI 完成的一项机械臂标记任务
2018 年,Scale AI 拿到了 1800 万美元 B 轮融资;2019 年收获了 1 亿美元的 C 轮融资,公司当前估值超过 10 亿美元。
而一些大的自动驾驶公司 Waymo、Uber、Lyft、Zoox 等,也正在采用 Scale 标注平台,用以开发复杂环境和极端气候下安全可控的自动驾驶技术。
所以这次将 PandaSet 完全开源允许商用,不知道又包含了 Scale AI 怎样的考虑。
数据集有了,到底该怎么用
无论如何,本次发布的 PandaSet 数据集,对于研究自动驾驶的朋友来说,还是一项不错的福利,还等什么?赶快用起来吧!
如何下载?
数据集官方申请下载地址:
https://scale.com/resources/download/pandaset
如何使用?
贴心的合作伙伴 OpenBayes,提供了一套简单易用的方案云服务方案,如果你想要使用算力服务,推荐你们去试用一下,当前还有专属的福利哦!
OpenBayes 拥有大规模的超算集群,GPU 集群架构专针对矩阵计算设计,面向 AI 应用提供算力容器,而且上手非常简单,开箱即用。
PandaSet 数据集已经上传至 OpenBayes 后台,并支持直接调用。
目前 OpenBayes 的算力容器产品已经支持 TensorFlow、PyTorch、MXNet 等 CPU 和 GPU 环境下,不同版本、类型的标准机器学习框架和各种常用依赖。
目前 OpenBayes 算力容器支持的标准库
并提供 CPU、NVIDIA T4、NVIDIA Tesla V100 等多种算力资源,无论是海量数据的集中训练,还是低功耗的模型常驻运行,都能轻松满足用户需求。
从 CPU 到 T4 再到 V100,丰富的算力容器配置
OpenBayes 还支持脚本上传和 JupyterLab 编辑器在线编程,然后进行模型训练。
清晰简洁的执行过程
完整教程:https://openbayes.com/docs/quickstart/
注册新用户,即可享受 GPU 算力
访问 openbayes.com,在官网首页点击立即注册,而且内测期间周周有赠哦,再也不用担心算力的问题啦!
该数据集可在公共资源直接使用/下载
活动说明
访问 openbayes.com
凭邀请码 【HyperAI】 注册新用户
即可享受
每周 600min 的 CPU + 300min NVIDIA T4
的免费算力~
—— 完 ——
扫描二维码,加入讨论群
获得更多优质数据集
了解人工智能落地应用
关注顶会&论文
回复「读者」了解更多
更多精彩内容(点击图片阅读)