AWS机器学习升级数据标记工具,增加3D可视化,面向自动驾驶

AWS为Amazon SageMaker机器学习服务升级了数据标签工具,增加了3D可视化功能,进一步强化了通过机器学习模型构建训练数据集。

Amazon Sagemaker Ground Truth是AWS机器学习服务堆栈中的一项服务,主要用于为机器学习数据集提供数据标签服务。用户使用Ground Truth内置的工作流程来高效、准确的标记图像和文本数据,也可以通过自定义工作流程的方式标记数据。

新增加的工具被称为3D Point Cloud Labeling,能够支持3D扫描和激光雷达传感器等工具生成的数据。

AWS表示,这项功能源于客户的需求,希望Ground Truth能够支持对自动驾驶的3D数据集的标记。因为在自动驾驶中,通过雷达传感器或摄像机捕获的数据集非常庞大,每一帧就高达数百兆字节,而通常的数据量包涵有50000-500万个帧中。

可以想象,标记这些数据集非常耗时,因为数据科学家需要应对复杂的3D场景,并注释许多不同的对象类,这通常需要构建和管理非常复杂的工具。现在通过3D Point Cloud Labeling,用户能够自定义工作流程,通过机器学习算法辅助自动标记,也可以选择人工标记。

引入3D Point Cloud Labeling,必须将数据存储在Amazon S3中,需要用JSON清单文件来描述S3的输入数据,如帧的位置及其属性,数据集可以包含单帧数据或多帧序列。就绪后,Ground Truth允许用户创建任务类型,例如对象检测,对象跟踪和语义分段。

同时,Ground Truth还集成了传感器融合功能,使其可以将3D Point Cloud Labeling与多达8个摄像机同步。然后,用户可以将标签互换地应用于2D图像和3D数据。

另一个挑战是包含3D数据和2D图像的混合数据集,这些数据和图像必须同步,以便数据科学家可以在车载摄像机捕获的图像上映射3D点和2D坐标。

AWS提供了一个“全局坐标系”,坐标系考虑了摄像机在汽车上的位置以及摄像机指向的位置,AWS工具会计算3D Point Cloud Labeling中所有数据点的坐标。

AWS表示,处理完成后的车辆位置,S3中雷达数据的位置,S3中相关图片的位置都将保存在清单文件中,这样的大型数据集可通过Amazon SageMaker服务来运行。

你可能感兴趣的:(AWS机器学习升级数据标记工具,增加3D可视化,面向自动驾驶)