运用AI进行数据预处理加速 ——英伟达 DALI平台

多种多样的结构化和文本/图像等非结构化数据,譬如矩阵操作/标准化normalize/图像水平翻转等,深度学习应用程序需要复杂的多阶段预处理数据管道。此类数据管道涉及在CPU上执行的计算密集型操作。例如,诸如:从磁盘加载数据,解码,数据增强,水平翻转,裁剪,随机调整大小,颜色和空间扩充以及格式转换等任务主要在CPU上执行,从而限制了训练和推理的性能和可伸缩性。

运用AI进行数据预处理加速 ——英伟达 DALI平台_第1张图片
DALI当前支持计算机视觉任务,例如图像分类,识别和对象检测。它还支持视频数据的 H.264和HVEC解码。将来的版本可能会支持其他功能,例如医学体数据和推理之前和之后的处理。

由于每天都会出现新的网络和扩充功能,因此DALI的插件管理器提供了扩展现有功能的简便方法。 可以将自定义运算符分别实现,编译和加载到DALI中。

DALI提供了不同DL框架之间整个管道的可移植性例如,您可以在基于MXNet或TensorFlow的网络中使用LMDB数据集。

DALI的内部工作机制分为如下三类:
1CPU数据预处理为核心:接收并生产数据全都在CPU平台完成
2CPU-GPU混合mixed:CPU接收数据,生产和输出通过GPU实现
3GPU数据预处理为核心:接收并生产数据全都在CPU平台完成
目前英伟达主要是以GPU平台进行数据预处理,当然也配置了第1种基于CPU的高效数据预处理程序。
运用AI进行数据预处理加速 ——英伟达 DALI平台_第2张图片
另外,DALI根据任务线程安排,优化队列,灵活高扩展性读取batch数

你可能感兴趣的:(CNN图像识别,人工智能,人工智能技术)