TensorRT笔记(12)使用量化网络

使用DLA

  • 11.使用DLA
    • 11.1 在TensorRT推理期间在DLA上运行
      • 11.1.1 示例:带有DLA的sampleMNIST
      • 11.1.2 示例:在网络创建期间为层启用DLA模式
    • 11.2 DLA支持的层
    • 11.3 GPU后备模式

11.使用DLA

NVIDIA®DLA™(深度学习加速器)是用于深度学习操作的固定功能加速器引擎。 DLA旨在进行卷积神经网络的完整硬件加速。 DLA支持各种层,例如卷积,解卷积,完全连接,激活,合并,批处理规范化等。
有关NVIDIA®TensorRT™层中DLA支持的更多信息,请参阅DLA支持的层。 trtexec工具具有其他参数,可在DLA上运行网络,请参阅trtexec。

要在FP16模式下使用trtexec在DLA上运行A

你可能感兴趣的:(TensorRT)