[未解决]TensorRT推理过程CUBLAS_STATUS_EXECUTION_FAILED

使用tensorRT进行YoloV3检测时,在运行tensorRT的m_Context->enqueue函数时,出现了下面所示的bug:
ERROR: c:\p4sw\sw\gpgpu\MachineLearning\DIT\release\5.1\engine\cuda\cublasHelpers.cpp (34) - cuBLAS Error in nvinfer1::stridedGemm: 13 (CUBLAS_STATUS_EXECUTION_FAILED)
造成的问题是,yoloV3三个尺度的输出仅获取了第一个尺度的数据,后两个尺度的数据未获取到(显示是未下载到内存中)。

google,stackoverflow,tensorRT讨论区均为找到同样的bug,后来发现该bug仅在第一批次的数据推理过程中出现,后面批次推理不会再出现同样的bug。因此解决方案是设定一个warmup的过程,任一模型加载完成之后首先进行一次数据的前向处理,然后再开始接收实时数据进行检测。

该解决方案是暂时的权益之计,希望大神指导!

你可能感兴趣的:(DeepStream)