yolov5-seg(实例分割)的tensorRT部署

先占坑。。。。

本文主要介绍如何利用tensorRT 的c++ api完整实现yolov5的实例分割部署,平时我的博文点赞很少,说实话,我本来真的不想继续写下去,觉得没意思。当然我这篇写下去,如果没人关注我就直接归到私密文章里面了,这就当作自己的私人笔记。文章主要包括:

(1)yolov5实例分割属于单输入,多输出,这就要确保tensorRT如何处理

(2)多输出的值的实际参数意义

(3)后处理解码检测和分割掩膜的具体操作

(4)矩阵相乘的cuda实现、普通的手动cpu矩阵相乘实现、opencv上的cpu矩阵相乘实现

并给出如何进行三者差异对比

(5)给出整体的解码思路(比如真实掩膜 = warpaffine_实际输入大小(mask_coef * mask_protos  -》 letterbox图上大小))

(6)sigmoid函数的cuda实现(将网络输出转为概率表示)

未完待续。。。。

 

参考资料:

tensorRT优化yolact++ - 热风丶1921 - 博客园

 yolact-trt/yolact.cpp at master · nanmi/yolact-trt · GitHub

 YolactDeploymentORTCpp/common.cpp at main · gsxab/YolactDeploymentORTCpp · GitHub

 YolactDeploymentORTCpp/common.h at main · gsxab/YolactDeploymentORTCpp · GitHub

https://github.com/gsxab/YolactDeploymentORTCpp/blob/main/main2.cpp 

你可能感兴趣的:(部署,ONNX,CUDA,C++,部署,深度学习,ONNX)