模型部署（tensorRT) 第21页

[DeepSpeed]初代chatGPT模型部署实践

DeepSpeedChat部署方式中间遇到很多坑，解决方法都写这里了DeepSpeed部署中bug以及解决方法环境基于阿里云GPU云服务器部署实践操作系统版本：Ubuntu18.04GPU驱动版本：470.161.03GPU型号：A100-80GCPU：16vCPU125GIntelXeon(IceLake)Platinum8369BCUDA版本：11.4Python版本：3.11.3Pip版本：

编程牧马人·2023-06-17 11:19

ONNX GraphSurgeon

None)node_ids()copy（）toposort（）tensors()layer（）NodeVariableto_constant(values:numpy.ndarray)Constant在进行TensorRT

蓝天巨人·2023-06-17 04:19

清北「学渣」创业心路：AI 新时代已来，不参与对不起自己

关键词：AIGCOAISIS团队大模型部署本文首发自HyperAI超神经微信公众平台~黑客马拉松是一种源于美国硅谷等地的技术活动，其具体方式是汇

·2023-06-16 15:35

Triton教程 -- 模型仓库

Triton教程–模型仓库文章目录Triton教程--模型仓库存储库布局模型存储库位置本地文件系统具有环境变量的云存储谷歌云存储S3Azure存储带凭证文件的云存储（测试版）模型版本模型文件TensorRT

扫地的小何尚·2023-06-16 13:37

[模型部署] 算子等价替换

[模型部署]算子等价替换ReduceMeanReduceSumReduceMean在PyTorch中可用torch.mean表示，该算子可被卷积等价替换；存在输入张量的形状为[1，48，56，56]，对其

上单之光·2023-06-16 12:41

YOLO v5 v6 v7 TensorRT速度比较

YOLOv5v6v7TensorRT速度比较YOLOV5-https://github.com/ultralytics/yolov5YOLOV6-https://github.com/meituan/YOLOv6YOLOV7

上单之光·2023-06-16 12:11

【MMDeploy&MMPose】手把手教你在Windows上使用MMDeploy1.x进行ONNX和TensorRT的部署（Python篇）

1.流程简介MMDeploy定义的模型部署流程，这里直接使用了官方文档的内容，如下图所示：1）模型转换（ModelConverter）模型转换的主要功能是把输入的模型格式，转换为目标设备的推理引擎所要求的模型格式

K.K.U·2023-06-16 11:05

MMDeploy安装和pth转ONNX

参考：https://github.com/open-mmlab/mmdeploy/blob/main/README_zh-CN.mdMMDeploy安装指导MMDeploy是OpenMMLab模型部署工具箱

HHzdh·2023-06-16 11:04

CUDA与TensorRT(5)之TensorRT介绍

1.TensorRT及其工作流程介绍TensorRT基本介绍TensorRT是可以在NVIDIA各种GPU硬件平台下运行的一个C++推理框架。

lonely-stone·2023-06-16 07:05

Windows11(CUDA11.7)下安装TensorRT

系列文章目录文章目录系列文章目录前言一、本人环境以及配置二、安装步骤首先CUDA和cuDNNTensorRT安装Python安装TensorRT库三、进行测试前言TensorRT有多厉害就不多说了，因为确实很好用

李寻欢a·2023-06-16 07:01

yolov5量化部署（基于openvino和tensorrt）

yolov5openvino量化部署首先，下载YOLOv5源码，安装YOLOv5和OpenVINO的python依赖。gitclonehttps://github.com/ultralytics/yolov5.gitpipinstall-rrequirements.txt&&pipinstallopenvinoopenvino-dev然后，通过YOLOv5提供的export.py将预训练的Pyto

给算法爸爸上香·2023-06-16 07:58

Nvidia-docker 配置 Tensorrt环境

主机端配置NVIDIA驱动安装NOTE:NVIDIA内核驱动版本与系统驱动一定要一致输入下条命令，查看你的显卡驱动所使用的内核版本cat/proc/driver/nvidia/versiong@g-Inspiron-5675:~$cat/proc/driver/nvidia/versionNVRMversion:NVIDIAUNIXx86_64KernelModule430.26TueJun417

大尾巴狼的觉悟·2023-06-16 05:58

【TensorRT】Win10 TensorRT下载与VS开发配置

1、TensorRT下载下载地址：NVIDIATensorRTDownload|NVIDIADeveloper在下载地址找到对应版本，以TensorRT7.2.3为例，找到其中的windows版本（注意

there2belief·2023-06-16 05:57

【TensorRT】TensorRT的环境配置

本文主要记录TensorRT8.6的环境配置过程！

Q小鑫·2023-06-16 05:57

【YOLOv8】实战三：基于LabVIEW TensorRT部署YOLOv8

‍‍博客主页：virobotics的CSDN博客：LabVIEW深度学习、人工智能博主所属专栏：『LabVIEW深度学习实战』上期文章：【YOLOv8】实战二：YOLOv8OpenVINO2022版windows部署实战如觉得博主文章写的不错或对你有所帮助的话，还望大家多多支持呀！欢迎大家✌关注、点赞、✌收藏、订阅专栏文章目录前言一、YOLOv8简介二、环境搭建2.1部署本项目时所用环境2.2La

virobotics·2023-06-15 20:45

LabVIEW开放神经网络交互工具包（ONNX)下载与超详细安装教程

开放神经网络交互工具包（ONNX)简介二、安装前的准备工作三、LabVIEW开放神经网络交互工具包（ONNX）下载四、LabVIEW开放神经网络交互工具包（ONNX）的安装1.CPU用户2.GPU用户（CUDA、TensorRT

virobotics·2023-06-15 20:44

LabVIEW AI视觉工具包OpenCV Mat基本用法和属性

对象基本属性2、Mat对象的数据属性总结‍‍博客主页：virobotics的CSDN博客：LabVIEW深度学习、人工智能博主所属专栏：『LabVIEW深度学习工具包』上期文章：【YOLOv5】LabVIEW+TensorRT

virobotics·2023-06-15 20:44

yolov8量化部署（基于openvino和tensorrt）

yolov8openvino量化部署环境配置：pipinstallultralytics&&pipinstallopenvino-dev将pytorch模型转为openvino模型:fromultralyticsimportYOLO#Loadamodelmodel=YOLO("./yolov8n.pt")#loadanofficialmodel#Exportthemodelmodel.export

给算法爸爸上香·2023-06-15 16:28

yolov5 6.1 关于 tensorrt 加速的使用以及问题说明

文章目录1.参考连接2.使用说明2.1导出加速模型2.1使用加速模型2.2加速参数对比3.问题说明3.1在Tensorrt8.4.1.5版本上使用export.py导出失败的问题3.2把模型文件由best.pt

Jerry.yl·2023-06-14 07:39

大模型部署实战（三）——ChatGLM-6B

有问题欢迎大家加关注私戳或者评论（包括但不限于NLP算法相关，linux学习相关，读研读博相关......）博主原文链接：https://www.yourmetaverse.cn/llm/213/（封面图由文心一格生成）大模型部署实战

Chaos_Wang_·2023-06-14 05:43

NVIDIA JETSON XAVIER NX （三）配置环境

文章目录(1)jetsonapt换源(2)pip安装换源(3)安装相关py库(4)TensorRT配置(1)jetsonapt换源首先需要搞清楚的是：1.JetsonXavierNX默认系统是Ubuntu18.04LTS

小可同学呀·2023-06-14 05:16

yolov5 6.1 关于 tensorrt 加速的使用以及问题说明

文章目录1.参考连接2.使用说明2.1导出加速模型2.1使用加速模型2.2加速参数对比3.问题说明3.1在Tensorrt8.4.1.5版本上使用export.py导出失败的问题3.2把模型文件由best.pt

Jerry.yl·2023-06-13 16:58

在米文动力 EVO Orin 设备 Jetson AGX Orin 下配置 YOLOV5 的环境说明

文章目录1.前言2.Anaconda安装3.jtop安装4.Cuda、Cudnn安装5.Pytorch安装6.Tensorrt安装7.yolov5安装使用8.环境备份9.参考连接1.前言本文设备内置的模组是

Jerry.yl·2023-06-13 16:27

mxnet模型转tensorrt

背景tensorrt是nvidia开发的模型推理框架,对于各个框架的模型推理都有比较高的加速比.不过tensorrt只支持加载caffe,onnx模型(官方建议tensorflow模型转UFF,不过一般还是转为

Threebucks·2023-06-13 14:59

人工智能让边缘计算更有价值!

LinkEdge的优势还体现在提升AI的实践效率，开发者可将深度学习的分析、训练过程放在云端，将生成的模型部署在边缘网关直接执行，优化良率、提升产能。另外

·2023-06-13 12:02

【TRT】使用TensorRT进行分类模型推理

1.pytorch模型导出为onnx模型1.1pytorch模型代码importtorchimporttorchvisionimportcv2importnumpyasnpclassClassifier(torch.nn.Module):def__init__(self):super().__init__()#使用torchvision自带的与训练模型,更多模型请参考:https://tensor

Dovake·2023-06-13 10:36

大模型部署实战（二）——Ziya-BLIP2-14B-Visual

❤️觉得内容不错的话，欢迎点赞收藏加关注，后续会继续输入更多优质内容❤️有问题欢迎大家加关注私戳或者评论（包括但不限于NLP算法相关，linux学习相关，读研读博相关......）大模型部署系列：博主原文链接

Chaos_Wang_·2023-06-13 02:40

【mmdeploy】让openmmlab带我走深度学习最后一公里，实现模型部署及终端推理。从模型转换，量化模型开始，小小的参数，大大的变化

如何将模型从pytorch形式转换成其他后端形式，准备工作安装目标后端。安装目标代码库。使用方法python./tools/deploy.py\${DEPLOY_CFG_PATH}\${MODEL_CFG_PATH}\${MODEL_CHECKPOINT_PATH}\${INPUT_IMG}\--test-img${TEST_IMG}\--work-dir${WORK_DIR}\--calib-d

羞儿·2023-06-11 20:25

Moss量化模型部署记录

一、Moss仓库代码下载及环境准备下载本仓库内容至本地/远程服务器gitclonehttps://github.com/OpenLMLab/MOSS.git安装依赖cdMOSSpipinstall-rrequirements.txt使用量化模型，需要安装tritonpipinstalltriton注意：使用triton可能会出现tritonnotinstalled报错，如果确认已经安装过trito

genghaojie123·2023-06-11 11:04

深度学习模型压缩与优化加速

1.简介深度学习（DeepLearning）因其计算复杂度或参数冗余，在一些场景和设备上限制了相应的模型部署，需要借助模型压缩、系统优化加速、异构计算等方法突破瓶颈，即分别在算法模型、计算图或算子优化以及硬件加速等层面采取必要的手段

老了敲不动了·2023-06-11 10:59

TensorRT入门实战,TensorRT Plugin介绍以及TensorRT INT8加速

文章目录一、TensorRT介绍,工作流程和优化策略TensorRT是什么TensorRT的工作流程TRT优化策略介绍二、TensorRT的组成和基本使用流程三、TensorRT的基本使用流程四、TensorRTDemo

NUS_Ryan·2023-06-10 20:36

WIN10安装CUDA保姆级教程[2023.5.7更新]

本系列分步记录在win10上搭建CUDA+cudnn+pytorch+YOLOv5+tensorrt等深度学习架构部署及系统搭建，欢迎关注追更！

问题多多快快改·2023-06-10 20:41

【目标检测】YOLOV8实战入门（七）模型基准测试

基准提供了关于导出格式的大小、其mAP50-95指标（用于目标检测和分割）或accuracy_top5指标（用于分类）以及ONNX、OpenVINO、TensorRT等各种导出格式中每张图像的毫秒推理时间的信息

卖报的大地主·2023-06-10 19:57

AI大模型私有化部署流程

私有化部署AI大模型需要一定的GPU支持，适合有一定经济实力的公司，今天和大家分享一下如何进行私有化部署，这涉及很专业的知识，包括硬件和软件环境、模型部署、API集成、测试验证等，这里只是初步讨论一下，

sofar_dev·2023-06-10 12:02

大模型部署实战（一）——Ziya-LLaMA-13B

（封面图由文心一格生成）大模型部署实战（一）——Ziya-LLaMA-13BZiya-LLaMA-13B是IDEA-CCNL基于LLaMa的130亿参数的大规模预训练模型，具备翻译，编程，文本分类，信息抽取

Chaos_Wang_·2023-06-10 06:35

docker镜像创建时使用GPU环境

我想将一个使用tensorrt加载的推理服务打包为docker镜像，如果推理引擎每次都加载onnx会比较慢，导致容器启动后一段时间内无法提供服务，所以最好能预先序列化为tensorrtengine文件保存在镜像中

zbharper·2023-06-10 05:01

详解Windows系统安装TensorRT

目录下载TensorRT安装TensorRT测试TensorRT是NVIDIA推出的一款高性能神经网络部署引擎.Windows系统下TensorRT目前不能简单直接通过pip指令自动下载安装,安装之前还需要提前安装好

KRISNAT·2023-06-10 00:53

【BEV】学习笔记之FastBEV(原理+代码注释)

1、前言BEV模型部署一直是难以解决的问题，在车载芯片上运行要占用大量计算资源，为此FastBEV的作者提出了更加轻量级的方法，不需要transformer来提取BEV特征，仅使用卷积网络来完成，简单而有效

Rex久居·2023-06-09 12:12

一站式完成车牌识别任务：从模型优化到端侧部署

本次飞桨产业实践范例库开源车牌识别场景应用，提供了从技术方案、模型训练优化，到模型部署的全流程可复用方案，降低产业落地门槛。项目链接https://github.com

飞桨PaddlePaddle·2023-06-08 19:09

Jetson Xavier NX Trtpy安装

0.准备工作安装之前请先安装好CUDA、cuDNN、TensorRT和PytorchJetsonXavierNXCUDA、cuDNN、TensorRT与Pytorch环境配置protobuf-3.11.4

ModernCode·2023-06-08 14:03

k210部署自行训练的口罩识别模型

因为培训需要，开坑K210，前后忙活了3天终于把自行训练的口罩模型部署成功了，实测还行，分享一下经（ni）验（keng）：本人学过一段时间python，见过别人玩开源硬件（没动过手），接触过一点人工智能项目的理论知识

razelan·2023-06-08 12:34

Jetson Xavier NX CUDA、cuDNN、TensorRT与Pytorch环境配置

torch与vision源码安装包下载链接：https://pan.baidu.com/s/1mrIgGoMo0bq6otGhlh-E3A提取码：6sb31.Cuda、CuDNN和TensorRT在JetsonXavierNx

ModernCode·2023-06-08 11:58

LoRA:大模型的低秩自适应微调模型

比如GPT-3175B，模型包含175B个参数吗，无论是微调训练和模型部署，都是不可能的事。

AI研究院·2023-06-08 06:07

TensorFlow 基本应用的学习报告及课后习题

此外，TensorTlow可在多种平台上工作，允许将模型部署到工业生产中，并易于使用。

m0_61463713·2023-06-08 05:26

深度学习知识点总结（持续更新中）

卷积神经网络(CNNs)3.循环神经网络(RNNs)4.深度强化学习(DRL)5.生成对抗网络(GANs)6.自编码器(Autoencoders)7.深度学习框架8.超参数调优9.迁移学习10.模型评估11.模型部署

旧言.·2023-06-08 01:01

【CV学习笔记】tensorrt篇之cuda_python

1、前言在使用tensorrt的时候，一般是使用cpp，对于cpp基础一般的同学不是很友好，尤其是在学习的过程中，而cpp主要是在部署的时候用到，最近了解到了Nvidia推出的cuda-python库，

Rex久居·2023-06-07 10:28

INT8 中的稀疏性：加速的训练工作流程和NVIDIA TensorRT 最佳实践

INT8中的稀疏性：加速的训练工作流程和NVIDIATensorRT最佳实践文章目录INT8中的稀疏性：加速的训练工作流程和NVIDIATensorRT最佳实践结构稀疏量化在TensorRT中部署稀疏量化模型的工作流程案例研究

扫地的小何尚·2023-06-06 23:13

实现PyTorch/ONNX自定义节点操作的TensorRT部署

参考一下面是基本步骤：加载训练好的bevtransformer网络权重参数：importtorchfrommodelimportModelmodel=Model()model.load_state_dict(torch.load("path/to/weights"))定义新的自定义操作：importtorchfromtorch.autogradimportFunctionclassCustomOp

ywfwyht·2023-06-06 23:35

jetson nano csi摄像头 tensorrt 运行yolov8检测

jetsonnanocsi摄像头tensorrt运行yolov8检测基于原始onnx模型的tensorrt预测1.在本地电脑训练环境下将onnx模型导出yolov8导出onnx模型2.在jetsonnano

图像处理大大大大大牛啊·2023-06-06 23:03

ONNX模型及自定义plugin的动态链接库转TensorRT模型推理

ONNX是一种用于表示机器学习模型的格式，而TensorRT是一个高性能的推理引擎，用于在NVIDIAGPU上进行推理。

ywfwyht·2023-06-06 22:44

推荐频道

模型部署（tensorRT)

[DeepSpeed]初代chatGPT模型部署实践

ONNX GraphSurgeon

清北「学渣」创业心路：AI 新时代已来，不参与对不起自己

Triton教程 -- 模型仓库

[模型部署] 算子等价替换

YOLO v5 v6 v7 TensorRT速度比较

【MMDeploy&MMPose】手把手教你在Windows上使用MMDeploy1.x进行ONNX和TensorRT的部署（Python篇）

MMDeploy安装和pth转ONNX

CUDA与TensorRT(5)之TensorRT介绍

Windows11(CUDA11.7)下安装TensorRT

yolov5量化部署（基于openvino和tensorrt）

Nvidia-docker 配置 Tensorrt环境

【TensorRT】Win10 TensorRT下载与VS开发配置

【TensorRT】TensorRT的环境配置

【YOLOv8】实战三：基于LabVIEW TensorRT部署YOLOv8

LabVIEW开放神经网络交互工具包（ONNX)下载与超详细安装教程

LabVIEW AI视觉工具包OpenCV Mat基本用法和属性

yolov8量化部署（基于openvino和tensorrt）

yolov5 6.1 关于 tensorrt 加速的使用以及问题说明

大模型部署实战（三）——ChatGLM-6B

NVIDIA JETSON XAVIER NX （三）配置环境

yolov5 6.1 关于 tensorrt 加速的使用以及问题说明

在米文动力 EVO Orin 设备 Jetson AGX Orin 下配置 YOLOV5 的环境说明

mxnet模型转tensorrt

人工智能让边缘计算更有价值!

【TRT】使用TensorRT进行分类模型推理

大模型部署实战（二）——Ziya-BLIP2-14B-Visual

【mmdeploy】让openmmlab带我走深度学习最后一公里，实现模型部署及终端推理。从模型转换，量化模型开始，小小的参数，大大的变化

Moss量化模型部署记录

深度学习模型压缩与优化加速

TensorRT入门实战,TensorRT Plugin介绍以及TensorRT INT8加速

WIN10安装CUDA保姆级教程[2023.5.7更新]

【目标检测】YOLOV8实战入门（七）模型基准测试

AI大模型私有化部署流程

大模型部署实战（一）——Ziya-LLaMA-13B

docker镜像创建时使用GPU环境

详解Windows系统安装TensorRT

【BEV】学习笔记之FastBEV(原理+代码注释)

一站式完成车牌识别任务：从模型优化到端侧部署

Jetson Xavier NX Trtpy安装

k210部署自行训练的口罩识别模型

Jetson Xavier NX CUDA、cuDNN、TensorRT与Pytorch环境配置

LoRA:大模型的低秩自适应微调模型

TensorFlow 基本应用的学习报告及课后习题

深度学习知识点总结（持续更新中）

【CV学习笔记】tensorrt篇之cuda_python

INT8 中的稀疏性：加速的训练工作流程和NVIDIA TensorRT 最佳实践

实现PyTorch/ONNX自定义节点操作的TensorRT部署

jetson nano csi摄像头 tensorrt 运行yolov8检测

ONNX模型及自定义plugin的动态链接库转TensorRT模型推理