小明是谁鸭

使用ONNX Runtime推理引擎进行加速（Pytorch----＞Onnx----＞ONNX Runtime）

前言

OpenMMLab 的算法如何部署？是很多社区用户的困惑。而模型部署工具箱 MMDeploy 的开源，强势打通了从算法模型到应用程序这 "最后一公里"！

今天我们将开启模型部署入门系列教程，在模型部署开源库 MMDeploy 的辅助下，介绍以下内容：

中间表示 ONNX 的定义标准
PyTorch 模型转换到 ONNX 模型的方法
推理引擎 ONNX Runtime、TensorRT 的使用方法
部署流水线 PyTorch - ONNX - ONNX Runtime/TensorRT 的示例及常见部署问题的解决方法
MMDeploy C/C++ 推理 SDK

希望通过本系列教程，带领大家学会如何把自己的 PyTorch 模型部署到 ONNX Runtime/TensorRT 上，并学会如何把 OpenMMLab 开源体系中各个计算机视觉任务的模型用 MMDeploy 部署到各个推理引擎上。

号外号外！模型部署入门系列教程都已整理至 MMDeploy GitHub 仓库啦，我们也将长期维护更新，欢迎大家来催更呀，多提 Issue 和 PR，一起完善丰富我们的教程哦~

https://github.com/open-mmlab/mmdeploy/blob/master/docs/zh_cn/tutorials/chapter_01_introduction_to_model_deployment.mdgithub.com/open-mmlab/mmdeploy/blob/master/docs/zh_cn/tutorials/chapter_01_introduction_to_model_deployment.md

我们默认大家熟悉 Python 语言，并对 PyTorch 框架有基本的认识，除此之外不需要了解任何模型部署的知识。

在第一篇文章中，我们将部署一个简单的超分辨率模型，认识中间表示、推理引擎等模型部署中的概念。

初识模型部署

在软件工程中，部署指把开发完毕的软件投入使用的过程，包括环境配置、软件安装等步骤。类似地，对于深度学习模型来说，模型部署指让训练好的模型在特定环境中运行的过程。相比于软件部署，模型部署会面临更多的难题：

1）运行模型所需的环境难以配置。深度学习模型通常是由一些框架编写，比如 PyTorch、TensorFlow。由于框架规模、依赖环境的限制，这些框架不适合在手机、开发板等生产环境中安装。

2）深度学习模型的结构通常比较庞大，需要大量的算力才能满足实时运行的需求。模型的运行效率需要优化。

因为这些难题的存在，模型部署不能靠简单的环境配置与安装完成。经过工业界和学术界数年的探索，模型部署有了一条流行的流水线：

使用ONNX Runtime推理引擎进行加速（Pytorch----＞Onnx----＞ONNX Runtime）_第1张图片

为了让模型最终能够部署到某一环境上，开发者们可以使用任意一种深度学习框架来定义网络结构，并通过训练确定网络中的参数。之后，模型的结构和参数会被转换成一种只描述网络结构的中间表示，一些针对网络结构的优化会在中间表示上进行。最后，用面向硬件的高性能编程框架(如 CUDA，OpenCL）编写，能高效执行深度学习网络中算子的推理引擎会把中间表示转换成特定的文件格式，并在对应硬件平台上高效运行模型。

这一条流水线解决了模型部署中的两大问题：使用对接深度学习框架和推理引擎的中间表示，开发者不必担心如何在新环境中运行各个复杂的框架；通过中间表示的网络结构优化和推理引擎对运算的底层优化，模型的运算效率大幅提升。

现在，让我们从一个模型部署的“Hello World”项目入手，见识一下模型部署各方面的知识吧！

部署第一个模型

创建 PyTorch 模型

让我们用 PyTorch 实现一个超分辨率模型，并把模型部署到 ONNX Runtime 这个推理引擎上。

首先，我们需要创建一个有 PyTorch 库的 Python 编程环境。如果你的 PyTorch 环境还没有装好，可以参考官方的入门教程。我们强烈推荐使用 conda 来管理 Python 库。使用 conda 可以靠如下的命令初始化一个 PyTorch 环境：


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 创建预安装 Python 3.7 的名叫 deploy 虚拟环境 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       conda create 
       -n deploy python
       =
       3.7 
       -y 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 进入虚拟环境 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       conda activate deploy 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 安装 cpu 版本的 PyTorch 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       conda install pytorch torchvision cpuonly 
       -
       c pytorch

如果你的设备支持 cuda 编程，我们建议你在配置 cuda 环境后使用 gpu 上的 PyTorch。比如将上面安装 PyTorch 的命令改成：


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 安装 cuda 11.3 的 PyTorch 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 如果你用的是其他版本的 cuda，请参考上面 PyTorch 的官方安装教程选择安装命令 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       conda install pytorch torchvision cudatoolkit
       =
       11.3 
       -
       c pytorch

本教程会用到其他一些第三方库。你可以用以下命令来安装这些库：


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 安装 ONNX Runtime, ONNX, OpenCV 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       pip install onnxruntime onnx opencv
       -python

在一切都配置完毕后，用下面的代码来创建一个经典的超分辨率模型 SRCNN。


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       import os 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       import cv2 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       import numpy as np 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       import requests 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       import torch 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       import torch
       .onnx 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       from torch import nn 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       class SuperResolutionNet(nn
       .Module): 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           def 
       __init__(self, upscale_factor): 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       super().
       __init__() 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.upscale_factor = upscale_factor 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.img_upsampler = nn.
       Upsample( 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   scale_factor=self.upscale_factor, 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   mode=
       'bicubic', 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   align_corners=False) 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.conv1 = nn.
       Conv2d(
       3,
       64,kernel_size=
       9,padding=
       4) 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.conv2 = nn.
       Conv2d(
       64,
       32,kernel_size=
       1,padding=
       0) 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.conv3 = nn.
       Conv2d(
       32,
       3,kernel_size=
       5,padding=
       2) 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.relu = nn.
       ReLU() 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           def 
       forward(self, x): 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               x = self.
       img_upsampler(x) 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               out = self.
       relu(self.
       conv1(x)) 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               out = self.
       relu(self.
       conv2(out)) 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               out = self.
       conv3(out) 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               return out 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       # Download checkpoint and test image 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       urls = [
       'https://download.openmmlab.com/mmediting/restorers/srcnn/srcnn_x4k915_1x16_1000k_div2k_20200608-4186f232.pth', 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       'https://raw.githubusercontent.com/open-mmlab/mmediting/master/tests/data/face/000001.png'] 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       names = [
       'srcnn.pth', 
       'face.png'] 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       for url, name in 
       zip(urls, names): 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           if not os.path.
       exists(name): 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       open(name, 
       'wb').
       write(requests.
       get(url).content) 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       def 
       init_torch_model(): 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           torch_model = 
       SuperResolutionNet(upscale_factor=
       3) 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           state_dict = torch.
       load(
       'srcnn.pth')[
       'state_dict'] 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           # Adapt the checkpoint 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           for old_key in 
       list(state_dict.
       keys()): 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               new_key = 
       '.'.
       join(old_key.
       split(
       '.')[
       1:]) 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               state_dict[new_key] = state_dict.
       pop(old_key) 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           torch_model.
       load_state_dict(state_dict) 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           torch_model.
       eval() 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           return torch_model 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       model = 
       init_torch_model() 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       input_img = cv2.
       imread(
       'face.png').
       astype(np.float32) 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       # HWC to NCHW 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       input_img = np.
       transpose(input_img, [
       2, 
       0, 
       1]) 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       input_img = np.
       expand_dims(input_img, 
       0) 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       # Inference 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       torch_output = 
       model(torch.
       from_numpy(input_img)).
       detach().
       numpy() 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       # NCHW to HWC 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       torch_output = np.
       squeeze(torch_output, 
       0) 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       torch_output = np.
       clip(torch_output, 
       0, 
       255) 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       torch_output = np.
       transpose(torch_output, [
       1, 
       2, 
       0]).
       astype(np.uint8) 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       # Show image 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       cv2.
       imwrite(
       "face_torch.png", torch_output)

SRCNN 先把图像上采样到对应分辨率，再用 3 个卷积层处理图像。为了方便起见，我们跳过训练网络的步骤，直接下载模型权重（由于 MMEditing 中 SRCNN 的权重结构和我们定义的模型不太一样，我们修改了权重字典的 key 来适配我们定义的模型），同时下载好输入图片。为了让模型输出成正确的图片格式，我们把模型的输出转换成 HWC 格式，并保证每一通道的颜色值都在 0~255 之间。如果脚本正常运行的话，一幅超分辨率的人脸照片会保存在 “face_torch.png” 中。

使用ONNX Runtime推理引擎进行加速（Pytorch----＞Onnx----＞ONNX Runtime）_第2张图片

在 PyTorch 模型测试正确后，我们来正式开始部署这个模型。我们下一步的任务是把 PyTorch 模型转换成用中间表示 ONNX 描述的模型。

中间表示 - ONNX

在介绍 ONNX 之前，我们先从本质上来认识一下神经网络的结构。神经网络实际上只是描述了数据计算的过程，其结构可以用计算图表示。比如 a+b 可以用下面的计算图来表示：

为了加速计算，一些框架会使用对神经网络“先编译，后执行”的静态图来描述网络。静态图的缺点是难以描述控制流（比如 if-else 分支语句和 for 循环语句），直接对其引入控制语句会导致产生不同的计算图。比如循环执行 n 次 a=a+b，对于不同的 n，会生成不同的计算图：

ONNX （Open Neural Network Exchange）是 Facebook 和微软在2017年共同发布的，用于标准描述计算图的一种格式。目前，在数家机构的共同维护下，ONNX 已经对接了多种深度学习框架和多种推理引擎。因此，ONNX 被当成了深度学习框架到推理引擎的桥梁，就像编译器的中间语言一样。由于各框架兼容性不一，我们通常只用 ONNX 表示更容易部署的静态图。

让我们用下面的代码来把 PyTorch 的模型转换成 ONNX 格式的模型：


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       x = torch.randn(
       1, 
       3, 
       256, 
       256) 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       with torch.no_grad(): 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           torch.onnx.
       export( 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               model, 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               x, 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       "srcnn.onnx", 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               opset_version=
       11, 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               input_names=[
       'input'], 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               output_names=[
       'output'])

其中，torch.onnx.export 是 PyTorch 自带的把模型转换成 ONNX 格式的函数。让我们先看一下前三个必选参数：前三个参数分别是要转换的模型、模型的任意一组输入、导出的 ONNX 文件的文件名。转换模型时，需要原模型和输出文件名是很容易理解的，但为什么需要为模型提供一组输入呢？这就涉及到 ONNX 转换的原理了。从 PyTorch 的模型到 ONNX 的模型，本质上是一种语言上的翻译。直觉上的想法是像编译器一样彻底解析原模型的代码，记录所有控制流。但前面也讲到，我们通常只用 ONNX 记录不考虑控制流的静态图。因此，PyTorch 提供了一种叫做追踪（trace）的模型转换方法：给定一组输入，再实际执行一遍模型，即把这组输入对应的计算图记录下来，保存为 ONNX 格式。export 函数用的就是追踪导出方法，需要给任意一组输入，让模型跑起来。我们的测试图片是三通道，256x256大小的，这里也构造一个同样形状的随机张量。

剩下的参数中，opset_version 表示 ONNX 算子集的版本。深度学习的发展会不断诞生新算子，为了支持这些新增的算子，ONNX会经常发布新的算子集，目前已经更新15个版本。我们令 opset_version = 11，即使用第11个 ONNX 算子集，是因为 SRCNN 中的 bicubic （双三次插值）在 opset11 中才得到支持。剩下的两个参数 input_names, output_names 是输入、输出 tensor 的名称，我们稍后会用到这些名称。

如果上述代码运行成功，目录下会新增一个"srcnn.onnx"的 ONNX 模型文件。我们可以用下面的脚本来验证一下模型文件是否正确。


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       import onnx 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       onnx_model = onnx.load(
       "srcnn.onnx") 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       try: 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           onnx.checker.check_model(onnx_model) 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       except Exception: 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       print(
       "Model incorrect") 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       else: 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       print(
       "Model correct")

其中，onnx.load 函数用于读取一个 ONNX 模型。onnx.checker.check_model 用于检查模型格式是否正确，如果有错误的话该函数会直接报错。我们的模型是正确的，控制台中应该会打印出"Model correct"。

接下来，让我们来看一看 ONNX 模型具体的结构是怎么样的。我们可以使用 Netron （开源的模型可视化工具）来可视化 ONNX 模型。把 srcnn.onnx 文件从本地的文件系统拖入网站，即可看到如下的可视化结果：

点击 input 或者 output，可以查看 ONNX 模型的基本信息，包括模型的版本信息，以及模型输入、输出的名称和数据类型。

使用ONNX Runtime推理引擎进行加速（Pytorch----＞Onnx----＞ONNX Runtime）_第6张图片

点击某一个算子节点，可以看到算子的具体信息。比如点击第一个 Conv 可以看到：

每个算子记录了算子属性、图结构、权重三类信息。

算子属性信息即图中 attributes 里的信息，对于卷积来说，算子属性包括了卷积核大小(kernel_shape)、卷积步长(strides)等内容。这些算子属性最终会用来生成一个具体的算子。
图结构信息指算子节点在计算图中的名称、邻边的信息。对于图中的卷积来说，该算子节点叫做 Conv_2，输入数据叫做 11，输出数据叫做 12。根据每个算子节点的图结构信息，就能完整地复原出网络的计算图。
权重信息指的是网络经过训练后，算子存储的权重信息。对于卷积来说，权重信息包括卷积核的权重值和卷积后的偏差值。点击图中 conv1.weight, conv1.bias 后面的加号即可看到权重信息的具体内容。

现在，我们有了 SRCNN 的 ONNX 模型。让我们看看最后该如何把这个模型运行起来。

推理引擎 -ONNX Runtime

ONNX Runtime 是由微软维护的一个跨平台机器学习推理加速器，也就是我们前面提到的”推理引擎“。ONNX Runtime 是直接对接 ONNX 的，即 ONNX Runtime 可以直接读取并运行 .onnx 文件, 而不需要再把 .onnx 格式的文件转换成其他格式的文件。也就是说，对于 PyTorch - ONNX - ONNX Runtime 这条部署流水线，只要在目标设备中得到 .onnx 文件，并在 ONNX Runtime 上运行模型，模型部署就算大功告成了。

通过刚刚的操作，我们把 PyTorch 编写的模型转换成了 ONNX 模型，并通过可视化检查了模型的正确性。最后，让我们用 ONNX Runtime 运行一下模型，完成模型部署的最后一步。

ONNX Runtime 提供了 Python 接口。接着刚才的脚本，我们可以添加如下代码运行模型：


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       import onnxruntime 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       ort_session = onnxruntime.InferenceSession(
       "srcnn.onnx") 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       ort_inputs = {
       'input': input_img} 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       ort_output = ort_session.run([
       'output'], ort_inputs)[
       0] 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       ort_output = np.squeeze(ort_output, 
       0) 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       ort_output = np.clip(ort_output, 
       0, 
       255) 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       ort_output = np.transpose(ort_output, [
       1, 
       2, 
       0]).astype(np.
       uint8) 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       cv2.imwrite(
       "face_ort.png", ort_output)

这段代码中，除去后处理操作外，和 ONNX Runtime 相关的代码只有三行。让我们简单解析一下这三行代码。onnxruntime.InferenceSession用于获取一个 ONNX Runtime 推理器，其参数是用于推理的 ONNX 模型文件。推理器的 run 方法用于模型推理，其第一个参数为输出张量名的列表，第二个参数为输入值的字典。其中输入值字典的 key 为张量名，value 为 numpy 类型的张量值。输入输出张量的名称需要和torch.onnx.export 中设置的输入输出名对应。

如果代码正常运行的话，另一幅超分辨率照片会保存在"face_ort.png"中。这幅图片和刚刚得到的"face_torch.png"是一模一样的。这说明 ONNX Runtime 成功运行了 SRCNN 模型，模型部署完成了！以后有用户想实现超分辨率的操作，我们只需要提供一个 "srcnn.onnx" 文件，并帮助用户配置好 ONNX Runtime 的 Python 环境，用几行代码就可以运行模型了。或者还有更简便的方法，我们可以利用 ONNX Runtime 编译出一个可以直接执行模型的应用程序。我们只需要给用户提供 ONNX 模型文件，并让用户在应用程序选择要执行的 ONNX 模型文件名就可以运行模型了。

总结

在这篇教程里，我们利用成熟的模型部署工具，轻松部署了一个初始版本的超分辨率模型 SRCNN。但在实际应用场景中，随着模型结构的复杂度不断加深，碰到的困难的也会越来越多。在下一篇教程里，我们将“升级”一下这个超分辨率模型，让它支持动态的输入。

看完这篇教程，是不是感觉知识太多一下消化不过来？没关系，模型部署本身有非常多的东西要学。为了举例的方便，这篇教程包含了许多未来才会讲到的知识点。事实上，读完这篇教程后，记下以下知识点就够了：

模型部署，指把训练好的模型在特定环境中运行的过程。模型部署要解决模型框架兼容性差和模型运行速度慢这两大问题。
模型部署的常见流水线是“深度学习框架-中间表示-推理引擎”。其中比较常用的一个中间表示是 ONNX。
深度学习模型实际上就是一个计算图。模型部署时通常把模型转换成静态的计算图，即没有控制流（分支语句、循环语句）的计算图。
PyTorch 框架自带对 ONNX 的支持，只需要构造一组随机的输入，并对模型调用 torch.onnx.export 即可完成 PyTorch 到 ONNX 的转换。
推理引擎 ONNX Runtime 对 ONNX 模型有原生的支持。给定一个 .onnx 文件，只需要简单使用 ONNX Runtime 的 Python API 就可以完成模型推理。

为了实现深度学习算法的落地，充满挑战的模型部署是一个逃不开的步骤。为此，我们开发的开源库 MMDeploy 实现了 OpenMMLab 中目标检测、图像分割、超分辨率等多个视觉任务模型的部署，支持 ONNX Runtime，TensorRT，ncnn ，openppl，OpenVINO 等多个推理引擎。在后续的模型部署教程中，我们将在介绍模型部署技术的同时，介绍这些技术是如何运用在 MMDeploy 中的。希望大家继续关注我们的后续教程，关注 MMDeploy，共同为深度学习算法落地贡献自己的一份力。

https://github.com/open-mmlab/mmdeploygithub.com/open-mmlab/mmdeploy

PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
vllm本地部署bge-reranker-v2-m3模型API服务实战教程雷电法王大模型部署 linux python vscode language model
文章目录一、说明二、配置环境2.1安装虚拟环境2.2安装vllm2.3对应版本的pytorch安装2.4安装flash_attn2.5下载模型三、运行代码3.1启动服务3.2调用代码验证一、说明本文主要介绍vllm本地部署BAAI/bge-reranker-v2-m3模型API服务实战教程本文是在Ubuntu24.04+CUDA12.8+Python3.12环境下复现成功的二、配置环境2.1安装虚
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
正义的算法迷宫—人工智能重构司法体系的技术悖论与文明试炼
一、法庭的数字化迁徙当美国威斯康星州法院采纳COMPAS算法评估被告再犯风险，当中国"智慧法院"系统年处理1.2亿件案件，司法体系正经历从石柱法典到代码裁判的范式革命。这场转型的核心驱动力是司法效率与公正的永恒张力：美国重罪案件平均审理周期达18个月，中国基层法官年人均结案357件（是德国同行的6倍），而算法能在0.3秒内完成百万份文书比对。人工智能渗透司法引发三重裂变：证据分析从经验推断转向数据
NumPy-@运算符详解 GG不是gg numpy numpy
NumPy-@运算符详解一、@运算符的起源与设计目标1.从数学到代码：符号的统一2.设计目标二、@运算符的核心语法与运算规则1.基础用法：二维矩阵乘法2.一维向量的矩阵语义3.高维数组：批次矩阵运算4.广播机制：灵活的形状匹配三、@运算符与其他乘法方式的核心区别1.对比`np.dot()`2.对比元素级乘法`*`3.对比`np.matrix`的`*`运算符四、典型应用场景：从基础到高阶1.深度学习
【python实战】不玩微博，一封邮件就能知道实时热榜，天秀吃瓜一条coding 从实战学python 人工智能 python linux 爬虫
❤️欢迎订阅《从实战学python》专栏，用python实现办公自动化、数据可视化、人工智能等各个方向的实战案例，有趣又有用！❤️更多精品专栏简介点这里有的人金玉其表败絮其中，有的人却若彩虹般绚烂，怦然心动前言哈喽，大家好，我是一条。在生活中我是一个不太喜欢逛娱乐平台的人，抖音、快手、微博我手机里都没装，甚至微信朋友圈都不看，但是自从开始写博客，有些热度不得不蹭。所以就有了这样一个需求，能不能让微
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
解决 Python 包安装失败问题：以 accelerate 为例
在使用Python开发项目时，我们经常会遇到依赖包安装失败的问题。今天，我们就以accelerate包为例，详细探讨一下可能的原因以及解决方法。通过这篇文章，你将了解到Python包安装失败的常见原因、如何切换镜像源、如何手动安装包，以及一些实用的注意事项。一、问题背景在开发一个深度学习项目时，我需要安装accelerate包来优化模型的训练过程。然而，当我运行以下命令时：bash复制pipins
MCP协议：AI时代的“万能插座”如何重构IT生态与未来
MCP协议：AI时代的“万能插座”如何重构IT生态与未来在人工智能技术爆炸式发展的浪潮中，一个名为ModelContextProtocol（MCP）的技术协议正以惊人的速度重塑IT行业的底层逻辑。2024年11月由Anthropic首次发布，MCP在短短半年内获得OpenAI、谷歌、亚马逊、阿里、腾讯等全球科技巨头的支持，被业内誉为AI时代的HTTP协议或USB-C接口，正在成为连接大模型与现实世
从RNN循环神经网络到Transformer注意力机制：解析神经网络架构的华丽蜕变熊猫钓鱼>_> 神经网络 rnn transformer
1.引言在自然语言处理和序列建模领域，神经网络架构经历了显著的演变。从早期的循环神经网络（RNN）到现代的Transformer架构，这一演变代表了深度学习方法在处理序列数据方面的重大进步。本文将深入比较这两种架构，分析它们的工作原理、优缺点，并通过实验结果展示它们在实际应用中的性能差异。2.循环神经网络（RNN）2.1基本原理循环神经网络是专门为处理序列数据而设计的神经网络架构。RNN的核心思想
《算法备案全攻略：规范与流程引领数字时代新秩序》算法及大模型备案顾问刘老师算法备案深度学习 AIGC 语言模型算法人工智能
一、算法备案：开启合规新征程（一）备案规定的起源与发展2022年国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合发布《互联网信息服务算法推荐管理规定》，自2022年3月1日起施行。此后，相关规定不断完善和演进。如国家网信办于2022年8月、10月及2023年1月先后三次公布了《境内互联网信息服务算法备案清单》。同时，2022年发布的最高人民法院《关于规范和加强人工智能司法应用
pycharm无法识别conda环境（已解决） Reborker pycharm conda ide
文章目录前言研究过程解决办法前言好久不用pycharm了，打开后提示更新，更新到了2023.1版本。安装conda后在新建了一个虚拟环境pytorch，但是无论是基础环境还是虚拟环境，pycharm都识别不出conda里的python.exe(如图)。如果不想看啰嗦直接看后面的解决办法，比较闲的话可以看看我的研究过程。研究过程看了很多博客，尝试了以下解决办法：加载conda.bat文件，虽然出现了
C语言学生成绩管理系统<；自创>；(功能7有小错误,但可运行） han_xue_feng java
腾讯云加速企业和个人开发创新公开直播预告直播预告：07/18(周四)15:00-16:00随着人工智能与大模型的蓬勃发展，我们正步入一个由技微信实习第一天周五入职，早上早早来到了公司，发现好多人都没上班，到十点才陆陆续续有人来，办理完入职后，mentor中联夏令营遗憾没有入选不过hr的回复真的很好，辛苦啦#提前批简历挂麻了怎么办##机械制造投递记录#大数据开发的工作有点过于简单了吧sq大数据开发的
Python 实战人工智能数学基础：推荐系统应用 AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术文章目录1.背景介绍2.核心概念与联系2.1用户画像2.2相似性计算2.2.1基于物品的相似度2.2.2基于用户的相似度2.3协同过滤算法2.3.1基于用户的协同过滤算法2.3.2基于物品的协同过滤算法2.3.3基于上下文的协同过滤算法3.核心算法原理和具体操作步骤以及数学模型公式详细讲解3.1基于用户的协同过滤算法3.2基于物品的协同过滤算法3.3混合协同过滤算法3.
jetson agx orin 刷机、cuda、pytorch配置指南【亲测有效】
jetsonagxorin刷机指南注意事项刷机具体指南cuda环境配置指南Anconda、Pytorch配置注意事项1.使用设备自带usbtoc的传输线时，注意c口插到orin左侧的口，右侧的口不支持数据传输；2.刷机时需准备ubuntu系统，可以是虚拟机，注意安装SDKManager刷机时，JetPack版本要选对，JetPack6.0的对应ubuntu22，cuda12版本，对应pytorch
Python桌面应用开发的未来——智能化工具与大模型赋能 IronwoodStag78
开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！标题：Python桌面应用开发的未来——智能化工具与大模型赋能随着人工智能技术的飞速发展，传统软件开发模式正在被重新定义。Python作为一门功能强大且灵活的语言，在桌面应用开发领域一直占据重要地位。然而，面对日益复杂的用户需求和快速变化的技术环境，如何提升开发效率、降低开发门槛，成为开发者亟需解决的问题
如何使用Python实现交通工具识别
如何使用Python实现交通工具识别文章目录技术架构功能流程识别逻辑用户界面增强特性依赖项主要类别内容展示该系统是一个基于深度学习的交通工具识别工具，具备以下核心功能与特点：技术架构使用预训练的ResNet50卷积神经网络模型（来自ImageNet数据集）集成图像增强预处理技术（随机裁剪、旋转、翻转等）采用多数投票机制提升预测稳定性基于置信度评分的结果筛选策略功能流程用户通过GUI界面选择待识别图
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST