Le0v1n

[学习笔记] ONNX 基础知识

1. ONNX 简介

1.1 什么是 ONNX

开放神经网络交换 ONNX（Open Neural Network Exchange）是一套表示深度神经网络模型的开放格式，由微软和 Facebook 于 2017 推出，然后迅速得到了各大厂商和框架的支持。通过短短几年的发展，已经成为表示深度学习模型的实际标准，并且通过 ONNX-ML，可以支持传统非神经网络机器学习模型，大有一统整个 AI 模型交换标准。

1.2 ONNX 的核心思想

ONNX 定义了一组与环境和平台无关的标准格式，为 AI 模型的互操作性提供了基础，使 AI 模型可以在不同框架和环境下交互使用。硬件和软件厂商可以基于 ONNX 标准优化模型性能，让所有兼容 ONNX 标准的框架受益。目前，ONNX 主要关注在模型预测方面（inferring），使用不同框架训练的模型，转化为 ONNX 格式后，可以很容易的部署在兼容 ONNX 的运行环境中。

1.3 ONNX 的存储方式 —— ProtoBuf

ONNX 使用的是 Protobuf 这个序列化数据结构去存储神经网络的权重信息。

Protobuf 是一种轻便高效的结构化数据存储格式，可以用于结构化数据串行化，或者说序列化。它很适合做数据存储或数据交换格式。可用于通讯协议、数据存储等领域的语言无关、平台无关、可扩展的序列化结构数据格式。目前提供了 C++、Java、Python 三种语言的 API。

1.4 ONNX 组成部分 {##Opset}

ONNX 规范由以下几个部分组成：

一个可扩展的计算图模型：定义了通用的计算图中间表示法（Intermediate Representation）。
opset：ai.onnx 和 ai.onnx.ml。
- ai.onnx 是默认的操作符集，主要针对神经网络模型
- ai.onnx.ml 主要适用于传统非神经网络机器学习模型
标准数据类型：包括张量（tensors）、序列（sequences）和映射（maps）。

opset：operator set，可以翻译为算子集合。

目前，ONNX 规范有两个官方变体，主要区别在与支持的类型和默认的操作符集（opset）。ONNX 神经网络变体只使用张量作为输入和输出；而作为支持传统机器学习模型的 ONNX-ML，还可以识别序列和映射，ONNX-ML 为支持非神经网络算法扩展了 ONNX 操作符集。

1.5 ONNX 主要协议

ModelProto（模型协议）： 定义整个神经网络模型的结构，包括模型的元数据、图结构以及其他相关信息。
GraphProto（图协议）： 描述神经网络的计算图结构，包括节点（NodeProto）、边（连接节点的边）等信息。
NodeProto（节点协议）： 用于定义计算图中的节点，每个节点表示一个操作或计算步骤，包括该节点的输入、输出、操作类型等信息。
ValueInfoProto（值信息协议）： 用于描述计算图中的值（如张量）的信息，包括名称、数据类型、形状等。
TensorProto（张量协议）： 用于描述神经网络中的张量，包括张量的数据、形状、数据类型等信息。
AttributeProto（属性协议）： 用于表示节点或图的属性，这些属性可能包含操作的参数、超参数等信息。

1.6 ONNX 的粒度与运行速度的关系

主流的模型部署有两种路径，以 TensorRT 为例，一种是 PyTorch->ONNX->TensorRT，另一种是 PyTorch->Caffe->TensorRT，两种转换路径的对比如下：

属性	ONNX	Caffe
灵活性	高	低
op 粒度	细粒度	粗粒度
条件分支	不支持	支持
动态 shape	支持	不支持

上面的表列了 ONNX 和 Caffe 的几点区别，其中最重要的区别就是 op 的粒度。举个例子，如果对 Bert 的 Attention 层做转换，ONNX 会把它变成 MatMul, Scale, SoftMax 的组合，而 Caffe 可能会直接生成一个叫做 Multi-Head Attention 的层，同时告诉 CUDA 工程师：“你去给我写一个大 kernel“（很怀疑发展到最后会不会把 ResNet50 都变成一个层）

因此如果某天一个研究员提了一个新的 SOTA 的 op，很可能它直接就可以被转换成 ONNX（如果这个 op 在 PyTorch 的实现全都是用 Aten 的库拼接的），但是对于 Caffe 的工程师，需要重新写一个 kernel。

ATen 是 PyTorch 内置的 C++ 张量计算库，PyTorch 算子在底层绝大多数计算都是用 ATen 实现的。

细粒度 op 的好处就是非常灵活，坏处就是速度会比较慢。这几年有很多工作都是在做 op fushion（比如把卷积和它后面的 ReLU 合到一起算），也就是把小 op 拼成大 op。

TensorRT 是 NVIDIA 推出的部署框架，自然性能是首要考量的，因此 Layer 的粒度都很粗（粗粒度代表着有大 op，从而速度会快）。在这种情况下把 Caffe 转换过去有天然的优势。

除此之外粗粒度也可以解决分支的问题。TensorRT 眼里的神经网络就是一个单纯的 DAG（有向无环图）：给定固定 shape 的输入，执行相同的运算，得到固定 shape 的输出。

在评估一个自定义的节点中有相关的实验。通过实验我们可以知道，将多个算子合在一起称之为 fusion，这个 fusion 是可以快加模型速度的。

2. ONNX 示例

2.1 线性回归（Linear Regression）{##example1}

线性回归是机器学习中最简单的模型，由以下表达式描述：

$Y = X A + B$

我们可以将其看作是三个变量 $Y = f (X, A, B)$ 分解成 y = Add(MatMul(X, A), B)。这是我们需要用 ONNX 运算符表示的内容。首先是使用 ONNX 运算符实现一个函数。ONNX 是强类型的，必须为函数的输入和输出定义形状和类型。也就是说，我们需要四个函数来构建图，其中包括 make 函数：

make_tensor_value_info：根据其形状和类型声明变量（输入或输出）
make_node：创建由操作（op 类型）、其输入和输出定义的节点
make_graph：创建一个带有前两个函数创建的对象的 ONNX 图的函数
make_model：最后一个函数，将图和附加元数据合并

在整个创建过程中，我们需要为图的每个节点的每个输入和输出赋予一个名称。图的输入和输出由 ONNX 对象定义，使用字符串引用中间结果。下面是示例代码。

import onnx
from onnx import TensorProto
from onnx.helper import (make_model, make_node, make_graph, 
                         make_tensor, make_tensor_value_info)
from onnx.checker import check_model


# -------------------------- inputs --------------------------
# 'X'是名称，TensorProto.FLOAT是类型，[None, None]是形状。
X = make_tensor_value_info('X', TensorProto.FLOAT, [None, None])
A = make_tensor_value_info('A', TensorProto.FLOAT, [None, None])
B = make_tensor_value_info('B', TensorProto.FLOAT, [None, None])

# -------------------------- outputs(形状未定义) --------------------------
Y = make_tensor_value_info('Y', TensorProto.FLOAT, [None])

# -------------------------- nodes --------------------------
# 它创建一个由运算符类型MatMul定义的节点，'X'、'A'是节点的输入，'XA'是输出。
node1 = make_node(op_type='MatMul', 
                  inputs=['X', 'A'],
                  outputs=['XA'])

node2 = make_node(op_type='Add', 
                  inputs=['XA', 'B'],
                  outputs=['Y'])

# -------------------------- graph --------------------------
# 从节点到图，图是由节点列表、输入列表、输出列表和名称构建的。
graph = make_graph(nodes=[node1, node2],  # 节点
                   name='lr',  # 名称
                   inputs=[X, A, B],  # 输入节点
                   outputs=[Y])  # 输出节点

# -------------------------- model --------------------------
# ONNX图，这种情况下没有元数据。
onnx_model = make_model(graph=graph)

# 让我们检查模型是否一致，这个函数在“Checker and Shape Inference”部分有描述。
check_model(model=onnx_model)  # 如果测试失败，将引发异常

print(onnx_model)

# 将这个模型保存到本地
onnx.save_model(onnx_model, 'ONNX/saves/linear_regression.onnx')

模型打印结果：

ir_version: 9
opset_import {
  version: 20
}
graph {
  node {
    input: "X"
    input: "A"
    output: "XA"
    op_type: "MatMul"
  }
  node {
    input: "XA"
    input: "B"
    output: "Y"
    op_type: "Add"
  }
  name: "lr"
  input {
    name: "X"
    type {
      tensor_type {
        elem_type: 1
        shape {
          dim {
          }
          dim {
          }
        }
      }
    }
  }
  input {
    name: "A"
    type {
      tensor_type {
        elem_type: 1
        shape {
          dim {
          }
          dim {
          }
        }
      }
    }
  }
  input {
    name: "B"
    type {
      tensor_type {
        elem_type: 1
        shape {
          dim {
          }
          dim {
          }
        }
      }
    }
  }
  output {
    name: "Y"
    type {
      tensor_type {
        elem_type: 1
        shape {
          dim {
          }
        }
      }
    }
  }
}

⚠️ check_model() 这个函数的目的是检查模型是否一直，它没有返回值，如果模型有问题，那么这个函数会自动抛出异常。

我们用 Netron 看一下这个模型：

2.2 查看对象的字段 -> 检查 ONNX

空形状（None）表示任意形状，形状定义为 [None, None] 表示此对象是一个具有两个维度且没有进一步精确度的张量。还可以通过查看图中每个对象的字段来检查 ONNX 图，代码如下：

import onnx
from onnx import TensorProto
from onnx.helper import (make_model, make_node, make_graph, 
                         make_tensor, make_tensor_value_info)
from onnx.checker import check_model


def shape2tuple(shape):
    return tuple(getattr(d, 'dim_value', 0) for d in shape.dim)


# -------------------------- inputs & outputs --------------------------
X = make_tensor_value_info('X', TensorProto.FLOAT, [None, None])
A = make_tensor_value_info('A', TensorProto.FLOAT, [None, None])
B = make_tensor_value_info('B', TensorProto.FLOAT, [None, None])
Y = make_tensor_value_info('Y', TensorProto.FLOAT, [None])

# -------------------------- nodes & graph --------------------------
node1 = make_node(op_type='MatMul', 
                  inputs=['X', 'A'],
                  outputs=['XA'])

node2 = make_node(op_type='Add', 
                  inputs=['XA', 'B'],
                  outputs=['Y'])

graph = make_graph(nodes=[node1, node2],  # 节点
                   name='lr',  # 名称
                   inputs=[X, A, B],  # 输入节点
                   outputs=[Y])  # 输出节点

# -------------------------- model --------------------------
onnx_model = make_model(graph=graph)
check_model(model=onnx_model)  # 如果测试失败，将引发异常

# -------------------------- Check: Inputs --------------------------
print(f"-------------------------- inputs --------------------------")
# print(onnx_model.graph.input)
"""
[name: "X"      
type {
  tensor_type { 
    elem_type: 1
    shape {     
      dim {     
      }
      dim {     
      }
    }
  }
}
, name: "A"     
type {
  tensor_type { 
    elem_type: 1
    shape {
      dim {
      }
      dim {
      }
    }
  }
}
, name: "B"
type {
  tensor_type {
    elem_type: 1
    shape {
      dim {
      }
      dim {
      }
    }
  }
}
]
"""

for obj in onnx_model.graph.input:
    print(f"name={obj.name!r} "
          f"dtype={obj.type.tensor_type.elem_type!r} "
          f"shape={shape2tuple(obj.type.tensor_type.shape)!r}")
    
# -------------------------- Check: Outputs --------------------------
print(f"------------------------- outputs -------------------------")
for obj in onnx_model.graph.output:
    print(f"name={obj.name!r} "
          f"dtype={obj.type.tensor_type.elem_type!r} "
          f"shape={shape2tuple(obj.type.tensor_type.shape)!r}")

# -------------------------- Check: Nodes --------------------------
print(f"-------------------------- nodes --------------------------")
for node in onnx_model.graph.node:
    print(f"name={node.name!r} "
          f"type={node.op_type!r} "
          f"input={node.input!r} "
          f"output={node.output!r}")

结果如下：

-------------------------- inputs --------------------------
name='X' dtype=1 shape=(0, 0)
name='A' dtype=1 shape=(0, 0)
name='B' dtype=1 shape=(0, 0)
------------------------- outputs -------------------------
name='Y' dtype=1 shape=(0,)
-------------------------- nodes --------------------------
name='' type='MatMul' input=['X', 'A'] output=['XA']
name='' type='Add' input=['XA', 'B'] output=['Y']

和 xml 和 json 类似

2.3 ONNX 数据类型查看和与 Numpy 数据类型的关系

张量类型是一个整数（= 1）。辅助函数 onnx.helper.tensor_dtype_to_np_dtype() 可以用于获取与 numpy 对应的数据类型。

from onnx import TensorProto
from onnx.helper import tensor_dtype_to_np_dtype, \
                        tensor_dtype_to_string


np_dtype = tensor_dtype_to_np_dtype(TensorProto.FLOAT)
print(f"将 ONNX 的 [{tensor_dtype_to_string(TensorProto.FLOAT)}] 数据类型转换为"
      f"Numpy 的 [{np_dtype}] 数据类型")

结果为：

将 ONNX 的 [TensorProto.FLOAT] 数据类型转换为Numpy 的 [float32] 数据类型

2.4 序列化

前面我们说了，ONNX 是建立在 Protobuf 之上的。它添加了描述机器学习模型所需的定义，大多数情况下，ONNX 用于序列化或反序列化模型。接下来实例操作一下对数据（如张量、稀疏张量等）进行序列化和反序列化的过程。

2.4.1 模型序列化（保存）

为了部署，模型需要被保存。ONNX 基于 protobuf，它最小化了在磁盘上保存图所需的空间。ONNX 中的每个对象都可以使用 SerializeToString 方法进行序列化。整个模型也是如此。

⚠️ 在 2.1 线性回归（Linear Regression）中我们使用 onnx.save() 这个函数对我们创建的 ONNX 模型进行了保存，这里我们探寻一下这个保存是如何进行的。

from onnx import TensorProto
from onnx.helper import (make_model, make_node, make_graph, 
                         make_tensor, make_tensor_value_info)
from onnx.checker import check_model


def shape2tuple(shape):
    return tuple(getattr(d, 'dim_value', 0) for d in shape.dim)


# -------------------------- inputs & outputs --------------------------
X = make_tensor_value_info('X', TensorProto.FLOAT, [None, None])
A = make_tensor_value_info('A', TensorProto.FLOAT, [None, None])
B = make_tensor_value_info('B', TensorProto.FLOAT, [None, None])
Y = make_tensor_value_info('Y', TensorProto.FLOAT, [None])

# -------------------------- nodes & graph --------------------------
node1 = make_node(op_type='MatMul', 
                  inputs=['X', 'A'],
                  outputs=['XA'])

node2 = make_node(op_type='Add', 
                  inputs=['XA', 'B'],
                  outputs=['Y'])

graph = make_graph(nodes=[node1, node2],  # 节点
                   name='lr',  # 名称
                   inputs=[X, A, B],  # 输入节点
                   outputs=[Y])  # 输出节点

# -------------------------- model --------------------------
onnx_model = make_model(graph=graph)
check_model(model=onnx_model)  # 如果测试失败，将引发异常

# 序列化保存模型
save_path = 'ONNX/saves/linear_regression-serialized.onnx'
with open(save_path, 'wb') as f:
  f.write(onnx_model.SerializeToString())

print(f"Serialized model has saved at {save_path}!")

Serialized model has saved at ONNX/saves/linear_regression-serialized.onnx!

我们使用 Netron 查看一下，并与之前使用 onnx.save() 保存的对比一下：

可以看到，两者是一样的，同时我们也问一下 GPT：

GPT：在 ONNX 中，onnx.save() 和模型序列化（serialization）实际上是相同的概念。onnx.save() 函数用于将整个 ONNX 模型保存到磁盘上的文件中，这个过程就是模型的序列化。这个函数的调用类似于对 ONNX 模型对象调用 SerializeToString() 方法。

⚠️ 选择使用 onnx.save() 更符合 ONNX 库的约定，同时提供了更方便的接口

2.4.2 模型反序列化（加载）

from onnx import load


weights_path = 'ONNX/saves/linear_regression-serialized.onnx'
with open(weights_path, 'rb') as f:
  onnx_model = load(f)
  
print(onnx_model)

这两种方式看起来确实是一样的。除非模型大小超过 2 GB，任何模型都可以通过这种方式进行序列化。Protobuf 对象的大小受到 2 GB 限制，因此需要采取其他方法来克服这一限制。接下来的章节将展示如何解决这个大小限制的问题。

下面两种读取模型的方法有什么区别吗？

import onnx


# 方法1
weights_path = 'ONNX/saves/linear_regression.onnx'
onnx_model = onnx.load(weights_path)

# 方法2
with open(weights_path, 'rb') as f:
    onnx_model = f.read()

是的，这两种读取方式有很大的区别。

第一种方式:
```
weights_path = 'ONNX/saves/linear_regression.onnx'
onnx_model = onnx.load(weights_path)
```
这种方式使用 onnx.load 函数从文件中直接加载 ONNX 模型。这是一种常见的方式，特别适用于大型的二进制文件，比如 ONNX 模型文件。
第二种方式:
```
weights_path = 'ONNX/saves/linear_regression.onnx'
with open(weights_path, 'rb') as f:
    onnx_model = f.read()
```
这种方式使用 Python 的 open 函数以二进制读取模式打开文件，然后使用 read 方法读取文件内容。这样获得的是文件的二进制数据，而不是 ONNX 模型对象。

区别:

第一种方式返回一个经过解析的 ONNX 模型对象，可以直接使用 ONNX 库的函数和方法进行操作，比如查看模型的结构、元数据等。
第二种方式返回一个包含整个文件内容的二进制数据，需要额外的步骤将其解析为 ONNX 模型对象，通常需要使用 onnx.load_model_from_string 等方法。

通常情况下，如果需要直接处理 ONNX 模型的结构和元数据，建议使用第一种方式，而如果需要将 ONNX 模型文件的内容作为二进制数据进行其他处理，可以选择第二种方式。

import onnx


# 第一种方法
weights_path = 'ONNX/saves/linear_regression.onnx'
onnx_model_1 = onnx.load(weights_path)
print(f"第一种方法: {type(onnx_model_1)}")

# 第二种方法
with open(weights_path, 'rb') as f:
    onnx_model_2 = f.read()
print(f"第二种方法: {type(onnx_model_2)}")

# 使用 onnx.load_model_from_string 解析二进制数据为 ONNX 模型对象
onnx_model_2 = onnx.load_model_from_string(onnx_model_2)
print(f"第二种方法（转换后）: {type(onnx_model_2)}")

第一种方法: 
第二种方法: 
第二种方法（转换后）:

2.4.3 数据序列化（保存）

Tensor 的序列化通常会按照以下方式进行：

import numpy as np
from onnx.numpy_helper import from_array


# 创建一个 numpy 的 Tensor
numpy_tensor = np.array([0, 1, 4, 5, 3], dtype=np.float32)
print(type(numpy_tensor))

# 创建一个 onnx 的 Tensor
onnx_tensor = from_array(numpy_tensor)
print(type(onnx_tensor))

# 将 onnx 的 Tensor 序列化
serialized_tensor = onnx_tensor.SerializeToString()
print(type(serialized_tensor))

# 将序列化的 onnx Tensor 保存到本地
save_path = 'ONNX/saves/saved_serialized_tensor.pb'  # pb: Protocol Buffers 
with open(save_path, 'wb') as f:
  f.write(serialized_tensor)
print(f"The serialized onnx tensor has been saved at {save_path}!")




The serialized onnx tensor has been saved at ONNX/saves/saved_serialized_tensor.pb!

文件扩展名为 .pb 的文件通常是 Protocol Buffers（protobuf）格式的文件。Protocol Buffers 是一种用于序列化结构化数据的轻量级机制，通常用于跨网络或持久化存储。

我们使用 Netron 查看一下这个保存的序列化 onnx Tensor：

2.4.4 数据反序列化（加载）

我们看一下反序列化（即将序列化的数据加载到代码中）：

from onnx import TensorProto
from onnx.numpy_helper import to_array


# 读取序列化数据
data_path = 'ONNX/saves/saved_serialized_tensor.pb'  # pb: Protocol Buffers 
with open(data_path, 'rb') as f:
  serialized_tensor = f.read()
print(f"--------------------------- serialized_tensor ---------------------------\n"
      f"{type(serialized_tensor)}\n"  # 
      f"{serialized_tensor}\n")

"""
我们发现此时 serialized_tensor 的数据类型并不是我们想要的 onnx.onnx_ml_pb2.TensorProto
而是 ，所以我们需要将其转换为 onnx.onnx_ml_pb2.TensorProto 格式
"""
# 创建一个空的 onnx tensor
onnx_tensor = TensorProto()

# 从二进制字符串 serialized_tensor 中解析数据，并将解析后的结果存储在 onnx_tensor 对象中
onnx_tensor.ParseFromString(serialized_tensor)
print(f"--------------------------- onnx_tensor ---------------------------\n"
      f"{type(onnx_tensor)}\n"
      f"{onnx_tensor}\n")

# 将 onnx 的 Tensor 转换为 numpy 的Tensor
numpy_tensor = to_array(onnx_tensor)
print(f"--------------------------- numpy_tensor ---------------------------\n"
      f"{type(numpy_tensor)}\n"
      f"{numpy_tensor}")

--------------------------- serialized_tensor ---------------------------

b'\x08\x05\x10\x01J\x14\x00\x00\x00\x00\x00\x00\x80?\x00\x00\x80@\x00\x00\xa0@\x00\x00@@'

--------------------------- onnx_tensor ---------------------------

dims: 5
data_type: 1
raw_data: "\000\000\000\000\000\000\200?\000\000\200@\000\000\240@\000\000@@"

--------------------------- numpy_tensor ---------------------------

[0. 1. 4. 5. 3.]

这段代码可以使用 load_tensor_from_string 函数进行简化：

from onnx import load_tensor_from_string
from onnx.numpy_helper import to_array


# 读取序列化数据
data_path = 'ONNX/saves/saved_serialized_tensor.pb'  # pb: Protocol Buffers 
with open(data_path, 'rb') as f:
  serialized_tensor = f.read()
print(f"--------------------------- serialized_tensor ---------------------------\n"
      f"{type(serialized_tensor)}\n"  # 
      f"{serialized_tensor}\n")

# 更加便捷地加载序列化数据
onnx_tensor = load_tensor_from_string(serialized_tensor)
print(f"--------------------------- onnx_tensor ---------------------------\n"
      f"{type(onnx_tensor)}\n"
      f"{onnx_tensor}\n")

# 将 onnx 的 Tensor 转换为 numpy 的Tensor
numpy_tensor = to_array(onnx_tensor)
print(f"--------------------------- numpy_tensor ---------------------------\n"
      f"{type(numpy_tensor)}\n"
      f"{numpy_tensor}")

--------------------------- serialized_tensor ---------------------------

b'\x08\x05\x10\x01J\x14\x00\x00\x00\x00\x00\x00\x80?\x00\x00\x80@\x00\x00\xa0@\x00\x00@@'

--------------------------- onnx_tensor ---------------------------

dims: 5
data_type: 1
raw_data: "\000\000\000\000\000\000\200?\000\000\200@\000\000\240@\000\000@@"

--------------------------- numpy_tensor ---------------------------

[0. 1. 4. 5. 3.]

2.4.5 序列化与反序列可用范围

相同的模式（序列化与反序列）可以用于但不仅限于 TensorProto：

import onnx
import pprint


pprint.pprint([protocol for protocol in dir(onnx) 
               if protocol.endswith('Proto') and protocol[0] != '_'])

['AttributeProto',
 'FunctionProto',
 'GraphProto',
 'MapProto',
 'ModelProto',
 'NodeProto',
 'OperatorProto',
 'OperatorSetIdProto',
 'OperatorSetProto',
 'OptionalProto',
 'SequenceProto',
 'SparseTensorProto',
 'StringStringEntryProto',
 'TensorProto',
 'TensorShapeProto',
 'TrainingInfoProto',
 'TypeProto',
 'ValueInfoProto']

Q：序列化就是保存，反序列化就是加载？
GPT：是的，你的理解是正确的。在计算机科学中，序列化是将数据结构或对象转换为可存储或传输的格式的过程，通常以字节流的形式。这个过程允许将数据保存到文件、数据库或通过网络传输。反序列化是将之前序列化的数据恢复为原始数据结构或对象的过程，以便进一步使用或处理。因此，序列化和反序列化是数据的保存和加载的过程。

2.5 Initializer（初始化器），默认值

前面的模型假设线性回归的系数也是模型的输入，但这并不太方便。它们应该作为模型的一部分（作为常数或初始化器），这样就符合 ONNX 的语义了。下面这个例子修改了前一个例子，将输入 A 和 B 改为初始化器。该包实现了两个函数，用于在 numpy 数组和 ONNX 格式之间进行转换。

onnx.numpy_helper.to_array: 从 ONNX 转换为 NumPy 数组
onnx.numpy_helper.from_array: 从 NumPy 转换为 ONNX

这两个函数我们上面的例子就已经用过了

import numpy as np
import onnx
from onnx import numpy_helper, TensorProto
from onnx.helper import (make_tensor_value_info, 
                         make_node, make_graph, make_model)
from onnx.checker import check_model


# -------------------------- 创建 initializers --------------------------
value = np.array([0.5, -0.6], dtype=np.float32)
A = numpy_helper.from_array(value, name='A')

value = np.array([0.4], dtype=np.float32)
C = numpy_helper.from_array(value, name='C')

# -------------------------- 创建 输入、输出、节点、图、模型 --------------------------
X = make_tensor_value_info(name='X', elem_type=TensorProto.FLOAT, shape=[None, None])
Y = make_tensor_value_info(name='Y', elem_type=TensorProto.FLOAT, shape=[None])

# 输入是['X', 'A']，输出是['AX']，那么意思就是说，将输入X与参数A相乘，得到输出AX
node1 = make_node(op_type='MatMul', inputs=['X', 'A'], outputs=['AX'])

# 输入是['AX', 'C']，输出是['Y']，那么意思就是说，将输入AX与参数C相加，得到输出Y --> Y <=> AX + C
node2 = make_node(op_type='Add', inputs=['AX', 'C'], outputs=['Y'])

# 创建图的时候输入就是最一开始的输入，输出就是最终的输出
graph = make_graph(nodes=[node1, node2], 
                   name='lr', 
                   inputs=[X], 
                   outputs=[Y], 
                   initializer=[A, C])

# 根据图创建模型
onnx_model = make_model(graph=graph)
check_model(onnx_model)  # 检查模型

model_save_path = 'ONNX/saves/onnx_with_initializer.onnx'
onnx.save(onnx_model, model_save_path)
print(f"ONNX model with initializer has been saved to {model_save_path}")

我们使用 Netron 查看一下这个模型（并附上之前的结果）：

可以看到，之前的模型步骤看起来有点繁琐，而加了 initializer 后的结果就简洁了很多，<2> 和 <1> 表示权重有几个维度。

同样，我们可以遍历 ONNX 结构，查看初始化器的具体内容。

...  # 代码同上

# 根据图创建模型
onnx_model = make_model(graph=graph)
check_model(onnx_model)  # 检查模型

# -------------------------- 查看初始化器 --------------------------
print(f" -------------------------- 查看初始化器 --------------------------")
for init in onnx_model.graph.initializer:
    print(init)

 -------------------------- 查看初始化器 --------------------------
dims: 2
data_type: 1
name: "A"
raw_data: "\000\000\000?\232\231\031\277"

dims: 1
data_type: 1
name: "C"
raw_data: "\315\314\314>"

类型也被定义为具有相同含义的整数。在第二个示例中，只剩下一个输入。输入 A 和 B 已被删除（他们可以被保留）。在这种情况下，它们是可选的：每个与输入共享相同名称的 initializer 都被视为默认值。如果未给出此输入，它将替换输入。

2.6 Attributes，属性

有些运算符需要像转置运算符（transpose）这样的属性。让我们为表达式 $y = X A^{'} + B$ 或 y = Add(MatMul(X, Transpose(A)) + B) 构建图。转置运算符需要一个定义轴置换的属性：perm=[1, 0]。它被添加为函数 make_node 中的一个具名属性。

import onnx
from onnx import numpy_helper, TensorProto
from onnx.helper import (make_tensor_value_info, 
                         make_node, make_graph, make_model)
from onnx.checker import check_model


# -------------------------- 不变 --------------------------
X = make_tensor_value_info(name='X', elem_type=TensorProto.FLOAT, shape=[None, None])
A = make_tensor_value_info(name='A', elem_type=TensorProto.FLOAT, shape=[None, None])
B = make_tensor_value_info(name='B', elem_type=TensorProto.FLOAT, shape=[None, None])
Y = make_tensor_value_info(name='Y', elem_type=TensorProto.FLOAT, shape=[None])

# -------------------------- 新算子：transpose --------------------------
node_transpose = make_node(op_type='Transpose', inputs=['A'], outputs=['tA'], perm=[1, 0])

# -------------------------- 创建 输入、输出、节点、图、模型 --------------------------
node1 = make_node(op_type='MatMul', inputs=['X', 'tA'], outputs=['XA'])
node2 = make_node(op_type='Add', inputs=['XA', 'B'], outputs=['Y'])

graph = make_graph(nodes=[node_transpose, node1, node2], 
                   name='example', 
                   inputs=[X, A, B], 
                   outputs=[Y])

# 根据图创建模型
onnx_model = make_model(graph=graph)
check_model(onnx_model)  # 检查模型

model_save_path = 'ONNX/saves/attributes-transpose.onnx'
onnx.save(onnx_model, model_save_path)
print(f"ONNX model with initializer has been saved to {model_save_path}")
print(onnx_model)

ONNX model with initializer has been saved to ONNX/saves/attributes-transpose.onnx
ir_version: 9
opset_import {
  version: 20
}
graph {
  node {
    input: "A"
    output: "tA"
    op_type: "Transpose"
    attribute {
      name: "perm"
      type: INTS
      ints: 1
      ints: 0
    }
  }
  node {
    input: "X"
    input: "tA"
    output: "XA"
    op_type: "MatMul"
  }
  node {
    input: "XA"
    input: "B"
    output: "Y"
    op_type: "Add"
  }
  name: "example"
  input {
    name: "X"
    type {
      tensor_type {
        elem_type: 1
        shape {
          dim {
          }
          dim {
          }
        }
      }
    }
  }
  input {
    name: "A"
    type {
      tensor_type {
        elem_type: 1
        shape {
          dim {
          }
          dim {
          }
        }
      }
    }
  }
  input {
    name: "B"
    type {
      tensor_type {
        elem_type: 1
        shape {
          dim {
          }
          dim {
          }
        }
      }
    }
  }
  output {
    name: "Y"
    type {
      tensor_type {
        elem_type: 1
        shape {
          dim {
          }
        }
      }
    }
  }
}

我们用 Netron 看一下：

以下是一系列 make 函数的完整列表：

import onnx
import pprint


pprint.pprint([k for k in dir(onnx.helper) if k.startswith('make')])

['make_attribute',
 'make_attribute_ref',
 'make_empty_tensor_value_info',
 'make_function',
 'make_graph',
 'make_map',
 'make_map_type_proto',
 'make_model',
 'make_model_gen_version',
 'make_node',
 'make_operatorsetid',
 'make_opsetid',
 'make_optional',
 'make_optional_type_proto',
 'make_sequence',
 'make_sequence_type_proto',
 'make_sparse_tensor',
 'make_sparse_tensor_type_proto',
 'make_sparse_tensor_value_info',
 'make_tensor',
 'make_tensor_sequence_value_info',
 'make_tensor_type_proto',
 'make_tensor_value_info',
 'make_training_info',
 'make_value_info']

2.7 Opset and metadata，算子集与元数据

首先先明白两个概念：

什么是 Opset：在 1.4 ONNX 组成部分中有提到，简而言之，Op 就是算子，Set 是集合，那么 Opset 就是算子集合。
什么是 metadata：这个需要好好说一下。

我们首先看一下维基百科的介绍：

元数据（Metadata，又译作诠释资料，元资料），是一群数据，其内容提供了有关于另一群数据的信息。英文前缀词 meta- 的意思是之后，进而有超出界限（transcending）之意思，其语义来自形而上学的外语构词 meta-physics （希腊语：μετά-φυσικά），具有探求现象或对象背后之本质的意味。因此，元数据也带有相仿的意义，指的就是超出于“特定一群数据”所呈现的内容数据之外，其第二层次的数据。实质上，也就是用于描述这“特定一群数据”的数据，具体来说，如：

书籍的书名、作者、主题、目次、页数、语言、出版时间、出版社等
新闻的报导日期、主副标题、关键字、记者、报刊名、版次/版名、语言等
照片的相机型号、拍摄时间、拍摄地点、照片尺寸、分辨率、照片标题、标签、摄影师等

正由于元数据是在描述关于“特定一群数据”的信息，但并非是这“特定一群数据”其自身的内容数据，所以才命名为 meta-data，即数据背后的数据。

再看一下知乎的解释：

最后看一下 GPT 对 meta 这个词的解释：

“meta”（元）是希腊语的一个前缀，表示在或超越某事物之后的事物，或者表示对该事物的更高级别或抽象的描述。在英语中，“meta” 常被用作前缀，用于构建一些与原始事物相关但更为抽象或高级的概念。

例如：

元数据（metadata）： “meta” 在这里表示数据的描述，即对数据的更高级别的信息，而不是数据本身。
元分析（meta-analysis）： “meta” 表示对多个独立研究的综合分析，是对研究的更高级别的分析。
元编程（meta-programming）： “meta” 表示在程序中对程序进行操作的能力，即在程序中对代码进行处理的过程。

总的来说，“meta” 表示对某一领域的更高级别、更抽象或更全面的理解和描述。

好的，我们现在回到正题。

让我们加载之前创建的 ONNX 文件并检查它具有哪些类型的元数据：

import onnx


# 第一种方法
weights_path = 'ONNX/saves/linear_regression.onnx'
onnx_model = onnx.load(weights_path)

# -------------------------- 获取 metadata --------------------------
for field in ['doc_string', 'domain', 'functions',
              'ir_version', 'metadata_props', 'model_version',
              'opset_import', 'producer_name', 'producer_version',
              'training_info']:
    print(field, getattr(onnx_model, field))

doc_string 
domain
functions []
ir_version 9
metadata_props []
model_version 0
opset_import [version: 20
]
producer_name
producer_version
training_info []

⚠️ 注意：我们不能使用二进制的方式读取模型，这样读取的模型的数据类型是而非。前者是没有 metadata 这些属性的，需要使用 onnx.load_model_from_string() 方法进行转换，得到这样数据类型的模型才会有 metada。

从上面的结果我们可以看到，这个模型中的 metadata 大多数都是空的，因为在创建 ONNX 图时没有填充它们。这个模型只有两个 metada 有数值：

import onnx


weights_path = 'ONNX/saves/linear_regression.onnx'
onnx_model = onnx.load(weights_path)

print(f"[metadata] ir_version: {onnx_model.ir_version}")
for opset in onnx_model.opset_import:
    print(f"[metadata] opset domain={opset.domain!r} version={opset.version!r}")

[metadata] ir_version: 9
[metadata] opset domain='' version=20

IR 定义了 ONNX 语言的版本。Opset 定义了正在使用的运算符的版本。如果没有指定精度，ONNX 将使用来自已安装包的最新版本。当然也可以使用其他版本。

IR 的英文全称是 “Intermediate Representation”，意为中间表示或中间表达式。在计算机科学和编程领域，IR 通常用来表示源代码和目标代码之间的一种中间形式，便于在编译过程中进行分析、优化和转换。在 ONNX 的上下文中，IR 指的是 ONNX 模型的中间表示。

import onnx


weights_path = 'ONNX/saves/linear_regression.onnx'
onnx_model = onnx.load(weights_path)

# 删除掉目前模型的 opset
del onnx_model.opset_import[:]

# 我们自己定义opset
opset = onnx_model.opset_import.add()
opset.domain = ''
opset.version = 14

print(f"[metadata] ir_version: {onnx_model.ir_version}")
for opset in onnx_model.opset_import:
    print(f"[metadata] opset domain={opset.domain!r} version={opset.version!r}")

[metadata] ir_version: 9
[metadata] opset domain='' version=14

只要所有运算符按照 ONNX 规定的方式进行定义，就可以使用任意的 opset。例如，运算符 Reshape 的第 5 个版本将形状定义为一个输入，而不像第 1 个版本那样定义为属性。Opset 指定了描述图时遵循的规范。

其他元数据可以用于存储任何信息，以存储有关模型生成方式的信息，或者用版本号区分一个模型和另一个模型。下面我们举个例子：

import onnx


# -------------------------- 加载模型 --------------------------
weights_path = 'ONNX/saves/linear_regression.onnx'
onnx_model = onnx.load(weights_path)

# -------------------------- 修改metadata --------------------------
onnx_model.model_version = 15
onnx_model.producer_name = 'Le0v1n'
onnx_model.producer_version = 'v1.0'
onnx_model.doc_string = 'documentation about this onnx model by Le0v1n'

# 读取模型现在的metadata属性
prop = onnx_model.metadata_props
print(prop)  # []

# 目前 metadata属性中的内容为空，我们可以往里面放一些信息
# ⚠️ metadata_props只接受字典
info1 = {'model说明': '这是一个用于学习的ONNX模型', 
         '时间': '20240123'}
onnx.helper.set_model_props(onnx_model, info1)
print(onnx_model)

[]
ir_version: 9
opset_import {
  version: 20
}
producer_name: "Le0v1n"
producer_version: "v1.0"
model_version: 15
doc_string: "documentation about this onnx model by Le0v1n"
graph {
  node {
    input: "X"
    input: "A"
    output: "XA"
    op_type: "MatMul"
  }
  node {
    input: "XA"
    input: "B"
    output: "Y"
    op_type: "Add"
  }
  name: "lr"
  input {
    name: "X"
    type {
      tensor_type {
        elem_type: 1
        shape {
          dim {
          }
          dim {
          }
        }
      }
    }
  }
  input {
    name: "A"
    type {
      tensor_type {
        elem_type: 1
        shape {
          dim {
          }
          dim {
          }
        }
      }
    }
  }
  input {
    name: "B"
    type {
      tensor_type {
        elem_type: 1
        shape {
          dim {
          }
          dim {
          }
        }
      }
    }
  }
  output {
    name: "Y"
    type {
      tensor_type {
        elem_type: 1
        shape {
          dim {
          }
        }
      }
    }
  }
}
metadata_props {
  key: "model说明"
  value: "这是一个用于学习的ONNX模型"
}
metadata_props {
  key: "时间"
  value: "20240123"
}

字段 training_info 可以用于存储额外的图形信息。

2.8 Subgraph: test and loops —— IF

它们通常被分组在一个称为控制流的类别中。通常最好避免使用它们，因为它们不像矩阵操作那样高效和优化。

可以使用运算符 If 来实现测试。它根据一个布尔值执行一个子图或另一个子图。这通常不经常使用，因为函数通常需要在批处理中进行许多比较的结果。以下示例根据矩阵中的符号计算所有浮点数的和，并返回 1 或 -1。

import numpy as np
import onnx
from onnx.helper import make_tensor_value_info, make_node, make_graph, make_model
from onnx.numpy_helper import from_array
from onnx.checker import check_model
from onnxruntime import InferenceSession

# -------------------------- 初始化器 --------------------------
# 创建一个包含值为0的浮点数数组，并指定数据类型为np.float32
value = np.array([0], dtype=np.float32)

# 使用onnx.numpy_helper.from_array将numpy数组转换为ONNX的TensorProto形式
zero = from_array(value, name='zero')

# -------------------------- 输入 --------------------------
# 创建输入Tensor信息，名称为'X'，数据类型为onnx.TensorProto.FLOAT，形状为[None, None]，表示可变维度
X = make_tensor_value_info('X', onnx.TensorProto.FLOAT, shape=[None, None])

# 创建输出Tensor信息，名称为'Y'，数据类型为onnx.TensorProto.FLOAT，形状为[None]，表示可变维度
Y = make_tensor_value_info('Y', onnx.TensorProto.FLOAT, shape=[None])

# -------------------------- 节点 --------------------------
# 创建 ReduceSum 节点，用于沿着指定轴对输入Tensor进行求和，输入为 'X'，输出为 'rsum'
rsum = make_node(op_type='ReduceSum', inputs=['X'], outputs=['rsum'])

# 创建 Greater 节点，用于比较 'rsum' 和 'zero'，输出结果保存在 'cond'
cond = make_node(op_type='Greater', inputs=['rsum', 'zero'], outputs=['cond'])

# -------------------------- 图形（带有条件） --------------------------
"""
    then <=> True:  表示当条件满足的时候执行的
    else <=> False: 表示当条件不满足的时候执行的
"""
# -------------------------- 图形: True -> then --------------------------
# 条件为True时的输出Tensor信息
then_out = make_tensor_value_info(name='then_out', 
                                  elem_type=onnx.TensorProto.FLOAT, 
                                  shape=None)

# 用于返回的常量Tensor
then_cst = from_array(np.array([1]).astype(np.float32))

# 创建 Constant 节点，将常量Tensor作为输出 'then_out' 的值，构成一个单一节点
then_const_node = make_node(op_type='Constant', 
                            inputs=[], 
                            outputs=['then_out'], 
                            value=then_cst, 
                            name='cst1')

# 创建包裹这些元素的图形，表示当条件为真时执行
then_body = make_graph(nodes=[then_const_node], 
                       name='then_body', 
                       inputs=[], 
                       outputs=[then_out])

# -------------------------- 图形: False -> else --------------------------
# 对于 else 分支，相同的处理过程
else_out = make_tensor_value_info(name='else_out', 
                                  elem_type=onnx.TensorProto.FLOAT, 
                                  shape=[5])

else_cst = from_array(np.array([-1]).astype(np.float32))

else_const_node = make_node(op_type='Constant', 
                            inputs=[], 
                            outputs=['else_out'], 
                            value=else_cst, 
                            name='cst2')

else_body = make_graph(nodes=[else_const_node], name='else_body', inputs=[], outputs=[else_out])

# 创建 If 节点，接受条件 'cond'，并有两个分支，分别为 'then_body' 和 'else_body'。
if_node = make_node(op_type='If', inputs=['cond'], outputs=['Y'], 
                    then_branch=then_body, 
                    else_branch=else_body)

# 创建整体的图形，包括 ReduceSum、Greater 和 If 节点
graph = make_graph(nodes=[rsum, cond, if_node],
                   name='if',
                   inputs=[X],
                   outputs=[Y],
                   initializer=[zero])

# -------------------------- 模型 --------------------------
# 创建 ONNX 模型，使用之前构建的图形作为参数
onnx_model = make_model(graph=graph)

# 检查模型的有效性，确保模型结构符合 ONNX 规范
check_model(onnx_model)

# 删除原有的 opset
del onnx_model.opset_import[:]

# 添加新的 opset
opset = onnx_model.opset_import.add()
opset.domain = ''
opset.version = 15

# 设置 ONNX 模型的 IR 版本和文档字符串
onnx_model.ir_version = 8
onnx_model.doc_string = '这是一个涉及到 if-else 语句的 ONNX 模型'

# 保存模型
model_save_path = 'ONNX/saves/if-else.onnx'
onnx.save(onnx_model, model_save_path)

print(onnx_model)

# -------------------------- 推理 --------------------------
# 创建推理会话，加载保存的 ONNX 模型
session = InferenceSession(path_or_bytes=model_save_path, 
                           providers=['CPUExecutionProvider'])

# 创建输入张量，全为1，形状为[3, 2]，数据类型为np.float32
input_tensor = np.ones(shape=[3, 2], dtype=np.float32)

# 运行推理，获取输出张量
output_tensor = session.run(output_names=None, 
                            input_feed={'X': input_tensor})

# 打印输出张量
print(f"output: {output_tensor}")

ir_version: 8
opset_import {
  domain: ""
  version: 15
}
doc_string: "这是一个涉及到 if-else 语句的 ONNX 模型"
graph {
  node {
    input: "X"
    output: "rsum"
    op_type: "ReduceSum"
  }
  node {
    input: "rsum"
    input: "zero"
    output: "cond"
    op_type: "Greater"
  }
  node {
    input: "cond"
    output: "Y"
    op_type: "If"
    attribute {
      name: "else_branch"
      type: GRAPH
      g {
        node {
          output: "else_out"
          name: "cst2"
          op_type: "Constant"
          attribute {
            name: "value"
            type: TENSOR
            t {
              dims: 1
              data_type: 1
              raw_data: "\000\000\200\277"
            }
          }
        }
        name: "else_body"
        output {
          name: "else_out"
          type {
            tensor_type {
              elem_type: 1
              shape {
                dim {
                  dim_value: 5
                }
              }
            }
          }
        }
      }
    }
    attribute {
      name: "then_branch"
      type: GRAPH
      g {
        node {
          output: "then_out"
          name: "cst1"
          op_type: "Constant"
          attribute {
            name: "value"
            type: TENSOR
            t {
              dims: 1
              data_type: 1
              raw_data: "\000\000\200?"
            }
          }
        }
        name: "then_body"
        output {
          name: "then_out"
          type {
            tensor_type {
              elem_type: 1
            }
          }
        }
      }
    }
  }
  name: "if"
  initializer {
    dims: 1
    data_type: 1
    name: "zero"
    raw_data: "\000\000\000\000"
  }
  input {
    name: "X"
    type {
      tensor_type {
        elem_type: 1
        shape {
          dim {
          }
          dim {
          }
        }
      }
    }
  }
  output {
    name: "Y"
    type {
      tensor_type {
        elem_type: 1
        shape {
          dim {
          }
        }
      }
    }
  }
}

output: [array([1.], dtype=float32)]

参数说明：

在 ONNX Runtime 中，providers 参数指定了在推理时使用的执行提供程序（Execution Provider）。Execution Provider 是 ONNX Runtime 提供的不同后端的实现，用于在不同硬件上进行推理。常见的 Execution Providers 包括 CPUExecutionProvider、CUDAExecutionProvider（用于 NVIDIA GPU）、DnnlExecutionProvider（用于 Intel CPU 使用 DNNL）、TensorRTExecutionProvider（用于 NVIDIA GPU 使用 TensorRT）等。
output_names 是在 ONNX Runtime 推理过程中用于指定输出张量的名称的参数。它允许用户选择性地获取模型中特定输出张量的值。在上述代码中，output_names=None 表示获取所有输出张量的值。如果想要仅获取模型中特定输出张量的值，可以将 output_names 设置为一个包含所需输出张量名称的列表。例如，如果模型有两个输出张量，分别命名为 'output1' 和 'output2'，可以使用 output_names=['output1'] 来指定只获取 'output1' 对应的输出张量的值。
input_feed 是在 ONNX Runtime 推理过程中用于提供输入数据的参数。它是一个字典，其中键是模型定义中输入张量的名称，而值是对应的输入数据。在上述代码中，input_feed={'X': input_tensor} 意味着将输入张量 input_tensor 提供给模型中名为 'X' 的输入张量。具体来说，'X' 是通过 make_tensor_value_info 创建的输入张量信息的名称。通过 input_feed 参数，可以在进行推理时将模型的输入用具体的数据填充，以获取对应的输出。

上面代码的可视化如下：

else 和 then 分支都非常简单。If 节点甚至可以被替换为一个 Where 节点，这样可能更快。当两个分支都更大且跳过其中一个更有效时，情况就变得有趣了。

2.9 Functions

正如前面所提到的，函数可用于缩短构建模型的代码，并且在运行预测时提供更多可能性，如果存在该函数的特定实现，运行时可以更快。如果不是这种情况，运行时仍然可以使用基于现有运算符的默认实现。

make_function 函数用于定义一个函数。它类似于一个图，但类型更少，更像是一个模板。这个 API 可能会发生变化。它也不包括初始化器。

2.9.1 A function with no attribute，没有属性的函数

这是更简单的情况，即函数的每个输入都是在执行时已知的动态对象。

import numpy as np
import onnx
from onnx import numpy_helper, TensorProto
from onnx.helper import (make_tensor_value_info, make_tensor, make_function, 
                         make_node, make_graph, make_model, set_model_props,
                         make_opsetid)
from onnx.checker import check_model


# -------------------------- 定义一个线性回归的函数 --------------------------
# 新的领域名称
new_domain = 'custom_domain'

# 构建 opset_imports 列表，包含两个 OpsetID，分别为默认领域和自定义领域
opset_imports = [
    make_opsetid(domain="", version=14),
    make_opsetid(domain=new_domain, version=1)
]

# 创建矩阵相乘节点，输入为 'X' 和 'A'，输出为 'XA'
node1 = make_node('MatMul', ['X', 'A'], ['XA'])

# 创建加法节点，输入为 'XA' 和 'B'，输出为 'Y'
node2 = make_node('Add', ['XA', 'B'], ['Y'])

linear_regression = make_function(
    domain=new_domain,  # 作用域名称（指定函数的作用域名称）
    fname='LinearRegression',  # 函数名称（指定函数的名称）
    inputs=['X', 'A', 'B'],  # 输入的名称（定义函数的输入张量的名称列表）
    outputs=['Y'],  # 输出的名称（定义函数的输出张量的名称列表）
    nodes=[node1, node2],  # 使用到的节点（定义函数使用到的节点列表）
    opset_imports=opset_imports,  # opset（指定 OpsetID 列表，定义函数使用的运算符版本）
    attributes=[],  # 属性的名称（定义函数的属性列表）
)

# -------------------------- 定义图 --------------------------
X = make_tensor_value_info(name='X', elem_type=TensorProto.FLOAT, shape=[None, None])
A = make_tensor_value_info(name='A', elem_type=TensorProto.FLOAT, shape=[None, None])
B = make_tensor_value_info(name='B', elem_type=TensorProto.FLOAT, shape=[None, None])
Y = make_tensor_value_info(name='Y', elem_type=TensorProto.FLOAT, shape=[None])

graph = make_graph(
    nodes=[make_node(op_type='LinearRegression', inputs=['X', 'A', 'B'], outputs=['Y1'], domain=new_domain),
           make_node(op_type='Abs', inputs=['Y1'], outputs=['Y'])],
    name='example',
    inputs=[X, A, B],
    outputs=[Y]
)

# -------------------------- 定义模型 --------------------------
onnx_model = make_model(graph=graph, 
                        opset_imports=opset_imports,
                        functions=[linear_regression])
check_model(onnx_model)

print(onnx_model)

ir_version: 9
opset_import {
  domain: ""
  version: 14
}
opset_import {
  domain: "custom_domain"
  version: 1
}
graph {
  node {
    input: "X"
    input: "A"
    input: "B"
    output: "Y1"
    op_type: "LinearRegression"
    domain: "custom_domain"
  }
  node {
    input: "Y1"
    output: "Y"
    op_type: "Abs"
  }
  name: "example"
  input {
    name: "X"
    type {
      tensor_type {
        elem_type: 1
        shape {
          dim {
          }
          dim {
          }
        }
      }
    }
  }
  input {
    name: "A"
    type {
      tensor_type {
        elem_type: 1
        shape {
          dim {
          }
          dim {
          }
        }
      }
    }
  }
  input {
    name: "B"
    type {
      tensor_type {
        elem_type: 1
        shape {
          dim {
          }
          dim {
          }
        }
      }
    }
  }
  output {
    name: "Y"
    type {
      tensor_type {
        elem_type: 1
        shape {
          dim {
          }
        }
      }
    }
  }
}
functions {
  name: "LinearRegression"
  input: "X"
  input: "A"
  input: "B"
  output: "Y"
  node {
    input: "X"
    input: "A"
    output: "XA"
    op_type: "MatMul"
  }
  node {
    input: "XA"
    input: "B"
    output: "Y"
    op_type: "Add"
  }
  opset_import {
    domain: ""
    version: 14
  }
  opset_import {
    domain: "custom_domain"
    version: 1
  }
  domain: "custom_domain"
}

2.9.2 A function with attribute，有属性的函数

下面的函数与前一个函数等效，只是一个输入 $B$ 被转换为名为 $bia s$ 的参数。代码几乎相同，只是现在偏置是一个常数。在函数定义内部，创建了一个节点 $C o n s t an t$ ，将参数插入为一个结果。它与参数之间通过属性 ref_attr_name 进行关联。

import numpy as np
import onnx
from onnx import numpy_helper, TensorProto, AttributeProto
from onnx.helper import (make_tensor_value_info, make_tensor, make_function, 
                         make_node, make_graph, make_model, set_model_props,
                         make_opsetid)
from onnx.checker import check_model


# -------------------------- 定义一个线性回归的函数 --------------------------
# 新的领域名称
new_domain = 'custom_domain'

# 构建 opset_imports 列表，包含两个 OpsetID，分别为默认领域和自定义领域
opset_imports = [
    make_opsetid(domain="", version=14),
    make_opsetid(domain=new_domain, version=1)
]

# 第一步是创建一个与函数的输入参数相等的常数
cst = make_node(op_type='Constant', inputs=[], outputs=['B'])

att = AttributeProto()
att.name = 'value'

# 这行代码指示该值来自函数所给定的名为 'bias' 的参数
att.ref_attr_name = 'bias'
att.type = AttributeProto.TENSOR
cst.attribute.append(att)

node1 = make_node('MatMul', ['X', 'A'], ['XA'])
node2 = make_node('Add', ['XA', 'B'], ['Y'])

linear_regression = make_function(
    domain=new_domain,  # 作用域名称（指定函数的作用域名称）
    fname='LinearRegression',  # 函数名称（指定函数的名称）
    inputs=['X', 'A'],  # 输入的名称（定义函数的输入张量的名称列表）
    outputs=['Y'],  # 输出的名称（定义函数的输出张量的名称列表）
    nodes=[cst, node1, node2],  # 使用到的节点（定义函数使用到的节点列表）
    opset_imports=opset_imports,  # opset（指定 OpsetID 列表，定义函数使用的运算符版本）
    attributes=[],  # 属性的名称（定义函数的属性列表）
)

# -------------------------- 定义图 --------------------------
X = make_tensor_value_info(name='X', elem_type=TensorProto.FLOAT, shape=[None, None])
A = make_tensor_value_info(name='A', elem_type=TensorProto.FLOAT, shape=[None, None])
B = make_tensor_value_info(name='B', elem_type=TensorProto.FLOAT, shape=[None, None])
Y = make_tensor_value_info(name='Y', elem_type=TensorProto.FLOAT, shape=[None])

graph = make_graph(
    nodes=[make_node(op_type='LinearRegression', 
                     inputs=['X', 'A'], outputs=['Y1'], 
                     domain=new_domain, bias=make_tensor('former_B', TensorProto.FLOAT, 
                                                         dims=[1], vals=[0.67])),
           make_node(op_type='Abs', inputs=['Y1'], outputs=['Y'])],
    name='example',
    inputs=[X, A],
    outputs=[Y]
)

# -------------------------- 定义模型 --------------------------
onnx_model = make_model(graph=graph, 
                        opset_imports=opset_imports,
                        functions=[linear_regression])
check_model(onnx_model)

print(onnx_model)

model_save_path = 'ONNX/saves/function-with_attribute.onnx'
onnx.save(onnx_model, model_save_path)

ir_version: 9
opset_import {
  domain: ""
  version: 14
}
opset_import {
  domain: "custom_domain"
  version: 1
}
graph {
  node {
    input: "X"
    input: "A"
    output: "Y1"
    op_type: "LinearRegression"
    domain: "custom_domain"
    attribute {
      name: "bias"
      type: TENSOR
      t {
        dims: 1
        data_type: 1
        float_data: 0.67
        name: "former_B"
      }
    }
  }
  node {
    input: "Y1"
    output: "Y"
    op_type: "Abs"
  }
  name: "example"
  input {
    name: "X"
    type {
      tensor_type {
        elem_type: 1
        shape {
          dim {
          }
          dim {
          }
        }
      }
    }
  }
  input {
    name: "A"
    type {
      tensor_type {
        elem_type: 1
        shape {
          dim {
          }
          dim {
          }
        }
      }
    }
  }
  output {
    name: "Y"
    type {
      tensor_type {
        elem_type: 1
        shape {
          dim {
          }
        }
      }
    }
  }
}
functions {
  name: "LinearRegression"
  input: "X"
  input: "A"
  output: "Y"
  node {
    output: "B"
    op_type: "Constant"
    attribute {
      name: "value"
      ref_attr_name: "bias"
      type: TENSOR
    }
  }
  node {
    input: "X"
    input: "A"
    output: "XA"
    op_type: "MatMul"
  }
  node {
    input: "XA"
    input: "B"
    output: "Y"
    op_type: "Add"
  }
  opset_import {
    domain: ""
    version: 14
  }
  opset_import {
    domain: "custom_domain"
    version: 1
  }
  domain: "custom_domain"
}

3. Evaluation and Runtime，模型评估和运行时间

ONNX 标准允许框架以 ONNX 格式导出训练好的模型，并且支持使用任何支持 ONNX 格式的后端进行推理。onnxruntime 是一个高效的选择，可在许多平台上使用。它经过优化，以实现快速推理。其覆盖范围可以在 ONNX 后端仪表板上跟踪。onnx 还实现了一个用于帮助理解模型的 Python 运行时。它并不打算用于生产，性能也不是其目标。

只是用于理解模型时性能不是目标，日常使用的话，ONNX 还是挺高效的。

3.1 Evaluation of a linear regression，评估一个线性回归模型

完整的 API 文档可以在 onnx.reference 中找到。它接受一个模型（一个 ModelProto，一个文件名等）。run 方法根据在字典中指定的一组输入返回输出。下面是一个示例：

import numpy
from onnx import numpy_helper, TensorProto
from onnx.helper import (
    make_model, make_node, set_model_props, make_tensor,
    make_graph, make_tensor_value_info)
from onnx.checker import check_model
from onnx.reference import ReferenceEvaluator


# -------------------------- 不变 --------------------------
X = make_tensor_value_info('X', TensorProto.FLOAT, [None, None])
A = make_tensor_value_info('A', TensorProto.FLOAT, [None, None])
B = make_tensor_value_info('B', TensorProto.FLOAT, [None, None])
Y = make_tensor_value_info('Y', TensorProto.FLOAT, [None])

node1 = make_node('MatMul', ['X', 'A'], ['XA'])
node2 = make_node('Add', ['XA', 'B'], ['Y'])

graph = make_graph([node1, node2], 'lr', [X, A, B], [Y])

onnx_model = make_model(graph)
check_model(onnx_model)

# -------------------------- 模型评估 --------------------------
# 创建 ReferenceEvaluator 对象，用于运行 ONNX 模型
sess = ReferenceEvaluator(onnx_model)

# 生成随机输入数据
x = numpy.random.randn(4, 2).astype(numpy.float32)
a = numpy.random.randn(2, 1).astype(numpy.float32)
b = numpy.random.randn(1, 1).astype(numpy.float32)

# 将输入数据放入字典中
feeds = {'X': x, 'A': a, 'B': b}

# 使用 ReferenceEvaluator 对象运行模型，获取输出结果
result = sess.run(None, feeds)

print(f"The model result is: \n{result}\n"
      f"It's type: {type(result)}\n"
      f"Specific type: {type(result[0])}")

The model result is: 
[array([[0.49450195],
       [0.5288675 ],
       [0.25783658],
       [1.0908649 ]], dtype=float32)]
It's type: 
Specific type:

3.2 Evaluation of a node, 评估某一个节点

评估器还可以评估一个简单的节点，以检查运算符在特定输入上的行为。下面是一个示例：

import numpy
from onnx import numpy_helper, TensorProto
from onnx.helper import make_node
from onnx.reference import ReferenceEvaluator


node = make_node('EyeLike', ['X'], ['Y'])

sess = ReferenceEvaluator(node)

x = numpy.random.randn(4, 2).astype(numpy.float32)
feeds = {'X': x}

result = sess.run(None, feeds)

print(f"The node result is: \n{result}\n"
      f"It's type: {type(result)}\n"
      f"Specific type: {type(result[0])}")

The node result is: 
[array([[1., 0.],
       [0., 1.],
       [0., 0.],
       [0., 0.]], dtype=float32)]
It's type: 
Specific type:

类似的代码也可以在 GraphProto 或 FunctionProto 上运行。

3.3 Evaluation Step by Step，一步一步的评估

转换库接收一个用机器学习框架（如 pytorch、scikit-learn 等）训练的现有模型，将该模型转换为一个 ONNX 图。通常，复杂的模型在第一次尝试时可能无法正常工作，查看中间结果可能有助于找到不正确转换的部分，使用参数 verbose 用于显示有关中间结果的信息。下面是一个示例代码：

import numpy
from onnx import numpy_helper, TensorProto
from onnx.helper import (
    make_model, make_node, set_model_props, make_tensor,
    make_graph, make_tensor_value_info)
from onnx.checker import check_model
from onnx.reference import ReferenceEvaluator


X = make_tensor_value_info('X', TensorProto.FLOAT, [None, None])
A = make_tensor_value_info('A', TensorProto.FLOAT, [None, None])
B = make_tensor_value_info('B', TensorProto.FLOAT, [None, None])
Y = make_tensor_value_info('Y', TensorProto.FLOAT, [None])
node1 = make_node('MatMul', ['X', 'A'], ['XA'])
node2 = make_node('Add', ['XA', 'B'], ['Y'])
graph = make_graph([node1, node2], 'lr', [X, A, B], [Y])
onnx_model = make_model(graph)
check_model(onnx_model)

for verbose in [1, 2, 3, 4]:
      print()
      print(f"------ verbose={verbose}")
      print()
      sess = ReferenceEvaluator(onnx_model, verbose=verbose)

      x = numpy.random.randn(4, 2).astype(numpy.float32)
      a = numpy.random.randn(2, 1).astype(numpy.float32)
      b = numpy.random.randn(1, 1).astype(numpy.float32)
      feeds = {'X': x, 'A': a, 'B': b}

      result = sess.run(None, feeds)

      print(f"No.{verbose} result is: \n{result}")

------ verbose=1

No.1 result is: 
[array([[1.3466744],
       [1.4322073],
       [1.4926268],
       [1.3633491]], dtype=float32)]

------ verbose=2

MatMul(X, A) -> XA
Add(XA, B) -> Y
No.2 result is:
[array([[ 0.6492353 ],
       [ 0.22668248],
       [-1.3016735 ],
       [-0.14969295]], dtype=float32)]

------ verbose=3

 +I X: float32:(4, 2) in [-1.3570822477340698, 0.5996934771537781]
 +I A: float32:(2, 1) in [-1.163417100906372, -0.8546339869499207]
 +I B: float32:(1, 1) in [0.16759172081947327, 0.16759172081947327]
MatMul(X, A) -> XA
 + XA: float32:(4, 1) in [-1.0257296562194824, 1.317176342010498]
Add(XA, B) -> Y
 + Y: float32:(4, 1) in [-0.8581379652023315, 1.484768033027649]
No.3 result is:
[array([[ 1.484768  ],
       [ 0.24345586],
       [-0.85813797],
       [ 1.3841225 ]], dtype=float32)]

------ verbose=4

 +I X: float32:(4, 2):-0.06228995695710182,-0.5402382016181946,0.855003833770752,0.023194529116153717,-1.138258934020996...
 +I A: float32:(2, 1):[2.67880916595459, 1.616241216659546]
 +I B: float32:(1, 1):[-0.08334967494010925]
MatMul(X, A) -> XA
 + XA: float32:(4, 1):[-1.040018081665039, 2.3278801441192627, -3.307098865509033, -1.5567586421966553]
Add(XA, B) -> Y
 + Y: float32:(4, 1):[-1.1233677864074707, 2.244530439376831, -3.390448570251465, -1.640108346939087]
No.4 result is:
[array([[-1.1233678],
       [ 2.2445304],
       [-3.3904486],
       [-1.6401083]], dtype=float32)]

3.4 Evaluate a custom node，评估一个自定义的节点 {##评估一个自定义的节点}

下面的例子仍然实现了一个线性回归，但在 $A$ 上添加了单位矩阵：

$Y = X (A + I) + B$

import numpy
from onnx import numpy_helper, TensorProto
from onnx.helper import (
    make_model, make_node, set_model_props, make_tensor,
    make_graph, make_tensor_value_info)
from onnx.checker import check_model
from onnx.reference import ReferenceEvaluator

X = make_tensor_value_info('X', TensorProto.FLOAT, [None, None])
A = make_tensor_value_info('A', TensorProto.FLOAT, [None, None])
B = make_tensor_value_info('B', TensorProto.FLOAT, [None, None])
Y = make_tensor_value_info('Y', TensorProto.FLOAT, [None])
node0 = make_node('EyeLike', ['A'], ['Eye'])
node1 = make_node('Add', ['A', 'Eye'], ['A1'])
node2 = make_node('MatMul', ['X', 'A1'], ['XA1'])
node3 = make_node('Add', ['XA1', 'B'], ['Y'])
graph = make_graph([node0, node1, node2, node3], 'lr', [X, A, B], [Y])
onnx_model = make_model(graph)
check_model(onnx_model)
with open("ONNX/saves/linear_regression.onnx", "wb") as f:
    f.write(onnx_model.SerializeToString())

sess = ReferenceEvaluator(onnx_model, verbose=2)

x = numpy.random.randn(4, 2).astype(numpy.float32)
a = numpy.random.randn(2, 2).astype(numpy.float32) / 10
b = numpy.random.randn(1, 2).astype(numpy.float32)
feeds = {'X': x, 'A': a, 'B': b}

result = sess.run(None, feeds)

print(f"Result is: \n{result}")

EyeLike(A) -> Eye
Add(A, Eye) -> A1
MatMul(X, A1) -> XA1
Add(XA1, B) -> Y
Result is:
[array([[ 0.48974502,  1.777401  ],
       [-0.90059066, -0.81312126],
       [-1.9505675 ,  0.43714556],
       [-1.9263479 , -1.0114272 ]], dtype=float32)]

如果我们将运算符 $E ye L ik e$ 和 $A dd$ 结合成 $A dd E ye L ik e$ ，那么是否可以是的推理更加高效呢？下一个例子将这两个运算符替换为来自领域 'optimized' 的单个运算符。

import numpy
from onnx import numpy_helper, TensorProto
from onnx.helper import (
    make_model, make_node, set_model_props, make_tensor,
    make_graph, make_tensor_value_info, make_opsetid)
from onnx.checker import check_model


X = make_tensor_value_info('X', TensorProto.FLOAT, [None, None])
A = make_tensor_value_info('A', TensorProto.FLOAT, [None, None])
B = make_tensor_value_info('B', TensorProto.FLOAT, [None, None])
Y = make_tensor_value_info('Y', TensorProto.FLOAT, [None])

node01 = make_node('AddEyeLike', ['A'], ['A1'], domain='optimized')

node2 = make_node('MatMul', ['X', 'A1'], ['XA1'])
node3 = make_node('Add', ['XA1', 'B'], ['Y'])
graph = make_graph([node01, node2, node3], 'lr', [X, A, B], [Y])

onnx_model = make_model(graph, opset_imports=[
    make_opsetid('', 18), make_opsetid('optimized', 1)
])

check_model(onnx_model)
with open("ONNX/saves/linear_regression_improved.onnx", "wb") as f:
    f.write(onnx_model.SerializeToString())

我们需要评估这个模型是否等价于第一个模型。这需要为这个特定的节点实现一个功能。

import numpy
from onnx.reference import ReferenceEvaluator
from onnx.reference.op_run import OpRun


class AddEyeLike(OpRun):
    op_domain = "optimized"

    def _run(self, X, alpha=1.):
        assert len(X.shape) == 2
        assert X.shape[0] == X.shape[1]
        X = X.copy()
        ind = numpy.diag_indices(X.shape[0])
        X[ind] += alpha
        return (X,)

sess = ReferenceEvaluator("ONNX/saves/linear_regression_improved.onnx", verbose=2, new_ops=[AddEyeLike])

x = numpy.random.randn(4, 2).astype(numpy.float32)
a = numpy.random.randn(2, 2).astype(numpy.float32) / 10
b = numpy.random.randn(1, 2).astype(numpy.float32)
feeds = {'X': x, 'A': a, 'B': b}

print(sess.run(None, feeds))

# Let's check with the previous model.
sess0 = ReferenceEvaluator("ONNX/saves/linear_regression.onnx",)
sess1 = ReferenceEvaluator("ONNX/saves/linear_regression_improved.onnx", new_ops=[AddEyeLike])

y0 = sess0.run(None, feeds)[0]
y1 = sess1.run(None, feeds)[0]
print(y0)
print(y1)
print(f"difference: {numpy.abs(y0 - y1).max()}")

AddEyeLike(A) -> A1
MatMul(X, A1) -> XA1
Add(XA1, B) -> Y
[array([[-0.42936724, -0.59607476],
       [-1.8834507 , -0.9946752 ],
       [ 1.0796697 , -0.16089936],
       [ 0.3997272 , -1.9825854 ]], dtype=float32)]
[[-0.42936724 -0.59607476]
 [-1.8834507  -0.9946752 ]
 [ 1.0796697  -0.16089936]
 [ 0.3997272  -1.9825854 ]]
[[-0.42936724 -0.59607476]
 [-1.8834507  -0.9946752 ]
 [ 1.0796697  -0.16089936]
 [ 0.3997272  -1.9825854 ]]
difference: 0.0

预测是相同的。让我们比较在一个足够大的矩阵上的性能，以便看到显著的差异。

import timeit
import numpy
from onnx.reference import ReferenceEvaluator
from onnx.reference.op_run import OpRun


class AddEyeLike(OpRun):
    op_domain = "optimized"

    def _run(self, X, alpha=1.):
        assert len(X.shape) == 2
        assert X.shape[0] == X.shape[1]
        X = X.copy()
        ind = numpy.diag_indices(X.shape[0])
        X[ind] += alpha
        return (X,)


sess = ReferenceEvaluator("ONNX/saves/linear_regression_improved.onnx", verbose=2, new_ops=[AddEyeLike])

x = numpy.random.randn(4, 100).astype(numpy.float32)
a = numpy.random.randn(100, 100).astype(numpy.float32) / 10
b = numpy.random.randn(1, 100).astype(numpy.float32)
feeds = {'X': x, 'A': a, 'B': b}

sess0 = ReferenceEvaluator("ONNX/saves/linear_regression.onnx")
sess1 = ReferenceEvaluator("ONNX/saves/linear_regression_improved.onnx", new_ops=[AddEyeLike])

y0 = sess0.run(None, feeds)[0]
y1 = sess1.run(None, feeds)[0]
print(f"difference: {numpy.abs(y0 - y1).max()}")
print(f"time with EyeLike+Add: {timeit.timeit(lambda: sess0.run(None, feeds), number=1000)}")
print(f"time with AddEyeLike: {timeit.timeit(lambda: sess1.run(None, feeds), number=1000)}")

difference: 0.0
time with EyeLike+Add: 0.09205669999937527
time with AddEyeLike: 0.12604709999868646

在这种情况下似乎值得添加一个优化节点。这种优化通常被称为 fusion。两个连续的运算符被融合成它们的优化版本。生产环境通常依赖于 onnxruntime，但由于这种优化使用基本的矩阵操作，它应该在任何其他运行时上带来相同的性能提升。

4. Implementation details，实现细节

4.1 Python and C++

ONNX 依赖于 Protobuf 来定义其类型。你可能会认为一个 Python 对象只是在内部结构上包装了一个 C 指针。因此，应该可以从接收 ModelProto 类型的 Python 对象的函数中访问内部数据。但事实并非如此。根据 Protobuf 4 的更改，在版本 4 之后不再可能这样做，更安全的做法是假设获取内容的唯一方法是将模型序列化为字节，传递给 C 函数，然后再进行反序列化。像 check_model 或 shape_inference 这样的函数在使用 C 代码检查模型之前，会调用 SerializeToString，然后再调用 ParseFromString。

4.2 Attributes and inputs，属性和输入

这两者之间有明显的区别。输入是动态的，可能在每次执行时都会改变。属性从不改变，优化器可以假设它永远不会改变来优化执行图。因此，⚠️ 将输入转换为属性是不可能的。而常量运算符是唯一将属性转换为输入的运算符。

4.3 Shape or no shape，有形状和没有形状

ONNX 通常期望每个输入或输出都有一个形状，假设已知秩（或维度的数量）。但如果我们需要为每个维度创建一个有效的图呢？这种情况仍然令人困惑。

import numpy
from onnx import numpy_helper, TensorProto, FunctionProto
from onnx.helper import (
    make_model, make_node, set_model_props, make_tensor,
    make_graph, make_tensor_value_info, make_opsetid,
    make_function)
from onnx.checker import check_model
from onnxruntime import InferenceSession


def create_model(shapes):
    new_domain = 'custom'
    opset_imports = [make_opsetid("", 14), make_opsetid(new_domain, 1)]

    node1 = make_node('MatMul', ['X', 'A'], ['XA'])
    node2 = make_node('Add', ['XA', 'A'], ['Y'])

    X = make_tensor_value_info('X', TensorProto.FLOAT, shapes['X'])
    A = make_tensor_value_info('A', TensorProto.FLOAT, shapes['A'])
    Y = make_tensor_value_info('Y', TensorProto.FLOAT, shapes['Y'])

    graph = make_graph([node1, node2], 'example', [X, A], [Y])

    onnx_model = make_model(graph, opset_imports=opset_imports)
    # Let models runnable by onnxruntime with a released ir_version
    onnx_model.ir_version = 8

    return onnx_model


print("----------- case 1: 2D x 2D -> 2D")
onnx_model = create_model({'X': [None, None], 'A': [None, None], 'Y': [None, None]})
check_model(onnx_model)
sess = InferenceSession(onnx_model.SerializeToString(),
                        providers=["CPUExecutionProvider"])
res = sess.run(None, {
    'X': numpy.random.randn(2, 2).astype(numpy.float32),
    'A': numpy.random.randn(2, 2).astype(numpy.float32)})
print(res)


print("----------- case 2: 2D x 1D -> 1D")
onnx_model = create_model({'X': [None, None], 'A': [None], 'Y': [None]})
check_model(onnx_model)
sess = InferenceSession(onnx_model.SerializeToString(),
                        providers=["CPUExecutionProvider"])
res = sess.run(None, {
    'X': numpy.random.randn(2, 2).astype(numpy.float32),
    'A': numpy.random.randn(2).astype(numpy.float32)})
print(res)


print("----------- case 3: 2D x 0D -> 0D")
onnx_model = create_model({'X': [None, None], 'A': [], 'Y': []})
check_model(onnx_model)
try:
    InferenceSession(onnx_model.SerializeToString(),
                     providers=["CPUExecutionProvider"])
except Exception as e:
    print(e)


print("----------- case 4: 2D x None -> None")
onnx_model = create_model({'X': [None, None], 'A': None, 'Y': None})
try:
    check_model(onnx_model)
except Exception as e:
    print(type(e), e)
sess = InferenceSession(onnx_model.SerializeToString(),
                        providers=["CPUExecutionProvider"])
res = sess.run(None, {
    'X': numpy.random.randn(2, 2).astype(numpy.float32),
    'A': numpy.random.randn(2).astype(numpy.float32)})
print(res)
print("----------- end")

----------- case 1: 2D x 2D -> 2D
[array([[-0.17025554, -0.19959664],
       [ 2.4781291 ,  1.6193585 ]], dtype=float32)]
----------- case 2: 2D x 1D -> 1D
[array([-0.84798825, -0.75835514], dtype=float32)]
----------- case 3: 2D x 0D -> 0D
[ONNXRuntimeError] : 1 : FAIL : Node () Op (MatMul) [ShapeInferenceError] Input tensors of wrong rank (0).
----------- case 4: 2D x None -> None
 Field 'shape' of 'type' is required but missing.
[array([ 0.6613703, -1.9580202], dtype=float32)]
----------- end

知识来源

使用ONNX部署深度学习和传统机器学习模型
PyTorch转ONNX-理论篇
ONNX学习笔记
ONNX Concepts
ONNX with Python

你可能感兴趣的:(深度学习（Deep,Learning）,机器学习（Machine,Learning）,Python,学习,笔记,人工智能)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s