NVIDIA 量化感知训练pytorch-quantization说明文档

使用指导

Quantization function

tensor_quant 和 fake_tensor_quant 是量化张量的两个基本函数。 fake_tensor_quant 返回伪量化张量(浮点值)。 tensor_quant 返回量化张量(整数值)和比例。

tensor_quant(inputs, amax, num_bits=8, output_dtype=torch.float, unsigned=False)
fake_tensor_quant(inputs, amax

你可能感兴趣的:(TensorRT-部署-加速,深度学习,pytorch,深度学习,机器学习)