深度学习8bit量化数据转16bit量化数据方法(一)

应用场景

在对网络转变为8bit量化网络后,有的算子譬如sigmoid需要按照浮点数进行计算,所以在sigmoid前端需要将8bit量化数据转变为16bit数据。本文阐述了如何将8bit量化的数据转变为Q(16,7)量化数据的方法。

参数定义

X_quant : 8bit量化数据
Z_quant :8bit量化时对应的Zero值
S_float : 8bit量化时的数据缩放系数
x_float :对应的浮点数

计算推导

深度学习8bit量化数据转16bit量化数据方法(一)_第1张图片

结束语

8bit网络的量化精度和能够量化的数据范围与n的值有关,详细将在下一节进行分析。

你可能感兴趣的:(机器学习,fpga,人工智能)