网络压缩相关指标理解与求解

持续更新……

  1. 压缩率:压缩前后模型size变化程度。
    对量化而言,32bit的数据量化至8bit,则压缩率为4x
    对剪枝而言,压缩率=1 / (1-FLOPs减少率);如FLOPs减少60%,则压缩率为1/0.4=2.5x
  2. FLOPs:FLoating point OPerations,即浮点计算次数,包含乘法和加法,只和模型相关。

你可能感兴趣的:(python,深度学习,神经网络)