Strawssberry778

pytorch模型量化

量化是一种加速推理的技术，量化算子并且仅仅支持前向传递。Pytorch支持int8量化，相比于float32,模型的大小减少4倍，内存要求减少4倍。与float32计算相比，对int8计算的硬件支持通常快2到4倍。

大多数情况下，模型需要以float32精度训练，然后将模型转换为int8。如今，PyTorch支持在具有AVX2支持或者更高版本的x86 CPU或者ARM CPU上运行量化运算符。

pytorch提供了三种量化模型的方法：

训练后动态量化：最简单的量化形式，权重被提前量化，激活在推理过程中被动态量化
训练后静态量化：最常用的量化形式，权重提前量化，并且基于观察校准过程中模型的行为来预先计算激活张量的比例因子和偏差。
量化意识训练：在极少数情况下，训练后量化不能提供足够的准确性，可以使用torch.quantization.FakeQuantize函数通过模拟量化来进行训练。

1. 前言

深度学习在移动端的应用越来越广泛，而移动端相对于GPU服务来讲算力较低并且存储空间也相对较小。基于这一点我们需要为移动端定制一些深度学习网络来满足我们的日常续需求，例如SqueezeNet，MobileNet，ShuffleNet等轻量级网络就是专为移动端设计的。但除了在网络方面进行改进，模型剪枝和量化应该算是最常用的优化方法了。剪枝就是将训练好的「大模型」的不重要的通道删除掉，在几乎不影响准确率的条件下对网络进行加速。而量化就是将浮点数（高精度）表示的权重和偏置用低精度整数（常用的有INT8）来近似表示，在量化到低精度之后就可以应用移动平台上的优化技术如NEON对计算过程进行加速，并且原始模型量化后的模型容量也会减少，使其能够更好的应用到移动端环境。但需要注意的问题是，将高精度模型量化到低精度必然会存在一个精度下降的问题，如何获取性能和精度的TradeOff很关键。

这篇文章是介绍使用Pytorch复现这篇论文：https://arxiv.org/abs/1806.08342 的一些细节并给出一些自测实验结果。注意，代码实现的是「Quantization Aware Training」 ，而后量化 「Post Training Quantization」 后面可能会再单独讲一下。代码实现是来自666DZY666博主实现的https://github.com/666DZY666/model-compression。

2. 对称量化

在上次的视频中梁德澎作者已经将这些概念讲得非常清楚了，如果不愿意看文字表述可以移步到这个视频链接下观看视频：深度学习量化技术科普。然后直接跳到第四节，但为了保证本次故事的完整性，我还是会介绍一下这两种量化方式。

对称量化的量化公式如下：

对称量化量化公式

其中表示量化的缩放因子，和分别表示量化前和量化后的数值。这里通过除以缩放因子接取整操作就把原始的浮点数据量化到了一个小区间中，比如对于「有符号的8Bit」 就是（无符号就是0到255了）。

这里有个Trick，即对于权重是量化到，这是为了累加的时候减少溢出的风险。

因为8bit的取值区间是[-2^7, 2^7-1]，两个8bit相乘之后取值区间是 (-2^14,2^14]，累加两次就到了(-2^15，2^15]，所以最多只能累加两次而且第二次也有溢出风险，比如相邻两次乘法结果都恰好是2^14会超过2^15-1（int16正数可表示的最大值）。

所以把量化之后的权值限制在（-127,127）之间，那么一次乘法运算得到结果永远会小于-128*-128 = 2^14。

对应的反量化公式为：

对称量化的反量化公式

即将量化后的值乘以就得到了反量化的结果，当然这个过程是有损的，如下图所示，橙色线表示的就是量化前的范围，而蓝色线代表量化后的数据范围，注意权重取。

量化和反量化的示意图

我们看一下上面橙色线的第个「黑色圆点对应的float32值」，将其除以缩放系数就量化为了一个在之间的值，然后取整之后就是，如果是反量化就乘以缩放因子返回上面的「第个黑色圆点」 ，用这个数去代替以前的数继续做网络的Forward。

那么这个缩放系数是怎么取的呢？如下式：

缩放系数Delta

3. 非对称量化

非对称量化相比于对称量化就在于多了一个零点偏移。一个float32的浮点数非对称量化到一个int8的整数（如果是有符号就是，如果是无符号就是）的步骤为缩放，取整，零点偏移，和溢出保护，如下图所示：

白皮书非对称量化过程

对于8Bit无符号整数Nlevel的取值

然后缩放系数和零点偏移的计算公式如下：

4. 中部小结

将上面两种算法直接应用到各个网络上进行量化后(训练后量化PTQ)测试模型的精度结果如下：

红色部分即将上面两种量化算法应用到各个网络上做精度测试结果

5. 训练模拟量化

我们要在网络训练的过程中模型量化这个过程，然后网络分前向和反向两个阶段，前向阶段的量化就是第二节和第三节的内容。不过需要特别注意的一点是对于缩放因子的计算，权重和激活值的计算方法现在不一样了。

对于权重缩放因子还是和第2,3节的一致，即：

weight scale = max(abs(weight)) / 127

但是对于激活值的缩放因子计算就不再是简单的计算最大值，而是在训练过程中通过滑动平均（EMA）的方式去统计这个量化范围，更新的公式如下：

moving_max = moving_max * momenta + max(abs(activation)) * (1- momenta)

其中，momenta取接近1的数就可以了，在后面的Pytorch实验中取0.99，然后缩放因子：

activation scale = moving_max /128

然后反向传播阶段求梯度的公式如下：

QAT反向传播阶段求梯度的公式

我们在反向传播时求得的梯度是模拟量化之后权值的梯度，用这个梯度去更新量化前的权值。

这部分的代码如下，注意我们这个实验中是用float32来模拟的int8，不具有真实的板端加速效果，只是为了验证算法的可行性：


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       class 
       Quantizer(nn.Module):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       def 
       __init__(
       self, bits, range_tracker):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       super().__init__()
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.bits = bits
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.range_tracker = range_tracker
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.register_buffer(
       'scale', 
       None)      
       # 量化比例因子
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.register_buffer(
       'zero_point', 
       None) 
       # 量化零点
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       def 
       update_params(
       self):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       raise NotImplementedError
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 量化
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       def 
       quantize(
       self, input):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               output = 
       input * self.scale - self.zero_point
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       return output
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       def 
       round(
       self, input):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               output = Round.apply(
       input)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       return output
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 截断
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       def 
       clamp(
       self, input):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               output = torch.clamp(
       input, self.min_val, self.max_val)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       return output
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 反量化
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       def 
       dequantize(
       self, input):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               output = (
       input + self.zero_point) / self.scale
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       return output
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       def 
       forward(
       self, input):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       if self.bits == 
       32:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   output = 
       input
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       elif self.bits == 
       1:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       print(
       '！Binary quantization is not supported ！')
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       assert self.bits != 
       1
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       else:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   self.range_tracker(
       input)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   self.update_params()
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   output = self.quantize(
       input)   
       # 量化
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   output = self.
       round(output)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   output = self.clamp(output)     
       # 截断
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   output = self.dequantize(output)
       # 反量化
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       return output

6. 代码实现

基于https://github.com/666DZY666/model-compression/blob/master/quantization/WqAq/IAO/models/util_wqaq.py 进行实验，这里实现了对称和非对称量化两种方案。需要注意的细节是，对于权值的量化需要分通道进行求取缩放因子，然后对于激活值的量化整体求一个缩放因子，这样效果最好（论文中提到）。

这部分的代码实现如下：


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # ********************* range_trackers(范围统计器，统计量化前范围) *********************
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       class 
       RangeTracker(nn.Module):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       def 
       __init__(
       self, q_level):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       super().__init__()
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.q_level = q_level
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       def 
       update_range(
       self, min_val, max_val):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       raise NotImplementedError
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
           @torch.no_grad()
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       def 
       forward(
       self, input):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       if self.q_level == 
       'L':    
       # A,min_max_shape=(1, 1, 1, 1),layer级
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   min_val = torch.
       min(
       input)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   max_val = torch.
       max(
       input)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       elif self.q_level == 
       'C':  
       # W,min_max_shape=(N, 1, 1, 1),channel级
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   min_val = torch.
       min(torch.
       min(torch.
       min(
       input, 
       3, keepdim=
       True)[
       0], 
       2, keepdim=
       True)[
       0], 
       1, keepdim=
       True)[
       0]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   max_val = torch.
       max(torch.
       max(torch.
       max(
       input, 
       3, keepdim=
       True)[
       0], 
       2, keepdim=
       True)[
       0], 
       1, keepdim=
       True)[
       0]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.update_range(min_val, max_val)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       class 
       GlobalRangeTracker(
       RangeTracker):  
       # W,min_max_shape=(N, 1, 1, 1),channel级,取本次和之前相比的min_max —— (N, C, W, H)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       def 
       __init__(
       self, q_level, out_channels):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       super().__init__(q_level)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.register_buffer(
       'min_val', torch.zeros(out_channels, 
       1, 
       1, 
       1))
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.register_buffer(
       'max_val', torch.zeros(out_channels, 
       1, 
       1, 
       1))
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.register_buffer(
       'first_w', torch.zeros(
       1))
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       def 
       update_range(
       self, min_val, max_val):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               temp_minval = self.min_val
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               temp_maxval = self.max_val
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       if self.first_w == 
       0:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   self.first_w.add_(
       1)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   self.min_val.add_(min_val)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   self.max_val.add_(max_val)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       else:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   self.min_val.add_(-temp_minval).add_(torch.
       min(temp_minval, min_val))
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   self.max_val.add_(-temp_maxval).add_(torch.
       max(temp_maxval, max_val))
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       class 
       AveragedRangeTracker(
       RangeTracker):  
       # A,min_max_shape=(1, 1, 1, 1),layer级,取running_min_max —— (N, C, W, H)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       def 
       __init__(
       self, q_level, momentum=0.1):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       super().__init__(q_level)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.momentum = momentum
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.register_buffer(
       'min_val', torch.zeros(
       1))
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.register_buffer(
       'max_val', torch.zeros(
       1))
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.register_buffer(
       'first_a', torch.zeros(
       1))
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       def 
       update_range(
       self, min_val, max_val):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       if self.first_a == 
       0:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   self.first_a.add_(
       1)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   self.min_val.add_(min_val)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   self.max_val.add_(max_val)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       else:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   self.min_val.mul_(
       1 - self.momentum).add_(min_val * self.momentum)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   self.max_val.mul_(
       1 - self.momentum).add_(max_val * self.momentum)

其中self.register_buffer这行代码可以在内存中定一个常量，同时，模型保存和加载的时候可以写入和读出，即这个变量不会参与反向传播。

❝ pytorch一般情况下，是将网络中的参数保存成orderedDict形式的，这里的参数其实包含两种，一种是模型中各种module含的参数，即nn.Parameter,我们当然可以在网络中定义其他的nn.Parameter参数，另一种就是buffer,前者每次optim.step会得到更新，而不会更新后者。
❞

另外，由于卷积层后面经常会接一个BN层，并且在前向推理时为了加速经常把BN层的参数融合到卷积层的参数中，所以训练模拟量化也要按照这个流程。即，我们首先需要把BN层的参数和卷积层的参数融合，然后再对这个参数做量化，具体过程可以借用德澎的这页PPT来说明：

Made By 梁德澎

因此，代码实现包含两个版本，一个是不融合BN的训练模拟量化，一个是融合BN的训练模拟量化，而关于为什么融合之后是上图这样的呢？请看下面的公式：

所以：

公式中的，和分别表示卷积层的权值与偏置，和分别为卷积层的输入与输出，则根据的计算公式，可以推出融合了batchnorm参数之后的权值与偏置，和。

未融合BN的训练模拟量化代码实现如下（带注释）：


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # ********************* 量化卷积（同时量化A/W，并做卷积） *********************
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       class 
       Conv2d_Q(nn.Conv2d):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       def 
       __init__(
       
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               self,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               in_channels,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               out_channels,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               kernel_size,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               stride=1,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               padding=0,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               dilation=1,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               groups=1,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               bias=True,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               a_bits=8,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               w_bits=8,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               q_type=1,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               first_layer=0,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
           ):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       super().__init__(
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   in_channels=in_channels,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   out_channels=out_channels,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   kernel_size=kernel_size,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   stride=stride,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   padding=padding,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   dilation=dilation,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   groups=groups,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   bias=bias
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               )
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 实例化量化器（A-layer级，W-channel级）
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       if q_type == 
       0:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   self.activation_quantizer = SymmetricQuantizer(bits=a_bits, range_tracker=AveragedRangeTracker(q_level=
       'L'))
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   self.weight_quantizer = SymmetricQuantizer(bits=w_bits, range_tracker=GlobalRangeTracker(q_level=
       'C', out_channels=out_channels))
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       else:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   self.activation_quantizer = AsymmetricQuantizer(bits=a_bits, range_tracker=AveragedRangeTracker(q_level=
       'L'))
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   self.weight_quantizer = AsymmetricQuantizer(bits=w_bits, range_tracker=GlobalRangeTracker(q_level=
       'C', out_channels=out_channels))
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.first_layer = first_layer
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       def 
       forward(
       self, input):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 量化A和W
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       if 
       not self.first_layer:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       input = self.activation_quantizer(
       input)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               q_input = 
       input
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               q_weight = self.weight_quantizer(self.weight) 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 量化卷积
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               output = F.conv2d(
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       input=q_input,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   weight=q_weight,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   bias=self.bias,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   stride=self.stride,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   padding=self.padding,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   dilation=self.dilation,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   groups=self.groups
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               )
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       return output

而考虑了折叠BN的代码实现如下（带注释）：


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       def 
       reshape_to_activation(
       input):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
          
       return 
       input.reshape(
       1, -
       1, 
       1, 
       1)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       def 
       reshape_to_weight(
       input):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
          
       return 
       input.reshape(-
       1, 
       1, 
       1, 
       1)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       def 
       reshape_to_bias(
       input):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
          
       return 
       input.reshape(-
       1)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # ********************* bn融合_量化卷积（bn融合后，同时量化A/W，并做卷积） *********************
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       class 
       BNFold_Conv2d_Q(
       Conv2d_Q):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       def 
       __init__(
       
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               self,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               in_channels,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               out_channels,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               kernel_size,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               stride=1,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               padding=0,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               dilation=1,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               groups=1,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               bias=False,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               eps=1e-5,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               momentum=0.01, # 考虑量化带来的抖动影响,对momentum进行调整(0.1 ——> 0.01),削弱batch统计参数占比，一定程度抑制抖动。经实验量化训练效果更好,acc提升1%左右
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               a_bits=8,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               w_bits=8,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               q_type=1,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               first_layer=0,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
           ):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       super().__init__(
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   in_channels=in_channels,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   out_channels=out_channels,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   kernel_size=kernel_size,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   stride=stride,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   padding=padding,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   dilation=dilation,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   groups=groups,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   bias=bias
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               )
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.eps = eps
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.momentum = momentum
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.gamma = Parameter(torch.Tensor(out_channels))
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.beta = Parameter(torch.Tensor(out_channels))
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.register_buffer(
       'running_mean', torch.zeros(out_channels))
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.register_buffer(
       'running_var', torch.ones(out_channels))
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.register_buffer(
       'first_bn', torch.zeros(
       1))
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               init.uniform_(self.gamma)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               init.zeros_(self.beta)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 实例化量化器（A-layer级，W-channel级）
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       if q_type == 
       0:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   self.activation_quantizer = SymmetricQuantizer(bits=a_bits, range_tracker=AveragedRangeTracker(q_level=
       'L'))
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   self.weight_quantizer = SymmetricQuantizer(bits=w_bits, range_tracker=GlobalRangeTracker(q_level=
       'C', out_channels=out_channels))
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       else:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   self.activation_quantizer = AsymmetricQuantizer(bits=a_bits, range_tracker=AveragedRangeTracker(q_level=
       'L'))
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   self.weight_quantizer = AsymmetricQuantizer(bits=w_bits, range_tracker=GlobalRangeTracker(q_level=
       'C', out_channels=out_channels))
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.first_layer = first_layer
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       def 
       forward(
       self, input):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 训练态
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       if self.training:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       # 先做普通卷积得到A，以取得BN参数
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   output = F.conv2d(
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                        
       input=
       input,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                       weight=self.weight,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                       bias=self.bias,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                       stride=self.stride,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                       padding=self.padding,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                       dilation=self.dilation,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                       groups=self.groups
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   )
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       # 更新BN统计参数（batch和running）
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   dims = [dim 
       for dim 
       in 
       range(
       4) 
       if dim != 
       1]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   batch_mean = torch.mean(output, dim=dims)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   batch_var = torch.var(output, dim=dims)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       with torch.no_grad():
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                        
       if self.first_bn == 
       0:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                           self.first_bn.add_(
       1)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                           self.running_mean.add_(batch_mean)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                           self.running_var.add_(batch_var)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                        
       else:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                           self.running_mean.mul_(
       1 - self.momentum).add_(batch_mean * self.momentum)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                           self.running_var.mul_(
       1 - self.momentum).add_(batch_var * self.momentum)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       # BN融合
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       if self.bias 
       is 
       not 
       None:  
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                     bias = reshape_to_bias(self.beta + (self.bias -  batch_mean) * (self.gamma / torch.sqrt(batch_var + self.eps)))
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       else:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                     bias = reshape_to_bias(self.beta - batch_mean  * (self.gamma / torch.sqrt(batch_var + self.eps)))
       # b融batch
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   weight = self.weight * reshape_to_weight(self.gamma / torch.sqrt(self.running_var + self.eps))     
       # w融running
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 测试态
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       else:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       #print(self.running_mean, self.running_var)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       # BN融合
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       if self.bias 
       is 
       not 
       None:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                     bias = reshape_to_bias(self.beta + (self.bias - self.running_mean) * (self.gamma / torch.sqrt(self.running_var + self.eps)))
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       else:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                     bias = reshape_to_bias(self.beta - self.running_mean * (self.gamma / torch.sqrt(self.running_var + self.eps)))  
       # b融running
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   weight = self.weight * reshape_to_weight(self.gamma / torch.sqrt(self.running_var + self.eps))  
       # w融running
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 量化A和bn融合后的W
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       if 
       not self.first_layer:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       input = self.activation_quantizer(
       input)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               q_input = 
       input
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               q_weight = self.weight_quantizer(weight) 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 量化卷积
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       if self.training:  
       # 训练态
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                 output = F.conv2d(
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                      
       input=q_input,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                     weight=q_weight,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                     bias=self.bias,  
       # 注意，这里不加bias（self.bias为None）
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                     stride=self.stride,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                     padding=self.padding,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                     dilation=self.dilation,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                     groups=self.groups
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                 )
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                  
       # （这里将训练态下，卷积中w融合running参数的效果转为融合batch参数的效果）running ——> batch
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                 output *= reshape_to_activation(torch.sqrt(self.running_var + self.eps) / torch.sqrt(batch_var + self.eps))
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                 output += reshape_to_activation(bias)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       else:  
       # 测试态
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                 output = F.conv2d(
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                      
       input=q_input,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                     weight=q_weight,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                     bias=bias,  
       # 注意，这里加bias，做完整的conv+bn
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                     stride=self.stride,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                     padding=self.padding,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                     dilation=self.dilation,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                     groups=self.groups
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                 )
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       return output

注意一个点，在训练的时候bias设置为None，即训练的时候不量化bias。

7. 实验结果

在CIFAR10做Quantization Aware Training实验，网络结构为：


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       import torch
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       import torch.nn 
       as nn
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       import torch.nn.functional 
       as F
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       from .util_wqaq 
       import Conv2d_Q, BNFold_Conv2d_Q
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       class QuanConv2d(nn.Module):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
           def __init__(self, input_channels, output_channels,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
                   kernel_size=-1, stride=-1, padding=-1, groups=1, last_relu=0, abits=8, wbits=8, bn_fold=0, q_type=1, first_layer=0):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               super(QuanConv2d, self).__init__()
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               self.last_relu = last_relu
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               self.bn_fold = bn_fold
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               self.first_layer = first_layer
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               if self.bn_fold == 1:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
                   self.bn_q_conv = BNFold_Conv2d_Q(input_channels, output_channels,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
                           kernel_size=kernel_size, stride=stride, padding=padding, groups=groups, a_bits=abits, w_bits=wbits, q_type=q_type, first_layer=first_layer)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               else:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
                   self.q_conv = Conv2d_Q(input_channels, output_channels,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
                           kernel_size=kernel_size, stride=stride, padding=padding, groups=groups, a_bits=abits, w_bits=wbits, q_type=q_type, first_layer=first_layer)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
                   self.bn = nn.BatchNorm2d(output_channels, momentum=0.01) # 考虑量化带来的抖动影响,对momentum进行调整(0.1 ——> 0.01),削弱batch统计参数占比，一定程度抑制抖动。经实验量化训练效果更好,acc提升1%左右
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               self.relu = nn.ReLU(inplace=True)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
           def forward(self, x):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               if not self.first_layer:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
                   x = self.relu(x)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               if self.bn_fold == 1:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
                   x = self.bn_q_conv(x)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               else:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
                   x = self.q_conv(x)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
                   x = self.bn(x)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               if self.last_relu:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
                   x = self.relu(x)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               return x
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       class Net(nn.Module):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
           def __init__(self, cfg = None, abits=8, wbits=8, bn_fold=0, q_type=1):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               super(Net, self).__init__()
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               if cfg is None:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
                   cfg = [192, 160, 96, 192, 192, 192, 192, 192]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               # model - A/W全量化(除输入、输出外)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               self.quan_model = nn.Sequential(
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
                       QuanConv2d(3, cfg[0], kernel_size=5, stride=1, padding=2, abits=abits, wbits=wbits, bn_fold=bn_fold, q_type=q_type, first_layer=1),
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
                       QuanConv2d(cfg[0], cfg[1], kernel_size=1, stride=1, padding=0, abits=abits, wbits=wbits, bn_fold=bn_fold, q_type=q_type),
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
                       QuanConv2d(cfg[1], cfg[2], kernel_size=1, stride=1, padding=0, abits=abits, wbits=wbits, bn_fold=bn_fold, q_type=q_type),
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
                       nn.MaxPool2d(kernel_size=3, stride=2, padding=1),
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
                       
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
                       QuanConv2d(cfg[2], cfg[3], kernel_size=5, stride=1, padding=2, abits=abits, wbits=wbits, bn_fold=bn_fold, q_type=q_type),
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
                       QuanConv2d(cfg[3], cfg[4], kernel_size=1, stride=1, padding=0, abits=abits, wbits=wbits, bn_fold=bn_fold, q_type=q_type),
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
                       QuanConv2d(cfg[4], cfg[5], kernel_size=1, stride=1, padding=0, abits=abits, wbits=wbits, bn_fold=bn_fold, q_type=q_type),
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
                       nn.MaxPool2d(kernel_size=3, stride=2, padding=1),
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
                       
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
                       QuanConv2d(cfg[5], cfg[6], kernel_size=3, stride=1, padding=1, abits=abits, wbits=wbits, bn_fold=bn_fold, q_type=q_type),
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
                       QuanConv2d(cfg[6], cfg[7], kernel_size=1, stride=1, padding=0, abits=abits, wbits=wbits, bn_fold=bn_fold, q_type=q_type),
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
                       QuanConv2d(cfg[7], 10, kernel_size=1, stride=1, padding=0, last_relu=1, abits=abits, wbits=wbits, bn_fold=bn_fold, q_type=q_type),
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
                       nn.AvgPool2d(kernel_size=8, stride=1, padding=0),
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
                       )
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
           def forward(self, x):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               x = self.quan_model(x)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               x = x.view(x.size(0), -1)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
               return x

训练Epoch数为30，学习率调整策略为：


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       def 
       adjust_learning_rate(
       optimizer, epoch):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       if args.bn_fold == 
       1:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       if args.model_type == 
       0:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   update_list = [
       12, 
       15, 
       25]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       else:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   update_list = [
       8, 
       12, 
       20, 
       25]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       else:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               update_list = [
       15, 
       17, 
       20]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       if epoch 
       in update_list:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       for param_group 
       in optimizer.param_groups:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   param_group[
       'lr'] = param_group[
       'lr'] * 
       0.1
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       return

类型Acc备注原模型(nin)91.01%全精度对称量化, bn不融合88.88%INT8对称量化，bn融合86.66%INT8非对称量化，bn不融合88.89%INT8非对称量化，bn融合87.30%INT8

现在不清楚为什么量化后的精度损失了1-2个点，根据德澎在MxNet的实验结果来看，分类任务不会损失精度，所以不知道这个代码是否存在问题，有经验的大佬欢迎来指出问题。

然后白皮书上提供的一些分类网络的训练模拟量化精度情况如下：

QAT方式明显好于Post Train Quantzation

注意前面有一些精度几乎为0的数据是因为MobileNet训练出来之后某些层的权重非常接近0，使用训练后量化方法之后权重也为0，这就导致推理后结果完全错误。

8. 总结

今天介绍了一下基于Pytorch实现QAT量化，并用一个小网络测试了一下效果，但比较遗憾的是并没有获得论文中那么理想的数据，仍需要进一步研究。

【LlamaIndex核心组件指南 | 数据加载篇】从原始数据到向量的全链路深度解析吴师兄大模型现代大模型技术与应用 llamaindex langchain 开发语言 python pytorch 人工智能大模型
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
【深度学习-Day 36】CNN的开山鼻祖：从LeNet-5到AlexNet的架构演进之路吴师兄大模型深度学习入门到精通 python pytorch 开发语言人工智能 CNN 深度学习大模型
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
【Agent的革命之路——LangGraph】人机交互中的四种决策设计模式乔巴先生24 人机交互设计模式人工智能 python
在现在强大的LLM应用程序中，最有用的无外乎就是人机交互工作流，它将人工输入集成到自动化流程中，允许在关键阶段做出决策、验证或更正，因为底层模型可能会偶尔产生不准确之处，在合规性、决策或内容生成等低容错场景中，人工参与可通过审查、更正或覆盖模型输出来确保可靠性。我么的应用程序在什么时候会使用人机交互工作流程呢？审查工具调用：人类可以在工具执行之前审查、编辑或批准LLM请求的工具调用。验证LLM输出
AI原生应用领域多租户的技术架构剖析 AI天才研究院 AI-native 架构人工智能 ai
AI原生应用领域多租户技术架构深度剖析元数据框架标题：AI原生应用多租户技术架构：从隔离性到智能化的分层设计与实践关键词：AI原生应用、多租户架构、数据隔离、模型共享、云原生租户管理摘要：本文系统解析AI原生应用场景下多租户技术架构的核心设计逻辑，覆盖从数据层到模型层的全栈隔离与共享机制。通过第一性原理推导，结合云原生、机器学习生命周期管理（MLOps）等技术范式，提出包含租户上下文管理、动态资源
大数据集成方案对比：Kafka vs Flume vs Sqoop AI天才研究院计算 AI大模型应用入门实战与进阶 Agentic AI 实战大数据 kafka flume ai
大数据集成方案对比：KafkavsFlumevsSqoop关键词：大数据集成、Kafka、Flume、Sqoop、流处理、批量迁移、日志收集摘要：在大数据生态中，数据集成是连接数据源与数据处理平台的关键环节。本文深度对比Kafka、Flume、Sqoop三大主流集成工具，从核心架构、技术原理、适用场景到实战案例展开系统性分析。通过数学模型量化性能差异，结合实际项目经验总结选型策略，帮助开发者根据业
工业喷涂机器人的革新：艾利特协作机器人引领人机交互新纪元 lingling009 人工智能运维大数据
将复杂技术转化为实际价值，赋能全球产业生态在工业自动化浪潮中，喷涂作业作为关键制造环节，长期面临效率低下、质量波动和安全隐患等痛点。艾利特机器人，作为专注新一代人机交互协作场景的制造商和迅速成长的国际协作机器人龙头企业之一，致力于通过一站式解决方案，深度升级汽车、3C、新能源等行业生态。本文将基于“工业喷涂机器人”这一核心场景，剖析其痛点、转化技术参数为可感知价值，并植入真实案例，构建“基础功能→
LangGraph教程6：LangGraph工作流人机交互 Cachel wood LLM和AIGC 人机交互 java 前端 langchain langgraph 开发语言数据库
文章目录Human-in-the-loop(人机交互)interruptWarningHuman-in-the-loop(人机交互)人机交互（或称“在循环中”）工作流将人类输入整合到自动化过程中，在关键阶段允许决策、验证或修正。这在基于LLM的应用中尤其有用，因为基础模型可能会产生偶尔的不准确性。在合规、决策或内容生成等低误差容忍场景中，人类的参与通过允许审查、修正或覆盖模型输出来确保可靠性。使用
帮你战胜99%普通人的意志力训练四：为什么善行之后会有恶行雪屋随思
回味了一下我最近的减重经历。为了减重，我增加了自己的运动量。燃烧卡路里的时候，我会不由自主地想，自己可以多吃一点作为锻炼的奖励。我认为积极锻炼的自己很“好”，这种“好”让我认为放弃节食是我对自己的“奖励”。最终锻炼成了我放纵胃口的许可证。这种“道德许可”很疯狂，它有可怕的诱惑力，让我们把“想做的事”，变成“必须做的事”。心理学家们的实验表明，哪怕我们所做的“善行”和我们要达成的目标毫无联系，我们的
致小溪流家人第十七封信 mxn马娜
溪爸，溪妈：周末好！溪流教室冬至的到来，让孩子们着实兴奋了一把。在这里也要感谢我们的昀恬妈妈，佳依妈妈，家梣妈妈到教室陪孩子们一起过冬至包饺子的活动。学霸队香蕉队水饺队草莓队我们分为了四组，每组分派一位大人参与。相信家人们从孩子的写绘里已经感知到当时现场的氛围有多热闹了。故事是如何而来？是从生活经历中来，培养孩子善于观察，善于发现，善于思考，用心感知生活中发生的一切，做一个心思细腻的人。生活经历，
Multisim、Proteus和LTspice 、我是男生。 proteus
以下是Multisim、Proteus和LTspice三款主流电路仿真软件的核心区别及适用场景分析，便于您根据需求精准选型：1.LTspice开发方：ADI（原LinearTechnology）定位：高频/高性能模拟电路仿真核心优势：⚡超快仿真速度：专为开关电源、高频模拟电路优化，引擎效率极高。高级器件模型：集成ADI高精度运放、电源IC等工业级模型（如LTC系列）。完全免费：无功能限制，商业项目
Linux 内存管理（六）之内存管理区
目录前言一、x86上的内存区域划分二、管理区结构1、structzone2、ZONE_PADDING三、高端内存1、高端内存的由来2、高端内存的访问3、高端内存的划分总结前言为了支持NUMA模型，也即CPU对不同内存单元的访问时间可能不同，此时系统的物理内存被划分为几个节点，一个节点对应一个内存簇bank，即每个内存簇被认为是一个节点。接着各个节点又被划分为内存管理区域，接下来将对内存管理区域进行
Linux五大网络IO模型 Acto
一、须知对于操作系统来说，空间会分为用户空间与内核空间用户空间：用户程序的运行空间。为了安全，它们是隔离的，即使用户的程序崩溃，内核也不会受到影响。只能执行简单的运算，不能直接调用系统资源，必须通过系统接口（systemcall），才能向内核发出指令。内核空间：这是Linux内核的运行空间，可以执行任意命令，调用系统的一切资源通过用户空间访问系统空间并让其帮助我们完成我们所需要执行的操作或者任务二
ADC模块在电路中的存在形式与主控(MCU)的关系、我是男生。单片机嵌入式硬件
四、ADC模块在电路中的存在形式与主控(MCU)的关系这是电子工程师必须彻底理解的要点！ADC的存在形式主要有三种：独立ADC芯片(DiscreteADCIC)：存在形式：一个单独的物理芯片(如TIADS1248,ADIAD7799)。与MCU关系：ADC芯片完成模拟信号采样、保持、量化、编码的全部工作。MCU通过数字通信接口(SPI,I2C,Parallel)向ADC发送控制命令(启动转换、选择
对话新希望CDO李旭昶：立足核心诉求，积极拥抱人工智能
“转型焕新，希望无限。”整理|王娴编辑|云舒出品｜极新4月12日，在「2024飞书先进生产力峰会|成都站」活动中，新希望首席数字官李旭昶先生做了主题为“转型焕新，希望无限”的分享。上次见他是4个月前，当时我们聊了1个多小时，内容涉及数字化转型、人工智能、管理、技术商业等话题。今天顺着他分享的内容，将这篇对话分享出来。随着信息科技的发展，我国传统企业在过去几年中逐步进行数字化转型，利用先进的科学技术
孩子大脑发育高峰期，父母千万不要错过！智秦数字出版
大脑发育从出生到3岁时最明显。宝宝大脑容量在5岁时已经发育了90%。越来越多的研究表明了早期教育的重要性，然而，早教并不是指单纯的知识灌输，重点在于大脑的开发，思维的训练.家长做些什么可以帮助孩子大脑发育？儿童教育专家给出了以下建议●●●1、在换尿布时、洗澡时、吃东西时经常和孩子说话。2、提供一个良好的环境，让宝宝有机会发展他的所有感觉——看、听、闻、触摸、尝。3、经常抚触孩子。4、说出物品的名字
学写人物稿要与人物合二为一静数秋天L
记得一位老师说，写人物稿要让自己与人物合二为一，成为这个人，设身处地与他同喜同悲，这样写出的人物才可能真实，才能活起来。对我来说，虽然有几年文书写作经验，但未经过正式写作训练，三十年搁笔，直到2018年，才开始在上写几句自嗨似的文字，且不会讲故事，完全和创作沾不上边。尤其今天想学习自媒体写作，更是小白一枚。尽管对老师的课有所理解，但眼高手低，实战经验为零。而且需放下多年来形成的，对文字字斟句酌的执
Flutter基础（前端教程①⑤-API请求转化为模型列成列表展示实战） aaiier Flutter flutter
models/post_model.dart定义Post数据模型包含fromJson()方法用于解析JSONcontrollers/post_controller.dart管理帖子数据的获取和状态使用http包请求API通过RxList和RxBool实现响应式状态管理views/post_list_view.dart展示帖子列表的UI使用Obx监听状态变化包含加载中、错误和数据展示三种状态main
飞算科技：以创新科技引领数字化变革，旗下飞算 JavaAI 成开发利器飞算JavaAI开发助手科技
作为国家级高新技术企业，飞算科技专注于自主创新，在数字科技领域持续深耕，用前沿技术为各行业客户赋能，助力其实现数字化转型升级的飞跃。飞算科技凭借深厚的技术积累，将互联网科技、大数据、人工智能等技术与实际应用紧密融合。公司组建了一支由行业资深专家和技术精英构成的团队，他们在相关领域积累了多年实践经验，深刻理解不同行业客户在数字化进程中面临的痛点与挑战。基于这些洞察，飞算科技推出了一系列具有创新性和实
Python爬虫实战：批量下载小红书笔记图片的全流程技术解析 Python爬虫项目 2025年爬虫实战项目 python 爬虫笔记开发语言音视频 github
1.引言：为什么要爬取小红书笔记图片小红书作为新兴的生活方式分享平台，聚集了大量高质量原创笔记内容，涵盖时尚、美妆、旅游、美食等多领域。笔记中的图片往往是内容的核心，批量下载小红书笔记图片，有助于：内容归档与备份数据分析与用户行为研究图像识别与机器学习训练电商推广及内容再加工但小红书对内容保护做得较好，爬取难度较高，需要结合多技术手段突破。2.小红书平台特点与爬取难点动态加载与API接口多变：页面
揭秘网络通信：数据传输的完整流程解析
网络通信是一个复杂但高度结构化的过程，涉及多个层次和协议的协作。以下是其核心原理和步骤的详细解析：1.网络通信的分层模型网络通信基于分层架构（如OSI七层模型或TCP/IP四层模型），每一层专注于特定功能，确保数据可靠传输：OSI模型TCP/IP模型功能应用层应用层提供用户接口（如HTTP、FTP、DNS）。表示层—数据格式转换（如加密、压缩）。会话层—建立、管理会话（如RPC、SQL）。传输层传
人脸识别实战：使用Python OpenCV 和深度学习进行人脸识别(2)
先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新Python全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课
Rust+ChatBoxAI：实战
ChatboxAIChatboxAI是一款基于人工智能技术的智能助手工具，旨在通过自然语言交互帮助用户完成多种任务。以下是其核心功能与特点：功能概述多模型支持：可连接OpenAI、Claude、Gemini等主流大语言模型，用户能自由切换不同AI服务。本地运行：支持离线使用，数据隐私性较强，适合敏感信息处理场景。跨平台兼容：提供Windows、macOS和Linux客户端，同步支持移动端应用。核心
高速通道的实用建模
正如MolexCorp.的DaveDunham喜欢说的那样，“在设计超过10GB/s的高速串行链路时，一切都很重要”。为了确保以这样的速度首次成功，准确的通道建模是先决条件。对于长背板通道尤其如此。尽管许多EDA工具都包含最新、最出色的导体表面粗糙度和宽带介电特性模型，但获得正确的参数来为模型提供数据始终是一项挑战。通常，唯一的来源仅来自数据表。但在大多数情况下，这些数字并不能直接转化为EDA工具
基于R、Python的Copula变量相关性分析及AI大语言模型应用阁楼里的小花儿 R语言 Python Copula变量相关性分析 AI大语言模型结构方程模型贝叶斯网络统计学
前言：在工程、水文和金融等各学科的研究中，总是会遇到很多变量，研究这些相互纠缠的变量间的相关关系是各学科的研究的重点。虽然皮尔逊相关、秩相关等相关系数提供了变量间相关关系的粗略结果，但这些系数都存在着无法克服的困难。例如，皮尔逊相关系数只能反映变量间的线性相关，而秩相关则更多的适用于等级变量。大多数情况下变量间的相关性非常复杂，而且随着变量取值的变化而变化，而这些相关系数都是全局性的，因此无法提供
林燕子分享有感:心里有人，眼里有活，你才能更快的走进别人的心里独处清幽
听了林燕子昨天在21天超级群主训练营的分享，给我的内心触动很大。林燕子本来也是训练营中一位普通的队员，一开始她最大的亮点是她的视觉笔记。但是这样的她是如何在短短一周内逆袭成为超级群主的群主呢？当她被乔帮主任命为超级群主群的群主时，我相信很多人都很羡慕她，也一定很后悔为什么一开始没有像她那样主动的为群里付出。因为她做的事情其实很多人也都可以做得到，只是没有行动而已。正如林燕子自己所说的:想都是问题，
轻松入门学python（四）python类的继承、添加与覆盖 Sunhen_Qiletian python 开发语言
Python类的继承、添加与覆盖：从语法到设计思想的完整指南————————————————————（全文约2000字，示例基于Python3.11）一、为什么要继承1.代码复用：子类自动拥有父类的属性与方法，减少重复。2.扩展与特化：在父类基础上增加新功能（添加），或改写已有实现（覆盖），使类型体系更符合领域模型。3.多态：通过继承+方法覆盖，实现“一个接口，多种实现”，让高层代码只依赖父类接口
【Java架构师的未来与趋势】架构学院 Java成神之路-架构师进阶 java 开发语言
Java架构师的未来与趋势引言Java作为企业级应用开发的主力军，已经走过了25年的历程。在这四分之一个世纪中，Java生态系统经历了从Applet到企业级应用，从单体架构到微服务，从本地部署到云原生的巨大转变。今天，Java架构师正站在新一轮技术变革的十字路口——人工智能、云计算、低代码、边缘计算等新兴技术正深刻重塑软件架构的形态和架构师的角色。据JetBrains《2023Java开发者调查》
【案例教程】基于R、Python的Copula变量相关性分析及AI大模型应用 AAIshangyanxiu 编程算法统计语言农林生态遥感生态环境 r语言 python 人工智能 copula函数变量相关性分析贝叶斯统计学
查看原文>>>https://mp.weixin.qq.com/s?__biz=MzAxNzcxMzc5MQ==&mid=2247726953&idx=6&sn=7ebd9948d54bbce401efdc908dbf67e2&scene=21#wechat_redirect在工程、水文和金融等各学科的研究中，总是会遇到很多变量，研究这些相互纠缠的变量间的相关关系是各学科的研究的重点。虽然皮尔逊相
2025 Java技术深度洞察：从性能革命到安全重构编***海科技 java
一、Java虚拟机的范式突破：虚拟线程与ZGC的协同进化Java22/23通过ProjectLoom将虚拟线程（VirtualThreads）正式带入生产环境，彻底重构并发编程模型。某电商平台将订单处理系统迁移至虚拟线程后，线程创建成本降低95%，单服务器并发处理能力从8000QPS提升至4.2万QPS。配合Java24引入的结构化并发（StructuredConcurrency），开发者可通过t
萌萌哒炫舞阳光
萌萌哒文/炫舞阳光今天，是这个学期的最后一天，我们这里的小学举行期末考试了。孩子们非常重视这次考试，所以来的都很早，而且都很自觉的“临阵磨枪”，那认真刻苦的样子，真叫一个磨刀霍霍、热火朝天。发卷子了，五个学生，五张桌子，单人单桌，和平时一个样子。每位同学都训练有素的派头，拿到卷子后，先填写学校、姓名，然后浏览大题，接着正式开始，进入启动“开战”模式。看她们一个个严肃认真的样子，心里感叹如今中国的孩
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs