Asionm

深度学习实践——模型推理优化练习

系列实验
深度学习实践——卷积神经网络实践：裂缝识别
深度学习实践——循环神经网络实践
深度学习实践——模型部署优化实践
深度学习实践——模型推理优化练习

深度学习实践——模型推理优化练习

- 模型推理优化练习
- - 架构设计练习
  - 知识蒸馏练习
  - 模型剪枝练习
  - 参数量化练习
- 算式检测模型压缩优化
- - 未优化前模型的大小与速度
  - 算式检测模型剪枝
  - 算式检测模型量化
- 算式识别模型压缩优化
- 实验结论

源码地址： https://pan.baidu.com/s/1PuWZF2DkG0-F5pQLMIkTcQ?pwd=c24s

模型推理优化练习

架构设计练习

通过代码修改，探索StudentNet中各参数对模型参数量的影响。

架构设计上的优化压缩，主要是通过减少神经网络的参数量来进行。在这里可以通过增减通道数，对通道数进行剪枝来对模型进行压缩优化。在网站所给的源码中，模型提供了两个参数对通道进行调整，首先是base参数，此参数直接用于定义初始的神经元的通道数。其次是width_mult，此参数是剪枝控制因子，为1时表示不剪枝。剪枝后通道数=剪枝前通道数*width_mult。

根据对参数的理解可以知道，base越小那么模型压缩得越小，同样width_mult越小也会压缩得越小。下面通过修改代码来验证假想。

默认参数输出

首先输出默认值的神经网络层与对于的参数大小：

主要代码如下，完整代码见于架构设计练习.py

model_default = StudentNet()
model_default.eval()
summary(model_default.to('cuda:0'), input_size=(3, 128, 128))

上面代码对应的输出结果如下，

----------------------------------------------------------------
        Layer (type)               Output Shape         Param #
================================================================
            Conv2d-1         [-1, 16, 128, 128]             448
       BatchNorm2d-2         [-1, 16, 128, 128]              32
             ReLU6-3         [-1, 16, 128, 128]               0
         MaxPool2d-4           [-1, 16, 64, 64]               0
            Conv2d-5           [-1, 16, 64, 64]             160
       BatchNorm2d-6           [-1, 16, 64, 64]              32
             ReLU6-7           [-1, 16, 64, 64]               0
            Conv2d-8           [-1, 32, 64, 64]             544
         MaxPool2d-9           [-1, 32, 32, 32]               0
           Conv2d-10           [-1, 32, 32, 32]             320
      BatchNorm2d-11           [-1, 32, 32, 32]              64
            ReLU6-12           [-1, 32, 32, 32]               0
           Conv2d-13           [-1, 64, 32, 32]           2,112
        MaxPool2d-14           [-1, 64, 16, 16]               0
           Conv2d-15           [-1, 64, 16, 16]             640
      BatchNorm2d-16           [-1, 64, 16, 16]             128
            ReLU6-17           [-1, 64, 16, 16]               0
           Conv2d-18          [-1, 128, 16, 16]           8,320
        MaxPool2d-19            [-1, 128, 8, 8]               0
           Conv2d-20            [-1, 128, 8, 8]           1,280
      BatchNorm2d-21            [-1, 128, 8, 8]             256
            ReLU6-22            [-1, 128, 8, 8]               0
           Conv2d-23            [-1, 256, 8, 8]          33,024
           Conv2d-24            [-1, 256, 8, 8]           2,560
      BatchNorm2d-25            [-1, 256, 8, 8]             512
            ReLU6-26            [-1, 256, 8, 8]               0
           Conv2d-27            [-1, 256, 8, 8]          65,792
           Conv2d-28            [-1, 256, 8, 8]           2,560
      BatchNorm2d-29            [-1, 256, 8, 8]             512
            ReLU6-30            [-1, 256, 8, 8]               0
           Conv2d-31            [-1, 256, 8, 8]          65,792
           Conv2d-32            [-1, 256, 8, 8]           2,560
      BatchNorm2d-33            [-1, 256, 8, 8]             512
            ReLU6-34            [-1, 256, 8, 8]               0
           Conv2d-35            [-1, 256, 8, 8]          65,792
AdaptiveAvgPool2d-36            [-1, 256, 1, 1]               0
           Linear-37                   [-1, 11]           2,827
================================================================
Total params: 256,779
Trainable params: 256,779
Non-trainable params: 0
----------------------------------------------------------------
Input size (MB): 0.19
Forward/backward pass size (MB): 13.13
Params size (MB): 0.98
Estimated Total Size (MB): 14.29
----------------------------------------------------------------

降低base值的结果

model_base12 = StudentNet(base=12)
model_base12.eval()
summary(model_base12.to('cuda:0'), input_size=(3, 128, 128))

其结果如下：

----------------------------------------------------------------
        Layer (type)               Output Shape         Param #
================================================================
            Conv2d-1         [-1, 12, 128, 128]             336
       BatchNorm2d-2         [-1, 12, 128, 128]              24
             ReLU6-3         [-1, 12, 128, 128]               0
         MaxPool2d-4           [-1, 12, 64, 64]               0
            Conv2d-5           [-1, 12, 64, 64]             120
       BatchNorm2d-6           [-1, 12, 64, 64]              24
             ReLU6-7           [-1, 12, 64, 64]               0
            Conv2d-8           [-1, 24, 64, 64]             312
         MaxPool2d-9           [-1, 24, 32, 32]               0
           Conv2d-10           [-1, 24, 32, 32]             240
      BatchNorm2d-11           [-1, 24, 32, 32]              48
            ReLU6-12           [-1, 24, 32, 32]               0
           Conv2d-13           [-1, 48, 32, 32]           1,200
        MaxPool2d-14           [-1, 48, 16, 16]               0
           Conv2d-15           [-1, 48, 16, 16]             480
      BatchNorm2d-16           [-1, 48, 16, 16]              96
            ReLU6-17           [-1, 48, 16, 16]               0
           Conv2d-18           [-1, 96, 16, 16]           4,704
        MaxPool2d-19             [-1, 96, 8, 8]               0
           Conv2d-20             [-1, 96, 8, 8]             960
      BatchNorm2d-21             [-1, 96, 8, 8]             192
            ReLU6-22             [-1, 96, 8, 8]               0
           Conv2d-23            [-1, 192, 8, 8]          18,624
           Conv2d-24            [-1, 192, 8, 8]           1,920
      BatchNorm2d-25            [-1, 192, 8, 8]             384
            ReLU6-26            [-1, 192, 8, 8]               0
           Conv2d-27            [-1, 192, 8, 8]          37,056
           Conv2d-28            [-1, 192, 8, 8]           1,920
      BatchNorm2d-29            [-1, 192, 8, 8]             384
            ReLU6-30            [-1, 192, 8, 8]               0
           Conv2d-31            [-1, 192, 8, 8]          37,056
           Conv2d-32            [-1, 192, 8, 8]           1,920
      BatchNorm2d-33            [-1, 192, 8, 8]             384
            ReLU6-34            [-1, 192, 8, 8]               0
           Conv2d-35            [-1, 192, 8, 8]          37,056
AdaptiveAvgPool2d-36            [-1, 192, 1, 1]               0
           Linear-37                   [-1, 11]           2,123
================================================================
Total params: 147,563
Trainable params: 147,563
Non-trainable params: 0
----------------------------------------------------------------
Input size (MB): 0.19
Forward/backward pass size (MB): 9.85
Params size (MB): 0.56
Estimated Total Size (MB): 10.60
----------------------------------------------------------------

可以看到与默认值相比，网络层的变量数减少了，网络层发送了变化，对模型进行了压缩。再依次减少base值，以模型为因变量base值为自变量可绘制下图。

可知模型的大小与base值基本成正比关系。

降低width_mult值的结果

model_mul0_8 = StudentNet(width_mult=0.8)
model_mul0_8.eval()
summary(model_mul0_8.to('cuda:0'), input_size=(3, 128, 128))

其结果如下：

----------------------------------------------------------------
        Layer (type)               Output Shape         Param #
================================================================
            Conv2d-1         [-1, 16, 128, 128]             448
       BatchNorm2d-2         [-1, 16, 128, 128]              32
             ReLU6-3         [-1, 16, 128, 128]               0
         MaxPool2d-4           [-1, 16, 64, 64]               0
            Conv2d-5           [-1, 16, 64, 64]             160
       BatchNorm2d-6           [-1, 16, 64, 64]              32
             ReLU6-7           [-1, 16, 64, 64]               0
            Conv2d-8           [-1, 32, 64, 64]             544
         MaxPool2d-9           [-1, 32, 32, 32]               0
           Conv2d-10           [-1, 32, 32, 32]             320
      BatchNorm2d-11           [-1, 32, 32, 32]              64
            ReLU6-12           [-1, 32, 32, 32]               0
           Conv2d-13           [-1, 64, 32, 32]           2,112
        MaxPool2d-14           [-1, 64, 16, 16]               0
           Conv2d-15           [-1, 64, 16, 16]             640
      BatchNorm2d-16           [-1, 64, 16, 16]             128
            ReLU6-17           [-1, 64, 16, 16]               0
           Conv2d-18          [-1, 102, 16, 16]           6,630
        MaxPool2d-19            [-1, 102, 8, 8]               0
           Conv2d-20            [-1, 102, 8, 8]           1,020
      BatchNorm2d-21            [-1, 102, 8, 8]             204
            ReLU6-22            [-1, 102, 8, 8]               0
           Conv2d-23            [-1, 204, 8, 8]          21,012
           Conv2d-24            [-1, 204, 8, 8]           2,040
      BatchNorm2d-25            [-1, 204, 8, 8]             408
            ReLU6-26            [-1, 204, 8, 8]               0
           Conv2d-27            [-1, 204, 8, 8]          41,820
           Conv2d-28            [-1, 204, 8, 8]           2,040
      BatchNorm2d-29            [-1, 204, 8, 8]             408
            ReLU6-30            [-1, 204, 8, 8]               0
           Conv2d-31            [-1, 204, 8, 8]          41,820
           Conv2d-32            [-1, 204, 8, 8]           2,040
      BatchNorm2d-33            [-1, 204, 8, 8]             408
            ReLU6-34            [-1, 204, 8, 8]               0
           Conv2d-35            [-1, 256, 8, 8]          52,480
AdaptiveAvgPool2d-36            [-1, 256, 1, 1]               0
           Linear-37                   [-1, 11]           2,827
================================================================
Total params: 179,637
Trainable params: 179,637
Non-trainable params: 0
----------------------------------------------------------------
Input size (MB): 0.19
Forward/backward pass size (MB): 12.72
Params size (MB): 0.69
Estimated Total Size (MB): 13.59
----------------------------------------------------------------

可知模型的大小与width_mul值基本成正比例关系，但是相对于base值其压缩的范围有限。

知识蒸馏练习

从案例中可以看出蒸馏后的student模型相比预训练的teacher模型，在性能上下降很多。请分析原因，并探索进一步提升student模型性能的方法。.

原因：

从网站的案例中可知，学生网络已经训练了很多轮次，理论上应该与教师网络的准确度相似，但是从结果可知还是差了很多。学生网络与教师网络有两大区别，其中之一是教师网路已经进行了充分训练，而学生网络一开始并未进行训练；其二是学生网络与教师网络的结构并不一致。

对于第一个不同，可以通过知识蒸馏的方法进行充分训练而消除，而第二个则不能。于是其性能不如教师网络的很大一个原因应该是其网络结构。于是打印教师网络和学生网络的结构进行对比，通过如下代码（具体代码见知识蒸馏.py）进行打印。

teacher_net = models.resnet18(pretrained=False, num_classes=11)
teacher_net.load_state_dict(torch.load(f'./teacher_resnet18.bin'))
student_net = StudentNet(base=16)
print("teacher Net")
summary(teacher_net.to('cuda:0'), input_size=(3, 128, 128))
print("\n\n\nstudent Net")
summary(student_net.to('cuda:0'), input_size=(3, 128, 128))

教师网络

----------------------------------------------------------------
        Layer (type)               Output Shape         Param #
================================================================
            Conv2d-1           [-1, 64, 64, 64]           9,408
       BatchNorm2d-2           [-1, 64, 64, 64]             128
              ReLU-3           [-1, 64, 64, 64]               0
         MaxPool2d-4           [-1, 64, 32, 32]               0
            Conv2d-5           [-1, 64, 32, 32]          36,864
       BatchNorm2d-6           [-1, 64, 32, 32]             128
              ReLU-7           [-1, 64, 32, 32]               0
            Conv2d-8           [-1, 64, 32, 32]          36,864
       BatchNorm2d-9           [-1, 64, 32, 32]             128
             ReLU-10           [-1, 64, 32, 32]               0
       BasicBlock-11           [-1, 64, 32, 32]               0
           Conv2d-12           [-1, 64, 32, 32]          36,864
      BatchNorm2d-13           [-1, 64, 32, 32]             128
             ReLU-14           [-1, 64, 32, 32]               0
           Conv2d-15           [-1, 64, 32, 32]          36,864
      BatchNorm2d-16           [-1, 64, 32, 32]             128
             ReLU-17           [-1, 64, 32, 32]               0
       BasicBlock-18           [-1, 64, 32, 32]               0
           Conv2d-19          [-1, 128, 16, 16]          73,728
      BatchNorm2d-20          [-1, 128, 16, 16]             256
             ReLU-21          [-1, 128, 16, 16]               0
           Conv2d-22          [-1, 128, 16, 16]         147,456
      BatchNorm2d-23          [-1, 128, 16, 16]             256
           Conv2d-24          [-1, 128, 16, 16]           8,192
      BatchNorm2d-25          [-1, 128, 16, 16]             256
             ReLU-26          [-1, 128, 16, 16]               0
       BasicBlock-27          [-1, 128, 16, 16]               0
           Conv2d-28          [-1, 128, 16, 16]         147,456
      BatchNorm2d-29          [-1, 128, 16, 16]             256
             ReLU-30          [-1, 128, 16, 16]               0
           Conv2d-31          [-1, 128, 16, 16]         147,456
      BatchNorm2d-32          [-1, 128, 16, 16]             256
             ReLU-33          [-1, 128, 16, 16]               0
       BasicBlock-34          [-1, 128, 16, 16]               0
           Conv2d-35            [-1, 256, 8, 8]         294,912
      BatchNorm2d-36            [-1, 256, 8, 8]             512
             ReLU-37            [-1, 256, 8, 8]               0
           Conv2d-38            [-1, 256, 8, 8]         589,824
      BatchNorm2d-39            [-1, 256, 8, 8]             512
           Conv2d-40            [-1, 256, 8, 8]          32,768
      BatchNorm2d-41            [-1, 256, 8, 8]             512
             ReLU-42            [-1, 256, 8, 8]               0
       BasicBlock-43            [-1, 256, 8, 8]               0
           Conv2d-44            [-1, 256, 8, 8]         589,824
      BatchNorm2d-45            [-1, 256, 8, 8]             512
             ReLU-46            [-1, 256, 8, 8]               0
           Conv2d-47            [-1, 256, 8, 8]         589,824
      BatchNorm2d-48            [-1, 256, 8, 8]             512
             ReLU-49            [-1, 256, 8, 8]               0
       BasicBlock-50            [-1, 256, 8, 8]               0
           Conv2d-51            [-1, 512, 4, 4]       1,179,648
      BatchNorm2d-52            [-1, 512, 4, 4]           1,024
             ReLU-53            [-1, 512, 4, 4]               0
           Conv2d-54            [-1, 512, 4, 4]       2,359,296
      BatchNorm2d-55            [-1, 512, 4, 4]           1,024
           Conv2d-56            [-1, 512, 4, 4]         131,072
      BatchNorm2d-57            [-1, 512, 4, 4]           1,024
             ReLU-58            [-1, 512, 4, 4]               0
       BasicBlock-59            [-1, 512, 4, 4]               0
           Conv2d-60            [-1, 512, 4, 4]       2,359,296
      BatchNorm2d-61            [-1, 512, 4, 4]           1,024
             ReLU-62            [-1, 512, 4, 4]               0
           Conv2d-63            [-1, 512, 4, 4]       2,359,296
      BatchNorm2d-64            [-1, 512, 4, 4]           1,024
             ReLU-65            [-1, 512, 4, 4]               0
       BasicBlock-66            [-1, 512, 4, 4]               0
AdaptiveAvgPool2d-67            [-1, 512, 1, 1]               0
           Linear-68                   [-1, 11]           5,643
================================================================
Total params: 11,182,155
Trainable params: 11,182,155
Non-trainable params: 0
----------------------------------------------------------------
Input size (MB): 0.19
Forward/backward pass size (MB): 20.50
Params size (MB): 42.66
Estimated Total Size (MB): 63.35
----------------------------------------------------------------

学生网络

----------------------------------------------------------------
        Layer (type)               Output Shape         Param #
================================================================
            Conv2d-1         [-1, 16, 128, 128]             448
       BatchNorm2d-2         [-1, 16, 128, 128]              32
             ReLU6-3         [-1, 16, 128, 128]               0
         MaxPool2d-4           [-1, 16, 64, 64]               0
            Conv2d-5           [-1, 16, 64, 64]             160
       BatchNorm2d-6           [-1, 16, 64, 64]              32
             ReLU6-7           [-1, 16, 64, 64]               0
            Conv2d-8           [-1, 32, 64, 64]             544
         MaxPool2d-9           [-1, 32, 32, 32]               0
           Conv2d-10           [-1, 32, 32, 32]             320
      BatchNorm2d-11           [-1, 32, 32, 32]              64
            ReLU6-12           [-1, 32, 32, 32]               0
           Conv2d-13           [-1, 64, 32, 32]           2,112
        MaxPool2d-14           [-1, 64, 16, 16]               0
           Conv2d-15           [-1, 64, 16, 16]             640
      BatchNorm2d-16           [-1, 64, 16, 16]             128
            ReLU6-17           [-1, 64, 16, 16]               0
           Conv2d-18          [-1, 128, 16, 16]           8,320
        MaxPool2d-19            [-1, 128, 8, 8]               0
           Conv2d-20            [-1, 128, 8, 8]           1,280
      BatchNorm2d-21            [-1, 128, 8, 8]             256
            ReLU6-22            [-1, 128, 8, 8]               0
           Conv2d-23            [-1, 256, 8, 8]          33,024
           Conv2d-24            [-1, 256, 8, 8]           2,560
      BatchNorm2d-25            [-1, 256, 8, 8]             512
            ReLU6-26            [-1, 256, 8, 8]               0
           Conv2d-27            [-1, 256, 8, 8]          65,792
           Conv2d-28            [-1, 256, 8, 8]           2,560
      BatchNorm2d-29            [-1, 256, 8, 8]             512
            ReLU6-30            [-1, 256, 8, 8]               0
           Conv2d-31            [-1, 256, 8, 8]          65,792
           Conv2d-32            [-1, 256, 8, 8]           2,560
      BatchNorm2d-33            [-1, 256, 8, 8]             512
            ReLU6-34            [-1, 256, 8, 8]               0
           Conv2d-35            [-1, 256, 8, 8]          65,792
AdaptiveAvgPool2d-36            [-1, 256, 1, 1]               0
           Linear-37                   [-1, 11]           2,827
================================================================
Total params: 256,779
Trainable params: 256,779
Non-trainable params: 0
----------------------------------------------------------------
Input size (MB): 0.19
Forward/backward pass size (MB): 13.13
Params size (MB): 0.98
Estimated Total Size (MB): 14.29
----------------------------------------------------------------

从上面的两个输出结果可知，学生网络相较于教师网络是比较小的，教师网络总共有11,182,155个参数，而学生网络只有256,779个。而我们知道模型的变量越多其拟合效果应当是越好的，那么可知教师网络明显多于学生网络，所以必然其准确率也比学生网络的高。

提升student模型性能的方法

对于学生模型的提升，从上面的原因分析可知。如果可以修改网络结构，则可以从网络结构方面提升。
其次可以寻找更强大的教师模型进行知识蒸馏以达到更高的准确率。
还可以通过增大数据集的方法，进行更高强度的训练。
通过调整参数以寻找更好的结果。

模型剪枝练习

类型单Module裁剪中的示例，对conv1的bias进行L1unstructured方法裁剪。

对于bias的剪枝，相对于weight只需要改变指定值即可，裁剪的代码基本于网站上的一致，只改变了下面的部分（具体代码见模型剪枝1.py）：

module = model.conv1
print(module.bias)
prune.l1_unstructured(module,name="bias",amount=0.3)
print(module.bias)

对上面代码进行运行后可得，

Parameter containing:
tensor([-0.2817, -0.0636,  0.0237,  0.2616, -0.3117, -0.0650], device='cuda:0',
       requires_grad=True)
tensor([-0.2817, -0.0000,  0.0000,  0.2616, -0.3117, -0.0650], device='cuda:0j',
       grad_fn=)

可见除了第2第3个数变为0给剪掉外，其他的均未变。

在实战案例中，batchsize对裁剪性能是否有影响？其他超参数呢？

对裁剪的参数逐个进行调整进行如下实验，相关代码见模型剪枝2.py

batchsize的影响

首先将数据集变小，然后修改batchsize分别为24、48、72对比其输出的剪枝结果。具体代码可见模型剪枝2.py。得到的结果如下：

修建后网络的结果：
- batchsize为72时的模型预估大小为52.85MB
- batchsize为48时的模型预估大小为52.85MB
- batchsize为24时的模型预估大小为52.85MB
可以发现batchsize对剪枝的效果是没有影响的。
prune_rate的影响

将prune_rate分为0.75、0.85、0.95进行实验

修建后网络的结果：
- prune_rate为0.75时的模型预估大小为48.90MB
- prune_rate为0.85时的模型预估大小为50.61MB
- prune_rate为0.95时的模型预估大小为52.85MB
可以发现当prune_rate越小时对应的剪枝压缩效果也越好。
prune_count的影响

将prune_count分为1、2、3进行实验

修建后网络的结果：
- prune_count为1时的模型预估大小为53.74MB
- prune_count为2时的模型预估大小为53.29MB
- prune_count为3时的模型预估大小为52.85MB
可以发现当prune_count越小时对应的剪枝压缩效果越差。

参数量化练习

查阅PyTorch的参考文档，实践其他量化方法，并做性能对比分析。

在查阅完Pytorch文档后，发现pytorch提供一个名为Eager Mode Quantization的API 用于量化。此API提供了3中量化模式，在此我使用了其动态量化与静态量化的功能对模型进行了量化。下面我将分别利用此API对学生网络模型进行量化。

动态模型量化

根据官方文档可知，动态量化是比较简单的一种量化，只需要指定模型、需要量化的层、量化类型即可。而动态量化一般只对线性层和LSTM层起作用，对于卷积层是不起作用的。而student_net是卷积层比较多，所以初步估计动态量化的效果不佳。下面为代码实现部分详细代码见动态量化.py。下面只展示未在网站上显示过的代码片段：

加载模型

student_net_fp32 = StudentNet(base=16)
device = "cpu"
student_net_fp32.load_state_dict(torch.load(f'./student_custom_small.bin'))
print('Model Loaded')

模型动态量化

student_net_int8 = torch.quantization.quantize_dynamic(
    student_net_fp32,
    {torch.nn.Linear},
    dtype=torch.qint8)

验证集加载以及模型时间效率评估

valid_dataloader = data_load()
student_net_fp32.eval()
student_net_int8.eval()
fp32_st = time.time()
valid_loss_fp32 = run_test_epoch(valid_dataloader, student_net_fp32)
fp32_time = time.time() - fp32_st
int8_st = time.time()
valid_loss_int8 = run_test_epoch(valid_dataloader, student_net_int8)
int8_time = time.time() - int8_st
print("valid_loss_fp32:",valid_loss_fp32,",time:",fp32_time)
print("valid_loss_int8:",valid_loss_int8,",time:",int8_time)

模型大小比较（代码参考于：https://github.com/pytorch/tutorials/blob/master/recipes_source/recipes/dynamic_quantization.py）

def print_size_of_model(model, label=""):
    torch.save(model.state_dict(), "temp.p")
    size=os.path.getsize("temp.p")
    print("model: ",label,' \t','Size (KB):', size/1e3)
    os.remove('temp.p')
    return size

# 模型大小比较
f=print_size_of_model(student_net_fp32,"fp32")
q=print_size_of_model(student_net_int8,"int8")
print("{0:.2f} times smaller".format(f/q))

最后的运行结果如下：

可以看到动态量化的效果并不是很好，在推理时间方面，int类型的甚至大于fp32原型的，量化后的结果差于量化前的。而其准确率两者基本一致，对于最后模型的大小，量化后的模型基本完全没有优势，量化后的模型大小未1045KB而量化前的是1053KB，相距不大。

静态模型量化

静态模型量化相对于动态量化会复杂一点，相对于动态量化而言，它们都是把网络的权重参数转从float32转换为int8。然而他们间也有很大的不同点，那就是静态量化需要把训练集或者和训练集分布类似的数据喂给模型，然后通过每个op输入的分布特点来计算activation的量化参数。静态量化更适合于卷积神经网络，而实验中所用到的student_net就是卷积神经网络，所以静态量化在此上面应该会有较好效果，下面为代码实现部分详细代码见静态量化.py。代码内容主要与动态量化的一致，以下主要展示量化的代码：

valid_dataloader = data_load()
student_net_fp32.eval()
student_net_fp32.qconfig = torch.quantization.get_default_qconfig('fbgemm')
student_net_fp32_prepared = torch.quantization.prepare(student_net_fp32)
# 先读取部分数据用于定位
for batch_data in tqdm(valid_dataloader):
    # 获取数据
    inputs, hard_labels = batch_data
    # 只是做validation的话，就不用计算梯度
    with torch.no_grad():
        student_net_fp32_prepared(inputs.to(device))

student_net_int8 = torch.quantization.convert(student_net_fp32_prepared)

除了定义量化的方法外，其网络结构也需要添加内容。需要在初始化时定义量化方法与逆量化方法，内容如下：

class StudentNet(nn.Module):
    def __init__(self, base=16, width_mult=1):
        super(StudentNet, self).__init__()
        multiplier = [1, 2, 4, 8, 16, 16, 16, 16]
        bandwidth = [base * m for m in multiplier]  # 每层输出的channel数量
        for i in range(3, 7):  # 对3/4/5/6层进行剪枝
            bandwidth[i] = int(bandwidth[i] * width_mult)
        self.cnn = nn.Sequential(...)
        # 直接将CNN的输出映射到11维作为最终输出
        self.fc = nn.Sequential(
            nn.Linear(bandwidth[7], 11)
        )
        self.quant = torch.quantization.QuantStub()
        self.dequant = torch.quantization.DeQuantStub()

    def forward(self, x):
        x = self.quant(x)
        x = self.cnn(x)
        x = x.view(x.size(0), -1)
        x = self.fc(x)
        x = self.dequant(x)
        return x

最后对验证集进行推理，得到一下的结果，

可见量化后的准确率明显偏低，与未量化前相差了两倍，但是量化后在运行时间方面是略优于未量化前的。而量化后最大的成果是其模型大小相对于未量化小了接近3倍。虽然模型大小小了3倍，但是其正确率实在太低，而不能有效使用，正确率方面的问题可能与网络结构有一定的联系。

算式检测模型压缩优化

算式检测模型是通过yolo训练得到的，它是基于yolov5s模型作为预训练模型得到的。而训练得到的结果，发现还有很多优化的地方，例如可以通过剪枝、量化等方式压缩模型的大小以节省存储空间，同时也可以通过此加快训练速度。而在这些压缩过程中虽然模型的精度会降低但是相对于存储空间的减少与推理数度的提升，其价值仍然很大。下面将对模型剪枝和量化两个方面对算式识别模型就行压缩优化以达到更好的效果。

未优化前模型的大小与速度

此算式识别模型是预先进行了训练的，最后得到了equation.pt的权重文件，先通过yolo自带的val.py文件查看模型对验证集的推理效果。进入yolov5文件夹后，输入下面的指令进行评估：

python val.py --weights ../equation.pt --data equation.yaml --img 640

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WKuRkJHP-1690719177664)(D:\学习资料\大三上\大三上资料\大三上资料\深度学习实践\作业\实验\实验5\文档记录.assets\image-20221206164134924.png)]$

可以看到其精确率、召回率、mAP50分别未0.997、0.999、0.994，而其预处理时间为1.8ms每张照片、推理为227.9ms每张。

算式检测模型剪枝

yolo提供的剪枝方法

根据yolo的说明文档（https://github.com/ultralytics/yolov5/issues/304），在val.py中插入模型剪枝语句以达到简单剪枝的效果。

需要在yolo源文件下的，val.py的第156行中添加如下的代码。
```
# prune
from utils.torch_utils import prune
prune(model, 0.3)
```
此代码经过搜索发现，其实yolo内部有提供剪枝的工具，在utils文件夹下的``torch_utils.py`文件中，其具体代码如下：
```
def prune(model, amount=0.3):
    # Prune model to requested global sparsity
    import torch.nn.utils.prune as prune
    for name, m in model.named_modules():
        if isinstance(m, nn.Conv2d):
            prune.l1_unstructured(m, name='weight', amount=amount)  # prune
            prune.remove(m, 'weight')  # make permanent
    LOGGER.info(f'Model pruned to {sparsity(model):.3g} global sparsity')
```
可以发现它使用了pytorch的API接口进行模型剪枝，对每个含有卷积的层都进行了默认30%的剪枝。

在val.py中嵌入以上代码后，开始对验证集进行推理，查看变化。其结果如下：

可以看到其精确率、召回率、mAP50的值均有稍微降低，而其运行时间基本上没有太大变化。在后面查看yolo上github的issue后发现他们的结果也是差不多的，剪枝后效果基本没有，大小也并没有给压缩。
另外的剪枝方法

除了yolo提供的剪枝方法后，在网络上（https://github.com/ZJU-lishuang/yolov5_prune）也找到了另外的一些剪枝方法。现尝试此方法对模型进行剪枝。

然而在测试后发现，此方法并不完善，在处理过很多次报错后均无法进行下一步的运行，所以最后放弃剪枝的方法。

算式检测模型量化

尝试寻找yolo的检测模型的量化方法，但是一直未找到，最后在github的issue中找到了对应的yolov5模型量化的问题，但是发现问题是20年提出的，但是在22年却仍未解决，yolo作者说cpu上运行的yolo无法进行int8量化，所以最后放弃了模型的量化。

https://github.com/ultralytics/yolov5/issues/1288

算式识别模型压缩优化

对于算式识别模型我使用的是模型量化的方法进行压缩优化，此处的算式识别模型是之前放弃的一个文字识别模型，此模型是直接选取easyocr提供的，由于后期选用的是paddleocr进行训练，所以放弃了easyocr，而paddleocr暂未训练完成所以此处选用easyocr作为实验对象对其进行压缩优化。

而对于压缩优化，我选用了量化的方法，将32位浮点数变为int8以实现在存储上的压缩以及推理的加速，此处只用于对模型进行压缩，而推理并不做评价。

模型下载

模型的下载主要是参考与作者github的链接：https://github.com/JaidedAI/EasyOCR/blob/master/custom_model.md

下载完成后有三个文件分别为custom_example.pth、custom_example.py、custom_example.yaml，其分别为权重文件、神经网络文件以及配置文件，此处只用到前两个。

模型加载

对于模型的加载直接在custom_example.py中编辑即可，

在源代码的基础上加上下面的代码即可加载完毕，

# 模型加载
model = Model(input_channel=1,output_channel=256,hidden_size=256,num_class=97)
dic = torch.load(f'./custom_example.pth')
model.load_state_dict(dic,False)

动态量化

可以知道此神经网络拥有很多的LSTM层，所以此处适合用动态量化。动态量化代码如下：

model_int8 = torch.quantization.quantize_dynamic(
    model,
    {torch.nn.Linear, torch.nn.LSTM},
    dtype=torch.qint8)

量化结果前后对比

对于量化的结果此处只讨论模型大小，定义一函数来获取模型的大小并进行比较。其代码如下：

def print_size_of_model(model, label=""):
    torch.save(model.state_dict(), "temp.p")
    size=os.path.getsize("temp.p")
    print("model: ",label,' \t','Size (KB):', size/1e3)
    os.remove('temp.p')
    return size

# 模型大小比较
f=print_size_of_model(model,"fp32")
q=print_size_of_model(model_int8,"int8")

输出的结果如下：

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9rubvI7A-1690719177669)(D:\学习资料\大三上\大三上资料\大三上资料\深度学习实践\作业\实验\实验5\文档记录.assets\image-20221206215301213-16703347822271.png)]$

可以看到模型的大小压缩到了原来的 $\frac{1}{2}$ ，说明动态量化对模型起到了一定的优化。

实验结论

在本次实验中，成功完成了基本要求中的多项练习，包括探讨架构设计中通道数改变对神经网络的影响、学生网络网络最终并不能比教师网络好的原因、剪枝参数的影响、pytorch量化方法的实现等等。其中发现模型架构设计练习中模型大小与base值和width_mult值均为正相关关系。在知识蒸馏的练习中，发现阻碍学生网络进一步提升的原因可能为神经网络的架构，教师网络相对学生网络更深，效果也更好。在模型量化练习中，复现了动态量化和静态量化，发现动态量化更适合于存在线性层和LSTM的神经网络使用，而静态量化更适合卷积神经网络使用。
除了完成基本要求外，我还对算式检测模型和算式内容提取模型尝试了压缩优化。对于检测模型，由于是使用yolo工具进行训练和使用的，所以直接使用了yolo的模型剪枝接口进行了压缩，然而压缩后的结果却并不好，其准确率有稍微降低，但是模型大小却无变化，推理的速度也无变化。最后猜测这可能剪枝接口直接将参数变为0而不是去除有关，而且还可能与运行的设备为CPU存在关联。对于内容提取的模型，我使用的是easyocr的模型。对于此模型我对它使用了量化的方法将其参数从32位浮点数变为了8位浮点数，最后模型的大小缩小了一般，同时验证优化的成功性。

你可能感兴趣的:(人工智能,深度学习,人工智能)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
Reflection 70B——HyperWrite推出的大型语言模型新加坡内哥谈技术语言模型人工智能自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/在AI技术飞速发展的过程中，我们已经见证了可以写作、编程，甚至创造艺术的模型问世。但有一
5条实操干货有效打造你的个人品牌长安行动派
这是ZerK的第46篇原创相信大家对个人品牌这个词已经不在陌生。尤其是在知识付费的年代，你的个人品牌，就是你的标签！在《深度工作》中说到，在未来有三种人会越来越贵第一种人:能与机器对话，操纵机器的人。人工智能时代的到来，机器毕竟部分取代人类。第二种人:IP，知识产权或者文学潜在财产就像有些网上课程一周卖出的钱和一个机构卖一年一样多。价值99元的课程，10万人购买，是很常见的。爱产出大概就是10万✖
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本