Strawssberry778

【图像分类案例】(9) MobileNetV3 癌症图像二分类，附Pytorch完整代码

大家好，今天和各位分享一下如何使用 Pytorch 构建 MobileNetV3 卷积神经网络，并基于 权重迁移学习 方法解决图像二分类问题，并且评价数据集的 召回率、精准率、F1 等。

MobileNetV3 的原理和 TensorFlow2 实现方法可以看我下面这篇博文，强烈建议大家先看一下，本文就不赘述原理了：

https://blog.csdn.net/dgvv4/article/details/123476899

1. 模型构建

首先导入网络构建过程中需要用到的所有工具包，本小节的代码都写在 MobileNetV3.py 文件下


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       import torch
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       from torch 
       import nn
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       from torchstat 
       import stat  
       # 查看网络参数

1.1 构建标准卷积块

标准卷积块是由 卷积层+BN层+激活函数 这三个部分组成的，先将标准卷积块打个包，方便后面使用。

这里要注意，padding=kernel_size//2 保证卷积前后的特征图size不变，相当于 TensorFlow 中的 padding = 'same'。如果卷积层下面直接跟 BN 层，那么卷积层就不需要 bias 偏置，会浪费内存资源。此外，MobileNetV3 主干网络中有2种激活函数：ReLU 和 Hardswish 激活函数；而 SE 通道注意力机制中使用 Hardsigmoid 函数。

代码如下：


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # ---------------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       #（2）标准卷积模块
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       '''
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       in_channel：输入特征图的通道数
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       out_channel： 卷积输出的通道数
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       kernel_size： 卷积核尺寸
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       stride： 卷积的步长
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       activation：'RE'和'HS'，使用RELU激活还是HardSwish激活
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       '''
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # ---------------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       class 
       conv_block(nn.Module):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       def 
       __init__(
       self, in_channel, out_channel, kernel_size, stride, activation):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       super(conv_block, self).__init__()
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 普通卷积
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.conv = nn.Conv2d(in_channels=in_channel, out_channels=out_channel, kernel_size=kernel_size,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                                     stride=stride, padding=kernel_size//
       2, bias=
       False)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # BN标准化
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.bn = nn.BatchNorm2d(num_features=out_channel)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 使用何种激活函数
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       if activation == 
       'RE':
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   self.act = nn.ReLU(inplace=
       True)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       elif activation == 
       'HS':
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   self.act = nn.Hardswish(inplace=
       True)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 前向传播
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       def 
       forward(
       self, inputs):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 卷积+BN+激活
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               x = self.conv(inputs)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               x = self.bn(x)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               x = self.act(x)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       return x

1.2 SE 通道注意力机制

SE 注意力机制是对特征图的每个通道增加权重，增强对当前识别任务重要的通道，弱化无用通道，具体操作步骤如下：

（1）先将特征图进行全局平均池化，特征图有多少个通道，那么池化结果（一维向量）就有多少个元素，[h, w, c]==>[None, c]。

（2）然后经过两个全连接层得到输出向量。第一个全连接层的输出通道数等于原输入特征图的通道数的1/4；第二个全连接层的输出通道数等于原输入特征图的通道数。即先降维后升维。

（3）全连接层的输出向量可理解为，向量的每个元素是对每张特征图进行分析得出的权重关系。比较重要的特征图就会赋予更大的权重，即该特征图对应的向量元素的值较大。反之，不太重要的特征图对应的权重值较小。

（4）第一个全连接层使用 ReLU 激活函数，第二个全连接层使用 hard_sigmoid 激活函数，将通道权重归一化。

（5）经过两个全连接层得到一个由 channel 个元素组成的向量，每个元素是针对每个通道的权重，将归一化后的通道权重和原特征图的对应相乘，得到新的特征图数据。

代码如下：


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # ---------------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       #（3）SE注意力机制
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       '''
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       in_channel：代表输入特征图的通道数
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       ratio：第一个全连接层下降的通道数
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       '''
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # ---------------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       class 
       se_block(nn.Module):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       def 
       __init__(
       self, in_channel, ratio=4):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       super(se_block, self).__init__()
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 全局平均池化, [b,c,h,w]==>[b,c,1,1]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.avg_pool = nn.AdaptiveAvgPool2d(output_size=
       1)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 第一个全连接层，将通道数下降为原来的四分之一
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.fc1 = nn.Linear(in_features=in_channel, out_features=in_channel//ratio, bias=
       False)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # relu激活函数
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.relu = nn.ReLU()
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 第二个全连接层，恢复通道数
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.fc2 = nn.Linear(in_features=in_channel//ratio, out_features=in_channel, bias=
       False)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # hard_sigmoid激活函数，通道权值归一化
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.hsigmoid = nn.Hardsigmoid()
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 前向传播
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       def 
       forward(
       self, inputs):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 获取输入图像的shape
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               b, c, h, w = inputs.shape
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 全局平均池化 [b,c,h,w]==>[b,c,1,1]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               x = self.avg_pool(inputs)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 维度调整 [b,c,1,1]==>[b,c]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               x = x.view([b,c])
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 第一个全连接下降通道 [b,c]==>[b,c//4]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               x = self.fc1(x)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # relu激活
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               x = self.relu(x)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 第二个全连接恢复通道 [b,c//4]==>[b,c]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               x = self.fc2(x)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # sigmoid权值归一化
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               x = self.hsigmoid(x)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 维度调整 [b,c]==>[b,c,1,1]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               x = x.view([b,c,
       1,
       1])
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 将输入图像和归一化由的通道权值相乘
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               outputs = inputs * x
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       return outputs

1.3 逆转残差模块

这一部分主要使用了深度可分离卷积和SE注意力机制，其结构和ResNet的残差单元相反，强烈建议大家先看一下该模块的基本原理：https://blog.csdn.net/dgvv4/article/details/123476899

图像输入，先通过1x1卷积上升通道数；然后在高维空间下使用深度卷积；再经过SE注意力机制优化特征图数据，给不同的通道分配不同的权重；最后经过1x1卷积下降通道数（使用线性激活函数）。当步长等于1且输入和输出特征图的shape相同时，使用残差连接输入和输出；当步长=2（下采样阶段）直接输出降维后的特征图。

代码如下：


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # ---------------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       #（4）倒残差结构
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       '''
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       in_channel：输入特征图的通道数
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       expansion： 第一个1*1卷积上升的通道数
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       out_channel： 最后一个1*1卷积下降的通道数
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       kernel_size： 深度可分离卷积的卷积核尺寸
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       stride： 深度可分离卷积的步长
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       se： 布尔类型，是否再深度可分离卷积之后使用通道注意力机制
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       activation：'RE'和'HS'，使用RELU激活还是HardSwish激活
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       '''
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # ---------------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       class 
       InvertedResBlock(nn.Module):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 初始化
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       def 
       __init__(
       self, in_channel, kernel_size, expansion, out_channel, se, activation, stride):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 继承父类初始化方法
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       super(InvertedResBlock, self).__init__()
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 属性分配
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.stride = stride
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.expansion = expansion
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 1*1卷积上升通道数
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.conv1 = nn.Conv2d(in_channels=in_channel, out_channels=expansion, kernel_size=
       1,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                                      stride=
       1, padding=
       0, bias=
       False)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
               
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 标准化，传入特征图的通道数
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.bn1 = nn.BatchNorm2d(num_features=expansion)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 3*3深度卷积提取特征, groups代表将输入特征图分成多少组，groups=expansion使卷积核的个数和输入特征图相同
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.conv2 = nn.Conv2d(in_channels=expansion, out_channels=expansion, kernel_size=kernel_size,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                                      stride=stride, padding=kernel_size//
       2, bias=
       False, groups=expansion)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 标准化
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.bn2 = nn.BatchNorm2d(num_features=expansion)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 1*1卷积下降通道数
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.conv3 = nn.Conv2d(in_channels=expansion, out_channels=out_channel, kernel_size=
       1,
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                                      stride=
       1, padding=
       0, bias=
       False)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 标准化
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.bn3 = nn.BatchNorm2d(num_features=out_channel)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 激活函数的选择
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       if activation == 
       'RE':  
       # relu激活函数
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   self.act = nn.ReLU(inplace=
       True)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       elif activation == 
       'HS':  
       # hard_swish激活函数
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   self.act = nn.Hardswish(inplace=
       True)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 是否使用SE注意力机制
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       if se 
       is 
       True:  
       # 对深度卷积的输出特征图使用通道注意力机制
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   self.se_block = se_block(in_channel=expansion)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       else:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   self.se_block = nn.Identity()  
       # 如果不做SE那么输入等于输出，不做变换
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 前向传播
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       def 
       forward(
       self, x):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 获取输入图像的shape
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               b, c, h, w = x.shape
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 残差边部分
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               residual = x
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 如果输入图像的channel和第一个1*1卷积上升的通道数相同，那么就不需要做1*1卷积升维
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       if c != self.expansion:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       # 1*1卷积+BN+激活
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   x = self.conv1(x)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   x = self.bn1(x)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   x = self.act(x)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 3*3深度卷积提取特征输入和输出通道数相同
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               x = self.conv2(x)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               x = self.bn2(x)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               x = self.act(x)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 使用注意力机制，或者不使用（该模块的输入等于输出）
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               x = self.se_block(x)        
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 1*1卷积下降通道数
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               x = self.conv3(x)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               x = self.bn3(x)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 如果深度卷积的步长等于1并且输入和输出的shape相同，就用残差连接输入和输出
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       if self.stride==
       1 
       and residual.shape == x.shape:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   outputs = x + residual
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 否则就直接输出下采样后的结果
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       else:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   outputs = x
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       return outputs

1.4 主干网络

网络模型结构如图所示，这里使用 MobileNetV3-Large 模型。exp size 代表1*1卷积上升的通道数；#out 代表1*1卷积下降的通道数，即输出特征图数量；SE 代表是否使用注意力机制；NL 代表使用哪种激活函数；s 代表步长；bneck 代表逆残差结构；NBN 代表不使用批标准化。

代码如下：


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # ---------------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       #（5）主干网络
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # ---------------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       class 
       mobilenetv3(nn.Module):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 初始化num_classes代表最终的分类数, width_mult代表宽度因子
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       def 
       __init__(
       self, num_classes, width_mult=1.0):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       super(mobilenetv3, self).__init__()
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 第一个下采样卷积层 [b,3,224,224]==>[b,16,112,112]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.conv_block1 = conv_block(in_channel=
       3, out_channel=
       16, kernel_size=
       3, stride=
       2, activation=
       'HS')
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 倒残差结构
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               inverted_block = [
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       # in_channel, kernel_size, expansion, out_channel, se, activation, stride
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   InvertedResBlock(
       16,  
       3, 
       16,  
       16,  
       False, 
       'RE', 
       1),
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   InvertedResBlock(
       16,  
       3, 
       64,  
       24,  
       False, 
       'RE', 
       2),  
       # [b,16,112,112]==>[b,24,56,56]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   InvertedResBlock(
       24,  
       3, 
       72,  
       24,  
       False, 
       'RE', 
       1),
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   InvertedResBlock(
       24,  
       5, 
       72,  
       40,  
       True,  
       'RE', 
       2),  
       # [b,24,56,56]==>[b,40,28,28]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   InvertedResBlock(
       40,  
       5, 
       120, 
       40,  
       True,  
       'RE', 
       1), 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   InvertedResBlock(
       40,  
       5, 
       120, 
       40,  
       True,  
       'RE', 
       1), 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   InvertedResBlock(
       40,  
       3, 
       240, 
       80,  
       False, 
       'HS', 
       2),  
       # [b,40,28,28]==>[b,80,14,14]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   InvertedResBlock(
       80,  
       3, 
       200, 
       80,  
       False, 
       'HS', 
       1),  
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   InvertedResBlock(
       80,  
       3, 
       184, 
       80,  
       False, 
       'HS', 
       1),
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   InvertedResBlock(
       80,  
       3, 
       184, 
       80,  
       False, 
       'HS', 
       1),  
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   InvertedResBlock(
       80,  
       3, 
       480, 
       112, 
       True,  
       'HS', 
       1),
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   InvertedResBlock(
       112, 
       3, 
       672, 
       112, 
       True,  
       'HS', 
       1),
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   InvertedResBlock(
       112, 
       5, 
       672, 
       160, 
       True,  
       'HS', 
       1), 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   InvertedResBlock(
       160, 
       5, 
       672, 
       160, 
       True,  
       'HS', 
       2),  
       # [b,80,14,14]==>[b,160,7,7]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   InvertedResBlock(
       160, 
       5, 
       960, 
       160, 
       True,  
       'HS', 
       1),  
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   ]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 将堆叠的倒残差结构以非关键字参数返回
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.inverted_block = nn.Sequential(*inverted_block)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 1*1卷积调整通道 [b,160,7,7]==>[b,960,7,7]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.conv_block2 = conv_block(in_channel=
       160, out_channel=
       960, 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                                             kernel_size=
       1, stride=
       1, activation=
       'HS')
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 全局平均池化 ==> [b,960,1,1]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.avg_pool = nn.AdaptiveAvgPool2d(output_size=
       1)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 分类层，先用一个全连接调整通道，再用一个全连接分类
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               self.classify = nn.Sequential(
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       # [b,960]==>[b,1280]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   nn.Linear(in_features=
       960, out_features=
       1280),
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   nn.Hardswish(inplace=
       True),
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   nn.Dropout(
       0.2, inplace=
       True),
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       # [b,1280]==>[b,num_classes]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   nn.Linear(in_features=
       1280, out_features=num_classes))
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 权值初始化
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       for m 
       in self.modules():
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       # 对卷积层使用kaiming初始化
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       if 
       isinstance(m, nn.Conv2d):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                       nn.init.kaiming_normal_(m.weight, mode=
       'fan_out')
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                        
       # 对偏置初始化
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                        
       if m.bias 
       is 
       not 
       None:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                           nn.init.zeros_(m.bias)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       # 对标准化层初始化
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       elif 
       isinstance(m, nn.BatchNorm2d):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                       nn.init.ones_(m.weight)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                       nn.init.zeros_(m.bias)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       # 对全连接层初始化
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       elif 
       isinstance(m, nn.Linear):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                       nn.init.normal_(m.weight, 
       0, 
       0.01)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                        
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                        
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 前向传播
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       def 
       forward(
       self, inputs):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # [b,3,224,224]==>[b,16,112,112]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               x = self.conv_block1(inputs)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # [b,16,112,112]==>[b,160,7,7]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               x = self.inverted_block(x)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # [b,160,7,7]==>[b,960,7,7]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               x = self.conv_block2(x)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # [b,960,7,7]==>[b,960,1,1]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               x = self.avg_pool(x)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 展平去除宽高维度 [b,960,1,1]==>[b,960]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               x = torch.flatten(x, 
       1)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # [b,960]==>[b,num_classes]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               x = self.classify(x)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       return x

1.5 查看网络结构

接下来我们查看一下网络的结构。注意，本代码中默认宽度因子width_mult等于1.0，因此没有修改网络输入特征图的通道数。

接下来通过一次前向传播查看模型内部结构是否有问题，再使用torchstat查看每一层的参数量


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # ---------------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       #（6）查看网络结构
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # ---------------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       if __name__ == 
       '__main__':
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 模型实例化
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           model = mobilenetv3(num_classes=
       1000)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 构造输入层shape==[4,3,224,224]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           inputs = torch.rand(
       4,
       3,
       224,
       224)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 前向传播查看输出结果
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           outputs = model(inputs)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       print(outputs.shape)  
       # [4, 1000]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
             
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 查看模型参数，不需要指定batch维度
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           stat(model, input_size=[
       3,
       224,
       224])  
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # Total params: 5,140,608
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # Total memory: 44.65MB
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # Total MAdd: 505.77MMAdd
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # Total Flops: 255.62MFlops
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # Total MemR+W: 96.79MB

2. 网络训练

接下来对使用权重迁移学习的方法训练模型，首先导入所有的工具包，定义好所有需要的参数，找到文件路径，方便后期使用管理。


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       import torch
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       from torch 
       import nn, optim
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       from torchvision 
       import transforms, datasets
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       from torch.utils.data 
       import DataLoader
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       from MobileNetV3 
       import mobilenetv3  
       # 导入我们定义好了的模型文件
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       import numpy 
       as np
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       import matplotlib.pyplot 
       as plt
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       plt.rcParams[
       'font.sans-serif'] = [
       'SimHei']  
       # 绘图显示中文
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # --------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       #（0）参数设置
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # --------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       batch_size = 
       32  
       # 每批次处理32张图片
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       epochs = 
       10  
       # 训练10轮
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       best_loss = 
       2.0  
       # 当验证集损失小于2时再保存模型权重
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 数据集根目录
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       filepath = 
       'D:/deeplearning/test/数据集/乳腺癌/new_data/'
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 预训练文件位置
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       weightpath = 
       'D:/deeplearning/imgnet/pytorchimgnet/pretrained_weights/mobilenet_v3_large.pth'
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 权重文件保存的根目录
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       savepath = 
       'D:/deeplearning/imgnet/pytorchimgnet/save_weights/'
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 获取GPU设备，如果检测到GPU就用，没有就用CPU
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       if torch.cuda.is_available():  
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           device = torch.device(
       'cuda:0')
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       else:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           device = torch.device(
       'cpu')

2.1 构造数据集

首先定义训练集和验证集的数据预处理方法 data_transform。通过 transforms.Resize() 将输入图像的尺寸变成模型要求的 224*224 大小，然后再通过 transforms.ToTensor() 将像素值类型从 numpy 变成 tensor 类型，并归一化处理，像素值大小从 [0,255] 变换到 [0,1]，再调整输入图像的维度，从 [h,w,c] 变成 [c,h,w]；接着 transforms.Normalize() 对图像的每个颜色通道做标准化处理，使像素值满足正态分布。

预处理之后就构造训练集和验证集 dataloader，指定 batch_size=32，代表训练时每个 step 训练32张图片。

接着查看数据集信息，查看分类类别及其对应的索引信息，其中 datasets['train'].class_to_idx 的结果是 {'得病': 0, '正常': 1}

代码如下：


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # --------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       #（1）数据集处理
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # --------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 定义预处理方法
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       data_transform = {
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 训练集预处理
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       'train' : transforms.Compose([
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               transforms.RandomResizedCrop(
       224),  
       # 随机长宽比裁剪原始图片到224*224的大小 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               transforms.RandomHorizontalFlip(),  
       # 随机水平翻转
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               transforms.ToTensor(),  
       # 将numpy类型变成tensor类型，像素归一化，shape:[h,w,c]==>[c,h,w]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               transforms.Normalize(mean=[
       0.485,
       0.456,
       0.406], std=[
       0.229,
       0.224,
       0.225])  
       # 对图像的每个通道做标准化
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               ]),
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 验证集预处理
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       'val' : transforms.Compose([
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               transforms.Resize((
       224,
       224)),  
       # 将图像的大小缩放至224*224
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               transforms.ToTensor(),
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               transforms.Normalize(mean=[
       0.485,
       0.456,
       0.406], std=[
       0.229,
       0.224,
       0.225])
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               ])    
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           }
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 图像导入并预处理
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       datasets = {
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       'train' : datasets.ImageFolder(filepath+
       'train', transform=data_transform[
       'train']),  
       # 读取训练集
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       'val'   : datasets.ImageFolder(filepath+
       'val', transform=data_transform[
       'val'])   
       # 读取验证集
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           }
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 构建数据集
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       dataloader = {
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       'train' : DataLoader(datasets[
       'train'], batch_size=batch_size, shuffle=
       True),  
       # 构造训练集
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       'val'   : DataLoader(datasets[
       'val'], batch_size=batch_size, shuffle=
       False)  
       # 构造验证集
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           }
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # --------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       #（2）查看数据集信息
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # --------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       train_num = 
       len(datasets[
       'train'])  
       # 查看训练集的图片数量
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       val_num = 
       len(datasets[
       'val'])   
       # 查看验证集的图片数量
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 查看分类类别及其索引 {0: '得病', 1: '正常'}
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       LABEL = 
       dict((v,k) 
       for k, v 
       in datasets[
       'train'].class_to_idx.items())
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 查看训练集的简介
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       print( dataloader[
       'train'].dataset )  
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 从训练集中取出一个batch的图像及其标签
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       train_img, train_label = 
       next(
       iter(dataloader[
       'train']))
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 查看图像及标签的shape train_img.shape:[32, 3, 224, 224]  train_label.shape:[32]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       print(
       'train_img.shape: ', train_img.shape, 
       'train_label.shape:', train_label.shape)

2.2 数据可视化

可视化训练集中的前12张图像。由于构造数据集时使用了一系列预处理方法，因此这里要将像素类型从 tensor 变成 numpy，调整图像的维度 [b,c,h,w]==>[b,h,w,c]，对图像的每个通道执行反标准化操作，恢复到0-1之间的随机分布。

标准化： $img = \frac{img - mean}{std}$ 反标准化：

代码如下：


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # --------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       #（3）数据可视化
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # --------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 从数据集中取出12张图片及其对应的标签
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       frame = train_img[:
       12]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       frame_label = train_label[:
       12]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 将图片从tensor类型变成numpy类型
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       frame = frame.numpy()    
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 调整维度 [b,c,h,w]==>[b,h,w,c]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       frame = np.transpose(frame, [
       0,
       2,
       3,
       1])
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 对图像的反标准化
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       mean = [
       0.485, 
       0.456, 
       0.406]  
       # 均值
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       std = [
       0.229, 
       0.224, 
       0.225]   
       # 标准化
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 乘以标准差再加上均值
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       frame = frame * std + mean
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 将图像的像素值限制在0-1之间，小于0的取0，大于1的取1
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       frame = np.clip(frame, 
       0, 
       1)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 绘制图像
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       plt.figure()
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       for i 
       in 
       range(
       12):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           plt.subplot(
       3,
       4,i+
       1)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           plt.imshow(frame[i])  
       # 绘制单张图像
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           plt.title(LABEL[frame_label[i].item()])  
       # 标签是图像的类别
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           plt.axis(
       'off')  
       # 不显示
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       plt.tight_layout()  
       # 轻量化布局
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       plt.show()

查看训练集的图片及其对应的分类名称

2.3 模型加载，迁移学习

首先加载预训练权重 torch.load() 到内存中。由于预训练模型的分类数有1000个，即最后一个全连接层有 1000 个神经元，因此我们只用预训练权重的特征提取部分，不需要分类层部分。

遍历预训练权重文件，保存除了分类层 'classifier' 以外的所有层的权重，到 pred_dict 中。

这里注意本次训练冻结主干网络的所有逆转残差结构的权重，model.inverted_block，这个类是我们之前定义的N个逆残结构组成的。

训练时只更新输入层卷积层和分类层的权重，建议大家在训练时前10轮使用冻结训练，后面都使用解冻训练，能够防止权值被破坏，提高识别效果。


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # --------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       #（4）模型加载，迁移学习
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # --------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 接收模型，二分类
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       model = mobilenetv3(num_classes=
       2)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 加载预训练权重文件，是字典类型。最后一层的神经元个数为1k
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       pre_weights = torch.load(weightpath, map_location=device)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 遍历权重文件，保存除分类层以外的所有权重
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       pre_dict = {k: v 
       for k, v 
       in pre_weights.items() 
       if 
       'classifier' 
       not 
       in k}
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # len(pre_weights)  312
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # len(pre_dict)  308
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 加载预训练权重，除了分类层以外其他都有预权重。
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 当strict=True,要求预训练权重层数的键值与新构建的模型中的权重层数名称完全吻合；
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 如果新构建的模型在层数上进行了部分微调，则上述代码就会报错：说key对应不上。
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       missing_keys, unexpected_keys = model.load_state_dict(pre_dict, strict=
       False)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 冻结网络的倒残差结构的权重, model.parameters() 代表网络的所有参数
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       for param 
       in model.inverted_block.parameters():
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           param.requires_grad = 
       False  
       # 参数不需要梯度更新

2.4 网络训练

接下来进行网络训练，将所有需要计算的部分都搬运到 GPU 上，加快训练速度。

我这里使用验证集损失作为网络监控指标，如果损失减小就保存当前 epoch 的权重。

还要注意的就是网络训练和测试的模式不一样，训练时 Dropout 层随机杀死神经元，BN 层取一个batch的均值和方差；验证时 Dropout 层不起作用，BN 层取整个训练集计算得到的均值和方差。通过 net.train() 和 net.eval() 来切换训练和验证模式。

代码如下：


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # --------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       #（5）网络编译
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # --------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 将模型搬运至GPU上
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       model.to(device)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 定义交叉熵损失
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       loss_function = nn.CrossEntropyLoss()
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 定义优化器
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       optimizer = optim.Adam(model.parameters(), lr=
       0.001)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # --------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       #（6）训练阶段
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # --------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       for epoch 
       in 
       range(epochs):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 打印当前训练轮次
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       print(
       '='*
       50, 
       '\n', 
       'epoch: ', epoch)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 将模型设置为训练模式，dropout层和BN层起作用
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           model.train()
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 记录一个epoch的训练集总损失
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           total_loss = 
       0.0
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 每个step训练一个batch，包含数据集和标签
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       for step, (images, labels) 
       in 
       enumerate(dataloader[
       'train']):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 将数据集搬运到GPU上
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               images, labels = images.to(device), labels.to(device)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 梯度清零，因为每次计算梯度是一个累加
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               optimizer.zero_grad()
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 前向传播，输出预测结果
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               logits = model(images)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       #（1）计算损失
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 计算每个step的预测值和真实值的交叉熵损失
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               loss = loss_function(logits, labels)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 累加一个epoch中所有batch的损失
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               total_loss += loss.item()
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       #（2）反向传播
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 梯度计算
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               loss.backward()
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 梯度更新
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               optimizer.step()
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 每100个batch打印一次当前的交叉熵损失
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       if step % 
       100 == 
       0:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       print(
       f'step:{step}, train_loss:{loss}')
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 计算一个epoch的平均损失，每个step的损失除以step的数量
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           train_loss = total_loss / 
       len(dataloader[
       'train'])
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # --------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       #（7）验证训练
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # --------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           model.
       eval()  
       # 切换成验证模式，dropout和BN切换工作模式
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           total_val_loss = 
       0.0  
       # 记录一个epoch的验证集损失
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           total_val_correct = 
       0   
       # 记录一个epoch预测对了多少张图
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 接下来不进行梯度更新
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       with torch.no_grad():
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 每个step测试一个batch
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       for images, labels 
       in dataloader[
       'val']:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       # 将数据集搬运到GPU上
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   images, labels = images.to(device), labels.to(device)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       # 前向传播 [b,c,h,w]==>[b,2]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   logits = model(images)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       #（1）损失计算
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       # 计算每个batch的预测值和真实值的交叉熵损失
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   loss = loss_function(logits, labels)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       # 累计每个batch的损失
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   total_val_loss += loss.item()
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       #（2）计算准确率
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       # 找出每张图片的最大分数对应的索引，即每张图片对应什么类别
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   pred = logits.argmax(dim=
       1)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       # 对比预测类别和真实类别，一个batch有多少个预测对了
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   val_correct = torch.eq(pred, labels).
       float().
       sum()
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       # 累加一个epoch中所有的batch被预测对的图片数量
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   total_val_correct += val_correct
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 计算一个epoch的验证集的平均损失和平均准确率
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               val_loss = total_val_loss / 
       len(dataloader[
       'val'])  
       # 一个epoch中每个step的损失和除以step的总数
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               val_acc =  total_val_correct / val_num   
       # 一个epoch预测对的所有图片数量除以总图片数量
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 打印一个epoch的训练集平均损失，验证集平均损失和准确率
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       print(
       '-'*
       30)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       print(
       f'train_loss:{train_loss}, val_loss:{val_loss}, val_acc:{val_acc}')
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # --------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       #（8）保存权重
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # --------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 保存最小损失值对应的权重文件
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       if val_loss < best_loss:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       # 权重文件名称
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   savename = savepath + 
       f'valacc{round(val_acc.item()*100)}%_' + 
       'mobilenetv3.pth'            
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       # 保存该轮次的权重
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   torch.save(model.state_dict(), savename)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       # 切换最小损失值
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
                   best_loss = val_loss
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       # 打印结果
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                    
       print(
       f'weights has been saved, best_loss has changed to {val_loss}')

网络训练过程如下：


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       ================================================== 
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
        epoch:  
       9
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       step:
       0, train_loss:
       0.42834100127220154
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       step:
       100, train_loss:
       0.531797468662262
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       step:
       200, train_loss:
       0.644078254699707
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       step:
       300, train_loss:
       0.5168130993843079
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       ------------------------------
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       train_loss:
       0.4817688945669534, val_loss:
       0.4419680222868919, val_acc:
       0.7974137663841248
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       weights has been saved, best_loss has changed to 
       0.4419680222868919

训练过程中保存的权重文件

3. 预测阶段

接下来我们用训练好了的权重文件来预测图像，绘制混淆矩阵，计算精确率、召回率、F1值作为评价指标。同样先导入所有需要用到的工具包。


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       import torch
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       from torch 
       import nn
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       from torchvision 
       import transforms, datasets
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       from torch.utils.data 
       import DataLoader
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       from MobileNetV3 
       import mobilenetv3
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       from mlxtend.plotting 
       import plot_confusion_matrix
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       from sklearn.metrics 
       import confusion_matrix
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       import matplotlib.pyplot 
       as plt
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       plt.rcParams[
       'font.sans-serif'] = [
       'SimHei']  
       # 绘图显示中文

3.1 构造数据集

这里测试集的预处理采用和验证集相同的预处理方法。这部分和上面相同，就不多做介绍。


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # --------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       #（0）参数设置
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # --------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       batch_size = 
       36  
       # 每批次处理72张图片
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 测试数据集地址
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       filepath = 
       'D:/deeplearning/test/数据集/乳腺癌/new_data/test'
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 模型训练权重文件位置
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       weightpath = 
       'D:/deeplearning/imgnet/pytorchimgnet/save_weights/valacc80%_mobilenetv3.pth'
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 获取GPU设备，如果检测到GPU就用，没有就用CPU
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       if torch.cuda.is_available():  
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           device = torch.device(
       'cuda:0')
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       else:
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           device = torch.device(
       'cpu')
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # --------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       #（1）测试集数据处理
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # --------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 定义测试集预处理方法，和验证集的预处理方法相同
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       data_transforms = transforms.Compose([
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           transforms.Resize((
       224,
       224)),  
       # 输入图像缩放至224*224
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           transforms.ToTensor(),  
       # 转变数据类型，维度调整，归一化
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           transforms.Normalize(mean=[
       0.485,
       0.456,
       0.406], std=[
       0.229,
       0.224,
       0.225])  
       # 每个通道的像素值标准化
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           ])
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 加载测试集，并作预处理
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       datasets = datasets.ImageFolder(filepath, transform=data_transforms)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 构造测试集
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       dataloader = DataLoader(datasets, batch_size=batch_size, shuffle=
       True)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 查看数据集信息 imgs.shape:[32, 3, 224, 224] labels.shape:[32]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       test_images, test_labels = 
       next(
       iter(dataloader))
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       print(
       'imgs.shape:', test_images.shape, 
       'labels.shape:', test_labels.shape)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 记录一共有多少张测试图片 72
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       test_num = 
       len(datasets)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 获取分类类别及其索引 {0: '得病', 1: '正常'}
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       class_names = 
       dict((v,k) 
       for k, v 
       in datasets.class_to_idx.items())

3.2 评价指标

接下来，通过一次前向传播会得到网络的预测值，即图像属于每个类别的得分 logits。通过 confusion_matrix() 计算混淆矩阵的值，有4个返回值，分别是：

TP：实际是正类，且预测为正类的数量； FN：实际是正类，但预测为负类的数量；

FP：实际是负类，但预测为正类的数量； TN：实际是负类，且预测为负类的数量；

精准率：预测为正例的那些数据里预测正确的数据个数，计算公式如下：

$precision = \frac{TP}{TP+FP}$

召回率：真实为正例的那些数据里预测正确的数据个数，计算公式如下：

$recall = \frac{TP}{TP+FN}$

F1值：精准率和召回率是此消彼长的，即精准率高了，召回率就下降，在一些场景下要兼顾精准率和召回率。计算公式如下：

$\frac{2}{F1} = \frac{1}{P}+\frac{1}{R}$

代码如下：


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # --------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       #（2）计算混淆矩阵值、精确率、召回率、F1
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # --------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       def 
       metrics(
       logits, labels):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 计算每张图片对应的类别索引
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           predict = logits.argmax(dim=
       1)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 计算混淆矩阵值，返回四个值 TN, FP, FN, TP
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           cm = confusion_matrix(labels.cpu().numpy(), predict.cpu().numpy())
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 获取 TN, FP, FN, TP
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           tn, fp, fn, tp = cm.ravel()
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 计算精确率
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           precision = tp / (tp+fp)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 计算召回率
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           recall = tp / (tp+fn)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 计算F1综合指标
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           f1 = 
       2 * ((precision * recall) / (precision + recall))
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 绘制混淆矩阵
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           plt.figure()  
       # 创建画板
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           plot_confusion_matrix(cm, figsize=(
       12,
       8), cmap=plt.cm.Blues)   
       # 绘制混淆矩阵
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           plt.xticks(
       range(
       2), 
       list(class_names.values()), fontsize=
       14)  
       # x轴刻度名称
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           plt.yticks(
       range(
       2), 
       list(class_names.values()), fontsize=
       14)  
       # y轴刻度
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           plt.xlabel(
       'predict label', fontsize=
       16)  
       # x轴标签
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           plt.ylabel(
       'true label', fontsize=
       16)  
       # y轴标签
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           plt.title(
       f'precision:{precision}, recall:{recall}, f1:{f1}')  
       # 标题
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           plt.show()
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       return precision, recall, f1

3.3 预测阶段

首先读取我们第一小节中构建的模型，然后载入训练权重，将模型搬运至GPU上计算。

预测阶段只对网络进行前向传播操作，不更新梯度，计算每个batch的精确率、召回率、F1值。

需要把网络切换到验证模式 model.eval() 不计算梯度。计算整个测试集的平均准确率和平均损失函数。


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # --------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       #（3）模型构建
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # --------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       model = mobilenetv3(num_classes=
       2)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 加载训练权重文件
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       model.load_state_dict(torch.load(weightpath, map_location=device))
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 将模型搬运至GPU上
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       model.to(device)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 定义交叉熵损失
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       loss_function = nn.CrossEntropyLoss()
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 保存测试集的指标 precision, recall, f1
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       precisions = []
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       recalls = []
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       f1s = []
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # --------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       #（4）网络测试
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # --------------------------------------------- #
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       model.
       eval()  
       # 切换成测试模式，改变BN和Dropout的工作模式
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       total_loss = 
       0.0  
       # 记录测试集总损失
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       test_correct = 
       0  
       # 记录测试集一共预测对了多少个
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       # 接下来的计算不需要更新梯度
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
       with torch.no_grad():
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 每次测试一个batch
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       for step, (images, labels) 
       in 
       enumerate(dataloader):
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 将数据集搬运到GPU上
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               images, labels = images.to(device), labels.to(device)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 前向传播 [b,2]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               logits = model(images)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 计算每个batch的损失
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               loss = loss_function(logits, labels)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 累加每个batch的测试损失
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               total_loss += loss.item()
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 计算每张图片对应的类别索引
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               predict = logits.argmax(dim=
       1)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 对比预测结果和实际结果，比较预测对了多少张图片
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               test_correct += torch.eq(predict, labels).
       float().
       sum()
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 计算每个batch的评价指标，并绘制每个batch的混淆矩阵
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               precision, recall, f1 = metrics(logits, labels)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
                
       # 保存评价指标
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               precisions.append(precision)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               recalls.append(recall)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
               f1s.append(f1)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 计算平均损失
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           avg_loss = total_loss / 
       len(dataloader)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 计算平均准确率
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
           test_acc = test_correct / test_num
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 打印测试集的总体损失和准确率
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       print(
       f'total_loss:{avg_loss}, total_test_acc:{test_acc}')
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       # 打印每个batch的评价指标
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       print(
       'batch_precision: ', precisions)
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       print(
       'batch_recalls: ', recalls)   
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
            
       print(
       'batch_f1s: ', f1s)

打印查看整个测试集的平均准确率和平均交叉熵损失，打印每个batch的精确率、召回率、F1值。


   
     
     
     
     
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       total_loss:
       0.45127132534980774, total_test_acc:
       0.7916666865348816
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       batch_precision:  [
       0.7142857142857143, 
       0.8571428571428571]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       batch_recalls:  [
       0.6666666666666666, 
       0.8571428571428571]
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
         
      
        
        
        
        
     
       
       
       
       
      
      
      
      
     
       
       
       
       
      
        
        
        
        
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        
         
         
         
         
       batch_f1s:  [
       0.689655172413793, 
       0.8571428571428571]

查看绘制后的每个batch的混淆矩阵

你可能感兴趣的:(深度学习,人工智能,pytorch,分类,pytorch,深度学习,mobilenetv3,图像二分类)

指令系统和计算机体系结构——一文解析冯·诺依曼架构点滴汇聚江河软考-软件设计师架构
文章目录一、核心思想二、核心组成部分1.中央处理器（CPU）2.内存（Memory）3.输入/输出（I/O）设备4.总线（Bus）三、工作流程四、冯·诺依曼架构的局限性五、现代计算机的改进1.流水线技术（Pipeline）关键机制2.高速缓存（Cache）关键机制3.多核CPU（Multi-Core）关键挑战与解决方案4.乱序执行（Out-of-OrderExecution）关键技术5.其他关键改
大模型时代的知识焦虑机载软件与适航机器学习-建模算法-代理模型人工智能大数据
引言：浪潮之巅，焦虑暗涌大模型时代已经浩荡而来，如同奔腾的浪潮，以令人惊叹的速度重塑着世界的面貌。从智能客服的温声细语，到AI绘画的妙笔生花，再到自动驾驶的日趋成熟，大型语言模型、图像模型等人工智能技术以前所未有的姿态，渗透进我们生活的方方面面。信息获取前所未有的便捷，知识创造空前高效，人机交互焕然一新，一个充满无限可能的智能化未来似乎触手可及。然而，在这令人眼花缭乱的技术盛景之下，一股无形的焦虑
【Leetcode刷题随笔】59 螺旋矩阵 Poor_DayDreamer leetcode数组篇 Medium Tag leetcode 矩阵算法
1.题目描述给定一个正整数n，生成一个包含1到n2所有元素，且元素按顺时针顺序螺旋排列的nxn正方形矩阵matrix。可结合以下原题链接阅读。原题链接：59螺旋矩阵2.解题思路本题为模拟矩阵填充过程，不需要设计算法，只要完成正确的填充过程即可。首先初始化一个nxn的二维矩阵（涉及到动态内存分配），从矩阵左上角开始往顺时针填充，关键在于填充的转角处不要重复填充，所以对于每条边都要遵循严格的统一规则，
含光热电站、有机有机朗肯循环、P2G的综合能源优化调度（Matlab代码实现）创新优化代码学习能源 matlab 前端
‍个人主页欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录1概述含光热电站、有机朗肯循环与P2G的综合能源优化调度研究一、技术基础与系统作用二、多技术协同机制三、优化调度模型构建四、典型案例与仿真分析五、未来研究方向结论2运行结果3参考文献4Matlab代码实现1概述光热发电(concentratingsolarp
力扣Hot100——136. 只出现一次的数字飞奔的马里奥 leetcode 算法职场和发展
难点在于时间与空间复杂度的要求，一般遇到这样的限制，就要考虑使用位运算，位运算效率最高了。异或当且仅当两个输入值不同时，异或运算输出为真（1），否则输出为假（0），即“同为0，异为1”。这是针对二进制运算的规则，整数进行异或运算，需要转换为二进制，一样遵循这个运算规则。异或的运算律：交换律：p⊕q=q⊕p结合律：p⊕(q⊕r)=(p⊕q)⊕r恒等律：p⊕0=p归零律：p⊕p=0对合运算：p⊕q⊕q
MySQL请求处理全流程深度解析：从SQL语句到数据返回 longdong7889 mysql sql adb
MySQL请求处理全流程深度解析：从SQL语句到数据返回一、MySQL架构全景图MySQL采用经典的C/S架构和分层设计，其核心模块协同工作流程如下：客户端连接管理器查询解析器查询优化器执行引擎存储引擎磁盘存储各层核心职责：连接层：管理客户端连接、权限验证服务层：SQL解析、优化、内置函数实现存储引擎层：数据存储与索引管理（如InnoDB）文件系统层：日志文件、数据文件存储二、请求处理七步详解步骤
每日新闻掌握【2025年3月20日星期四】 cdmt 每日新闻掌握科技
2025年3月20日星期四农历二月廿一大公司/大事件住建部：坚决稳住楼市，推动房地产市场止跌回稳近日，中共住房和城乡建设部党组召开理论学习中心组学习（扩大）会议。会议要求，要持续推进城市更新，坚持问题导向和目标导向，开展城市体检，找准人民群众急难愁盼问题和城市发展短板弱项，下功夫实施一批惠民生、防风险、促发展的更新项目。要坚决稳住楼市，持续巩固“四个取消、四个降低、两个增加”房地产政策“组合拳”效
RAG 企业级应用落地框架细节差异对比一顿码架构人工智能 python 数据挖掘知识图谱语言模型
—1—什么是RAG？RAG检索增强生成本质上来讲，就三件事情：第一、Indexing索引。即如何更有效地存储知识。第二、Retrieval检索。即在庞大的知识库中，如何筛选出少量的有益知识，供大模型参考。第三、Generation生成。即如何将用户的提问与检索到的知识相结合，使得大模型能够生成有价值的回答。这三个步骤表面上看似乎并不复杂，然而在RAG从构建到实际部署的整个流程中，包含了众多精细且复
“轻松一键生成 AI 图像：Stable Diffusion Online 带来革命性视觉创意体验！“ ai小精灵人工智能 stable diffusion 文心一言 AI作画 chatgpt
StableDiffusionOnline正在为AI图像生成领域树立新标准，将复杂的功能与便捷直观的用户体验相结合。历史上，StableDiffusion的部署步骤带来了重大挑战，特别是对于技术新手而言。然而，StableDiffusionOnline消除了这些障碍，提供了一个既适合新手也适合资深专业人士的酷炫界面。什么是StableDiffusionOnline？StableDiffusionO
算法入门——二分法 Able Zhao 650829 算法数据结构 c++蓝桥杯
二分法真的很容易出错！！！在用dp学习之后总结了一下二分法二分查找关键总结一、核心思想分治策略：每次将搜索范围缩小一半，适用于有序数组。时间复杂度：O(logn)，比线性查找高效得多。二、关键点前提条件有序性：数组必须有序（升序或降序），否则需先排序（但排序成本O(nlogn)）。静态性：适合静态数据或低频更新的数据（高频更新建议用哈希表或树结构）。两种边界问题左边界：第一个等于目标的位置（或第一
PTA天梯赛Python7-52 古风排版胡同Alley python
中国的古人写文字，是从右向左竖向排版的。本题就请你编写程序，把一段文字按古风排版。输入格式：输入在第一行给出一个正整数N（<100），是每一列的字符数。第二行给出一个长度不超过1000的非空字符串，以回车结束。输出格式：按古风格式排版给定的字符串，每列N个字符（除了最后一列可能不足N个）。输入样例：4Thisisatestcase输出样例：asaTstihetsices代码长度限制16KB时间限制
鸿蒙HarmonyOS开发：应用程序静态包-HAR 让开，我要吃人了鸿蒙开发 OpenHarmony HarmonyOS harmonyos 华为移动开发前端 html 开发语言鸿蒙
HAR（HarmonyArchive）是静态共享包，可以包含代码、C++库、资源和配置文件。通过HAR可以实现多个模块或多个工程共享ArkUI组件、资源等相关代码。使用场景作为二方库，发布到OHPM私仓，供公司内部其他应用使用。作为三方库，发布到OHPM中心仓，供其他应用使用。约束限制HAR不支持在设备上单独安装/运行，只能作为应用模块的依赖项被引用。HAR不支持在配置文件中声明UIAbility
CTF杂项挑战：使用已知字典破解ZIP文件密码 0dayNu1L Web安全 CTF web安全网络安全
在CTF比赛中，杂项挑战通常包含一些非传统的题目，其中破解ZIP文件密码是一个常见的任务。本文将介绍两种在已知密码字典文件的情况下，破解ZIP文件密码的方法：一种是使用Python脚本进行暴力破解，另一种是通过zip2john和john命令结合进行破解。0dayNu1L-CSDN博客请一键三连吧！！！❤❤❤目录方法一：使用Python脚本进行暴力破解步骤方法二：使用zip2john和john命令结
文本转语音的Python库（pyttsx3）数产第一混子 python库 python
一、pyttsx3的概述pyttsx3isatext-to-speechconversionlibraryinPython.pyttsx3是Python中的文本到语音转换库。二、pyttsx3的安装pipinstallpyttsx3三、小试牛刀importpyttsx3engine=pyttsx3.init()engine.say("Iwillspeakthistextrightnow")engi
近期计算机领域的热点技术 0dayNu1L 云计算量子计算人工智能
随着科技的飞速发展，计算机领域的新技术、新趋势层出不穷。本文将探讨近期计算机领域的几个热点技术趋势，并对它们进行简要的分析和展望。一、人工智能与机器学习人工智能（AI）和机器学习（ML）是近年来计算机领域最为热门的话题之一。AI和ML技术已经广泛应用于图像识别、自然语言处理、智能推荐等领域，并取得了显著的成果。随着技术的不断进步，AI和ML将更深入地渗透到各个行业，为人类社会带来更多便利和效益。在
谷歌准备斥资 230 亿收购网络安全初创公司 Wiz 网络研究观网络研究观谷歌
Alphabet正在就收购Wiz进行深入谈判，这将显著增强其安全能力。这将是谷歌母公司有史以来最大规模的收购。这是路透社根据匿名消息来源撰写的内容。目标收购金额为230亿美元，即211亿欧元。Wiz拥有实时检测和响应网络威胁的技术。通过实施人工智能，Wiz能够在短时间内吸引许多公司作为客户。Alphabet的收购目标定于2020年初。到2023年，Wiz的收入将达到3.5亿美元。当时，全球40%的
Java+Selenium+Cucumber自动化测试框架：高效软件测试的利器测试渣 java selenium
一、引言在当今软件开发的快速迭代的背景下，确保软件质量和功能的正确性变得愈发关键。自动化测试作为一种提高测试效率、降低成本的有效手段，受到了广泛的关注。Java作为一门功能强大且广泛应用的编程语言，与Selenium和Cucumber相结合的自动化测试框架，为软件测试领域带来了诸多优势。本文将深入探讨这一自动化测试框架，包括其简介、各组件的作用、环境搭建、实际应用案例以及未来发展趋势等内容。二、J
从需求文档到测试用例的转化方法论测试渣测试用例
在当今快速发展的软件行业中，软件质量的高低直接关系到企业的市场竞争力和用户体验。作为软件质量保障的关键环节，测试用例的设计与实施起着至关重要的作用。而测试用例的设计，又是以需求文档为依据的。因此，如何从需求文档中准确、全面地提取信息，并转化为有效的测试用例，成为了测试团队面临的重要挑战。本文将从需求文档的特点、测试用例设计的原则和方法，以及二者之间的转化流程等方面，详细阐述从需求文档到测试用例的转
Web自动化测试（一）树的鲨鱼前端自动化功能测试
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档Web自动化测试（一）前言一、自动化相关理论1.什么是自动化以及它的好处2.什么是软件测试3.什么是自动化测试4.自动化测试能解决什么问题4.自动化测试分类5.什么Web项目适合做自动化测试6.Web自动化测试所属分类7.主流的Web自动化测试化工具二、Selenium1.特点2.发展历程3.环境搭建4.第一个案例三、Selenium
数学领域的跨时代进化与升级：从公理化到智能化的破茧之路夏末之花算法
作者：夏末之花|发布时间：2025-03-16|阅读量：10万+|点赞数：5.6万引言：数学的“破茧时刻”与文明跃迁人类历史上，数学的每一次重大突破都像一次“破茧时刻”，推动文明跨越式发展。从古希腊的几何公理化到牛顿的微积分，再到20世纪的计算机理论，数学始终是科学革命的基石。而在21世纪的今天，随着量子计算、人工智能、生物信息等技术的爆发，数学正迎来新一轮的进化与升级——从纯粹的逻辑工具，演变为
如何在 Python 中将语音转换为文本无水先生语音处理人工智能综合 python xcode 开发语言
一、说明学习如何使用语音识别Python库执行语音识别，以在Python中将音频语音转换为文本。想要更快地编码吗？我们的Python代码生成器让您只需点击几下即可创建Python脚本。现在就现在试试！二、语言AI库2.1相当给力的转文字库语音识别是计算机软件识别口语中的单词和短语并将其转换为人类可读文本的能力。在本教程中，您将学习如何使用SpeechRecognition库在Python中
精准测试：软件开发中的高效质量保障利器霍格沃兹软件测试开发精准化测试测试用例安全性测试测试覆盖率模块测试 selenium 测试工具压力测试
全面解析软件测试开发：人工智能测试、自动化测试、性能测试、测试左移、测试右移到DevOps如何驱动持续交付在现代软件开发中，测试效率与测试质量直接影响产品竞争力。精准测试作为一项兼具效率与精度的创新测试方法，已经成为众多企业提升软件质量的重要手段。本篇文章围绕精准测试的落地实施、对质量指标的提升、数据统计与效果评估方法以及如何提高投入产出比进行全面解读，帮助企业掌握精准测试的价值与实践路径。精准测
Java IO流详解我真的不想做程序员 java 文件读写 java 开发语言后端数据结构算法
目录一、JavaIO流基础（一）字节流常见字节流类（二）字符流常见字符流类二、字节流操作示例（一）读取文件（二）写入文件（三）带缓冲功能的字节流三、字符流操作示例（一）读取文件（二）写入文件（三）带缓冲功能的字符流四、总结一、JavaIO流基础JavaIO流用于处理设备之间的数据传输，主要包括字节流和字符流两大类。字节流以字节为单位进行数据传输，适用于处理二进制数据；字符流以字符为单位进行传输，适
提升敏感力，“工具人”破圈的唯一解！技能咖 GAI认证生成式人工智能认证人工智能
在当今这个日新月异的数字化时代，个人与组织面临着前所未有的挑战与机遇。随着科技的飞速发展，尤其是生成式人工智能（GenerativeAI）的兴起，职场生态正在发生深刻变革。如何在这场变革中提升敏感力，实现从“工具人”到行业佼佼者的跨越，成为了众多职场人士关注的焦点。本文将探讨提升敏感力的重要性，并引入生成式人工智能认证（GAI认证），为您揭示“工具人”破圈的唯一解。提升敏感力：职场竞争的关键什么是
CSS3背景与渐变天涯学馆大前端&移动端全栈架构 css3 前端 css
背景与渐变background-sizebackground-size属性用于设置背景图像的尺寸。您可以指定绝对或相对单位，或者使用关键词来控制背景图像在元素背景区域中的大小。.element{background-size:[length|percentage|cover|contain]|[length|percentage][length|percentage]|auto|inherit;}
详解C语言字符和字符串的输入与输出凭君语未可 C语言 c语言开发语言
字符和字符串的输入与输出一、字符的输入与输出1.1字符的输入使用`getchar()`使用`scanf()`1.2字符的输出使用`putchar()`使用`printf()`二、字符串的输入与输出2.1字符串的输入使用`scanf()`输入字符串使用`fgets()`输入字符串2.2字符串的输出使用`printf()`输出字符串使用`puts()`输出字符串三、总结与注意事项在C语言中，字符（ch
Moodle + Websoft9：创新教育的强大组合，助力教学与学习开源软件
Moodle+Websoft9：构建未来课堂的技术基石一、Moodle：开源生态的深度解析•模块化设计：支持超800个官方插件，如H5P交互内容创作、BigBlueButton虚拟课堂，满足个性化教学需求。•学习分析引擎：内置LearningAnalyticsAPI，可集成Python/R语言进行深度学习，预测学生学业风险。•移动优先战略：MoodleApp支持离线学习、扫码签到，2023年新增A
Trading星周二Space第三期：理性应对波动，聚焦长期价值 web3区块链比特币
作者：Trading星周二在3月20日美联储利率决议这一关键节点前夕，TechubNews王牌栏目「Trading星周二」第三期以「加密资产仓位攻防战：政策拐点下的BTC/ETH配置法则」为主题，引发行业高度关注。数据显示，本期由主持人茄哥与Balance（Kingdata&Geniidata联合创始人）、A神（RITDLab联合创始人）、交易员Beyond、Cassie（LYSLab研究员）组成
新浪财经App喜娜AI助手通过大模型登记，已上线AI摘要和个股公告AI解读量子位
3月14日，官方发布的信息显示，新浪财经App喜娜AI助手近日已通过北京市生成式人工智能服务登记。目前，喜娜AI助手已上线两项创新功能：喜娜AI摘要和个股公告AI解读。这两项功能旨在通过先进的人工智能技术，提升用户对财经资讯和上市公司公告的理解与分析效率，这标志着AI技术在信息服务领域的又一重大突破。喜娜AI摘要：快速提炼财经资讯核心要点AI时代，资讯信息迎来爆炸性增长，用户每天都要面对海量资讯，
书籍-《动手学深度学习（英文版）》
书籍：DiveintoDeepLearning作者：AstonZhang，ZacharyC.Lipton，MuLi，AlexanderJ.Smola出版：CambridgeUniversityPress编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《动手学深度学习（英文版）》01书籍介绍深度学习已经彻底改变了模式识别，为计算机视觉、自然语言处理和自动语音识别等领域提供了强大的工具。应用深度学
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s