撸码的xiao摩羯

第04章经典卷积神经网络模型

序言

1. 内容介绍

本章介绍深度学习算法-卷积神经网络用于 图片分类 的应用，主要介绍主流经典卷积神经网络 (CNN) 模型，包括 LeNet AlexNet VGGNet 的算法模型、数学推理、模型实现 以及 PyTorch框架 的实现。并能够把它应用于现实世界的 数据集 实现分类效果。

2. 理论目标

LeNet 的基础模型架构、训练细节与数学推理
AlexNet 的基础模型架构、训练细节与数学推理
VGGNet 的基础模型架构、训练细节与数学推理

3. 实践目标

掌握PyTorch框架下LeNet AlexNet VGGNet 的实现
掌握迁移学习与特征提取
熟悉各经典算法在图像分类应用上的优缺点

4. 实践数据集

Flower 数据集分类
Oxford-IIIT 数据集分类
CIFAR-10 数据集分类

5. 内容目录

1.卷积神经网络模型详解 LeNet
2.卷积神经网络模型详解 AlexNet
3.卷积神经网络模型详解 VGGNet
4.PyTorch 实践
5.图像分类实例 Flower 数据集
6.图像分类实例 Oxford-IIIT 数据集
7.图像分类实例 CIFAR-10 数据集

第1节卷积神经网络模型 LeNet

1.1 LeNet 简介

LeNet 诞生于 1998 年，是最早的卷积神经网络之一，并且推动了深度学习领域的发展。自从 1998 年开始，在许多次成功的迭代后，这项由 Yann LeCun 完成的开拓性成果被命名为 LeNet5。LeNet5 的架构基于这样的观点：图像的特征分布在整张图像上，以及带有可学习参数的卷积是一种用少量参数在多个位置上提取相似特征的有效方式。在那时候，没有 GPU 帮助训练，甚至 CPU 的速度也很慢。因此，能够保存参数以及计算过程是一个关键进展。这和将每个像素用作一个大型多层神经网络。

1.2 LeNet 模型结构

LeNet网络包含了 卷积层、池化层 和 全连接层，这些都是现代CNN 网络的基本组件：

输入层：二维图像，尺寸为 32\times3232×32 的灰色图像或RGB图像
卷积层：二维卷积C1、C3、C5层。其中 C1 与 C3 层运用卷积计算降低输入特征图的尺寸大小，C5 层将输入尺寸为 16\times5\times516×5×5 的特征图转化为尺寸为 120\times1\times1120×1×1，然后转换为长度为 120 的一维向量。这是一种常见的、将卷积层的输出转换为全连接层的输入的一种方法
池化层：池化S2、S4层，也就是下采样层，使用最大池化进行下采样，池化的尺寸大小为 2\times22×2。例如对 C1层 28\times2828×28 的图片，进行分块，每个块的大小为 2\times22×2，可以得到 14\times1414×14 个块，然后统计每个块中，最大的值作为下采样的新像素，因此S1结果为 6 个 14\times1414×14 大小的图像。LeNet 使用 sigmoid 函数作为激活函数，后续 CNN 模型多使用 ReLU 函数
全连接层：F6层，线性函数将输出特征向量从 120 减低为 84
输出层：由欧式径向基函数单元组成，后续 CNN 模型多使用 softmax 输出单元

1.3 LeNet PyTorch

# %load lenet.py import torch import torch.nn as nn import torch.nn.functional as F class LeNet(nn.Module): def __init__(self, num_classes=10): super(LeNet,self).__init__() self.conv1 = nn.Conv2d(3,16,kernel_size = 5) self.pool1 = nn.MaxPool2d(2,2) self.conv2 = nn.Conv2d(16,32,kernel_size = 5) self.pool2 = nn.MaxPool2d(2,2) self.fc1 = nn.Linear(32*5*5,120) self.fc2 = nn.Linear(120,84) self.fc3 = nn.Linear(84,num_classes) def forward(self, x): x = F.relu(self.conv1(x)) x = self.pool1(x) x = F.relu(self.conv2(x)) x = self.pool2(x) x = x.view(-1,32*5*5) x = F.relu(self.fc1(x)) x = F.relu(self.fc2(x)) x = self.fc3(x) return x def build_lenet5(phase, num_classes): if phase != "test" and phase != "train": print("ERROR: Phase: " + phase + " not recognized") return return LeNet(num_classes=num_classes)

from torchsummary import summary net = build_lenet5('train',10) net.cuda() summary(net,(3,32,32))

----------------------------------------------------------------
        Layer (type)               Output Shape         Param #
================================================================
            Conv2d-1           [-1, 16, 28, 28]           1,216
         MaxPool2d-2           [-1, 16, 14, 14]               0
            Conv2d-3           [-1, 32, 10, 10]          12,832
         MaxPool2d-4             [-1, 32, 5, 5]               0
            Linear-5                  [-1, 120]          96,120
            Linear-6                   [-1, 84]          10,164
            Linear-7                   [-1, 10]             850
================================================================
Total params: 121,182
Trainable params: 121,182
Non-trainable params: 0
----------------------------------------------------------------
Input size (MB): 0.01
Forward/backward pass size (MB): 0.15
Params size (MB): 0.46
Estimated Total Size (MB): 0.63
----------------------------------------------------------------

第2节卷积神经网络模型 AlexNet

2.1 AlexNet 简介

ImageNet 数据集 是一个开源的图片数据集，包含超过 14001400 万张图片和图片对应的标签，包含 22 万多个类别。自从 20102010 年以来，ImageNet 每年举办一次比赛，即 ImageNet 大规模视觉识别挑战赛 ILSVRC ，比赛使用 10001000 个类别图片。

2017年7月，ImageNet 宣布ILSVRC 于 2017 年正式结束，因为图像分类、物体检测、物体识别任务中计算机的正确率都远超人类，计算机视觉在感知方面的问题基本得到解决，后续将专注于目前尚未解决的问题。这一切都起源于 2012 年 Geoffrey Hinton 和他的学生 Alex Krizhevsky 推出了AlexNet 。在当年的ImageNet 图像分类竞赛中，AlexeNet 以远超第二名的成绩夺冠，使得深度学习重回历史舞台，具有重大历史意义。

2.2 AlexNet 模型结构

AlexNet 有 55 个广义卷积层和 33 个广义全连接层。

广义的卷积层：包含了卷积层、池化层、ReLU、LRN 层等。
广义全连接层：包含了全连接层、ReLU、Dropout 层等。

网络结构如下表所示：

输入层会将 3\times224\times2243×224×224 的三维图片预处理变成 3\times227\times2273×227×227 的三维图片。
第二层广义卷积层、第四层广义卷积层、第五层广义卷积层都是分组卷积，仅采用 GPU 内的通道数据进行计算。
第一层广义卷积层、第三层广义卷积层、第六层连接层、第七层连接层、第八层连接层执行的是全部通道数据的计算。
第二层广义卷积层的卷积、第三层广义卷积层的卷积、第四层广义卷积层的卷积、第五层广义卷积层的卷积均采用 same padding 填充。当卷积的步长为 11，核大小为 3\times33×3 时，如果不填充 00，则 feature map 的宽/高都会缩减 22 。因此这里填充 00，使得输出 feature map 的宽/高保持不变。其它层的卷积，以及所有的池化都是 valid 填充（即不填充 00）。
第六层广义连接层的卷积之后，会将 feature map 展平为长度为 40964096 的一维向量。

2.2 AlexNet PyTorch

# %load alex.py import math import torch import torch.nn as nn class AlexNet(nn.Module): def __init__(self,num_classes=1000, init_weights=False): super(AlexNet, self).__init__() self.features = nn.Sequential( nn.Conv2d(3, 64, kernel_size=11, stride=4, padding=2), nn.ReLU(inplace=True), nn.MaxPool2d(kernel_size=3, stride=2), nn.Conv2d(64, 192, kernel_size=5, padding=2), nn.ReLU(inplace=True), nn.MaxPool2d(kernel_size=3, stride=2), nn.Conv2d(192, 384, kernel_size=3, padding=1), nn.ReLU(inplace=True), nn.Conv2d(384, 256, kernel_size=3, padding=1), nn.ReLU(inplace=True), nn.Conv2d(256, 256, kernel_size=3, padding=1), nn.ReLU(inplace=True), nn.MaxPool2d(kernel_size=3, stride=2), ) self.avgpool = nn.AdaptiveAvgPool2d((6, 6)) self.classifier = nn.Sequential( nn.Dropout(), nn.Linear(256 * 6 * 6, 4096), nn.ReLU(inplace=True), nn.Dropout(), nn.Linear(4096, 4096), nn.ReLU(inplace=True), nn.Linear(4096, num_classes), ) if init_weights: self._initialize_weights() def forward(self, x): x = self.features(x) x = torch.flatten(x, start_dim=1) x = self.classifier(x) return x def _initialize_weights(self): for m in self.modules(): if isinstance(m, nn.Conv2d): nn.init.kaiming_normal_(m.weight, mode='fan_out', nonlinearity='relu') if m.bias is not None: nn.init.constant_(m.bias, 0) elif isinstance(m, nn.Linear): nn.init.normal_(m.weight, 0, 0.01) nn.init.constant_(m.bias, 0) def build_alex(phase, num_classes, pretrained): if phase != "test" and phase != "train": print("ERROR: Phase: " + phase + " not recognized") return if not pretrained: model = AlexNet(num_classes=num_classes) else: model = AlexNet() model_weights_path = 'weights/alexnet-owt-4df8aa71.pth' model.load_state_dict(torch.load(model_weights_path), strict=False) for parma in model.parameters(): parma.requires_grad = False ratio = int(math.sqrt(4096/num_classes)) floor = math.floor(math.log2(ratio)) trans_size = int(math.pow(2,10-floor)) model.classifier = nn.Sequential(nn.Linear(256 * 6 * 6, 4096), nn.ReLU(inplace=True), nn.Dropout(p=0.5), nn.Linear(4096, trans_size), nn.ReLU(inplace=True), nn.Dropout(p=0.5), nn.Linear(trans_size, num_classes) ) return model

net = build_alex('train',10,False) net.cuda() summary(net,(3,224,224))

----------------------------------------------------------------
        Layer (type)               Output Shape         Param #
================================================================
            Conv2d-1           [-1, 64, 55, 55]          23,296
              ReLU-2           [-1, 64, 55, 55]               0
         MaxPool2d-3           [-1, 64, 27, 27]               0
            Conv2d-4          [-1, 192, 27, 27]         307,392
              ReLU-5          [-1, 192, 27, 27]               0
         MaxPool2d-6          [-1, 192, 13, 13]               0
            Conv2d-7          [-1, 384, 13, 13]         663,936
              ReLU-8          [-1, 384, 13, 13]               0
            Conv2d-9          [-1, 256, 13, 13]         884,992
             ReLU-10          [-1, 256, 13, 13]               0
           Conv2d-11          [-1, 256, 13, 13]         590,080
             ReLU-12          [-1, 256, 13, 13]               0
        MaxPool2d-13            [-1, 256, 6, 6]               0
          Dropout-14                 [-1, 9216]               0
           Linear-15                 [-1, 4096]      37,752,832
             ReLU-16                 [-1, 4096]               0
          Dropout-17                 [-1, 4096]               0
           Linear-18                 [-1, 4096]      16,781,312
             ReLU-19                 [-1, 4096]               0
           Linear-20                   [-1, 10]          40,970
================================================================
Total params: 57,044,810
Trainable params: 57,044,810
Non-trainable params: 0
----------------------------------------------------------------
Input size (MB): 0.57
Forward/backward pass size (MB): 8.30
Params size (MB): 217.61
Estimated Total Size (MB): 226.48
----------------------------------------------------------------

net = build_alex('train',10,True) net.cuda() summary(net,(3,224,224))

----------------------------------------------------------------
        Layer (type)               Output Shape         Param #
================================================================
            Conv2d-1           [-1, 64, 55, 55]          23,296
              ReLU-2           [-1, 64, 55, 55]               0
         MaxPool2d-3           [-1, 64, 27, 27]               0
            Conv2d-4          [-1, 192, 27, 27]         307,392
              ReLU-5          [-1, 192, 27, 27]               0
         MaxPool2d-6          [-1, 192, 13, 13]               0
            Conv2d-7          [-1, 384, 13, 13]         663,936
              ReLU-8          [-1, 384, 13, 13]               0
            Conv2d-9          [-1, 256, 13, 13]         884,992
             ReLU-10          [-1, 256, 13, 13]               0
           Conv2d-11          [-1, 256, 13, 13]         590,080
             ReLU-12          [-1, 256, 13, 13]               0
        MaxPool2d-13            [-1, 256, 6, 6]               0
           Linear-14                 [-1, 4096]      37,752,832
             ReLU-15                 [-1, 4096]               0
          Dropout-16                 [-1, 4096]               0
           Linear-17                   [-1, 64]         262,208
             ReLU-18                   [-1, 64]               0
          Dropout-19                   [-1, 64]               0
           Linear-20                   [-1, 10]             650
================================================================
Total params: 40,485,386
Trainable params: 38,015,690
Non-trainable params: 2,469,696
----------------------------------------------------------------
Input size (MB): 0.57
Forward/backward pass size (MB): 8.17
Params size (MB): 154.44
Estimated Total Size (MB): 163.18
----------------------------------------------------------------

2.3 AlexNet 设计技巧

AlexNet 在 2012 年 ImageNet 大获成功的主要原因在于：

使用 ReLU 激活函数
使用 dropout、数据集增强、重叠池化等防止 过拟合 的方法
使用 百万级 的大数据集来训练
使用 GPU 训练，以及的 LRN 使用
使用带动量的 mini batch 随机梯度下降来训练

2.3.1 非线性函数 ReLU

AlexNet 问世之前，标准的神经元激活函数是 tanh() 函数，即双曲正切函数，由基本双曲函数双曲正弦和双曲余弦推导而来

y = tanh(x) = \frac{sinh(x)}{cosh(x)} = \frac{e^{x} - e^{-x}}{e^{x} + e^{-x}}y=tanh(x)=cosh(x)sinh(x)=ex+e−xex−e−x y = tanh(x) = 2sigmoid(2x) - 1y=tanh(x)=2sigmoid(2x)−1

y' = \frac{4 e^{2x}}{(e^{2x} + 1)^2}y′=(e2x+1)24e2x

蓝色为原函数 y = tanh(x)y=tanh(x), 红色为微分函数 y'y′

tanh(x) 是一个奇函数，其函数图像为过原点并且穿越Ⅰ、Ⅲ 象限的严格单调递增曲线，其图像被限制在两水平渐近线 y = 1y=1 和 y = -1y=−1 之间。这种饱和的非线性函数在梯度下降的时候要比非饱和的非线性函数慢得多，因此，在 AlexNet 中使用 ReLU 函数作为激活函数

ReLU，即 Rectified Linear Unit，整流线性单元，激活部分神经元，增加稀疏性，当 x 小于 0 时，输出值为 0，当 x 大于 0 时，输出值为 x

y = max(0,x)y=max(0,x)

y' = \begin{cases}0&if\;x\le0\\x&if\;x>0\\\end{cases}y′={0xifx≤0ifx>0

2.3.2 数据集增强 Data Augmentation

AlexNet 中使用的数据集增强手段包括：

随机裁剪、随机水平翻转：原始图片的尺寸为256xx256，裁剪大小为224x224
- 每一个epoch 中，对同一张图片进行随机性的裁剪，然后随机性的水平翻转。理论上相当于扩充了数据集 (256-224)^2 \times 2 = 2048(256−224)2×2=2048 倍
- 在预测阶段不是随机裁剪，而是固定裁剪图片四个角、一个中心位置，再加上水平翻转，一共获得 10 张图片, 并用这 10 张图片的预测结果的均值作为原始图片的预测结果
PCA 降噪：对 RGB 空间做 PCA 变换来完成去噪功能。同时在特征值上放大一个随机性的因子倍数（单位 1 加上一个 \aleph(0,0.1)ℵ(0,0.1) 的高斯绕动），从而保证图像的多样性
- 每一个 epoch 重新生成一个随机因子
- 该操作使得错误率下降 1%

AlexNet 使用随机剪裁的数据增强手段存在两个潜在问题：

固定裁剪四个角、一个中心的方式把图片的很多区域都给忽略掉了，所以很有可能一些重要信息被裁剪
裁剪窗口重叠这会引起冗余的计算量

针对此问题的改善思路为：

执行所有的裁剪方式，再对所有裁剪后的图片进行平均值预测，即可得到原始测试图片的预测结果
减少裁剪窗口重叠部分的冗余计算

因此，AlexNet 之后的多种不同的迭代模型将全连接层用等效的 卷积层替代，然后直接使用原始大小的测试图片进行预测。具体操作为将输出的各位置处的概率值按每一类取 平均值或最大值，以获得原始测试图像的输出类别概率。

2.3.3 随机失活 Dropout

AlexNet 中设置的失活概率为 0.5，在测试的时候，使用所有的神经元但是要给它们的输出都乘以 0.5。Dropout 正则化方法解决过拟合问题时，会遍历网络的每一层，并设置消除神经网络中节点的概率。AlexNet 网络中的每一层，每个节点都会以抛硬币的方式设置概率，每个节点得以保留和消除的概率都是 0.5，设置完节点概率，一半节点会被 随机去除，然后删除掉从该节点进出的连线，最后得到一个节点更少，规模更小的网络，然后再用 反向传播 方法进行训练。

Dropout 正则化后，每个神经元都有失活的可能，对于单个神经元来说，输入的特征量存在被清除的可能，这就使得神经元不会依赖于任何一个特征。对于不同的层，应该设置不同的 keep_prob，即失活概率。那些神经元数量较少的层，keep_prob可以设置为 1，这样会保留该层所有神经元信息，而那些神经元较多的层，可以将 keep_prob 设置为较小的值。

Dropout 正则化广泛运用于计算机视觉领域，因为计算机视觉领域输入的特征一般特别多，而且用于训练的数据较少。需要注意的是，这是一种正则化的方法，在实践过程中，除非算法出现过拟合，否则不推荐使用Dropout 正则化，因为其一大缺点就是代价函数不再被明确定义，每次迭代，都会随机移除一些节点，因此无法确保成本函数单调递减。

2.3.4 多GPU训练 Multi-GPU Processing

AlexNet 采用两块 GTX 580 3G 并行训练。网络结构图由上、下两部分组成：一个 GPU 运行图上方的通道数据，一个 GPU 运行图下方的通道数据，两个 GPU 只在特定的网络层通信, 即执行 分组卷积：

第二、四、五层卷积层的核只和同一个 GPU 上的前一层的 feature map 相连。
第三层卷积层的核和前一层所有 GPU 的 feature map 相连。
全连接层中的神经元和前一层中的所有神经元相连。

多 GPU 训练方法使 top-1 和 top-5 错误率和使用一个 GPU 训练一半的 kernels 相比分别降低了 1.7% 和 1.2%

2.3.5 局部响应归一化 Local Response Normalization,LRN

ReLU 函数不像 tanh 和 sigmoid 一样有一个有限的值域区间，所以在 ReLU 之后需要进行 归一化处理，LRN 的思想来源于神经生物学中一个叫做 “侧抑制” 的概念，指的是被激活的神经元抑制周围的神经元

局部响应规范层LRN：进行一个横向抑制，使得不同的卷积核所获得的响应产生竞争
- LRN 层现在很少使用，因为效果不是很明显，而且增加了内存消耗和计算时间
- AlexNet 中 LRN 策略提高了 1.2% 的准确率
LRN 的思想：输出通道 ii 在位置 (x,y)(x,y) 处的输出会受到相邻通道在相同位置输出的影响
- 为了刻画这种影响，将输出通道 ii 的原始值除以一个归一化因子
- LRN 使 AlexNet 的 top-1 和 top-5 错误率分别降低了 1.4% 和 1.2%
- \hat{a}^{(x,y)}_i = \left. {a^{(x,y)}_i} \middle/ {(k + \alpha\Sigma^{min(N-1,i+n/2)}_{j=max(0,i-n/2)}{(a^{(x,y)}_j)^2}})^\beta \right. , i = 0, 1, \dots, N-1a^i(x,y)=ai(x,y)/(k+αΣj=max(0,i−n/2)min(N−1,i+n/2)(aj(x,y))2)β,i=0,1,…,N−1
其中：a^{(x,y)}_iai(x,y) 为输出通道 ii 在位置 (x,y)(x,y) 处的原始值，\hat{a}^{(x,y)}a^(x,y) 为归一化之后的值。nn 为影响第 ii 通道的通道数量（分别从左侧、右侧 \left. n \middle/ 2 \right.n/2 个通道考虑。\alpha, \beta, kα,β,k 为超参数, 通常情况下 \alpha = 2, n = 5, \alpha = 10 ^ {-4}, \beta = 0.75α=2,n=5,α=10−4,β=0.75

2.3.6 重叠池化 Overlapping Pooling

一般的池化是不重叠的，池化区域的大小与步长相同。Alexnet 中，池化是可重叠的，即步长小于池化区域的大小。

重叠池化可以缓解过拟合，该策略贡献了 0.4% 的错误率。
重叠池化减少过拟合的原理很难用数学甚至直观上的观点来解答。一个稍微合理的解释是重叠池化会带来更多的特征，这些特征很可能会有利于提高模型的泛化能力。

2.3.7 优化算法 Optimization

AlexNet 使用了带动量的 mini-batch 随机梯度下降法。标准的带动量的mini-batch 随机梯度下降法为：

\vec{v}\gets \alpha\vec{v} - \epsilon \nabla_{\vec{\theta}}J(\vec{\theta})v←αv−ϵ∇θJ(θ)

\vec{\theta} \gets \vec{\theta} + \vec{\textbf{v}}θ←θ+v

AlexNet 使用修正动量的mini-batch为:

\vec{v}\gets \alpha\vec{v} - \beta\epsilon\vec{\theta} - \epsilon \nabla_{\vec{\theta}}J(\vec{\theta})v←αv−βϵθ−ϵ∇θJ(θ)

\vec{\theta} \gets \vec{\theta} + \vec{\textbf{v}}θ←θ+v

\alpha, \beta, \epsilonα,β,ϵ 为学习率
\beta\epsilon\vec{\theta}βϵθ 为 权重衰减 , 对于模型训练非常重要，不仅可以起到正则化效果，还可以减少训练误差。

第3节卷积神经网络模型 VGGNet

3.1 VGGNet 简介

VGGNet 是牛津大学计算机视觉组和DeepMind公司共同研发一种深度卷积网络，并且在 2014 年在ILSVRC比赛上获得了分类项目的第二名和定位项目的第一名。VGG-Net 的主要贡献是：

证明了 小尺寸卷积核 (3\times3)(3×3) 的深层网络优于大尺寸卷积核的浅层网络
证明了深度对网络的泛化性能的重要性
验证了尺寸抖动 scale jittering 这一数据增强技术的有效性
VGGNet 最大的缺陷在于参数数量，VGG-19 是参数数量最多的卷积网络架构

3.2 VGGNet 模型结构

VGGNet 一共有五组结构，可表示为 A-E，其每组结构都类似，区别在于网络深度上的不同。

结构中不同的部分用黑色粗体给出
卷积层的参数为 convx-y，其中 x 为卷积核大小，y 为卷积核数量，conv3-64 表示 6464 个 3\times33×3 的卷积核
卷积层的通道数刚开始很小（64通道），然后在每个池化层之后的卷积层通道数翻倍，直到512
每个卷积层之后都跟随一个 ReLU 激活函数

VggNet 通用结构：

输入层：固定大小的 224\times224224×224 的 RGB 图像
卷积层：卷积步长均为 1
- 填充方式：填充卷积层的输入，使得卷积前后保持同样的空间分辨率
  - (3\times3)(3×3) 卷积：same 填充，即输入的上下左右各填充 1 个像素
  - (1\times1)(1×1) 卷积：不需要填充
- 卷积核尺寸：有 3\times33×3 和 1\times11×1 两种
  - (3\times3)(3×3) 卷积核：捕获左右、上下、中心等概念的最小尺寸
  - (1\times1)(1×1) 卷积核：用于输入通道的线性变换, 在它之后接一个ReLU 激活函数，使得输入通道执行了非线性变换
池化层：采用 最大池化
- 池化层连接在卷积层之后，但并不是所有的卷积层之后都有池化
- 池化窗口为 2\times22×2，步长为 2
网络最后四层为：三个 全连接层 + 一个 softmax层
- 前两个全连接层都是 4096 个神经元，第三个全连接层是 1000 个神经元（ImageNet 1000 类的分类）
- 最后一层是softmax 层用于输出类别的概率
所有隐层都使用ReLU 激活函数
VGGNet 网络中第一个全连接层 FC-4096 的参数数量为：7x7x512x4096=1.02亿，网络绝大部分参数来自于该层

3.2 VGGNet PyTorch

# %load vgg.py import math import torch import torch.nn as nn cfg = [64, 64, 'M', 128, 128, 'M', 256, 256, 256, 'M', 512, 512, 512, 'M', 512, 512, 512, 'M'] class VGGNet(nn.Module): def __init__(self, features, num_classes=1000, init_weights=True): super(VGGNet, self).__init__() self.features = features self.avgpool = nn.AdaptiveAvgPool2d((7, 7)) self.classifier = nn.Sequential( nn.Linear(512 * 7 * 7, 4096), nn.ReLU(True), nn.Dropout(), nn.Linear(4096, 4096), nn.ReLU(True), nn.Dropout(), nn.Linear(4096, num_classes), ) if init_weights: self._initialize_weights() def forward(self, x): x = self.features(x) x = self.avgpool(x) x = torch.flatten(x, 1) x = self.classifier(x) return x def _initialize_weights(self): for m in self.modules(): if isinstance(m, nn.Conv2d): nn.init.kaiming_normal_(m.weight, mode='fan_out', nonlinearity='relu') if m.bias is not None: nn.init.constant_(m.bias, 0) elif isinstance(m, nn.BatchNorm2d): nn.init.constant_(m.weight, 1) nn.init.constant_(m.bias, 0) elif isinstance(m, nn.Linear): nn.init.normal_(m.weight, 0, 0.01) nn.init.constant_(m.bias, 0) def make_layers(cfg, batch_norm=False): layers = [] in_channels = 3 for v in cfg: if v == 'M': layers += [nn.MaxPool2d(kernel_size=2, stride=2)] else: conv2d = nn.Conv2d(in_channels, v, kernel_size=3, padding=1) if batch_norm: layers += [conv2d, nn.BatchNorm2d(v), nn.ReLU(inplace=True)] else: layers += [conv2d, nn.ReLU(inplace=True)] in_channels = v return nn.Sequential(*layers) def build_vgg16(phase,num_classes,pretrained): if phase != "test" and phase != "train": print("ERROR: Phase: " + phase + " not recognized") return if not pretrained: model = VGGNet(make_layers(cfg, False),num_classes=num_classes) else: model = VGGNet(make_layers(cfg, False)) model_weights_path = 'weights/vgg16-397923af.pth' model.load_state_dict(torch.load(model_weights_path), strict=False) for parma in model.parameters(): parma.requires_grad = False ratio = int(math.sqrt(25088/num_classes)) floor = math.floor(math.log2(ratio)) hidden_size = int(math.pow(2,12-floor)) model.classifier = nn.Sequential(nn.Linear(512 * 7 * 7, 4096), nn.ReLU(inplace=True), nn.Dropout(p=0.5), nn.Linear(4096, hidden_size), nn.ReLU(inplace=True), nn.Dropout(p=0.5), nn.Linear(hidden_size, num_classes)) return model

net = build_vgg16('train',10,False) net.cuda() summary(net,(3,224,224))

----------------------------------------------------------------
        Layer (type)               Output Shape         Param #
================================================================
            Conv2d-1         [-1, 64, 224, 224]           1,792
              ReLU-2         [-1, 64, 224, 224]               0
            Conv2d-3         [-1, 64, 224, 224]          36,928
              ReLU-4         [-1, 64, 224, 224]               0
         MaxPool2d-5         [-1, 64, 112, 112]               0
            Conv2d-6        [-1, 128, 112, 112]          73,856
              ReLU-7        [-1, 128, 112, 112]               0
            Conv2d-8        [-1, 128, 112, 112]         147,584
              ReLU-9        [-1, 128, 112, 112]               0
        MaxPool2d-10          [-1, 128, 56, 56]               0
           Conv2d-11          [-1, 256, 56, 56]         295,168
             ReLU-12          [-1, 256, 56, 56]               0
           Conv2d-13          [-1, 256, 56, 56]         590,080
             ReLU-14          [-1, 256, 56, 56]               0
           Conv2d-15          [-1, 256, 56, 56]         590,080
             ReLU-16          [-1, 256, 56, 56]               0
        MaxPool2d-17          [-1, 256, 28, 28]               0
           Conv2d-18          [-1, 512, 28, 28]       1,180,160
             ReLU-19          [-1, 512, 28, 28]               0
           Conv2d-20          [-1, 512, 28, 28]       2,359,808
             ReLU-21          [-1, 512, 28, 28]               0
           Conv2d-22          [-1, 512, 28, 28]       2,359,808
             ReLU-23          [-1, 512, 28, 28]               0
        MaxPool2d-24          [-1, 512, 14, 14]               0
           Conv2d-25          [-1, 512, 14, 14]       2,359,808
             ReLU-26          [-1, 512, 14, 14]               0
           Conv2d-27          [-1, 512, 14, 14]       2,359,808
             ReLU-28          [-1, 512, 14, 14]               0
           Conv2d-29          [-1, 512, 14, 14]       2,359,808
             ReLU-30          [-1, 512, 14, 14]               0
        MaxPool2d-31            [-1, 512, 7, 7]               0
AdaptiveAvgPool2d-32            [-1, 512, 7, 7]               0
           Linear-33                 [-1, 4096]     102,764,544
             ReLU-34                 [-1, 4096]               0
          Dropout-35                 [-1, 4096]               0
           Linear-36                 [-1, 4096]      16,781,312
             ReLU-37                 [-1, 4096]               0
          Dropout-38                 [-1, 4096]               0
           Linear-39                   [-1, 10]          40,970
================================================================
Total params: 134,301,514
Trainable params: 134,301,514
Non-trainable params: 0
----------------------------------------------------------------
Input size (MB): 0.57
Forward/backward pass size (MB): 218.77
Params size (MB): 512.32
Estimated Total Size (MB): 731.67
----------------------------------------------------------------

net = build_vgg16('train',10,True) net.cuda() summary(net,(3,224,224))

----------------------------------------------------------------
        Layer (type)               Output Shape         Param #
================================================================
            Conv2d-1         [-1, 64, 224, 224]           1,792
              ReLU-2         [-1, 64, 224, 224]               0
            Conv2d-3         [-1, 64, 224, 224]          36,928
              ReLU-4         [-1, 64, 224, 224]               0
         MaxPool2d-5         [-1, 64, 112, 112]               0
            Conv2d-6        [-1, 128, 112, 112]          73,856
              ReLU-7        [-1, 128, 112, 112]               0
            Conv2d-8        [-1, 128, 112, 112]         147,584
              ReLU-9        [-1, 128, 112, 112]               0
        MaxPool2d-10          [-1, 128, 56, 56]               0
           Conv2d-11          [-1, 256, 56, 56]         295,168
             ReLU-12          [-1, 256, 56, 56]               0
           Conv2d-13          [-1, 256, 56, 56]         590,080
             ReLU-14          [-1, 256, 56, 56]               0
           Conv2d-15          [-1, 256, 56, 56]         590,080
             ReLU-16          [-1, 256, 56, 56]               0
        MaxPool2d-17          [-1, 256, 28, 28]               0
           Conv2d-18          [-1, 512, 28, 28]       1,180,160
             ReLU-19          [-1, 512, 28, 28]               0
           Conv2d-20          [-1, 512, 28, 28]       2,359,808
             ReLU-21          [-1, 512, 28, 28]               0
           Conv2d-22          [-1, 512, 28, 28]       2,359,808
             ReLU-23          [-1, 512, 28, 28]               0
        MaxPool2d-24          [-1, 512, 14, 14]               0
           Conv2d-25          [-1, 512, 14, 14]       2,359,808
             ReLU-26          [-1, 512, 14, 14]               0
           Conv2d-27          [-1, 512, 14, 14]       2,359,808
             ReLU-28          [-1, 512, 14, 14]               0
           Conv2d-29          [-1, 512, 14, 14]       2,359,808
             ReLU-30          [-1, 512, 14, 14]               0
        MaxPool2d-31            [-1, 512, 7, 7]               0
AdaptiveAvgPool2d-32            [-1, 512, 7, 7]               0
           Linear-33                 [-1, 4096]     102,764,544
             ReLU-34                 [-1, 4096]               0
          Dropout-35                 [-1, 4096]               0
           Linear-36                  [-1, 128]         524,416
             ReLU-37                  [-1, 128]               0
          Dropout-38                  [-1, 128]               0
           Linear-39                   [-1, 10]           1,290
================================================================
Total params: 118,004,938
Trainable params: 103,290,250
Non-trainable params: 14,714,688
----------------------------------------------------------------
Input size (MB): 0.57
Forward/backward pass size (MB): 218.68
Params size (MB): 450.15
Estimated Total Size (MB): 669.41
----------------------------------------------------------------

3.3 VGGNet 设计技巧

VGGNet 在 AlexNet 的基础上改进了：

使用 输入预处理 对输入图像进行标准剪裁
使用 多尺度训练 与 多尺度测试 的方法
使用 权重初始化 的模型进行训练
使用学习率递减、带动量的最小批梯度下降算法、SGD优化函数等完善 训练策略
使用三种模型 评估方案

3.3.1 输入预处理 Data Preprocessing

输入预处理：通道像素零均值化。

先统计训练集中全部样本的通道均值：所有红色通道的像素均值 \bar{Red}Redˉ、所有绿色通道的像素均值 \bar{Green}Greenˉ、所有蓝色通道的像素均值 \bar{Blue}Blueˉ

\bar{Red} = \Sigma_n\Sigma_i\Sigma_jI_{n,0,i,j}Redˉ=ΣnΣiΣjIn,0,i,j

\bar{Green} = \Sigma_n\Sigma_i\Sigma_jI_{n,1,i,j}Greenˉ=ΣnΣiΣjIn,1,i,j

\bar{Blue} = \Sigma_n\Sigma_i\Sigma_jI_{n,2,i,j}Blueˉ=ΣnΣiΣjIn,2,i,j

假设红色通道为通道 0，绿色通道为通道 1，蓝色通道为通道 2; nn 遍历所有的训练样本, i,ji,j 遍历图片空间上的所有坐标。

对每个样本：红色通道的每个像素值减去 \bar{Red}Redˉ，绿色通道的每个像素值减去 \bar{Green}Greenˉ ，蓝色通道的每个像素值减去 \bar{Blue}Blueˉ

3.3.2 多尺度策略 Multi-Scale Strategy

多尺度训练将原始的图像缩放到 最小的边 S\ge224S≥224，然后在整副图像上截取 224\times224224×224 的区域来训练

在所有图像上固定 SS 用 S=256S=256 来训练一个模型，用 S=384S=384 来训练另一个模型。最后使用两个模型来评估
对每个图像，在 [S_{min},S_{max}][Smin,Smax] 之间随机选取一个 SS ，然后进行裁剪来训练一个模型。最后使用单个模型来评估
- 该方法只需要一个单一的模型
- 该方法相当于使用了尺寸抖动 (scale jittering) 的数据增强

多尺度测试将测试的原始图像等轴的缩放到预定义的最小图像边，表示为 QQ （QQ 不一定等于 SS)，称作测试尺度

在一张测试图像的几个归一化版本上运行模型，然后对得到的结果进行平均
不同版本对应于不同的 QQ 值
- 所有版本都执行通道像素归一化
- 该方法相当于在测试时使用了尺寸抖动 (scale jittering) 的数据增强

3.3.3 训练策略 Training Strategy

大部分神经网络的训练都遵循了 AlexNet 的训练方式，除了在输入采样上有所区别。VGGNet 训练使用了 带动量的最小批梯度下降算法（ mini-batch gradient descent with momentum）来优化多项式逻辑回归（ multinomial logistic regression）

为了进一步增强训练集，裁剪图像进行随机水平翻转和随机 RGB 颜色偏移
批次的大小设置为 256
动量设置为 0.9
在前两个全连接层（FC）使用 Dropout，值设置为 0.5
学习速率初始中设置为 1^{-2}1−2，当验证精度停止提升值，将学习速率衰减 10
整个训练过程中学习速率衰减 3 次，在经过 370K 此迭代，即 74 轮

VGGNet 训练之所以可以收敛的比 AlexNet 快，是因为：

通过增加深度和使用小的卷积 filter 隐式的进行了正则化
预初始化（pre-initialisation）确定的层

3.3.4 权重初始化 Weight Initialization

为解决 权重初始化 等问题，VggNet采用的是一种 Pre-training 的方式，先训练浅层的的简单网络 VGG11，再复用 VGG11 的权重来初始化 VGG13，如此反复训练并初始化 VGG19，能够使训练时收敛的速度更快。整个网络都使用卷积核尺寸为 3\times33×3 和最大池化尺寸 2\times22×2。比较常用的 VGG-16 的 16 指的是 conv+fc 的总层数是16，是不包括 max pool 的层数, 同时可以通过 Xavier 均匀初始化来直接初始化权重而不需要进行预训练操作

3.3.5 评估方案 Evaluation

single-crop：对测试图片沿着最短边缩放，然后选择其中的 center crop 来裁剪图像，选择这个图像的预测结果作为原始图像的预测结果

该方法的缺点是：仅仅保留图片的 中央部分 可能会丢掉图片类别的关键信息。因此该方法很少在实际任务中使用，通常用于不同模型之间的性能比较
multi-crop：类似 AlexNet 的做法，对每个测试图像获取多个裁剪图像，平均每个裁剪图像的预测结果为原始图像的预测结果

该方法的缺点是：需要网络 重新计算 每个裁剪图像，效率较低
dense：将最后三个全连接层用等效的卷积层替代，成为一个全卷积网络。其中第一个全连接层用 7\times77×7 的卷积层替代，后面两个全连接层用 1\times11×1 的卷积层替代

该全卷积网络应用到整张图片上(无需裁剪)，得到一个多位置的、各类别的概率字典。通过原始图片、水平翻转图片的各类别预测的均值，得到原始图片的各类别概率

该方法的优点是：不需要裁剪图片，支持 多尺度 的图片测试，计算效率较高

实验结果表明 multi-crop 评估方式要比 dense 评估方式表现更好，而二者的组合要优于任何单独的一种

第4节 PyTorch 实践

4.1 模型训练代码

加载同级目录下 train.py 程序代码

# %load train.py import os os.environ["KMP_DUPLICATE_LIB_OK"]="TRUE" import time import argparse import sys import torch import torch.nn as nn import torch.optim as optim import torch.backends.cudnn as cudnn from torchvision import datasets, transforms from torch.autograd import Variable import matplotlib as mpl import matplotlib.pyplot as plt mpl.rc('axes', labelsize = 14) mpl.rc('xtick', labelsize = 12) mpl.rc('ytick', labelsize = 12) sys.path.append(os.path.dirname(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))) from lenet import build_lenet5 from alex import build_alex from vgg import build_vgg16 from datasets.config import * from datasets.cifar import CIFAR10 from datasets.FLOWER.flower import shuffle_flower from datasets.oxford_iiit import shuffle_oxford def str2bool(v): return v.lower() in ("yes", "true", "t", "1") parser = argparse.ArgumentParser( description='Image Classification Training With Pytorch') train_set = parser.add_mutually_exclusive_group() parser.add_argument('--dataset', default='Flower', choices=['Flower', 'Oxford-IIIT', 'CIFAR-10'], type=str, help='Flower, Oxford-IIIT, CIFAR-10') parser.add_argument('--dataset_root', default=FLOWER_ROOT, help='Dataset root directory path') parser.add_argument('--model', default='LeNet', choices=['LeNet', 'AlexNet', 'VGGNet'], type=str, help='LeNet, AlexNet or VGGNet') parser.add_argument('--pretrained', default=True, type=str2bool, help='Using pretrained model weights') parser.add_argument('--crop_size', default=224, type=int, help='Resized crop value') parser.add_argument('--batch_size', default=32, type=int, help='Batch size for training') parser.add_argument('--num_workers', default=0, type=int, help='Number of workers used in dataloading') parser.add_argument('--epoch_size', default=20, type=int, help='Number of Epoches for training') parser.add_argument('--cuda', default=True, type=str2bool, help='Use CUDA to train model') parser.add_argument('--shuffle', default=False, type=str2bool, help='Shuffle new train and test folders') parser.add_argument('--lr', '--learning-rate', default=2e-4, type=float, help='initial learning rate') parser.add_argument('--save_folder', default='weights/', help='Directory for saving checkpoint models') parser.add_argument('--photo_folder', default='results/', help='Directory for saving photos') args = parser.parse_args() if not os.path.exists(args.save_folder): os.mkdir(args.save_folder) if not os.path.exists(args.photo_folder): os.mkdir(args.photo_folder) data_transform = transforms.Compose([transforms.RandomResizedCrop(args.crop_size), transforms.RandomHorizontalFlip(), transforms.ToTensor(), transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))]) def train(): if args.dataset == 'Flower': if not os.path.exists(FLOWER_ROOT): parser.error('Must specify dataset_root if specifying dataset') args.dataset_root = FLOWER_ROOT train_path = os.path.join(FLOWER_ROOT, 'train') if not os.path.exists(train_path) or args.shuffle: shuffle_flower() dataset = datasets.ImageFolder(root=train_path,transform=data_transform) if args.dataset == 'Oxford-IIIT': if not os.path.exists(OXFORD_IIIT_ROOT): parser.error('Must specify dataset_root if specifying dataset') args.dataset_root = OXFORD_IIIT_ROOT train_path = os.path.join(OXFORD_IIIT_ROOT, 'train') if not os.path.exists(train_path) or args.shuffle: shuffle_oxford() dataset = datasets.ImageFolder(root=train_path,transform=data_transform) if args.dataset == 'CIFAR-10': if not os.path.exists(CIFAR_ROOT): parser.error('Must specify dataset_root if specifying dataset') args.dataset_root = CIFAR_ROOT dataset = CIFAR10(train=True,transform=data_transform,target_transform=None) classes = dataset.classes if args.model == 'LeNet': net = build_lenet5(phase='train', num_classes=len(classes)) if args.model == 'AlexNet': net = build_alex(phase='train', num_classes=len(classes), pretrained=args.pretrained) if args.model == 'VGGNet': net = build_vgg16(phase='train', num_classes=len(classes), pretrained=args.pretrained) if args.cuda and torch.cuda.is_available(): net = torch.nn.DataParallel(net) cudnn.benchmark = True net.cuda() optimizer = optim.Adam(net.parameters(), lr=args.lr) criterion = nn.CrossEntropyLoss() epoch_size = args.epoch_size print('Loading the dataset...') data_loader = torch.utils.data.DataLoader(dataset, args.batch_size, num_workers=args.num_workers, shuffle=True, pin_memory=True) print('Training on:', args.dataset) print('Using model:', args.model) print('Using the specified args:') print(args) loss_list = [] acc_list = [] for epoch in range(epoch_size): net.train() train_loss = 0.0 correct = 0 total = len(dataset) t0 = time.perf_counter() for step, data in enumerate(data_loader, start=0): images, labels = data if args.cuda: images = Variable(images.cuda()) labels = Variable(labels.cuda()) else: images = Variable(images) labels = Variable(labels) # forward outputs = net(images) # backprop optimizer.zero_grad() loss = criterion(outputs, labels) loss.backward() optimizer.step() # print statistics train_loss += loss.item() _, predicted = outputs.max(1) correct += predicted.eq(labels).sum().item() # print train process rate = (step + 1) / len(data_loader) a = "*" * int(rate * 50) b = "." * int((1 - rate) * 50) print("\rEpoch {}: {:^3.0f}%[{}->{}]{:.3f}".format(epoch+1, int(rate * 100), a, b, loss), end="") print(' Running time: %.3f' % (time.perf_counter() - t0)) acc = 100.*correct/ total loss = train_loss / step print('train loss: %.6f, acc: %.3f%% (%d/%d)' % (loss, acc, correct, total)) loss_list.append(loss) acc_list.append(acc/100) torch.save(net.state_dict(),args.save_folder + args.dataset + "_" + args.model + '.pth') plt.plot(range(epoch_size), loss_list, range(epoch_size), acc_list) plt.xlabel('Epoches') plt.ylabel('Sparse CrossEntropy Loss | Accuracy') plt.savefig(os.path.join( os.path.dirname( os.path.abspath(__file__)), args.photo_folder, args.dataset + "_" + args.model + "_train_details.png")) if __name__ == '__main__': train()

程序输入参数说明

dataset：

训练采用的数据集，目前提供 Flower, Oxford-IIIT, CIFAR-10 供选择。点击查看数据集加载Demo

dataset_root:

数据集读取地址, default已设置为数据集相对路径，部署在云端可能需要修改

model:

训练使用的算法模型，目前提供 LeNet, AlexNet, VGGNet, ResNet, DenseNet, SeNet 等卷积神经网络

pretrained：

是否使用 PyTorch 预训练权重

crop_size:

数据图像预处理剪裁大小，default为224，只有 LeNet 默认使用 32\times3232×32 尺寸大小

shuffle：

是否重新生成新的train-test数据集样本

batch_size:

单次训练所抓取的数据样本数量，default为32

num_workers:

加载数据所使用线程个数，default为0，n\in (2,4,8,12\dots)n∈(2,4,8,12…)

epoch_size:

训练次数, default为20

cuda:

是否调用GPU训练

超参数学习率，采用Adam优化函数，default为 0.0020.002

save_folder:

模型权重保存地址

程序输出文件说明

训练细节

print 于 python console, 包括单个epoch训练时间、训练集损失值、准确率

模型权重

模型保存路径为 ./weight/{dataset}_{model}.pth

损失函数与正确率

图片保存路径为 ./result/{dataset}_{model}_train_details.png

4.2 模型测试代码

加载同级目录下 test.py 程序代码

# %load test.py from algorithms.CNN_Image_Classification.train import train import sys import os os.environ["KMP_DUPLICATE_LIB_OK"]="TRUE" import argparse import torch import torch.nn as nn import torch.backends.cudnn as cudnn from torchvision import transforms, datasets from torch.autograd import Variable import itertools import numpy as np import matplotlib as mpl import matplotlib.pyplot as plt mpl.rc('axes', labelsize = 14) mpl.rc('xtick', labelsize = 12) mpl.rc('ytick', labelsize = 12) sys.path.append(os.path.dirname(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))) from lenet import build_lenet5 from alex import build_alex from vgg import build_vgg16 from datasets.config import * from datasets.cifar import CIFAR10 parser = argparse.ArgumentParser( description='Convolutional Neural Network Testing With Pytorch') parser.add_argument('--dataset', default='Flower', choices=['Flower', 'Oxford-IIIT', 'CIFAR-10'], type=str, help='Flower, Oxford-IIIT, or CIFAR-10') parser.add_argument('--dataset_root', default=FLOWER_ROOT, help='Dataset root directory path') parser.add_argument('--model', default='LeNet', choices=['LeNet', 'AlexNet', 'VGGNet'], type=str, help='LeNet, AlexNet or VGGNet') parser.add_argument('--crop_size', default=224, type=int, help='Resized crop value') parser.add_argument('--batch_size', default=32, type=int, help='Batch size for training') parser.add_argument('--num_workers', default=0, type=int, help='Number of workers used in dataloading') parser.add_argument('--weight', default='weights/{}_{}.pth', type=str, help='Trained state_dict file path to open') parser.add_argument('--cuda', default=True, type=bool, help='Use cuda to train model') parser.add_argument('--pretrained', default=True, type=bool, help='Using pretrained model weights') parser.add_argument('-f', default=None, type=str, help="Dummy arg so we can load in Jupyter Notebooks") args = parser.parse_args() args.weight = args.weight.format(args.dataset,args.model) data_transform = transforms.Compose([transforms.RandomResizedCrop(args.crop_size), transforms.RandomHorizontalFlip(), transforms.ToTensor(), transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))]) def confusion_matrix(preds, labels, conf_matrix): for p, t in zip(preds, labels): conf_matrix[p, t] += 1 return conf_matrix def save_confusion_matrix(cm, classes, normalize=False, title='Confusion matrix', cmap=plt.cm.Blues): plt.imshow(cm, interpolation='nearest', cmap=cmap) plt.title(title) plt.colorbar() tick_marks = np.arange(len(classes)) plt.xticks(tick_marks, classes, rotation=90) plt.yticks(tick_marks, classes) plt.axis("equal") ax = plt.gca() left, right = plt.xlim() ax.spines['left'].set_position(('data', left)) ax.spines['right'].set_position(('data', right)) for edge_i in ['top', 'bottom', 'right', 'left']: ax.spines[edge_i].set_edgecolor("white") thresh = cm.max() / 2. for i, j in itertools.product(range(cm.shape[0]), range(cm.shape[1])): num = '{:.2f}'.format(cm[i, j]) if normalize else int(cm[i, j]) plt.text(j, i, num, verticalalignment='center', horizontalalignment="center", color="white" if num > thresh else "black") plt.ylabel('True label') plt.xlabel('Predicted label') plt.savefig(os.path.join( os.path.dirname( os.path.abspath(__file__)), "results", args.dataset + '_confusion_matrix.png')) def test(): # load data if args.dataset == 'Flower': if not os.path.exists(FLOWER_ROOT): parser.error('Must specify dataset_root if specifying dataset') args.dataset_root = FLOWER_ROOT test_path = os.path.join(FLOWER_ROOT, 'val') if not os.path.exists(test_path): parser.error('Must train models before evaluating') dataset = datasets.ImageFolder(root=test_path,transform=data_transform) if args.dataset == 'Oxford-IIIT': if not os.path.exists(OXFORD_IIIT_ROOT): parser.error('Must specify dataset_root if specifying dataset') args.dataset_root = OXFORD_IIIT_ROOT test_path = os.path.join(OXFORD_IIIT_ROOT, 'val') if not os.path.exists(test_path): parser.error('Must train models before evaluating') dataset = datasets.ImageFolder(root=test_path,transform=data_transform) if args.dataset == 'CIFAR-10': if not os.path.exists(CIFAR_ROOT): parser.error('Must specify dataset_root if specifying dataset') args.dataset_root = CIFAR_ROOT dataset = CIFAR10(train=False,transform=data_transform,target_transform=None) classes = dataset.classes num_classes = len(classes) data_loader = torch.utils.data.DataLoader(dataset, args.batch_size, num_workers=args.num_workers, shuffle=True, pin_memory=True) # load net if args.model == 'LeNet': net = build_lenet5(phase='test', num_classes=num_classes) if args.model == 'AlexNet': net = build_alex(phase='test', num_classes=num_classes, pretrained=args.pretrained) if args.model == 'VGGNet': net = build_vgg16(phase='test', num_classes=num_classes, pretrained=args.pretrained) if args.cuda and torch.cuda.is_available(): net = torch.nn.DataParallel(net) cudnn.benchmark = True net.cuda() net.load_state_dict(torch.load(args.weight)) print('Finish loading model: ', args.weight) net.eval() print('Training on:', args.dataset) print('Using model:', args.model) print('Using the specified args:') print(args) # evaluation criterion = nn.CrossEntropyLoss() test_loss = 0 correct = 0 total = 0 conf_matrix = torch.zeros(num_classes, num_classes) class_correct = list(0 for i in range(num_classes)) class_total = list(0 for i in range(num_classes)) with torch.no_grad(): for step, data in enumerate(data_loader): images, labels = data if args.cuda: images = Variable(images.cuda()) labels = Variable(labels.cuda()) else: images = Variable(images) labels = Variable(labels) # forward outputs = net(images) loss = criterion(outputs, labels) test_loss += loss.item() _, predicted = outputs.max(1) conf_matrix = confusion_matrix(predicted, labels=labels, conf_matrix=conf_matrix) total += labels.size(0) correct += predicted.eq(labels).sum().item() c = (predicted.eq(labels)).squeeze() for i in range(c.size(0)): label = labels[i] class_correct[label] += c[i].item() class_total[label] += 1 acc = 100.* correct / total loss = test_loss / step print('test loss: %.6f, acc: %.3f%% (%d/%d)' % (loss, acc, correct, total)) for i in range(num_classes): print('accuracy of %s : %.3f%% (%d/%d)' % ( str(classes[i]), 100 * class_correct[i] / class_total[i], class_correct[i], class_total[i])) save_confusion_matrix(conf_matrix.numpy(), classes=classes, normalize=False, title = 'Normalized confusion matrix') if __name__ == '__main__': test()

程序输入参数说明

训练采用的数据集，目前提供 Flower, Oxford-IIIT, CIFAR-10 供选择。点击查看数据集加载 Demo

dataset_root:

数据集读取地址, default已设置为数据集相对路径，部署在云端可能需要修改

model:

训练使用的算法模型，目前提供 LeNet, AlexNet, VGGNet, ResNet, DenseNet, SeNet 等卷积神经网络

pretrained：

是否使用 PyTorch 预训练权重

crop_size:

数据图像预处理剪裁大小，default为224，只有 LeNet 默认使用 32\times3232×32 尺寸大小

shuffle：

单次训练所抓取的数据样本数量，default为32

num_workers:

加载数据所使用线程个数，default为0，n\in (2,4,8,12\dots)n∈(2,4,8,12…)

trained_model:

模型权重保存路径，default为 train.py 生成的ptb文件路径

cuda:

是否调用GPU训练

程序输出文件说明

测试集损失值与准确率

print 于 python console 第一行

各类别准确率

print 于 python console 后续列表

混淆矩阵

图片保存路径为 ./photos/%_confusion_matrix.png

第5节 Flower 数据集

Flower 数据集来自 Tensorflow 团队，创建于 2019 年 1 月，作为 入门级轻量数据集 包含5个花卉类别 [‘daisy’, ‘dandelion’, ‘roses’, ‘sunflowers’, ‘tulips’]
Flower 数据集是深度学习图像分类中经典的一个数据集，各个类别有 [633, 898, 641, 699, 799] 个样本，每个样本都是一张 320\times232320×232 像素的RGB图片
Dataset 库中的 flower.py 按照 0.1 的比例实现训练集与测试集的 样本分离

5.1 LeNet

%run train.py --dataset Flower --model LeNet --crop_size 32

Dataset 'Flower' contains 5 catagories: ['daisy', 'dandelion', 'roses', 'sunflowers', 'tulips']
[daisy] train/test dataset split [633/633] with ratio 0.1
[dandelion] train/test dataset split [898/898] with ratio 0.1
[roses] train/test dataset split [641/641] with ratio 0.1
[sunflowers] train/test dataset split [699/699] with ratio 0.1
[tulips] train/test dataset split [799/799] with ratio 0.1
Loading the dataset...
Training on: Flower
Using model: LeNet
Using the specified args:
Namespace(batch_size=32, crop_size=32, cuda=True, dataset='Flower', dataset_root='C:\\Users\\sbzy\\Documents/GitHub/dl_algorithm/datasets\\FLOWER', epoch_size=20, lr=0.0002, model='LeNet', num_workers=0, photo_folder='results/', pretrained=True, save_folder='weights/', shuffle=False)
Epoch 1: 100%[**************************************************->]1.365  Running time: 9.335
train loss: 1.548427, acc: 28.615% (946/3306)
Epoch 2: 100%[**************************************************->]1.212  Running time: 9.215
train loss: 1.308180, acc: 42.861% (1417/3306)
Epoch 3: 100%[**************************************************->]1.296  Running time: 9.455
train loss: 1.258674, acc: 44.797% (1481/3306)
Epoch 4: 100%[**************************************************->]1.547  Running time: 9.580
train loss: 1.249931, acc: 45.523% (1505/3306)
Epoch 5: 100%[**************************************************->]1.264  Running time: 8.800
train loss: 1.229576, acc: 46.673% (1543/3306)
Epoch 6: 100%[**************************************************->]0.901  Running time: 9.047
train loss: 1.219630, acc: 48.004% (1587/3306)
Epoch 7: 100%[**************************************************->]1.822  Running time: 8.900
train loss: 1.212125, acc: 49.425% (1634/3306)
Epoch 8: 100%[**************************************************->]1.057  Running time: 8.680
train loss: 1.180733, acc: 50.423% (1667/3306)
Epoch 9: 100%[**************************************************->]1.056  Running time: 8.682
train loss: 1.175452, acc: 50.938% (1684/3306)
Epoch 10: 100%[**************************************************->]1.464  Running time: 8.733
train loss: 1.167319, acc: 51.996% (1719/3306)
Epoch 11: 100%[**************************************************->]1.513  Running time: 8.670
train loss: 1.157543, acc: 54.083% (1788/3306)
Epoch 12: 100%[**************************************************->]1.068  Running time: 8.686
train loss: 1.135259, acc: 53.690% (1775/3306)
Epoch 13: 100%[**************************************************->]1.168  Running time: 8.661
train loss: 1.114434, acc: 54.628% (1806/3306)
Epoch 14: 100%[**************************************************->]1.058  Running time: 8.828
train loss: 1.116139, acc: 55.535% (1836/3306)
Epoch 15: 100%[**************************************************->]0.996  Running time: 8.677
train loss: 1.097041, acc: 56.987% (1884/3306)
Epoch 16: 100%[**************************************************->]0.792  Running time: 8.588
train loss: 1.080893, acc: 57.229% (1892/3306)
Epoch 17: 100%[**************************************************->]1.116  Running time: 8.779
train loss: 1.065502, acc: 58.016% (1918/3306)
Epoch 18: 100%[**************************************************->]0.737  Running time: 8.683
train loss: 1.043998, acc: 58.348% (1929/3306)
Epoch 19: 100%[**************************************************->]0.814  Running time: 8.656
train loss: 1.038189, acc: 58.923% (1948/3306)
Epoch 20: 100%[**************************************************->]1.060  Running time: 8.660
train loss: 1.018091, acc: 60.163% (1989/3306)

%run test.py --dataset Flower --model LeNet --crop_size 32 --pretrained False

Finish loading model:  weights/Flower_LeNet.pth
Training on: Flower
Using model: LeNet
Using the specified args:
Namespace(batch_size=32, crop_size=32, cuda=True, dataset='Flower', dataset_root='C:\\Users\\sbzy\\Documents/GitHub/dl_algorithm/datasets\\FLOWER', f=None, model='LeNet', num_workers=0, pretrained=True, weight='weights/Flower_LeNet.pth')
test loss: 1.163283, acc: 56.868% (207/364)
accuracy of daisy : 52.381% (33/63)
accuracy of dandelion : 69.663% (62/89)
accuracy of roses : 56.250% (36/64)
accuracy of sunflowers : 60.870% (42/69)
accuracy of tulips : 43.038% (34/79)

5.2 AlexNet

%run train.py --dataset Flower --model AlexNet --crop_size 224 --pretrained True

Loading the dataset...
Training on: Flower
Using model: AlexNet
Using the specified args:
Namespace(batch_size=32, crop_size=224, cuda=True, dataset='Flower', dataset_root='C:\\Users\\sbzy\\Documents/GitHub/dl_algorithm/datasets\\FLOWER', epoch_size=20, lr=0.0002, model='AlexNet', num_workers=0, photo_folder='results/', pretrained=True, save_folder='weights/', shuffle=False)
Epoch 1: 100%[**************************************************->]0.823  Running time: 15.608
train loss: 0.813369, acc: 68.754% (2273/3306)
Epoch 2: 100%[**************************************************->]0.591  Running time: 15.173
train loss: 0.578639, acc: 79.068% (2614/3306)
Epoch 3: 100%[**************************************************->]0.672  Running time: 15.601
train loss: 0.517714, acc: 80.702% (2668/3306)
Epoch 4: 100%[**************************************************->]0.682  Running time: 16.043
train loss: 0.496228, acc: 82.517% (2728/3306)
Epoch 5: 100%[**************************************************->]1.111  Running time: 16.056
train loss: 0.484389, acc: 82.396% (2724/3306)
Epoch 6: 100%[**************************************************->]0.286  Running time: 16.655
train loss: 0.427296, acc: 84.755% (2802/3306)
Epoch 7: 100%[**************************************************->]0.342  Running time: 16.279
train loss: 0.431695, acc: 83.848% (2772/3306)
Epoch 8: 100%[**************************************************->]0.662  Running time: 16.429
train loss: 0.409742, acc: 84.634% (2798/3306)
Epoch 9: 100%[**************************************************->]0.633  Running time: 16.282
train loss: 0.425239, acc: 83.485% (2760/3306)
Epoch 10: 100%[**************************************************->]0.525  Running time: 16.102
train loss: 0.393042, acc: 85.451% (2825/3306)
Epoch 11: 100%[**************************************************->]0.700  Running time: 16.264
train loss: 0.365828, acc: 86.570% (2862/3306)
Epoch 12: 100%[**************************************************->]0.593  Running time: 15.894
train loss: 0.361874, acc: 86.782% (2869/3306)
Epoch 13: 100%[**************************************************->]0.740  Running time: 15.882
train loss: 0.355939, acc: 86.509% (2860/3306)
Epoch 14: 100%[**************************************************->]0.747  Running time: 15.625
train loss: 0.348140, acc: 87.598% (2896/3306)
Epoch 15: 100%[**************************************************->]0.151  Running time: 16.246
train loss: 0.339823, acc: 87.356% (2888/3306)
Epoch 16: 100%[**************************************************->]0.109  Running time: 16.298
train loss: 0.326062, acc: 87.931% (2907/3306)
Epoch 17: 100%[**************************************************->]0.207  Running time: 16.075
train loss: 0.332952, acc: 88.355% (2921/3306)
Epoch 18: 100%[**************************************************->]0.302  Running time: 16.000
train loss: 0.322535, acc: 87.780% (2902/3306)
Epoch 19: 100%[**************************************************->]0.689  Running time: 15.750
train loss: 0.312812, acc: 88.717% (2933/3306)
Epoch 20: 100%[**************************************************->]0.347  Running time: 15.821
train loss: 0.309125, acc: 88.627% (2930/3306)

%run test.py --dataset Flower --model AlexNet --crop_size 224 --pretrained True

Finish loading model:  weights/Flower_AlexNet.pth
Training on: Flower
Using model: AlexNet
Using the specified args:
Namespace(batch_size=32, crop_size=224, cuda=True, dataset='Flower', dataset_root='C:\\Users\\sbzy\\Documents/GitHub/dl_algorithm/datasets\\FLOWER', f=None, model='AlexNet', num_workers=0, pretrained=True, weight='weights/Flower_AlexNet.pth')
test loss: 0.625130, acc: 82.692% (301/364)
accuracy of daisy : 77.778% (49/63)
accuracy of dandelion : 89.888% (80/89)
accuracy of roses : 89.062% (57/64)
accuracy of sunflowers : 76.812% (53/69)
accuracy of tulips : 78.481% (62/79)

5.3 VGGNet

%run train.py --dataset Flower --model VGGNet --crop_size 224 --pretrained True

Loading the dataset...
Training on: Flower
Using model: VGGNet
Using the specified args:
Namespace(batch_size=32, crop_size=224, cuda=True, dataset='Flower', dataset_root='C:\\Users\\sbzy\\Documents/GitHub/dl_algorithm/datasets\\FLOWER', epoch_size=20, lr=0.0002, model='VGGNet', num_workers=0, photo_folder='results/', pretrained=True, save_folder='weights/', shuffle=False)
Epoch 1: 100%[**************************************************->]0.444  Running time: 42.314
train loss: 0.804131, acc: 69.661% (2303/3306)
Epoch 2: 100%[**************************************************->]0.644  Running time: 38.402
train loss: 0.485267, acc: 82.456% (2726/3306)
Epoch 3: 100%[**************************************************->]0.554  Running time: 38.777
train loss: 0.454202, acc: 83.575% (2763/3306)
Epoch 4: 100%[**************************************************->]0.164  Running time: 38.346
train loss: 0.399140, acc: 85.209% (2817/3306)
Epoch 5: 100%[**************************************************->]0.346  Running time: 38.359
train loss: 0.364771, acc: 87.024% (2877/3306)
Epoch 6: 100%[**************************************************->]0.096  Running time: 38.401
train loss: 0.354722, acc: 86.540% (2861/3306)
Epoch 7: 100%[**************************************************->]0.182  Running time: 38.425
train loss: 0.337731, acc: 87.840% (2904/3306)
Epoch 8: 100%[**************************************************->]0.215  Running time: 38.656
train loss: 0.321707, acc: 88.838% (2937/3306)
Epoch 9: 100%[**************************************************->]0.063  Running time: 38.800
train loss: 0.287286, acc: 90.109% (2979/3306)
Epoch 10: 100%[**************************************************->]0.270  Running time: 38.718
train loss: 0.270214, acc: 90.260% (2984/3306)
Epoch 11: 100%[**************************************************->]0.143  Running time: 38.187
train loss: 0.263321, acc: 90.381% (2988/3306)
Epoch 12: 100%[**************************************************->]0.290  Running time: 38.329
train loss: 0.272533, acc: 89.837% (2970/3306)
Epoch 13: 100%[**************************************************->]0.723  Running time: 38.959
train loss: 0.278160, acc: 90.593% (2995/3306)
Epoch 14: 100%[**************************************************->]0.019  Running time: 38.523
train loss: 0.244733, acc: 90.865% (3004/3306)
Epoch 15: 100%[**************************************************->]0.151  Running time: 38.222
train loss: 0.246557, acc: 91.228% (3016/3306)
Epoch 16: 100%[**************************************************->]0.429  Running time: 38.806
train loss: 0.244205, acc: 90.835% (3003/3306)
Epoch 17: 100%[**************************************************->]0.112  Running time: 38.546
train loss: 0.249062, acc: 91.379% (3021/3306)
Epoch 18: 100%[**************************************************->]0.007  Running time: 38.902
train loss: 0.208794, acc: 92.680% (3064/3306)
Epoch 19: 100%[**************************************************->]0.170  Running time: 38.456
train loss: 0.228088, acc: 91.954% (3040/3306)
Epoch 20: 100%[**************************************************->]0.854  Running time: 38.961
train loss: 0.225824, acc: 92.740% (3066/3306)

%run test.py --dataset Flower --model VGGNet --crop_size 224 --pretrained True

Finish loading model:  weights/Flower_VGGNet.pth
Training on: Flower
Using model: VGGNet
Using the specified args:
Namespace(batch_size=32, crop_size=224, cuda=True, dataset='Flower', dataset_root='C:\\Users\\sbzy\\Documents/GitHub/dl_algorithm/datasets\\FLOWER', f=None, model='VGGNet', num_workers=0, pretrained=True, weight='weights/Flower_VGGNet.pth')
test loss: 0.463054, acc: 87.088% (317/364)
accuracy of daisy : 85.714% (54/63)
accuracy of dandelion : 87.640% (78/89)
accuracy of roses : 92.188% (59/64)
accuracy of sunflowers : 88.406% (61/69)
accuracy of tulips : 82.278% (65/79)

第6节 Oxford-IIIT 数据集

Oxford-IIIT 数据集覆盖 30 个种类的猫狗品种，每个类别收集了约 200 张图像样本
Oxford-IIIT 中每张图像在尺寸、姿势、光暗程度上有很大的浮动，但所有的图像都匹配了相关联的品种、头部框架定位、三维像素点语义分割的标注信息
Dataset 库中的 oxford_iiit.py 按照 0.1 的比例实现训练集与测试集的样本分离

6.1 LeNet

%run train.py --dataset Oxford-IIIT --model LeNet --crop_size 32 --pretrained False

Dataset 'Oxford-IIIT' contains 30 catagories: ['Abyssinian', 'American_Bulldog', 'American_Pit_Bull_Terrier', 'Basset_Hound', 'Beagle', 'Bengal', 'Birman', 'Bombay', 'Boxer', 'British_Shorthair', 'Chihuahua', 'Egyptian_Mau', 'English_Cocker_Spaniel', 'English_Setter', 'German_Shorthaired', 'Great_Pyrenees', 'Havanese', 'Japanese_Chin', 'Keeshond', 'Leonberger', 'Maine_Coon', 'Miniature_Pinscher', 'Newfoundland', 'Persian', 'Pomeranian', 'Pug', 'Ragdoll', 'Russian_Blue', 'Saint_Bernard', 'Samoyed']
[Abyssinian] train/test dataset split [200/200] with ratio 0.1
[American_Bulldog] train/test dataset split [200/200] with ratio 0.1
[American_Pit_Bull_Terrier] train/test dataset split [200/200] with ratio 0.1
[Basset_Hound] train/test dataset split [200/200] with ratio 0.1
[Beagle] train/test dataset split [200/200] with ratio 0.1
[Bengal] train/test dataset split [200/200] with ratio 0.1
[Birman] train/test dataset split [200/200] with ratio 0.1
[Bombay] train/test dataset split [200/200] with ratio 0.1
[Boxer] train/test dataset split [200/200] with ratio 0.1
[British_Shorthair] train/test dataset split [200/200] with ratio 0.1
[Chihuahua] train/test dataset split [200/200] with ratio 0.1
[Egyptian_Mau] train/test dataset split [200/200] with ratio 0.1
[English_Cocker_Spaniel] train/test dataset split [200/200] with ratio 0.1
[English_Setter] train/test dataset split [200/200] with ratio 0.1
[German_Shorthaired] train/test dataset split [200/200] with ratio 0.1
[Great_Pyrenees] train/test dataset split [200/200] with ratio 0.1
[Havanese] train/test dataset split [200/200] with ratio 0.1
[Japanese_Chin] train/test dataset split [200/200] with ratio 0.1
[Keeshond] train/test dataset split [200/200] with ratio 0.1
[Leonberger] train/test dataset split [200/200] with ratio 0.1
[Maine_Coon] train/test dataset split [200/200] with ratio 0.1
[Miniature_Pinscher] train/test dataset split [200/200] with ratio 0.1
[Newfoundland] train/test dataset split [200/200] with ratio 0.1
[Persian] train/test dataset split [200/200] with ratio 0.1
[Pomeranian] train/test dataset split [200/200] with ratio 0.1
[Pug] train/test dataset split [200/200] with ratio 0.1
[Ragdoll] train/test dataset split [200/200] with ratio 0.1
[Russian_Blue] train/test dataset split [200/200] with ratio 0.1
[Saint_Bernard] train/test dataset split [200/200] with ratio 0.1
[Samoyed] train/test dataset split [197/197] with ratio 0.1
Loading the dataset...
Training on: Oxford-IIIT
Using model: LeNet
Using the specified args:
Namespace(batch_size=32, crop_size=32, cuda=True, dataset='Oxford-IIIT', dataset_root='C:\\Users\\sbzy\\Documents/GitHub/dl_algorithm/datasets\\OXFORD-IIIT', epoch_size=20, lr=0.0002, model='LeNet', num_workers=0, photo_folder='results/', pretrained=False, save_folder='weights/', shuffle=False)
Epoch 1: 100%[**************************************************->]3.339  Running time: 23.284
train loss: 3.393844, acc: 4.687% (253/5398)
Epoch 2: 100%[**************************************************->]3.468  Running time: 23.144
train loss: 3.328217, acc: 7.206% (389/5398)
Epoch 3: 100%[**************************************************->]3.146  Running time: 22.369
train loss: 3.261986, acc: 8.392% (453/5398)
Epoch 4: 100%[**************************************************->]3.165  Running time: 22.697
train loss: 3.233198, acc: 9.207% (497/5398)
Epoch 5: 100%[**************************************************->]3.339  Running time: 22.388
train loss: 3.207408, acc: 9.726% (525/5398)
Epoch 6: 100%[**************************************************->]3.039  Running time: 22.092
train loss: 3.191449, acc: 10.467% (565/5398)
Epoch 7: 100%[**************************************************->]3.238  Running time: 22.248
train loss: 3.167063, acc: 11.541% (623/5398)
Epoch 8: 100%[**************************************************->]2.879  Running time: 22.819
train loss: 3.143465, acc: 10.986% (593/5398)
Epoch 9: 100%[**************************************************->]3.076  Running time: 22.619
train loss: 3.124420, acc: 12.690% (685/5398)
Epoch 10: 100%[**************************************************->]3.200  Running time: 22.696
train loss: 3.110711, acc: 13.097% (707/5398)
Epoch 11: 100%[**************************************************->]3.334  Running time: 22.007
train loss: 3.074659, acc: 13.394% (723/5398)
Epoch 12: 100%[**************************************************->]3.115  Running time: 21.971
train loss: 3.059965, acc: 13.690% (739/5398)
Epoch 13: 100%[**************************************************->]2.947  Running time: 22.448
train loss: 3.045815, acc: 14.098% (761/5398)
Epoch 14: 100%[**************************************************->]3.011  Running time: 23.345
train loss: 3.033115, acc: 14.672% (792/5398)
Epoch 15: 100%[**************************************************->]3.315  Running time: 22.555
train loss: 3.008330, acc: 14.302% (772/5398)
Epoch 16: 100%[**************************************************->]3.115  Running time: 22.701
train loss: 3.005380, acc: 15.098% (815/5398)
Epoch 17: 100%[**************************************************->]2.642  Running time: 22.415
train loss: 2.995956, acc: 15.320% (827/5398)
Epoch 18: 100%[**************************************************->]3.228  Running time: 22.398
train loss: 2.991024, acc: 15.635% (844/5398)
Epoch 19: 100%[**************************************************->]2.689  Running time: 23.170
train loss: 2.966305, acc: 15.821% (854/5398)
Epoch 20: 100%[**************************************************->]2.850  Running time: 22.989
train loss: 2.970545, acc: 15.858% (856/5398)

%run test.py --dataset Oxford-IIIT --model LeNet --crop_size 32 --pretrained False

Finish loading model:  weights/Oxford-IIIT_LeNet.pth
Training on: Oxford-IIIT
Using model: LeNet
Using the specified args:
Namespace(batch_size=32, crop_size=32, cuda=True, dataset='Oxford-IIIT', dataset_root='C:\\Users\\sbzy\\Documents/GitHub/dl_algorithm/datasets\\OXFORD-IIIT', f=None, model='LeNet', num_workers=0, pretrained=True, weight='weights/Oxford-IIIT_LeNet.pth')
test loss: 3.162863, acc: 18.531% (111/599)
accuracy of Abyssinian : 20.000% (4/20)
accuracy of American_Bulldog : 15.000% (3/20)
accuracy of American_Pit_Bull_Terrier : 0.000% (0/20)
accuracy of Basset_Hound : 20.000% (4/20)
accuracy of Beagle : 20.000% (4/20)
accuracy of Bengal : 45.000% (9/20)
accuracy of Birman : 25.000% (5/20)
accuracy of Bombay : 70.000% (14/20)
accuracy of Boxer : 5.000% (1/20)
accuracy of British_Shorthair : 15.000% (3/20)
accuracy of Chihuahua : 5.000% (1/20)
accuracy of Egyptian_Mau : 20.000% (4/20)
accuracy of English_Cocker_Spaniel : 5.000% (1/20)
accuracy of English_Setter : 5.000% (1/20)
accuracy of German_Shorthaired : 5.000% (1/20)
accuracy of Great_Pyrenees : 15.000% (3/20)
accuracy of Havanese : 10.000% (2/20)
accuracy of Japanese_Chin : 25.000% (5/20)
accuracy of Keeshond : 20.000% (4/20)
accuracy of Leonberger : 10.000% (2/20)
accuracy of Maine_Coon : 5.000% (1/20)
accuracy of Miniature_Pinscher : 10.000% (2/20)
accuracy of Newfoundland : 30.000% (6/20)
accuracy of Persian : 30.000% (6/20)
accuracy of Pomeranian : 5.000% (1/20)
accuracy of Pug : 5.000% (1/20)
accuracy of Ragdoll : 30.000% (6/20)
accuracy of Russian_Blue : 20.000% (4/20)
accuracy of Saint_Bernard : 25.000% (5/20)
accuracy of Samoyed : 42.105% (8/19)

6.2 AlexNet

%run train.py --dataset Oxford-IIIT --model AlexNet --crop_size 224 --pretrained True

Loading the dataset...
Training on: Oxford-IIIT
Using model: AlexNet
Using the specified args:
Namespace(batch_size=32, crop_size=224, cuda=True, dataset='Oxford-IIIT', dataset_root='C:\\Users\\sbzy\\Documents/GitHub/dl_algorithm/datasets\\OXFORD-IIIT', epoch_size=20, lr=0.0002, model='AlexNet', num_workers=0, photo_folder='results/', pretrained=True, save_folder='weights/', shuffle=False)
Epoch 1: 100%[**************************************************->]1.908  Running time: 33.767
train loss: 2.572819, acc: 24.954% (1347/5398)
Epoch 2: 100%[**************************************************->]1.467  Running time: 33.638
train loss: 1.731733, acc: 46.184% (2493/5398)
Epoch 3: 100%[**************************************************->]1.703  Running time: 34.106
train loss: 1.502371, acc: 52.538% (2836/5398)
Epoch 4: 100%[**************************************************->]1.473  Running time: 34.103
train loss: 1.382494, acc: 56.836% (3068/5398)
Epoch 5: 100%[**************************************************->]1.035  Running time: 35.174
train loss: 1.279476, acc: 60.356% (3258/5398)
Epoch 6: 100%[**************************************************->]1.437  Running time: 33.971
train loss: 1.243415, acc: 61.041% (3295/5398)
Epoch 7: 100%[**************************************************->]1.087  Running time: 33.781
train loss: 1.197725, acc: 63.079% (3405/5398)
Epoch 8: 100%[**************************************************->]1.887  Running time: 34.815
train loss: 1.144729, acc: 63.820% (3445/5398)
Epoch 9: 100%[**************************************************->]1.252  Running time: 34.342
train loss: 1.133453, acc: 65.228% (3521/5398)
Epoch 10: 100%[**************************************************->]0.813  Running time: 34.848
train loss: 1.131729, acc: 64.635% (3489/5398)
Epoch 11: 100%[**************************************************->]1.486  Running time: 35.012
train loss: 1.074429, acc: 65.580% (3540/5398)
Epoch 12: 100%[**************************************************->]0.711  Running time: 33.890
train loss: 1.049976, acc: 67.284% (3632/5398)
Epoch 13: 100%[**************************************************->]1.421  Running time: 33.940
train loss: 1.020311, acc: 67.506% (3644/5398)
Epoch 14: 100%[**************************************************->]1.146  Running time: 33.795
train loss: 1.022906, acc: 67.951% (3668/5398)
Epoch 15: 100%[**************************************************->]0.785  Running time: 33.609
train loss: 0.970554, acc: 69.248% (3738/5398)
Epoch 16: 100%[**************************************************->]1.075  Running time: 33.834
train loss: 0.986888, acc: 69.192% (3735/5398)
Epoch 17: 100%[**************************************************->]0.906  Running time: 32.842
train loss: 0.972849, acc: 69.804% (3768/5398)
Epoch 18: 100%[**************************************************->]1.277  Running time: 32.982
train loss: 0.974976, acc: 69.248% (3738/5398)
Epoch 19: 100%[**************************************************->]0.797  Running time: 32.309
train loss: 0.979732, acc: 68.989% (3724/5398)
Epoch 20: 100%[**************************************************->]1.116  Running time: 33.062
train loss: 0.944694, acc: 70.471% (3804/5398)

%run test.py --dataset Oxford-IIIT --model AlexNet --crop_size 224 --pretrained True

Finish loading model:  weights/Oxford-IIIT_AlexNet.pth
Training on: Oxford-IIIT
Using model: AlexNet
Using the specified args:
Namespace(batch_size=32, crop_size=224, cuda=True, dataset='Oxford-IIIT', dataset_root='C:\\Users\\sbzy\\Documents/GitHub/dl_algorithm/datasets\\OXFORD-IIIT', f=None, model='AlexNet', num_workers=0, pretrained=True, weight='weights/Oxford-IIIT_AlexNet.pth')
test loss: 1.047209, acc: 68.781% (412/599)
accuracy of Abyssinian : 75.000% (15/20)
accuracy of American_Bulldog : 80.000% (16/20)
accuracy of American_Pit_Bull_Terrier : 40.000% (8/20)
accuracy of Basset_Hound : 55.000% (11/20)
accuracy of Beagle : 65.000% (13/20)
accuracy of Bengal : 65.000% (13/20)
accuracy of Birman : 80.000% (16/20)
accuracy of Bombay : 80.000% (16/20)
accuracy of Boxer : 40.000% (8/20)
accuracy of British_Shorthair : 55.000% (11/20)
accuracy of Chihuahua : 40.000% (8/20)
accuracy of Egyptian_Mau : 85.000% (17/20)
accuracy of English_Cocker_Spaniel : 50.000% (10/20)
accuracy of English_Setter : 70.000% (14/20)
accuracy of German_Shorthaired : 75.000% (15/20)
accuracy of Great_Pyrenees : 70.000% (14/20)
accuracy of Havanese : 75.000% (15/20)
accuracy of Japanese_Chin : 75.000% (15/20)
accuracy of Keeshond : 70.000% (14/20)
accuracy of Leonberger : 90.000% (18/20)
accuracy of Maine_Coon : 60.000% (12/20)
accuracy of Miniature_Pinscher : 75.000% (15/20)
accuracy of Newfoundland : 85.000% (17/20)
accuracy of Persian : 60.000% (12/20)
accuracy of Pomeranian : 85.000% (17/20)
accuracy of Pug : 60.000% (12/20)
accuracy of Ragdoll : 75.000% (15/20)
accuracy of Russian_Blue : 70.000% (14/20)
accuracy of Saint_Bernard : 80.000% (16/20)
accuracy of Samoyed : 78.947% (15/19)

6.3 VGGNet

%run train.py --dataset Oxford-IIIT --model VGGNet --crop_size 224 --pretrained True

Loading the dataset...
Training on: Oxford-IIIT
Using model: VGGNet
Using the specified args:
Namespace(batch_size=32, crop_size=224, cuda=True, dataset='Oxford-IIIT', dataset_root='C:\\Users\\sbzy\\Documents/GitHub/dl_algorithm/datasets\\OXFORD-IIIT', epoch_size=20, lr=0.0002, model='VGGNet', num_workers=0, photo_folder='results/', pretrained=True, save_folder='weights/', shuffle=False)
Epoch 1: 100%[**************************************************->]1.641  Running time: 70.449
train loss: 2.196864, acc: 35.217% (1901/5398)
Epoch 2: 100%[**************************************************->]1.456  Running time: 69.130
train loss: 1.290058, acc: 59.596% (3217/5398)
Epoch 3: 100%[**************************************************->]1.503  Running time: 71.794
train loss: 1.078245, acc: 65.858% (3555/5398)
Epoch 4: 100%[**************************************************->]0.894  Running time: 70.677
train loss: 0.977357, acc: 69.248% (3738/5398)
Epoch 5: 100%[**************************************************->]0.831  Running time: 71.447
train loss: 0.889816, acc: 71.360% (3852/5398)
Epoch 6: 100%[**************************************************->]1.159  Running time: 69.928
train loss: 0.807542, acc: 74.509% (4022/5398)
Epoch 7: 100%[**************************************************->]0.808  Running time: 70.562
train loss: 0.800703, acc: 74.657% (4030/5398)
Epoch 8: 100%[**************************************************->]0.355  Running time: 70.667
train loss: 0.766814, acc: 75.695% (4086/5398)
Epoch 9: 100%[**************************************************->]0.715  Running time: 70.067
train loss: 0.737668, acc: 76.028% (4104/5398)
Epoch 10: 100%[**************************************************->]0.830  Running time: 70.479
train loss: 0.722530, acc: 76.658% (4138/5398)
Epoch 11: 100%[**************************************************->]0.550  Running time: 71.665
train loss: 0.693594, acc: 78.066% (4214/5398)
Epoch 12: 100%[**************************************************->]0.717  Running time: 70.093
train loss: 0.695827, acc: 77.418% (4179/5398)
Epoch 13: 100%[**************************************************->]0.486  Running time: 72.732
train loss: 0.673381, acc: 78.010% (4211/5398)
Epoch 14: 100%[**************************************************->]0.723  Running time: 70.313
train loss: 0.630606, acc: 79.807% (4308/5398)
Epoch 15: 100%[**************************************************->]0.416  Running time: 70.576
train loss: 0.650497, acc: 79.604% (4297/5398)
Epoch 16: 100%[**************************************************->]0.426  Running time: 71.687
train loss: 0.630823, acc: 79.659% (4300/5398)
Epoch 17: 100%[**************************************************->]0.470  Running time: 71.292
train loss: 0.607875, acc: 80.382% (4339/5398)
Epoch 18: 100%[**************************************************->]0.846  Running time: 71.260
train loss: 0.614151, acc: 80.345% (4337/5398)
Epoch 19: 100%[**************************************************->]0.393  Running time: 71.111
train loss: 0.613701, acc: 80.493% (4345/5398)
Epoch 20: 100%[**************************************************->]0.636  Running time: 71.137
train loss: 0.588036, acc: 81.271% (4387/5398)

%run test.py --dataset Oxford-IIIT --model VGGNet --crop_size 224 --pretrained True

Finish loading model:  weights/Oxford-IIIT_VGGNet.pth
Training on: Oxford-IIIT
Using model: VGGNet
Using the specified args:
Namespace(batch_size=32, crop_size=224, cuda=True, dataset='Oxford-IIIT', dataset_root='C:\\Users\\sbzy\\Documents/GitHub/dl_algorithm/datasets\\OXFORD-IIIT', f=None, model='VGGNet', num_workers=0, pretrained=True, weight='weights/Oxford-IIIT_VGGNet.pth')
test loss: 0.566790, acc: 81.636% (489/599)
accuracy of Abyssinian : 75.000% (15/20)
accuracy of American_Bulldog : 90.000% (18/20)
accuracy of American_Pit_Bull_Terrier : 70.000% (14/20)
accuracy of Basset_Hound : 85.000% (17/20)
accuracy of Beagle : 75.000% (15/20)
accuracy of Bengal : 80.000% (16/20)
accuracy of Birman : 85.000% (17/20)
accuracy of Bombay : 90.000% (18/20)
accuracy of Boxer : 85.000% (17/20)
accuracy of British_Shorthair : 60.000% (12/20)
accuracy of Chihuahua : 70.000% (14/20)
accuracy of Egyptian_Mau : 95.000% (19/20)
accuracy of English_Cocker_Spaniel : 75.000% (15/20)
accuracy of English_Setter : 95.000% (19/20)
accuracy of German_Shorthaired : 85.000% (17/20)
accuracy of Great_Pyrenees : 85.000% (17/20)
accuracy of Havanese : 90.000% (18/20)
accuracy of Japanese_Chin : 95.000% (19/20)
accuracy of Keeshond : 100.000% (20/20)
accuracy of Leonberger : 70.000% (14/20)
accuracy of Maine_Coon : 70.000% (14/20)
accuracy of Miniature_Pinscher : 80.000% (16/20)
accuracy of Newfoundland : 80.000% (16/20)
accuracy of Persian : 90.000% (18/20)
accuracy of Pomeranian : 85.000% (17/20)
accuracy of Pug : 85.000% (17/20)
accuracy of Ragdoll : 75.000% (15/20)
accuracy of Russian_Blue : 85.000% (17/20)
accuracy of Saint_Bernard : 85.000% (17/20)
accuracy of Samoyed : 57.895% (11/19)

第7节 CIFAR-10 数据集

CIFAR-10 数据集是 Visual Dictionary (Teaching computers to recognize objects) 的子集，由三个多伦多大学教授收集，主要来自Google和各类搜索引擎的图片
CIFAR-10 数据集包含 60000 张 32\times3232×32 的RBG彩色图像，共计 10 个包含 6000 张样本图像的不同类别，训练集包含 50000 张图像样本，测试集包含 10000 张图像样本
CIFAR-10 数据集在深度学习初期 (ImageNet 问世前) 一直是衡量各种算法模型的 benchmark，但其 32\times3232×32 的图像尺寸逐渐无法满足日渐飞速迭代的神经网络结构

7.1 LeNet

%run train.py --dataset CIFAR-10 --model LeNet --crop_size 32

Loading the dataset...
Training on: CIFAR-10
Using model: LeNet
Using the specified args:
Namespace(batch_size=32, crop_size=32, cuda=True, dataset='CIFAR-10', dataset_root='C:\\Users\\sbzy\\Documents/GitHub/dl_algorithm/datasets\\CIFAR-10', epoch_size=20, lr=0.0002, model='LeNet', num_workers=0, photo_folder='results/', pretrained=True, save_folder='weights/', shuffle=False)
Epoch 1: 100%[**************************************************->]2.067  Running time: 18.131
train loss: 1.957531, acc: 27.192% (13596/50000)
Epoch 2: 100%[**************************************************->]1.967  Running time: 18.142
train loss: 1.790899, acc: 34.038% (17019/50000)
Epoch 3: 100%[**************************************************->]1.774  Running time: 18.248
train loss: 1.719512, acc: 36.854% (18427/50000)
Epoch 4: 100%[**************************************************->]2.105  Running time: 18.549
train loss: 1.663305, acc: 39.356% (19678/50000)
Epoch 5: 100%[**************************************************->]1.800  Running time: 18.677
train loss: 1.622431, acc: 40.874% (20437/50000)
Epoch 6: 100%[**************************************************->]1.487  Running time: 18.907
train loss: 1.583741, acc: 42.430% (21215/50000)
Epoch 7: 100%[**************************************************->]1.489  Running time: 18.950
train loss: 1.563447, acc: 43.164% (21582/50000)
Epoch 8: 100%[**************************************************->]1.264  Running time: 19.690
train loss: 1.530724, acc: 44.590% (22295/50000)
Epoch 9: 100%[**************************************************->]1.803  Running time: 19.383
train loss: 1.509350, acc: 45.668% (22834/50000)
Epoch 10: 100%[**************************************************->]2.050  Running time: 19.377
train loss: 1.494817, acc: 46.074% (23037/50000)
Epoch 11: 100%[**************************************************->]1.305  Running time: 19.001
train loss: 1.479431, acc: 46.528% (23264/50000)
Epoch 12: 100%[**************************************************->]1.386  Running time: 19.197
train loss: 1.464298, acc: 47.312% (23656/50000)
Epoch 13: 100%[**************************************************->]1.400  Running time: 19.015
train loss: 1.448093, acc: 48.020% (24010/50000)
Epoch 14: 100%[**************************************************->]1.598  Running time: 19.190
train loss: 1.438962, acc: 48.090% (24045/50000)
Epoch 15: 100%[**************************************************->]1.325  Running time: 19.532
train loss: 1.418389, acc: 49.276% (24638/50000)
Epoch 16: 100%[**************************************************->]1.312  Running time: 19.307
train loss: 1.413084, acc: 49.370% (24685/50000)
Epoch 17: 100%[**************************************************->]1.144  Running time: 19.146
train loss: 1.404172, acc: 49.750% (24875/50000)
Epoch 18: 100%[**************************************************->]1.383  Running time: 19.099
train loss: 1.391703, acc: 49.908% (24954/50000)
Epoch 19: 100%[**************************************************->]1.085  Running time: 19.255
train loss: 1.384111, acc: 50.604% (25302/50000)
Epoch 20: 100%[**************************************************->]1.462  Running time: 19.090
train loss: 1.372485, acc: 50.862% (25431/50000)

%run test.py --dataset CIFAR-10 --model LeNet --crop_size 32 --pretrained False

Finish loading model:  weights/CIFAR-10_LeNet.pth
Training on: CIFAR-10
Using model: LeNet
Using the specified args:
Namespace(batch_size=32, crop_size=32, cuda=True, dataset='CIFAR-10', dataset_root='C:\\Users\\sbzy\\Documents/GitHub/dl_algorithm/datasets\\CIFAR-10', f=None, model='LeNet', num_workers=0, pretrained=True, weight='weights/CIFAR-10_LeNet.pth')
test loss: 1.377149, acc: 50.180% (5018/10000)
accuracy of airplane : 52.100% (521/1000)
accuracy of automobile : 51.100% (511/1000)
accuracy of bird : 36.400% (364/1000)
accuracy of cat : 45.200% (452/1000)
accuracy of deer : 42.300% (423/1000)
accuracy of dog : 35.400% (354/1000)
accuracy of frog : 64.200% (642/1000)
accuracy of horse : 42.800% (428/1000)
accuracy of ship : 71.300% (713/1000)
accuracy of truck : 61.000% (610/1000)

7.2 AlexNet

%run train.py --dataset CIFAR-10 --model AlexNet --crop_size 224 --pretrained True --lr 0.0002

Loading the dataset...
Training on: CIFAR-10
Using model: AlexNet
Using the specified args:
Namespace(batch_size=32, crop_size=224, cuda=True, dataset='CIFAR-10', dataset_root='C:\\Users\\sbzy\\Documents/GitHub/dl_algorithm/datasets\\CIFAR-10', epoch_size=20, lr=0.0002, model='AlexNet', num_workers=0, photo_folder='results/', pretrained=True, save_folder='weights/', shuffle=False)
Epoch 1: 100%[**************************************************->]0.762  Running time: 109.670
train loss: 1.399911, acc: 49.404% (24702/50000)
Epoch 2: 100%[**************************************************->]1.160  Running time: 109.014
train loss: 1.205459, acc: 57.554% (28777/50000)
Epoch 3: 100%[**************************************************->]0.319  Running time: 109.240
train loss: 1.145497, acc: 59.440% (29720/50000)
Epoch 4: 100%[**************************************************->]0.995  Running time: 109.151
train loss: 1.114250, acc: 60.624% (30312/50000)
Epoch 5: 100%[**************************************************->]1.127  Running time: 110.430
train loss: 1.088160, acc: 61.314% (30657/50000)
Epoch 6: 100%[**************************************************->]0.710  Running time: 111.913
train loss: 1.066579, acc: 62.746% (31373/50000)
Epoch 7: 100%[**************************************************->]1.191  Running time: 109.896
train loss: 1.045675, acc: 63.328% (31664/50000)
Epoch 8: 100%[**************************************************->]1.238  Running time: 109.992
train loss: 1.033945, acc: 63.690% (31845/50000)
Epoch 9: 100%[**************************************************->]1.324  Running time: 109.250
train loss: 1.026369, acc: 64.046% (32023/50000)
Epoch 10: 100%[**************************************************->]0.540  Running time: 109.925
train loss: 1.013423, acc: 64.276% (32138/50000)
Epoch 11: 100%[**************************************************->]1.012  Running time: 110.583
train loss: 1.006714, acc: 64.526% (32263/50000)
Epoch 12: 100%[**************************************************->]1.302  Running time: 110.184
train loss: 0.995984, acc: 65.078% (32539/50000)
Epoch 13: 100%[**************************************************->]1.381  Running time: 109.893
train loss: 0.989883, acc: 65.620% (32810/50000)
Epoch 14: 100%[**************************************************->]0.819  Running time: 109.314
train loss: 0.985121, acc: 65.406% (32703/50000)
Epoch 15: 100%[**************************************************->]0.530  Running time: 110.224
train loss: 0.972704, acc: 65.636% (32818/50000)
Epoch 16: 100%[**************************************************->]1.170  Running time: 111.533
train loss: 0.969235, acc: 66.026% (33013/50000)
Epoch 17: 100%[**************************************************->]0.727  Running time: 110.352
train loss: 0.962344, acc: 66.146% (33073/50000)
Epoch 18: 100%[**************************************************->]1.442  Running time: 110.224
train loss: 0.960633, acc: 66.492% (33246/50000)
Epoch 19: 100%[**************************************************->]1.182  Running time: 110.790
train loss: 0.951001, acc: 66.790% (33395/50000)
Epoch 20: 100%[**************************************************->]0.933  Running time: 110.760
train loss: 0.949523, acc: 66.908% (33454/50000)

%run test.py --dataset CIFAR-10 --model AlexNet --crop_size 224 --pretrained True

Finish loading model:  weights/CIFAR-10_AlexNet.pth
Training on: CIFAR-10
Using model: AlexNet
Using the specified args:
Namespace(batch_size=32, crop_size=224, cuda=True, dataset='CIFAR-10', dataset_root='C:\\Users\\sbzy\\Documents/GitHub/dl_algorithm/datasets\\CIFAR-10', f=None, model='AlexNet', num_workers=0, pretrained=True, weight='weights/CIFAR-10_AlexNet.pth')
test loss: 0.911197, acc: 68.160% (6816/10000)
accuracy of airplane : 75.600% (756/1000)
accuracy of automobile : 76.900% (769/1000)
accuracy of bird : 53.300% (533/1000)
accuracy of cat : 45.500% (455/1000)
accuracy of deer : 69.200% (692/1000)
accuracy of dog : 71.100% (711/1000)
accuracy of frog : 74.500% (745/1000)
accuracy of horse : 65.700% (657/1000)
accuracy of ship : 83.400% (834/1000)
accuracy of truck : 66.400% (664/1000)

7.3 VGGNet

%run train.py --dataset CIFAR-10 --model VGGNet --crop_size 224 --pretrained True

Loading the dataset...
Training on: CIFAR-10
Using model: VGGNet
Using the specified args:
Namespace(batch_size=32, crop_size=224, cuda=True, dataset='CIFAR-10', dataset_root='C:\\Users\\sbzy\\Documents/GitHub/dl_algorithm/datasets\\CIFAR-10', epoch_size=20, lr=0.0002, model='VGGNet', num_workers=0, photo_folder='results/', pretrained=True, save_folder='weights/', shuffle=False)
Epoch 1: 100%[**************************************************->]0.825  Running time: 457.017
train loss: 1.299643, acc: 53.500% (26750/50000)
Epoch 2: 100%[**************************************************->]0.985  Running time: 455.760
train loss: 1.103995, acc: 61.484% (30742/50000)
Epoch 3: 100%[**************************************************->]0.727  Running time: 455.579
train loss: 1.055385, acc: 63.100% (31550/50000)
Epoch 4: 100%[**************************************************->]0.880  Running time: 455.259
train loss: 1.027496, acc: 64.394% (32197/50000)
Epoch 5: 100%[**************************************************->]0.662  Running time: 47280.368
train loss: 1.008327, acc: 64.816% (32408/50000)
Epoch 6: 100%[**************************************************->]0.823  Running time: 463.944
train loss: 0.979664, acc: 66.002% (33001/50000)
Epoch 7: 100%[**************************************************->]0.909  Running time: 461.185
train loss: 0.971267, acc: 66.046% (33023/50000)
Epoch 8: 100%[**************************************************->]0.886  Running time: 462.846
train loss: 0.955294, acc: 67.042% (33521/50000)
Epoch 9: 100%[**************************************************->]1.318  Running time: 461.485
train loss: 0.951767, acc: 66.904% (33452/50000)
Epoch 10: 100%[**************************************************->]0.884  Running time: 462.301
train loss: 0.933519, acc: 67.644% (33822/50000)
Epoch 11: 100%[**************************************************->]0.679  Running time: 462.665
train loss: 0.930770, acc: 67.678% (33839/50000)
Epoch 12: 100%[**************************************************->]0.992  Running time: 462.602
train loss: 0.920103, acc: 68.142% (34071/50000)
Epoch 13: 100%[**************************************************->]1.567  Running time: 462.302
train loss: 0.918952, acc: 68.326% (34163/50000)
Epoch 14: 100%[**************************************************->]0.732  Running time: 459.445
train loss: 0.899105, acc: 68.768% (34384/50000)
Epoch 15: 100%[**************************************************->]0.711  Running time: 460.863
train loss: 0.891965, acc: 69.092% (34546/50000)
Epoch 16: 100%[**************************************************->]0.788  Running time: 463.364
train loss: 0.896177, acc: 68.850% (34425/50000)
Epoch 17: 100%[**************************************************->]0.894  Running time: 462.913
train loss: 0.885664, acc: 69.406% (34703/50000)
Epoch 18: 100%[**************************************************->]1.163  Running time: 462.078
train loss: 0.880681, acc: 69.420% (34710/50000)
Epoch 19: 100%[**************************************************->]0.837  Running time: 461.616
train loss: 0.878448, acc: 69.496% (34748/50000)
Epoch 20: 100%[**************************************************->]1.309  Running time: 459.242
train loss: 0.870379, acc: 69.692% (34846/50000)

%run test.py --dataset CIFAR-10 --model VGGNet --crop_size 224 --pretrained True

Finish loading model:  weights/CIFAR-10_VGGNet.pth
Training on: CIFAR-10
Using model: VGGNet
Using the specified args:
Namespace(batch_size=32, crop_size=224, cuda=True, dataset='CIFAR-10', dataset_root='C:\\Users\\sbzy\\Documents/GitHub/dl_algorithm/datasets\\CIFAR-10', f=None, model='VGGNet', num_workers=0, pretrained=True, weight='weights/CIFAR-10_VGGNet.pth')
test loss: 0.829929, acc: 71.480% (7148/10000)
accuracy of airplane : 79.200% (792/1000)
accuracy of automobile : 76.000% (760/1000)
accuracy of bird : 60.700% (607/1000)
accuracy of cat : 56.000% (560/1000)
accuracy of deer : 71.400% (714/1000)
accuracy of dog : 65.700% (657/1000)
accuracy of frog : 74.600% (746/1000)
accuracy of horse : 72.700% (727/1000)
accuracy of ship : 77.500% (775/1000)
accuracy of truck : 81.000% (810/1000)

开始实验

你可能感兴趣的:(Python,Python高级,Java,cnn,深度学习,神经网络)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
【华为OD机试真题2023B卷 JAVA&JS】We Are A Team 若博豆 java 算法华为 javascript
华为OD2023（B卷）机试题库全覆盖，刷题指南点这里WeAreATeam时间限制：1秒|内存限制：32768K|语言限制：不限题目描述：总共有n个人在机房，每个人有一个标号（1<=标号<=n），他们分成了多个团队，需要你根据收到的m条消息判定指定的两个人是否在一个团队中，具体的：1、消息构成为：abc，整数a、b分别代
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》

第04章 经典卷积神经网络模型

序言