Oaix Nay

365天深度学习训练营-第P2周：彩色图片识别

本文为365天深度学习训练营中的学习记录博客

参考文章：365天深度学习训练营-第P2周：彩色识别

原作者：K同学啊|接辅导、项目定制

一、课题背景和开发环境
- 开发环境
二、前期准备
- 1.设置GPU
- 2.导入数据
- 3.数据可视化
三、构建简单的CNN网络
- 关于矩阵在网络中的大小变化过程的推导结果
- 推导结果2 (`padding=1`时)
四、训练模型
- 1.设置超参数
- 2.编写训练函数
- 3.编写测试函数
- 4.正式训练
五、预测&结果可视化
六、模型保存和代码封装
七、总结

一、课题背景和开发环境

第P2周：彩色图片识别

难度：小白入门⭐
语言：Python3、Pytorch

要求：

学习如何编写一个完整的深度学习程序
手动推导卷积层与池化层的计算过程

本次的重点在于学会构建CNN网络

开发环境

电脑系统：Windows 10
语言环境：Python 3.8.2
编译器：无（直接在cmd.exe内运行）
深度学习环境：Pytorch
显卡及显存：NVIDIA GeForce GTX 1660 Ti 12G
CUDA版本：Release 10.0, V10.0.130（cmd输入nvcc -V或nvcc --version指令可查看）

二、前期准备

1.设置GPU

import torch
import torch.nn as nn
import matplotlib.pyplot as plt
import torchvision

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

print('Device', device, '\n')
# device(type='cuda')

Device cuda

2.导入数据

使用torchvision.datasets.CIFAR10下载CIFAR10数据集，并划分好训练集与测试集

import os

ROOT_FOLDER = 'data'
CIFAR10_FOLDER = os.path.join(OOT_FOLDER, 'cifar-10-batches-py')
if not os.path.exists(CIFAR10_FOLDER) or not os.path.isdir(CIFAR10_FOLDER):
    print('开始下载数据集')
    # 下载训练集
    train_ds = torchvision.datasets.CIFAR10(ROOT_FOLDER, 
                                            train=True, 
                                            transform=torchvision.transforms.ToTensor(), # 将数据类型转化为Tensor
                                            download=True)
    # 下载测试集
    test_ds  = torchvision.datasets.CIFAR10(ROOT_FOLDER, 
                                            train=False, 
                                            transform=torchvision.transforms.ToTensor(), # 将数据类型转化为Tensor
                                            download=True)
else:
    print('数据集已下载 直接读取')
    # 读取已下载的训练集
    train_ds = torchvision.datasets.CIFAR10(ROOT_FOLDER, 
                                            train=True, 
                                            transform=torchvision.transforms.ToTensor(), # 将数据类型转化为Tensor
                                            download=False)
    # 读取已下载的测试集
    test_ds  = torchvision.datasets.CIFAR10(ROOT_FOLDER, 
                                            train=False, 
                                            transform=torchvision.transforms.ToTensor(), # 将数据类型转化为Tensor
                                            download=False)

使用torch.utils.data.DataLoader加载数据，并设置batch_size=32

batch_size = 32
# 从 train_ds 加载训练集
train_dl = torch.utils.data.DataLoader(train_ds, 
                                       batch_size=batch_size, 
                                       shuffle=True)
# 从 test_ds 加载测试集
test_dl  = torch.utils.data.DataLoader(test_ds, 
                                       batch_size=batch_size)

# 取一个批次查看数据格式
# 数据的shape为：[batch_size, channel, height, weight]
# 其中batch_size为自己设定，channel，height和weight分别是图片的通道数，高度和宽度。
imgs, labels = next(iter(train_dl))
print('Image shape: ', imgs.shape, '\n')
# torch.Size([32, 3, 32, 32])  # 所有数据集中的图像都是32*32的RGB图

Image shape:  torch.Size([32, 3, 32, 32])

3.数据可视化

import numpy as np

 # 指定图片大小，图像大小为20宽、5高的绘图(单位为英寸inch)
plt.figure('Data Visualization', figsize=(20, 5)) 
for i, imgs in enumerate(imgs[:20]):
    # 维度顺序调整 [3, 32, 32]->[32, 32, 3]
    npimg = imgs.numpy().transpose((1, 2, 0))
    # 将整个figure分成2行10列，绘制第i+1个子图。
    plt.subplot(2, 10, i+1)
    plt.imshow(npimg, cmap=plt.cm.binary)
    plt.axis('off')

三、构建简单的CNN网络

对于一般的CNN网络来说，都是由特征提取网络和分类网络构成，其中特征提取网络用于提取图片的特征，分类网络用于将图片进行分类。

⭐1. torch.nn.Conv2d()详解

函数原型：

torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True, padding_mode=‘zeros’, device=None, dtype=None)

参数说明：

in_channels ( int ) – 输入图像中的通道数

out_channels ( int ) – 卷积产生的通道数

kernel_size ( int or tuple ) – 卷积核的大小

stride ( int or tuple , optional ) – 卷积的步幅。默认值：1

padding ( int , tuple或str , optional ) – 添加到输入的所有四个边的填充。默认值：0

padding_mode (字符串,可选) – 'zeros', 'reflect', 'replicate'或'circular'。默认：'zeros'

⭐2. torch.nn.Linear()详解

函数原型：

torch.nn.Linear(in_features, out_features, bias=True, device=None, dtype=None)

参数说明：

in_features：每个输入样本的大小

out_features：每个输出样本的大小

⭐3. torch.nn.MaxPool2d()详解

函数原型：

torch.nn.MaxPool2d(kernel_size, stride=None, padding=0, dilation=1, return_indices=False, ceil_mode=False)

参数说明：

kernel_size：最大的窗口大小

stride：窗口的步幅，默认值为 kernel_size

padding：填充值，默认为 0

dilation：控制窗口中元素步幅的参数

⭐4. 关于卷积层、池化层的计算
下面是一个简单的卷积过程展示，卷积核大小为3*3：
[[1, 0, 1],
[0, 1, 0],
[1, 0, 1]]

网络数据shape变化过程的推导：

符号定义：
input： $W_1 × W_2$
kernel： $K_1 × K_2$
padding： $P_1 × P_2$
stride： $S_1 × S_2$
dilation： $D_1 × D_2$

通过卷积层时，shape的变化
$\lfloor \frac{W_1 + P_1 * 2 - (K_1 - 1) - 1}{S_1} \rfloor + 1\quad × \quad \lfloor \frac{W_2 + P_2 * 2 - (K_2 - 1) - 1}{S_2} \rfloor + 1$

通过池化层时，shape的变化
$\lfloor \frac{W_1 + P_1 * 2 - (K_1 - 1) * D_1 - 1}{S_1} \rfloor + 1 \quad × \lfloor \quad \frac{W_2 + P_2 * 2 - (K_2 - 1) * D_2 - 1}{S_2} \rfloor + 1$

我的一些理解：
卷积层中的stride过程，类似于在stride=1的卷积基础上再加上了一个核大小等于stride的池化过程
在卷积过程中，如果不设置padding，则矩阵必变小；若需要矩阵大小不变，在不考虑stride的情况下(即stride=1)，则需要按照kernel_size大小设置padding的值（例，kernel=3时padding=1，kernel=5时padding=2）。
池化过程本质也是一层卷积，只是把值计算的过程由卷积层中的对应点乘加的计算变为了求最大值(以MaxPool为例)
(上面的公式是我重新推导的，应该没问题)
[参考资料1]
[参考资料2]

构建CNN网络

import torch.nn.functional as F

num_classes = 10  # 图片的类别数

class Model(nn.Module):
    def __init__(self):
        super().__init__()
        # 特征提取网络
        self.conv1 = nn.Conv2d(3, 64, kernel_size=3)   # 第一层卷积,卷积核大小为3*3
        self.pool1 = nn.MaxPool2d(kernel_size=2)       # 设置池化层,池化核大小为2*2
        self.drop1 = nn.Dropout(p=0.15)
        self.conv2 = nn.Conv2d(64, 64, kernel_size=3)  # 第二层卷积,卷积核大小为3*3   
        self.pool2 = nn.MaxPool2d(kernel_size=2)       # 设置池化层,池化核大小为2*2
        self.drop2 = nn.Dropout(p=0.15)
        self.conv3 = nn.Conv2d(64, 128, kernel_size=3) # 第三层卷积,卷积核大小为3*3   
        self.pool3 = nn.MaxPool2d(kernel_size=2)       # 设置池化层,池化核大小为2*2
        self.drop3 = nn.Dropout(p=0.15)
        
        # 分类网络
        self.fc1 = nn.Linear(512, 256)
        self.fc2 = nn.Linear(256, num_classes)
    
    # 前向传播
    def forward(self, x):
        x = self.drop1(self.pool1(F.relu(self.conv1(x))))     
        x = self.drop2(self.pool2(F.relu(self.conv2(x))))
        x = self.drop3(self.pool3(F.relu(self.conv3(x))))
        
        x = torch.flatten(x, start_dim=1)
        
        x = F.relu(self.fc1(x))
        x = self.fc2(x)
        
        return x

加载并打印模型

from torchinfo import summary
# 将模型转移到GPU中（我们模型运行均在GPU中进行）
model = Model().to(device)

summary(model)

=================================================================
Layer (type:depth-idx)                   Param #
=================================================================
Model                                    --
├─Conv2d: 1-1                            1,792
├─MaxPool2d: 1-2                         --
├─Dropout: 1-3                           --
├─Conv2d: 1-4                            36,928
├─MaxPool2d: 1-5                         --
├─Dropout: 1-6                           --
├─Conv2d: 1-7                            73,856
├─MaxPool2d: 1-8                         --
├─Dropout: 1-9                           --
├─Linear: 1-10                           131,328
├─Linear: 1-11                           2,570
=================================================================
Total params: 246,474
Trainable params: 246,474
Non-trainable params: 0
=================================================================

我后面用 torch.nn.Sequential 把模型重新打包了以下，结构打印出来更清晰一些。
这里设置卷积层的 padding=0 ，如果想要矩阵经过卷积层后大小不改变，在当前 kernel_size=3, stride=1的情况下，则需要设置 padding=1。

class Model(nn.Module):
    def __init__(self):
        super(Model, self).__init__()
        self.conv1=nn.Sequential(
            nn.Conv2d(3, 64, kernel_size=3, padding=0),# 64*30*30
            nn.ReLU(),
            nn.MaxPool2d(2),  #高宽减半 64*15*15
            nn.Dropout(0.15)
        )
        self.conv2=nn.Sequential(
            nn.Conv2d(64, 64, kernel_size=3, padding=0), # 64*13*13
            nn.ReLU(),
            nn.MaxPool2d(2),  #高宽减半 64*6*6
            nn.Dropout(0.15)
        )
        self.conv3=nn.Sequential(
            nn.Conv2d(64, 128, kernel_size=3, padding=0), # 128*4*4
            nn.ReLU(),
            nn.MaxPool2d(2),  #高宽减半 128*2*2
            nn.Dropout(0.15)
        )
        self.fc=nn.Sequential(
            nn.Linear(128*2*2, 256),
            nn.ReLU(), 
            nn.Linear(256, num_classes)
        )
    
    def forward(self, x):
       batch_size = x.size(0)
       x = self.conv1(x)  # 卷积-激活-池化-Dropout
       x = self.conv2(x)  # 卷积-激活-池化-Dropout
       x = self.conv3(x)  # 卷积-激活-池化-Dropout
       x = x.view(batch_size, -1)  # flatten 变成全连接网络需要的输入 (batch, 128*4*4) ==> (batch, 128*4*4), -1 此处自动算出的是3136
       x = self.fc(x)
       
       return x

=================================================================
Layer (type:depth-idx)                   Param #
=================================================================
ModelS                                   --
├─Sequential: 1-1                        --
│    └─Conv2d: 2-1                       1,792
│    └─ReLU: 2-2                         --
│    └─MaxPool2d: 2-3                    --
│    └─Dropout: 2-4                      --
├─Sequential: 1-2                        --
│    └─Conv2d: 2-5                       36,928
│    └─ReLU: 2-6                         --
│    └─MaxPool2d: 2-7                    --
│    └─Dropout: 2-8                      --
├─Sequential: 1-3                        --
│    └─Conv2d: 2-9                       73,856
│    └─ReLU: 2-10                        --
│    └─MaxPool2d: 2-11                   --
│    └─Dropout: 2-12                     --
├─Sequential: 1-4                        --
│    └─Linear: 2-13                      131,328
│    └─ReLU: 2-14                        --
│    └─Linear: 2-15                      2,570
=================================================================
Total params: 246,474
Trainable params: 246,474
Non-trainable params: 0
=================================================================

关于矩阵在网络中的大小变化过程的推导结果

[3, 32, 32]（输入数据）
[64, 30, 30]（经过卷积层1，k=3，s=1，p=0，则矩阵上下左右各向内缩1px，即长宽均减2）-> [64, 15, 15]（经过池化层1，长宽减半）
[64, 13, 13]（经过卷积层2）-> [64, 6, 6] （经过池化层2，长宽减半）
[128, 4, 4] （经过卷积层3） -> [128, 2, 2] （经过池化层3，长宽减半）
[512] （flatten拉平） -> [256]（FC1层） -> num_classes[10]（FC2层）

推导结果2 (padding=1时)

[3, 32, 32]（输入数据）
[64, 32, 32]（经过卷积层1，k=3，s=1，p=1，则矩阵长宽不变）-> [64, 16, 16]（经过池化层1，长宽减半）
[64, 16, 16]（经过卷积层2）-> [64, 8, 8] （经过池化层2，长宽减半）
[128, 8, 8] （经过卷积层3） -> [128, 4, 4] （经过池化层3，长宽减半）
[2048] （flatten拉平） -> [256]（FC1层） -> num_classes[10]（FC2层）

四、训练模型

1.设置超参数

loss_fn    = nn.CrossEntropyLoss() # 创建损失函数
learn_rate = 1e-2 # 学习率
opt        = torch.optim.SGD(model.parameters(),lr=learn_rate)

2.编写训练函数

optimizer.zero_grad()
loss.backward()
optimizer.step()
关于以上三个函数，我在上一篇文章中有做说明，这里不再赘述

# 训练循环
def train(dataloader, model, loss_fn, optimizer):
    size = len(dataloader.dataset)  # 训练集的大小
    num_batches = len(dataloader)   # 批次数目

    train_loss, train_acc = 0, 0  # 初始化训练损失和正确率
    
    for X, y in dataloader:  # 获取图片及其标签
        X, y = X.to(device), y.to(device)
        
        # 计算预测误差
        pred = model(X)          # 网络输出
        loss = loss_fn(pred, y)  # 计算网络输出和真实值之间的差距，targets为真实值，计算二者差值即为损失
        
        # 反向传播
        optimizer.zero_grad()  # grad属性归零
        loss.backward()        # 反向传播
        optimizer.step()       # 每一步自动更新
        
        # 记录acc与loss
        train_acc  += (pred.argmax(1) == y).type(torch.float).sum().item()
        train_loss += loss.item()
            
    train_acc  /= size
    train_loss /= num_batches

    return train_acc, train_loss

3.编写测试函数

测试函数和训练函数大致相同，但是由于不进行梯度下降对网络权重进行更新，所以不需要传入优化器

def test (dataloader, model, loss_fn):
    size        = len(dataloader.dataset)  # 测试集的大小
    num_batches = len(dataloader)          # 批次数目
    test_loss, test_acc = 0, 0
    
    # 当不进行训练时，停止梯度更新，节省计算内存消耗
    with torch.no_grad():
        for imgs, target in dataloader:
            imgs, target = imgs.to(device), target.to(device)
            
            # 计算loss
            target_pred = model(imgs)
            loss        = loss_fn(target_pred, target)
            
            test_loss += loss.item()
            test_acc  += (target_pred.argmax(1) == target).type(torch.float).sum().item()

    test_acc  /= size
    test_loss /= num_batches

    return test_acc, test_loss

4.正式训练

model.train()
model.eval()

关于以上两个个函数，我在上一篇文章中有做说明，这里不再赘述

import time

epochs     = 50
train_loss = []
train_acc  = []
test_loss  = []
test_acc   = []

print('\nStart training...')
for epoch in range(epochs):
    model.train()
    epoch_train_acc, epoch_train_loss = train(train_dl, model, loss_fn, opt)
    
    model.eval()
    epoch_test_acc, epoch_test_loss = test(test_dl, model, loss_fn)
    
    train_acc.append(epoch_train_acc)
    train_loss.append(epoch_train_loss)
    test_acc.append(epoch_test_acc)
    test_loss.append(epoch_test_loss)
    
    template = ('Epoch:{:2d}, Train_acc:{:.1f}%, Train_loss:{:.3f}, Test_acc:{:.1f}%，Test_loss:{:.3f}')
    print(time.strftime('[%Y-%m-%d %H:%M:%S]'), template.format(epoch+1, epoch_train_acc*100, epoch_train_loss, epoch_test_acc*100, epoch_test_loss))
print('Done')

Start training...
[2022-10-05 14:28:44] Epoch: 1, Train_acc:13.5%, Train_loss:2.269, Test_acc:19.4%，Test_loss:2.177
[2022-10-05 14:28:59] Epoch: 2, Train_acc:24.4%, Train_loss:2.023, Test_acc:26.6%，Test_loss:1.977
[2022-10-05 14:29:12] Epoch: 3, Train_acc:31.6%, Train_loss:1.856, Test_acc:36.0%，Test_loss:1.749
[2022-10-05 14:29:26] Epoch: 4, Train_acc:37.7%, Train_loss:1.693, Test_acc:41.5%，Test_loss:1.608
[2022-10-05 14:29:39] Epoch: 5, Train_acc:42.1%, Train_loss:1.585, Test_acc:42.8%，Test_loss:1.617
[2022-10-05 14:29:53] Epoch: 6, Train_acc:45.5%, Train_loss:1.499, Test_acc:47.0%，Test_loss:1.454
[2022-10-05 14:30:07] Epoch: 7, Train_acc:48.8%, Train_loss:1.418, Test_acc:52.0%，Test_loss:1.341
[2022-10-05 14:30:21] Epoch: 8, Train_acc:51.4%, Train_loss:1.353, Test_acc:51.1%，Test_loss:1.418
[2022-10-05 14:30:35] Epoch: 9, Train_acc:54.1%, Train_loss:1.292, Test_acc:56.4%，Test_loss:1.235
[2022-10-05 14:30:48] Epoch:10, Train_acc:55.4%, Train_loss:1.249, Test_acc:58.5%，Test_loss:1.176
[2022-10-05 14:31:01] Epoch:11, Train_acc:57.4%, Train_loss:1.202, Test_acc:58.1%，Test_loss:1.184
[2022-10-05 14:31:14] Epoch:12, Train_acc:59.0%, Train_loss:1.159, Test_acc:60.6%，Test_loss:1.118
[2022-10-05 14:31:27] Epoch:13, Train_acc:60.3%, Train_loss:1.124, Test_acc:62.1%，Test_loss:1.076
[2022-10-05 14:31:41] Epoch:14, Train_acc:61.6%, Train_loss:1.087, Test_acc:64.3%，Test_loss:1.028
[2022-10-05 14:31:54] Epoch:15, Train_acc:62.8%, Train_loss:1.059, Test_acc:63.6%，Test_loss:1.039
[2022-10-05 14:32:08] Epoch:16, Train_acc:64.1%, Train_loss:1.028, Test_acc:64.8%，Test_loss:1.020
[2022-10-05 14:32:21] Epoch:17, Train_acc:64.8%, Train_loss:1.004, Test_acc:62.4%，Test_loss:1.080
[2022-10-05 14:32:34] Epoch:18, Train_acc:66.0%, Train_loss:0.974, Test_acc:67.9%，Test_loss:0.931
[2022-10-05 14:32:47] Epoch:19, Train_acc:66.9%, Train_loss:0.951, Test_acc:66.5%，Test_loss:0.951
[2022-10-05 14:33:00] Epoch:20, Train_acc:67.1%, Train_loss:0.927, Test_acc:68.8%，Test_loss:0.908
[2022-10-05 14:33:14] Epoch:21, Train_acc:68.6%, Train_loss:0.900, Test_acc:70.0%，Test_loss:0.883
[2022-10-05 14:33:27] Epoch:22, Train_acc:69.1%, Train_loss:0.881, Test_acc:67.6%，Test_loss:0.931
[2022-10-05 14:33:40] Epoch:23, Train_acc:70.0%, Train_loss:0.857, Test_acc:68.9%，Test_loss:0.892
[2022-10-05 14:33:53] Epoch:24, Train_acc:70.9%, Train_loss:0.839, Test_acc:69.8%，Test_loss:0.859
[2022-10-05 14:34:06] Epoch:25, Train_acc:71.5%, Train_loss:0.819, Test_acc:70.3%，Test_loss:0.850
[2022-10-05 14:34:19] Epoch:26, Train_acc:72.1%, Train_loss:0.800, Test_acc:69.0%，Test_loss:0.871
[2022-10-05 14:34:32] Epoch:27, Train_acc:72.4%, Train_loss:0.785, Test_acc:72.2%，Test_loss:0.803
[2022-10-05 14:34:45] Epoch:28, Train_acc:73.1%, Train_loss:0.767, Test_acc:73.3%，Test_loss:0.775
[2022-10-05 14:34:58] Epoch:29, Train_acc:73.8%, Train_loss:0.752, Test_acc:73.5%，Test_loss:0.771
[2022-10-05 14:35:11] Epoch:30, Train_acc:74.0%, Train_loss:0.739, Test_acc:72.2%，Test_loss:0.798
[2022-10-05 14:35:24] Epoch:31, Train_acc:74.6%, Train_loss:0.723, Test_acc:74.1%，Test_loss:0.757
[2022-10-05 14:35:37] Epoch:32, Train_acc:74.9%, Train_loss:0.716, Test_acc:72.0%，Test_loss:0.805
[2022-10-05 14:35:51] Epoch:33, Train_acc:75.4%, Train_loss:0.701, Test_acc:74.4%，Test_loss:0.736
[2022-10-05 14:36:04] Epoch:34, Train_acc:76.1%, Train_loss:0.685, Test_acc:74.8%，Test_loss:0.730
[2022-10-05 14:36:18] Epoch:35, Train_acc:76.3%, Train_loss:0.673, Test_acc:75.0%，Test_loss:0.719
[2022-10-05 14:36:32] Epoch:36, Train_acc:76.7%, Train_loss:0.662, Test_acc:73.5%，Test_loss:0.760
[2022-10-05 14:36:45] Epoch:37, Train_acc:77.1%, Train_loss:0.653, Test_acc:72.8%，Test_loss:0.782
[2022-10-05 14:36:59] Epoch:38, Train_acc:77.7%, Train_loss:0.641, Test_acc:74.1%，Test_loss:0.741
[2022-10-05 14:37:12] Epoch:39, Train_acc:77.9%, Train_loss:0.629, Test_acc:75.7%，Test_loss:0.706
[2022-10-05 14:37:28] Epoch:40, Train_acc:78.2%, Train_loss:0.621, Test_acc:75.4%，Test_loss:0.714
[2022-10-05 14:37:42] Epoch:41, Train_acc:78.3%, Train_loss:0.615, Test_acc:75.7%，Test_loss:0.698
[2022-10-05 14:37:55] Epoch:42, Train_acc:78.9%, Train_loss:0.597, Test_acc:75.9%，Test_loss:0.707
[2022-10-05 14:38:09] Epoch:43, Train_acc:79.0%, Train_loss:0.590, Test_acc:75.5%，Test_loss:0.703
[2022-10-05 14:38:23] Epoch:44, Train_acc:79.5%, Train_loss:0.580, Test_acc:75.3%，Test_loss:0.714
[2022-10-05 14:38:38] Epoch:45, Train_acc:79.9%, Train_loss:0.574, Test_acc:76.4%，Test_loss:0.681
[2022-10-05 14:38:52] Epoch:46, Train_acc:80.4%, Train_loss:0.560, Test_acc:76.5%，Test_loss:0.683
[2022-10-05 14:39:06] Epoch:47, Train_acc:80.6%, Train_loss:0.554, Test_acc:75.1%，Test_loss:0.720
[2022-10-05 14:39:20] Epoch:48, Train_acc:80.6%, Train_loss:0.546, Test_acc:76.5%，Test_loss:0.683
[2022-10-05 14:39:33] Epoch:49, Train_acc:81.0%, Train_loss:0.538, Test_acc:76.0%，Test_loss:0.691
[2022-10-05 14:39:47] Epoch:50, Train_acc:81.2%, Train_loss:0.532, Test_acc:76.6%，Test_loss:0.685
Done

最终结果，训练集准确率达到81.2%，测试集准确率达到76.6%。

五、预测&结果可视化

import matplotlib.pyplot as plt
#隐藏警告
import warnings
warnings.filterwarnings("ignore")               #忽略警告信息
plt.rcParams['font.sans-serif']    = ['SimHei'] # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False      # 用来正常显示负号
plt.rcParams['figure.dpi']         = 100        #分辨率

epochs_range = range(epochs)

plt.figure('Result Visualization', figsize=(12, 3))
plt.subplot(1, 2, 1)

plt.plot(epochs_range, train_acc, label='Training Accuracy')
plt.plot(epochs_range, test_acc, label='Test Accuracy')
plt.legend(loc='lower right')
plt.title('Training and Validation Accuracy')

plt.subplot(1, 2, 2)
plt.plot(epochs_range, train_loss, label='Training Loss')
plt.plot(epochs_range, test_loss, label='Test Loss')
plt.legend(loc='upper right')
plt.title('Training and Validation Loss')
plt.show()

六、模型保存和代码封装

保存当前模型参数

''' 保存模型参数 '''
saveFile = os.path.join(output, 'epoch'+str(epochs)+'.pkl')
torch.save(model.state_dict(), saveFile)

加载之前保存的模型参数

''' 加载之前保存的模型 '''
if not os.path.exists(output) or not os.path.isdir(output):
    os.makedirs(output)
if start_epoch > 0:
    resumeFile = os.path.join(output, 'epoch'+str(start_epoch)+'.pkl')
    if not os.path.exists(resumeFile) or not os.path.isfile(resumeFile):
        start_epoch = 0
    else:
        model.load_state_dict(torch.load(resumeFile))  # 加载模型参数

最后把代码做了函数封装，大概结构如下：

import os
import time
import torch
import torch.nn as nn
import torch.nn.functional as F
import torchvision
from torchinfo import summary
import matplotlib.pyplot as plt
import numpy as np
import warnings

''' 下载或读取CIFAR10数据集，并划分好训练集与测试集 '''
def getDataset(root, dataset):
    pass

''' 加载数据，并设置batch_size '''
def loadData(train_ds, test_ds, batch_size=32, root='', show_flag=False):
    pass

''' 数据可视化 '''
def displayData(imgs, root='', flag=False):
    pass

''' 构建简单的CNN网络 '''
class Model(nn.Module):
    def __init__(self):
        pass
    def forward(self, x):
        pass

''' 训练循环 '''
def train(dataloader, model, loss_fn, optimizer):
    pass

''' 测试函数 '''
def test(dataloader, model, loss_fn):
    pass

''' 结果可视化 '''
def displayResult(train_acc, test_acc, train_loss, test_loss, start_epoch, epochs, output=''):
    pass

if __name__=='__main__':
    ''' 设置图片的类别数 '''
    num_classes = 10
    ''' 设置GPU '''
    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
    print('Device', device, '\n')
    
    ''' 加载数据 '''
    root = 'data'
    output = 'output'
    dataset = os.path.join(root, 'cifar-10-batches-py')
    batch_size = 32
    train_ds, test_ds = getDataset(root, dataset)
    train_dl, test_dl = loadData(train_ds, test_ds, batch_size, dataset, False)
    
    ''' 调用并将模型转移到GPU中（我们模型运行均在GPU中进行） '''
    model = Model().to(device)
    ''' 显示网络结构 '''
    summary(model)
    
    ''' 设置超参数 '''
    start_epoch = 0
    epochs      = 50
    learn_rate  = 1e-2  # 学习率
    loss_fn     = nn.CrossEntropyLoss()  # 创建损失函数
    opt         = torch.optim.SGD(model.parameters(),lr=learn_rate)
    train_loss  = []
    train_acc   = []
    test_loss   = []
    test_acc    = []
    
    
    ''' 加载之前保存的模型 '''
    if not os.path.exists(output) or not os.path.isdir(output):
        os.makedirs(output)
    if start_epoch > 0:
        resumeFile = os.path.join(output, 'epoch'+str(start_epoch)+'.pkl')
        if not os.path.exists(resumeFile) or not os.path.isfile(resumeFile):
            start_epoch = 0
        else:
            model.load_state_dict(torch.load(resumeFile))  # 加载模型参数
    
    ''' 开始训练模型 '''
    print('\nStart training...')
    for epoch in range(start_epoch, epochs):
        model.train()
        epoch_train_acc, epoch_train_loss = train(train_dl, model, loss_fn, opt)
        
        model.eval()
        epoch_test_acc, epoch_test_loss = test(test_dl, model, loss_fn)
        
        train_acc.append(epoch_train_acc)
        train_loss.append(epoch_train_loss)
        test_acc.append(epoch_test_acc)
        test_loss.append(epoch_test_loss)
        
        template = ('Epoch:{:2d}, Train_acc:{:.1f}%, Train_loss:{:.3f}, Test_acc:{:.1f}%，Test_loss:{:.3f}')
        print(time.strftime('[%Y-%m-%d %H:%M:%S]'), template.format(epoch+1, epoch_train_acc*100, epoch_train_loss, epoch_test_acc*100, epoch_test_loss))
    print('Done\n')
    
    ''' 保存模型参数 '''
    saveFile = os.path.join(output, 'epoch'+str(epochs)+'.pkl')
    torch.save(model.state_dict(), saveFile)
    
    ''' 绘制准确率&损失率曲线图 '''
    displayResult(train_acc, test_acc, train_loss, test_loss, start_epoch, epochs, output)

七、总结

总体来讲，这次课题相对上一个课题来讲，难度没太大变化，只是输入数据由上一次的灰度图变成了彩色图像（针对这点，在网络中带来的影响就是第一个卷积层上参数有一点变化）。另外网络相较上一次复杂了一些（增加了一组卷积池化层）。

目前了解到的内容：

熟悉了 torch.nn.Sequential 接口的使用过程
系统的理解了卷积与池化过程，并自己动手跟踪计算了矩阵在网络中每层的变化

你可能感兴趣的:(365天深度学习训练记录,深度学习,python,pytorch)

使用Python将PDF文件转换为MOBI格式 choiiie 菜狗的怪问题合集 pdf python 经验分享
使用Python将PDF文件转换为MOBI格式引言在这篇文章中，我们将学习如何使用Python创建一个图形用户界面（GUI）应用程序，将PDF文件转换为MOBI格式。我们将使用tkinter作为GUI库，PyMuPDF或PyPDF2来处理PDF文件，以及Calibre的ebook-convert命令行工具来完成文件格式的转换。GitHub项目地址这个项目已经托管在GitHub上准备工作在开始之前，
JsonPath用法详解吴少凡 python 开发语言自动化 pycharm
JSONPath是一种信息抽取类库，是从JSON文档中抽取指定信息的工具，提供多种语言实现版本，包括Javascript、Python、PHP和Java。1、JSONPath安装:pipinstalljsonpath#如果安装太慢可以使用清华源来加速安装pipinstalljsonpath-ihttps://pypi.tuna.tsinghua.edu.cn/simple2、JSONPath语法J
python批量转化pdf图片为jpg图片不懂python不懂R python python pdf
1.把pdf图片批量转为jpg；需要注意的是，需要先安装poppler这个软件，具体安装教程放在下面代码中了2.代码#poppler安装教程参考：https://blog.csdn.net/wy01415/article/details/110257130#windows上poppler下载链接：https://github.com/oschwartz10612/poppler-windowsfr
想转行到人工智能领域，我该学什么，怎么学？张登杰踩人工智能 python
转行到人工智能（AI）领域需要系统的学习和实践，以下是详细的路径建议，涵盖基础知识、技能学习、项目实践和求职准备：一、明确目标和领域方向人工智能领域广泛，建议先了解细分方向（如机器学习、深度学习、计算机视觉、自然语言处理、强化学习等），结合兴趣和职业规划选择切入点。二、构建基础知识1.数学基础线性代数：矩阵运算、特征值、向量空间。微积分：导数、梯度、优化理论。概率与统计：贝叶斯定理、分布、假设检验
tensorlow中tensorboard可视化展示训练过程张登杰踩 tensorflow tensorboard tensorflow mnist 神经网络
importtensorflowastffromtensorflow.examples.tutorials.mnistimportinput_datamax_steps=1000#训练步数learning_rate=0.001#设置学习率dropout=0.9#神经元保留比例data_dir='./MNIST_data'#数据存放路径#minist数据集下载链接:https://pan.baidu
Git上传了秘钥如何彻底修改包括历史记录【从安装到实战详细版】 web2u git elasticsearch 数据库 spring boot java 后端
使用BFGRepo-Cleaner清除Git仓库中的敏感信息1.背景介绍在使用Git进行版本控制时，有时会不小心将敏感信息（如API密钥、密码等）提交到仓库中。即使后续删除，这些信息仍然存在于Git的历史记录中。本文将介绍如何使用BFGRepo-Cleaner工具彻底清除这些敏感信息。2.准备工作2.1环境要求Java运行环境（JRE8或更高版本）Git客户端需要清理的Git仓库2.2下载BFG访
python程序中调用openai接口 MEMORYLORRY gpt openai gpt 人工智能机器学习 python transformer
调用openai接口1.openai例子（国内访问）2.解决思路3.搭建nginx3.1创建OpenSSL创建证书3.2nginx配置3.3验证效果4.python调用5.SSL:certificate_verify_failed错误1.openai例子（国内访问）fromopenaiimportOpenAIAPI_KEY='sk-api-key'client=OpenAI(api_key=API
python config使用 Soochow_NJU_Smile python config
config.cfg[test]filename=C:\\Users\\86188\\Desktop\\study\\configstudy\\fire.png[detect]number=1main.pyimportcv2importconfigparsercfg=configparser.ConfigParser()cfg.read('config.cfg')source=cfg.get('t
2024年最全办公室文员必备python神器，将PDF文件表格转换成excel表格！(1)，把面试官逗笑了 TOP级别安卓开发程序员 python pdf excel
如果你也是看准了Python，想自学Python，在这里为大家准备了丰厚的免费学习大礼包，带大家一起学习，给大家剖析Python兼职、就业行情前景的这些事儿。一、Python所有方向的学习路线Python所有方向路线就是把Python常用的技术点做整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。二、学习软件工欲善其必先利其器。学习Py
第 9 课 Python 异常处理嵌入式老牛 Python入门 python 开发语言
1.异常与错误程序错误是指语法错误（指令输入不正确）和逻辑错误（程序执行结果不正确），而程序异常是一个意外事件，该事件会在程序执行过程中发生，影响了程序的正常执行，比如：打开的文件不存在、被除数为0、操作的数据类型不对、存储错误，互联网请求错误等等。一般情况下，在Python无法正常处理程序时就会发生一个异常。异常是Python对象，表示一个错误。当Python脚本发生异常时我们需要捕获处理它，否
华为OD机试E卷 -boss的收入（Java & Python& JS & C++ & C ）算法大师最新华为OD机试华为od java python javascript c++c语言华为od机考e卷
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述一个XX产品行销总公司，只有一个boss，其有若干一级分销，一级分销又有若干二级分销，每个分销只有唯一的上级分销。规定，每个月，下级分销需要将自己的总收入（自己的+下级上交的）每满100元上交15元给自己的上级。现给出一组分销的关系，和每个分销的收入，请找出boss并计算出这个boss的收入。比如：收入100元，上交1
如何用Python将pdf文件转化为高清图片张登杰踩 pdf
最近在整理文档，需要将文档进行OCR识别，然后结构化。直接解析pdf文档，行不通，因为文档里面是图片。于是采取先转图片，然后OCR，然后结构化。下面是pdf文档转图片的方法。importfitz#PyMuPDFdefpdf_to_images(pdf_path,images_folder):#打开PDF文件document=fitz.open(pdf_path)forpage_numinrange
华为OD机试E卷 --选修课--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript python js c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码题目描述现有两门选修课，每门选修课都有一部分学生选修，每个学生都有选修课的成绩，需要你找出同时选修了两门选修课的学生，先按照班级进行划分，班级编号小的先输出，每个班级按照两门选修课成绩和的降序排序，成绩相同时按照学生的学号升序排序。输入描述第一行为第一门选修课学生的成绩，第二行为第二门选修课学生的
Python调用open ai接口蓝天星空编程人工智能 python
要使用Python调用OpenAI的接口，您需要完成以下几个步骤：1.**注册并获取API密钥**2.**安装OpenAI的Python库**3.**编写Python代码以调用API**以下是详细的步骤说明：---###1.注册并获取API密钥首先，您需要在[OpenAI官方网站](https://beta.openai.com/signup/)注册一个账户。注册完成后，您需要创建一个API密钥：
Linux搭建wordpress 长江空自流 vps linux wordpress 安装
Linux搭建wordpress一、环境vps：Centos6x86minimal512ram小内存xshell5：ssh远程连接主机首先搭建lamp环境（linuxapachemysqlphp或python等）二、apache1安装yuminstallhttpd2启动apacheservicehttpdstart直接在浏览器中输入IP地址，应该就可以访问到Apache的欢迎页面了三、mysql1
python中strip()和split()的使用方法（学习笔记）木子_李轩笔记
1.strip()：用于移除字符串头、尾指定的字符(默认空格)，不能删除中间部分的字符。#未使用strip()path=r"C:\Users\67539\Desktop\22\11.txt"f=open(path,"r")forlineinf:#按行读取print(line)f.close()#结果cat22airplane23dog58mug86#########################
Flask基础和URL映射終不似少年遊* python进阶学习 flask python 后端开发框架
目录1.Flask介绍2.Flask第一个应用程序3.Flask运行方式4.Flask中DEBUG模式5.Flask环境参数的加载6.Flask路径参数的使用7.Flask路径参数类型8.Flask路径参数类型转换底层9.Flask自定义路由转换器自定义步骤：10.自定义转换to_python函数11.Postman的使用功能：使用示例：12.查询参数的使用13.请求体参数的使用14.上传文件的使
python strip() 函数和 split() 函数的详解 xinyuerr java python python java 数据库
本文主要介绍了pythonstrip()函数和split()函数的详解及实例的相关资料,需要的朋友可以参考下pythonstrip()函数和split()函数的详解及实例一直以来都分不清楚strip和split的功能，实际上strip是删除的意思；而split则是分割的意思。因此也表示了这两个功能是完全不一样的，strip可以删除字符串的某些字符，而split则是根据规定的字符将字符串进行分割。下
# AI计算模式神经网络模型深度神经网络多层感知机卷积神经网络循环神经网络长短期记忆网络图像识别、语音识别、自然语言轻量化模型和模型压缩大模型分布式并行 EwenWanW AGI 人工智能神经网络 dnn
AI计算模式AI技术发展至今，主流的模型是深度神经网络模型。近20年来，神经网络模型经过多样化的发展，模型总体变得越来越复杂和庞大，对硬件设备的计算速度、存储能力、通信速度的要求越来越高。尽管学者已经提出了许多方法优化模型结构，降低模型的参数量，但是伴随着人们对AI能力的要求越来越高，模型变得更大是不可避免的。原先单CPU可进行模型的训练与推理，如今需要使用GPU、TPU等设备，并通过分布式并行的
CH4 - Python开发技术—流程控制之分支结构（头歌） MSY～学习日记分享 python python 开发语言
目录第1关：英制单位英寸与公制单位厘米互换第2关：百分制成绩转换为等级制成绩第3关：约瑟夫环问题第1关：英制单位英寸与公制单位厘米互换"""英制单位英寸和公制单位厘米互换"""defcmin(value,unit):''':paramvalue:长度，:paramunit:单位'''#请在此处添加代码##*************begin************#ifunit=='cm'orun
LLaMA Pro是什么相比于lora full freeze有什么区别怎么使用 Ven% 简单说深度学习深度学习基础动手深度学习速通系列 llama transformer 深度学习人工智能
1.LLaMAPro是什么？LLaMAPro是一种基于LLaMA架构改进的大型语言模型（LLM），旨在解决大模型微调中的知识遗忘问题。它通过在原有模型的基础上扩展新的模块（如Transformer块），并在微调时仅训练这些新增模块，从而在适应新任务的同时保留预训练模型的通用知识。LLaMAPro在代码理解、数学推理和语言理解等任务上表现出色，特别适合需要持续学习和多任务处理的场景。2.LLaMAP
hyper快照，hyper-v快照的管理 hyper-v
企业战略实施的过程中，批量管理如同战略落地的坚实基石，确保战略目标的逐步实现。今天小编要给大家分享hyper-v快照的管理。Hyper-V快照是Hyper-V虚拟化环境中的一项重要功能，它允许用户记录虚拟机在某一特定时间点的状态，包括内存、磁盘和网络配置等。通过快照，用户可以在虚拟机出现问题或需要回溯到某个状态时，快速恢复到该快照所记录的状态。Hyper-V快照的类型：标准检查点：记录虚拟机及其内
hyper快照，hyper-v快照的管理 hyper-v
企业战略实施的过程中，批量管理如同战略落地的坚实基石，确保战略目标的逐步实现。今天小编要给大家分享hyper-v快照的管理。Hyper-V快照是Hyper-V虚拟化环境中的一项重要功能，它允许用户记录虚拟机在某一特定时间点的状态，包括内存、磁盘和网络配置等。通过快照，用户可以在虚拟机出现问题或需要回溯到某个状态时，快速恢复到该快照所记录的状态。Hyper-V快照的类型：标准检查点：记录虚拟机及其内
fit_transform,fit,transform区别和作用浊酒南街 #机器学习深度学习人工智能
目录前言fit,transform,fit_transform函数介绍函数使用示例前言sklearn中封装的各种算法调用之前都要fit。fit相对于整个代码而言，为后续API服务，用于从一个训练集中学习模型参数，包括归一化时要用到的均值，标准偏差。fit之后，可以调用各种API方法，transform是其中之一。所以当你调用transform之外的方法，也必须要先fit。但是fit与transfo
Python中strip()函数和split()函数用法：半吊子烟酒僧函数
pythonstrip()函数和split()函数：strip是删除的意思；split则是分割的意思。strip可以删除字符串的某些字符，而split则是根据规定的字符将字符串进行分割。1Pythonstrip()函数介绍:声明：s为字符串，x为要删除的字符序列s.strip(x)删除s字符串中开头、结尾处为x的序列字符s.lstrip(x)删除s字符串中开头处为x的序列字符s.rstrip(x)
python面试情景题_50道python笔试面试真题大集合我是史迪仔 python面试情景题
Python爬虫人工智能100GBweb爬虫数据分析人工智能视频免费领题目后面有50道题答案领取方式哦1、一行代码实现1--100之和利用sum()函数求和2、如何在一个函数内部修改全局变量利用global修改全局变量3、列出5个python标准库os：提供了不少与操作系统相关联的函数sys:通常用于命令行参数re:正则匹配math:数学运算datetime:处理日期时间4、字典如何删除键和合并两
Error in py_run_file_impl(file, local, convert) : ModuleNotFoundError: No module named ‘igraph‘ hyena_7 Python R 服务器配置 python r语言开发语言
在HPC平台上跑我的R语言代码，结果一直报错说：Errorinpy_run_file_impl(file,local,convert):ModuleNotFoundError:Nomodulenamed'igraph'我就知道是我R语言里面导入python包那里出现了问题，对应的python环境没有这个包，我进入了R环境，使用命令如下：library(reticulate)py_module_av
python strip() 详解薇远镖局 Python python 开发语言
strip()是Python字符串方法之一，用于移除字符串开头和结尾的空白字符（包括空格、制表符、换行符等）或指定字符。它不会影响字符串中间的空白字符。语法str.strip([chars])参数chars（可选）：一个字符串，表示要移除的字符集合。如果未指定，默认移除空白字符。返回值返回一个新的字符串，表示移除了开头和结尾指定字符后的结果。示例1、移除空白字符：s="Hello,World!"p
项目风险控制模版智能合约
本项目的主要风险点为代码质量与进度，为保障项目代码质量及按项目规划的时间表推进项目实施，我们将采取如下的措施来控制风险控制项目进度措施项目负责人一定对整个项目的开发周期有一个清楚的了解，把任务的划分一定要一天为单位，不要一模块为单位，而每天无论是开发人员还是测试人员，都要对自己的工作有一个大致的估计。即每天下午，有项目负责人组织开发人员进行系统的了解，并且作好相应的记录。对已经解决的问题一定要一个
Python--字符串小丁丁_ddxdd 技术层-python
描述Pythonstrip()方法用于移除字符串头尾指定的字符（默认为空格）。语法strip()方法语法：str.strip([chars]);参数chars--移除字符串头尾指定的字符。返回值返回移除字符串头尾指定的字符生成的新字符串。实例以下实例展示了strip()函数的使用方法：#!/usr/bin/pythonstr="0000000thisisstringexample....wow!!
解读Servlet原理篇二---GenericServlet与HttpServlet 周凡杨 java HttpServlet 源理 GenericService 源码
在上一篇《解读Servlet原理篇一》中提到，要实现javax.servlet.Servlet接口（即写自己的Servlet应用），你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ，也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet（这就是为什么我们自定义的Servlet通常是exte
MySQL性能优化 bijian1013 数据库 mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度，减少占用的磁盘空间。性能优化包含很多方面，例如优化查询速度，优化更新速度和优化MySQL服务器等。本文介绍方法的主要有： a.优化查询 b.优化数据库结构
ThreadPool定时重试 dai_lm java ThreadPool thread timer timertask
项目需要当某事件触发时，执行http请求任务，失败时需要有重试机制，并根据失败次数的增加，重试间隔也相应增加，任务可能并发。由于是耗时任务，首先考虑的就是用线程来实现，并且为了节约资源，因而选择线程池。为了解决不定间隔的重试，选择Timer和TimerTask来完成 package threadpool; public class ThreadPoolTest {
Oracle 查看数据库的连接情况周凡杨 sql oracle 连接
首先要说的是，不同版本数据库提供的系统表会有不同，你可以根据数据字典查看该版本数据库所提供的表。 select * from dict where table_name like '%SESSION%'; 就可以查出一些表，然后根据这些表就可以获得会话信息 select sid,serial#,status,username,schemaname,osuser,terminal,ma
类的继承朱辉辉33 java
类的继承可以提高代码的重用行，减少冗余代码；还能提高代码的扩展性。Java继承的关键字是extends 格式:public class 类名（子类）extends 类名（父类）{ } 子类可以继承到父类所有的属性和普通方法，但不能继承构造方法。且子类可以直接使用父类的public和 protected属性，但要使用private属性仍需通过调用。子类的方法可以重写，但必须和父类的返回值类
android 悬浮窗特效肆无忌惮_ android
最近在开发项目的时候需要做一个悬浮层的动画，类似于支付宝掉钱动画。但是区别在于，需求是浮出一个窗口，之后边缩放边位移至屏幕右下角标签处。效果图如下：一开始考虑用自定义View来做。后来发现开线程让其移动很卡，ListView+动画也没法精确定位到目标点。后来想利用Dialog的dismiss动画来完成。自定义一个Dialog后，在styl
hadoop伪分布式搭建林鹤霄 hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
gdb调试命令 aigo gdb
原文：http://blog.csdn.net/hanchaoman/article/details/5517362 一、GDB常用命令简介 r run 运行.程序还没有运行前使用 c cuntinue
Socket编程的HelloWorld实例 alleni123 socket
public class Client { public static void main(String[] args) { Client c=new Client(); c.receiveMessage(); } public void receiveMessage(){ Socket s=null; BufferedRea
线程同步和异步百合不是茶线程同步异步
多线程和同步 : 如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行；B依言执行，再将结果给A；A再继续操作。所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回，同时其它线程也不能调用这个方法多线程和异步:多线程可以做不同的事情,涉及到线程通知 &
JSP中文乱码分析 bijian1013 java jsp 中文乱码
在JSP的开发过程中，经常出现中文乱码的问题。首先了解一下Java中文问题的由来： Java的内核和class文件是基于unicode的，这使Java程序具有良好的跨平台性，但也带来了一些中文乱码问题的麻烦。原因主要有两方面，
js实现页面跳转重定向的几种方式 bijian1013 JavaScript 重定向
js实现页面跳转重定向有如下几种方式：一.window.location.href <script language="javascript"type="text/javascript"> window.location.href="http://www.baidu.c
【Struts2三】Struts2 Action转发类型 bit1129 struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action，配置如下 <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configurat
【HBase十一】Java API操作HBase bit1129 hbase
Admin类的主要方法注释： 1. 创建表 /** * Creates a new table. Synchronous operation. * * @param desc table descriptor for table * @throws IllegalArgumentException if the table name is res
nginx gzip ronin47 nginx gzip
Nginx GZip 压缩 Nginx GZip 模块文档详见：http://wiki.nginx.org/HttpGzipModule 常用配置片段如下： gzip on; gzip_comp_level 2; # 压缩比例，比例越大，压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
java-7.微软亚院之编程判断俩个链表是否相交给出俩个单向链表的头指针，比如 h1 ， h2 ，判断这俩个链表是否相交 bylijinnan java
public class LinkListTest { /** * we deal with two main missions: * * A. * 1.we create two joined-List(both have no loop) * 2.whether list1 and list2 join * 3.print the join
Spring源码学习-JdbcTemplate batchUpdate批量操作 bylijinnan java spring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法，Spring只是做了一下改造和封装 JDBC的batch操作： String sql = "INSERT INTO CUSTOMER " + "(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
[JWFD开源工作流]大规模拓扑矩阵存储结构最新进展 comsci 工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出......... 竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
base64编码和url编码 cuityang base64 url
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.io.StringWriter; import java.io.UnsupportedEncodingException;
web应用集群Session保持 dalan_123 session
关于使用 memcached 或redis 存储 session ，以及使用 terracotta 服务器共享。建议使用 redis，不仅仅因为它可以将缓存的内容持久化，还因为它支持的单个对象比较大，而且数据类型丰富，不只是缓存 session，还可以做其他用途，一举几得啊。1、使用 filter 方法存储这种方法比较推荐，因为它的服务器使用范围比较多，不仅限于tomcat ，而且实现的原理比较简
Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式'] dcj3sjt126com 数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
solr StatsComponent（聚合统计） eksliang solr聚合查询 solr stats
StatsComponent 转载请出自出处：http://eksliang.iteye.com/blog/2169134 http://eksliang.iteye.com/ 一、概述 Solr可以利用StatsComponent 实现数据库的聚合统计查询，也就是min、max、avg、count、sum的功能二、参数
百度一道面试题 greemranqq 位运算百度面试寻找奇数算法 bitmap 算法
那天看朋友提了一个百度面试的题目：怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字. 我这里复制的是原话，当然顺序是不一定的，很多拿到题目第一反应就是用map,当然可以解决，但是效率不高。还有人觉得应该用算法xxx,我是没想到用啥算法好...！还有觉得应该先排序... 还有觉
Spring之在开发中使用SpringJDBC ihuning spring
在实际开发中使用SpringJDBC有两种方式： 1. 在Dao中添加属性JdbcTemplate并用Spring注入； JdbcTemplate类被设计成为线程安全的，所以可以在IOC 容器中声明它的单个实例，并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱，泛型，可变长度
JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节 justjavac json
2013年5月，Yehuda Katz 完成了JSON API(英文，中文) 技术规范的初稿。事情就发生在 RailsConf 之后，在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
网站项目建设流程概述 macroli 工作
一.概念网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。二.需求分析项目立项　　我们接到客户的业务咨询，经过双方不断的接洽和了解，并通过基本的可行性讨论够，初步达成制作协议，这时就需要将项目立项。较好的做法是成立一个专门的项目小组，小组成员包括：项目经理，网页设计，程序员，测试员，编辑/文档等必须人员。项目实行项目经理制。客户的需求说明书　　第一步是需
AngularJs 三目运算表达式判断 qiaolevip 每天进步一点点学习永无止境众观千象 AngularJS
事件回顾：由于需要修改同一个模板，里面包含2个不同的内容，第一个里面使用的时间差和第二个里面名称不一样，其他过滤器，内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not，继续追究其源码。 var b = "{{", a = "}}"; this.startSymbol = function(a) {
Spark算子：统计RDD分区中的元素及数量 superlxw1234 spark spark算子 Spark RDD分区元素
关键字：Spark算子、Spark RDD分区、Spark RDD分区元素数量 Spark RDD是被分区的，在生成RDD时候，一般可以指定分区的数量，如果不指定分区数量，当RDD从集合创建时候，则默认为该程序所分配到的资源的CPU核数，如果是从HDFS文件创建，默认为文件的Block数。可以利用RDD的mapPartitionsWithInd
Spring 3.2.x将于2016年12月31日停止支持 wiselyman Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x（包含tomcat 6.x）的支持。在此之前spring团队将持续发布3.2.x的维护版本。请大家及时准备及时升级到Spring
fis纯前端解决方案fis-pure zccst JavaScript
作者：zccst FIS通过插件扩展可以完美的支持模块化的前端开发方案，我们通过FIS的二次封装能力，封装了一个功能完备的纯前端模块化方案pure。 1，fis-pure的安装 $ fis install -g fis-pure $ pure -v 0.1.4 2，下载demo到本地 git clone https://github.com/hefangshi/f

365天深度学习训练营-第P2周：彩色图片识别

目录

一、课题背景和开发环境

开发环境

二、前期准备

1.设置GPU

2.导入数据

3.数据可视化

三、构建简单的CNN网络

关于矩阵在网络中的大小变化过程的推导结果

推导结果2 (padding=1时)

四、训练模型

1.设置超参数

2.编写训练函数

3.编写测试函数

4.正式训练

五、预测&结果可视化

六、模型保存和代码封装

七、总结

你可能感兴趣的:(365天深度学习训练记录,深度学习,python,pytorch)

推导结果2 (`padding=1`时)