Pytorch多层全连接神经网络实现手写数字识别

一、库导入

import numpy as np
import torch
from torchvision.datasets import mnist # 导入 pytorch 内置的 mnist 数据
from torch import nn
from torch.autograd import Variable
from torch.utils.data import DataLoader

二、下载训练集MNIST手写数字训练集

train_set = mnist.MNIST('./data', train=True, transform=deal, download=True) # 重新载入数据集,申明定义的数据变换
test_set = mnist.MNIST('./data', train=False, transform=deal, download=True)
# 使用 pytorch 自带的 DataLoader 定义一个数据迭代器
train_data = DataLoader(train_set, batch_size=64, transform=deal,shuffle=True)
test_data = DataLoader(test_set, batch_size=128,transform=deal, shuffle=False)

三、数据预处理

def deal(x):
    x = np.array(x, dtype='float32') / 255
    x = x.reshape((-1,)) # 将二维数据变成一维
    x = torch.from_numpy(x)
    return x

四、定义多层连接神经网络

# 使用 Sequential 定义 4 层神经网络
class bp(nn.Module):
    def __init__(self):
        super(bp,self).__init__()
        self.net = nn.Sequential(
           nn.Linear(784, 1024),
            nn.Tanh(),
            nn.Linear(1024, 500),
            nn.Tanh(),
            nn.Linear(500, 200),
            nn.Tanh(),
            nn.Linear(200, 10)
        )
    def forward(self,x):
        x=self.net(x)
        return x

五、定义损害函数和优化方法

net=bp()
#交叉熵损失
criterion = nn.CrossEntropyLoss()
#随机梯度下降优化
optimizer = torch.optim.SGD(net.parameters(), 1e-1) # 使用随机梯度下降,学习率 0.1

六、开始训练

# 开始训练
for e in range(30):
    tloss = 0
    tacc = 0
    net.train()
    for im, label in train_data:
        im = Variable(im)
        label = Variable(label)
        # 前向传播
        out = net(im)
        loss = criterion(out, label)
        # 反向传播
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        # 记录误差
        tloss += loss.item()
        # 计算分类的准确率
        _, pred = out.max(1)
        num_correct = (pred == label).sum().item()
        acc = num_correct / im.shape[0]
        train_acc += acc
	print("locc: ",tloss / len(test_data)," acc: ",tacc / len(test_data))

Pytorch多层全连接神经网络实现手写数字识别_第1张图片
最后,经过数据训练,多层全连接网络的准确度在0.98左右,为了增加我们网络的准确度我们可以对网络添加批标准化,同时也可以进入网络中增加网络的泛化能力,如Dropout、正则化等。

你可能感兴趣的:(深度学习)