PyTorch中的神经网络 Mnist 分类任务

一、Mnist 分类任务简介

在上一篇博客当中，我们通过搭建 PyTorch 神经网络实现了气温预测，这本质上是一个回归任务。在本次博文当中，我们使用 PyTorch 做一个分类任务。
其实，分类任务和回归任务在本质上没有任何区别，只是说在结果上是不同的，损失函数是不同的，中间的网络架构却是大体一致的。
在本次的分类任务当中，我们使用的数据集是 Mnist 数据集，这个数据集大家都比较熟悉，可以在 http://yann.lecun.com/exdb/mnist/ 中获取，主要包括四个文件：

文件名称	大小	内容
train-images-idx3-ubyte.gz	9,681 kb	55000 张训练集，5000 张验证集
train-labels-idx1-ubyte.gz	29 kb	训练集图片对应的标签
t10k-images-idx3-ubyte.gz	1,611kb	10000 张测试集
t10k-labels-idx1-ubyte.gz	5 kb	测试集图片对应的标签

在上述在上述文件中，训练集 train 一共包含了 60000 张图像和标签，而测试集一共包含了 10000 张图像和标签。
idx3 表示 3 维，ubyte 表示是以字节的形式进行存储的，t10k 表示 10000 张测试图片（test10000）。
每张图片是一个 28*28 像素点的 0 ~ 9 的灰质手写数字图片，黑底白字，图像像素值为 0 ~ 255，越大该点越白。
本次分类任务主要包含如下的几个部分：
（1）网络基本构建与训练方法，常用函数解析。
（2） torch.nn.functional 模块。
（3） nn.Module 模块。

二、Mnist 数据集的读取

对于 Mnist 数据集，我们可以通过代码编写，就可以实现自动下载。

%matplotlib inline
from pathlib import Path
import requests

DATA_PATH = Path("data")
PATH = DATA_PATH / "mnist"

PATH.mkdir(parents=True, exist_ok=True)

URL = "http://deeplearning.net/data/mnist/"
FILENAME = "mnist.pkl.gz"

对于我们上面定义的下载路径等等，会进行自动判断，如果该路径下没有 Minst 数据集的话，就会自动进行下载。

if not (PATH / FILENAME).exists():
        content = requests.get(URL + FILENAME).content
        (PATH / FILENAME).open("wb").write(content)

由于下载出来的数据集是压缩包的状态，因此，我们还需要对其进行解压，具体的代码详见下面。

import pickle
import gzip

with gzip.open((PATH / FILENAME).as_posix(), "rb") as f:
        ((x_train, y_train), (x_valid, y_valid), _) = pickle.load(f, encoding="latin-1")

在上述工作准备完成后，我们可以先查看一个数据，观察他的特征。

from matplotlib import pyplot
import numpy as np

pyplot.imshow(x_train[0].reshape((28, 28)), cmap="gray")
print(x_train.shape)
#(50000, 784)

在此处，我们查看的训练集当中的第一个数据，大小重构为（28，28，1），表示长是 28，宽是 28，颜色通道是 1（黑白图就只有一个颜色通道），颜色设置为灰色。在查看第一个数据的同时，我们也输出整个训练集的数据大小，其中，(50000, 784) 中的 50000 表示训练集一共有 50000 个数据样本，784 表示训练集中每个样本有 784 个像素点（可以理解成 784 个特征）。

三、 Mnist 分类任务实现

1. 标签和简单网络架构在分类任务当中，标签的设计是有所不同的。

很多人认为预测出来的 9，具体指的是 0，1，2，3，4，5，6，7，8，9 当中的具体哪一个，但实际上并不是这样的，他也是一个 One-Hot 的编码，他预测的出来的不是一个具体的数值，而是十个概率，就是当前这个输入属于 0-9 这十个数字的概率是多少。
以上图为例，该输入属于 0 的概率就是 0，属于 1 的概率就是 12%，属于 9 的概率就是 87%，属于 9 的概率最高，因此，该输入的输出就是 9。

对于这个网络架构，由于我们的每个数据样本都有 784 个像素点，中间进行特征提取，得到一定数量的特征，最终得到 10 个输出，通过 Softmax 层得到是个概率。

2. 具体代码实现

需要注意的是，我们需要先将数据转换成 tensor 才能参与后续建模训练。
这里的数据包括 x_train, y_train, x_valid, y_valid 四种，对于他们的含义，我们可以这样理解：
（1） x_train 包括所有自变量，这些变量将用于训练模型。
（2） y_train 是指因变量，需要此模型进行预测，其中包括针对自变量的类别标签，我们需要在训练/拟合模型时指定我们的因变量。
（3） x_valid 也就是 x_test，这些自变量将不会在训练阶段使用，并将用于进行预测，以测试模型的准确性。
（4） y_valid 也就是 y_test，此数据具有测试数据的类别标签，这些标签将用于测试实际类别和预测类别之间的准确性。

import torch

x_train, y_train, x_valid, y_valid = map(
    torch.tensor, (x_train, y_train, x_valid, y_valid)
)
n, c = x_train.shape
x_train, x_train.shape, y_train.min(), y_train.max()
print(x_train, y_train)
print(x_train.shape)
print(y_train.min(), y_train.max())
#tensor([[0., 0., 0.,  ..., 0., 0., 0.],
#        [0., 0., 0.,  ..., 0., 0., 0.],
#        [0., 0., 0.,  ..., 0., 0., 0.],
#        ...,
#        [0., 0., 0.,  ..., 0., 0., 0.],
#        [0., 0., 0.,  ..., 0., 0., 0.],
#        [0., 0., 0.,  ..., 0., 0., 0.]]) tensor([5, 0, 4,  ..., 8, 4, 8])
#torch.Size([50000, 784])
#tensor(0) tensor(9)

在模型训练的过程中，大家经常会看到 nn.Module 和 nn.functional。那什么时候使用 nn.Module，什么时候使用 nn.functional 呢？
一般情况下，如果模型有可学习的参数，最好用 nn.Module，其他情况 nn.functional 相对更简单一些。
我们先导入需要的模块包。

import torch.nn.functional as F

loss_func = F.cross_entropy

def model(xb):
    return xb.mm(weights) + bias

然后进行参数的设定。

bs = 64
xb = x_train[0:bs]  # a mini-batch from x
yb = y_train[0:bs]
weights = torch.randn([784, 10], dtype = torch.float,  requires_grad = True) 
bs = 64
bias = torch.zeros(10, requires_grad=True)

print(loss_func(model(xb), yb))
#tensor(10.7988, grad_fn=)

我们也创建一个 model 来更简化代码。
在这中间必须继承 nn.Module 且在其构造函数中需调用 nn.Module 的构造函数，无需写反向传播函数，nn.Module 能够利用 autograd 自动实现反向传播，Module 中的可学习参数可以通过 named_parameters() 或者 parameters() 返回迭代器。

from torch import nn

class Mnist_NN(nn.Module):
    def __init__(self):
        super().__init__()
        self.hidden1 = nn.Linear(784, 128) #隐藏层1：784*128
        self.hidden2 = nn.Linear(128, 256) #隐藏层2：128*256
        self.out  = nn.Linear(256, 10) #输出层，256*10

    def forward(self, x):
        x = F.relu(self.hidden1(x))
        x = F.relu(self.hidden2(x))
        x = self.out(x)
        return x
        
net = Mnist_NN()
print(net)
#Mnist_NN(
#  (hidden1): Linear(in_features=784, out_features=128, bias=True)
#  (hidden2): Linear(in_features=128, out_features=256, bias=True)
#  (out): Linear(in_features=256, out_features=10, bias=True)
#)

我们可以打印定义好名字里的权重和偏置项，首先打印名字，然后打印参数，最后打印参数的维度。

for name, parameter in net.named_parameters():
    print(name, parameter,parameter.size())
#hidden1.weight Parameter containing:
#tensor([[ 0.0018,  0.0218,  0.0036,  ..., -0.0286, -0.0166,  0.0089],
#        [-0.0349,  0.0268,  0.0328,  ...,  0.0263,  0.0200, -0.0137],
#        [ 0.0061,  0.0060, -0.0351,  ...,  0.0130, -0.0085,  0.0073],
#        ...,
#        [-0.0231,  0.0195, -0.0205,  ..., -0.0207, -0.0103, -0.0223],
#        [-0.0299,  0.0305,  0.0098,  ...,  0.0184, -0.0247, -0.0207],
#        [-0.0306, -0.0252, -0.0341,  ...,  0.0136, -0.0285,  0.0057]],
#       requires_grad=True) torch.Size([128, 784])
#hidden1.bias Parameter containing:
#tensor([ 0.0072, -0.0269, -0.0320, -0.0162,  0.0102,  0.0189, -0.0118, -0.0063,
#        -0.0277,  0.0349,  0.0267, -0.0035,  0.0127, -0.0152, -0.0070,  0.0228,
#        -0.0029,  0.0049,  0.0072,  0.0002, -0.0356,  0.0097, -0.0003, -0.0223,
#        -0.0028, -0.0120, -0.0060, -0.0063,  0.0237,  0.0142,  0.0044, -0.0005,
#         0.0349, -0.0132,  0.0138, -0.0295, -0.0299,  0.0074,  0.0231,  0.0292,
#        -0.0178,  0.0046,  0.0043, -0.0195,  0.0175, -0.0069,  0.0228,  0.0169,
#         0.0339,  0.0245, -0.0326, -0.0260, -0.0029,  0.0028,  0.0322, -0.0209,
#        -0.0287,  0.0195,  0.0188,  0.0261,  0.0148, -0.0195, -0.0094, -0.0294,
#        -0.0209, -0.0142,  0.0131,  0.0273,  0.0017,  0.0219,  0.0187,  0.0161,
#         0.0203,  0.0332,  0.0225,  0.0154,  0.0169, -0.0346, -0.0114,  0.0277,
#         0.0292, -0.0164,  0.0001, -0.0299, -0.0076, -0.0128, -0.0076, -0.0080,
#        -0.0209, -0.0194, -0.0143,  0.0292, -0.0316, -0.0188, -0.0052,  0.0013,
#        -0.0247,  0.0352, -0.0253, -0.0306,  0.0035, -0.0253,  0.0167, -0.0260,
#        -0.0179, -0.0342,  0.0033, -0.0287, -0.0272,  0.0238,  0.0323,  0.0108,
#         0.0097,  0.0219,  0.0111,  0.0208, -0.0279,  0.0324, -0.0325, -0.0166,
#        -0.0010, -0.0007,  0.0298,  0.0329,  0.0012, -0.0073, -0.0010,  0.0057],
#       requires_grad=True) torch.Size([128])
#hidden2.weight Parameter containing:
#tensor([[-0.0383, -0.0649,  0.0665,  ..., -0.0312,  0.0394, -0.0801],
#        [-0.0189, -0.0342,  0.0431,  ..., -0.0321,  0.0072,  0.0367],
#        [ 0.0289,  0.0780,  0.0496,  ...,  0.0018, -0.0604, -0.0156],
#        ...,
#        [-0.0360,  0.0394, -0.0615,  ...,  0.0233, -0.0536, -0.0266],
#        [ 0.0416,  0.0082, -0.0345,  ...,  0.0808, -0.0308, -0.0403],
#        [-0.0477,  0.0136, -0.0408,  ...,  0.0180, -0.0316, -0.0782]],
#       requires_grad=True) torch.Size([256, 128])
#hidden2.bias Parameter containing:
#tensor([-0.0694, -0.0363, -0.0178,  0.0206, -0.0875, -0.0876, -0.0369, -0.0386,
#         0.0642, -0.0738, -0.0017, -0.0243, -0.0054,  0.0757, -0.0254,  0.0050,
#         0.0519, -0.0695,  0.0318, -0.0042, -0.0189, -0.0263, -0.0627, -0.0691,
#         0.0713, -0.0696, -0.0672,  0.0297,  0.0102,  0.0040,  0.0830,  0.0214,
#         0.0714,  0.0327, -0.0582, -0.0354,  0.0621,  0.0475,  0.0490,  0.0331,
#        -0.0111, -0.0469, -0.0695, -0.0062, -0.0432, -0.0132, -0.0856, -0.0219,
#        -0.0185, -0.0517,  0.0017, -0.0788, -0.0403,  0.0039,  0.0544, -0.0496,
#         0.0588, -0.0068,  0.0496,  0.0588, -0.0100,  0.0731,  0.0071, -0.0155,
#        -0.0872, -0.0504,  0.0499,  0.0628, -0.0057,  0.0530, -0.0518, -0.0049,
#         0.0767,  0.0743,  0.0748, -0.0438,  0.0235, -0.0809,  0.0140, -0.0374,
#         0.0615, -0.0177,  0.0061, -0.0013, -0.0138, -0.0750, -0.0550,  0.0732,
#         0.0050,  0.0778,  0.0415,  0.0487,  0.0522,  0.0867, -0.0255, -0.0264,
#         0.0829,  0.0599,  0.0194,  0.0831, -0.0562,  0.0487, -0.0411,  0.0237,
#         0.0347, -0.0194, -0.0560, -0.0562, -0.0076,  0.0459, -0.0477,  0.0345,
#        -0.0575, -0.0005,  0.0174,  0.0855, -0.0257, -0.0279, -0.0348, -0.0114,
#        -0.0823, -0.0075, -0.0524,  0.0331,  0.0387, -0.0575,  0.0068, -0.0590,
#        -0.0101, -0.0880, -0.0375,  0.0033, -0.0172, -0.0641, -0.0797,  0.0407,
#         0.0741, -0.0041, -0.0608,  0.0672, -0.0464, -0.0716, -0.0191, -0.0645,
#         0.0397,  0.0013,  0.0063,  0.0370,  0.0475, -0.0535,  0.0721, -0.0431,
#         0.0053, -0.0568, -0.0228, -0.0260, -0.0784, -0.0148,  0.0229, -0.0095,
#        -0.0040,  0.0025,  0.0781,  0.0140, -0.0561,  0.0384, -0.0011, -0.0366,
#         0.0345,  0.0015,  0.0294, -0.0734, -0.0852, -0.0015, -0.0747, -0.0100,
#         0.0801, -0.0739,  0.0611,  0.0536,  0.0298, -0.0097,  0.0017, -0.0398,
#         0.0076, -0.0759, -0.0293,  0.0344, -0.0463, -0.0270,  0.0447,  0.0814,
#        -0.0193, -0.0559,  0.0160,  0.0216, -0.0346,  0.0316,  0.0881, -0.0652,
#        -0.0169,  0.0117, -0.0107, -0.0754, -0.0231, -0.0291,  0.0210,  0.0427,
#         0.0418,  0.0040,  0.0762,  0.0645, -0.0368, -0.0229, -0.0569, -0.0881,
#        -0.0660,  0.0297,  0.0433, -0.0777,  0.0212, -0.0601,  0.0795, -0.0511,
#        -0.0634,  0.0720,  0.0016,  0.0693, -0.0547, -0.0652, -0.0480,  0.0759,
#         0.0194, -0.0328, -0.0211, -0.0025, -0.0055, -0.0157,  0.0817,  0.0030,
#         0.0310, -0.0735,  0.0160, -0.0368,  0.0528, -0.0675, -0.0083, -0.0427,
#        -0.0872,  0.0699,  0.0795, -0.0738, -0.0639,  0.0350,  0.0114,  0.0303],
#       requires_grad=True) torch.Size([256])
#out.weight Parameter containing:
#tensor([[ 0.0232, -0.0571,  0.0439,  ..., -0.0417, -0.0237,  0.0183],
#        [ 0.0210,  0.0607,  0.0277,  ..., -0.0015,  0.0571,  0.0502],
#        [ 0.0297, -0.0393,  0.0616,  ...,  0.0131, -0.0163, -0.0239],
#        ...,
#        [ 0.0416,  0.0309, -0.0441,  ..., -0.0493,  0.0284, -0.0230],
#        [ 0.0404, -0.0564,  0.0442,  ..., -0.0271, -0.0526, -0.0554],
#        [-0.0404, -0.0049, -0.0256,  ..., -0.0262, -0.0130,  0.0057]],
#       requires_grad=True) torch.Size([10, 256])
#out.bias Parameter containing:
#tensor([-0.0536,  0.0007,  0.0227, -0.0072, -0.0168, -0.0125, -0.0207, -0.0558,
#         0.0579, -0.0439], requires_grad=True) torch.Size([10])

四、使用 TensorDataset 和 DataLoader 简化

自己构建数据集，使用 batch 取数据会略显麻烦，因此，我们可以使用 TensorDataset 和 DataLoader 这两个模块进行简化。

from torch.utils.data import TensorDataset
from torch.utils.data import DataLoader

train_ds = TensorDataset(x_train, y_train)
train_dl = DataLoader(train_ds, batch_size=bs, shuffle=True)

valid_ds = TensorDataset(x_valid, y_valid)
valid_dl = DataLoader(valid_ds, batch_size=bs * 2)
def get_data(train_ds, valid_ds, bs):
    return (
        DataLoader(train_ds, batch_size=bs, shuffle=True),
        DataLoader(valid_ds, batch_size=bs * 2),
    )

一般在训练模型时加上 model.train()，这样会正常使用 Batch Normalization 和 Dropout。
测试的时候一般选择 model.eval()，这样就不会使用 Batch Normalization 和 Dropout。

import numpy as np

def fit(steps, model, loss_func, opt, train_dl, valid_dl):
    for step in range(steps):
        model.train()
        for xb, yb in train_dl:
            loss_batch(model, loss_func, xb, yb, opt)

        model.eval()
        with torch.no_grad():
            losses, nums = zip(
                *[loss_batch(model, loss_func, xb, yb) for xb, yb in valid_dl]
            )
        val_loss = np.sum(np.multiply(losses, nums)) / np.sum(nums)
        print('当前step:'+str(step), '验证集损失：'+str(val_loss))
from torch import optim
def get_model():
    model = Mnist_NN()
    return model, optim.SGD(model.parameters(), lr=0.001)
def loss_batch(model, loss_func, xb, yb, opt=None):
    loss = loss_func(model(xb), yb)

    if opt is not None:
        loss.backward()
        opt.step()
        opt.zero_grad()

    return loss.item(), len(xb)

我们也可以像上篇博文一样，使用三行代码进行解决。

train_dl, valid_dl = get_data(train_ds, valid_ds, bs)
model, opt = get_model()
fit(25, model, loss_func, opt, train_dl, valid_dl)
#当前step:0 验证集损失：2.2796445930480957
#当前step:1 验证集损失：2.2440698066711424
#当前step:2 验证集损失：2.1889826164245605
#当前step:3 验证集损失：2.0985311767578123
#当前step:4 验证集损失：1.9517273582458496
#当前step:5 验证集损失：1.7341805934906005
#当前step:6 验证集损失：1.4719875366210937
#当前step:7 验证集损失：1.2273896869659424
#当前step:8 验证集损失：1.0362271406173706
#当前step:9 验证集损失：0.8963696184158325
#当前step:10 验证集损失：0.7927186088562012
#当前step:11 验证集损失：0.7141492074012756
#当前step:12 验证集损失：0.6529350900650024
#当前step:13 验证集损失：0.60417300491333
#当前step:14 验证集损失：0.5643046331882476
#当前step:15 验证集损失：0.5317994566917419
##当前step:16 验证集损失：0.5047958114624024
#当前step:17 验证集损失：0.4813900615692139
#当前step:18 验证集损失：0.4618900228500366
#当前step:19 验证集损失：0.4443243554592133
#当前step:20 验证集损失：0.4297310716629028
#当前step:21 验证集损失：0.416976597738266
#当前step:22 验证集损失：0.406348459148407
#当前step:23 验证集损失：0.3963301926612854
#当前step:24 验证集损失：0.38733808159828187

到此这篇关于PyTorch中的神经网络 Mnist 分类任务的文章就介绍到这了,更多相关PyTorch神经网络 Mnist 分类任务内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

Unity文件路径访问总结：从基础到高级的资源加载方法 Unity青子 Unity零基础系列课程 unity
在Unity开发中，文件路径的访问和资源加载是开发者经常需要处理的任务。无论是加载纹理、模型、音频，还是读取配置文件，正确地处理路径和资源加载是确保项目顺利运行的关键。本文将以Unity文件路径访问为主线，详细介绍Unity中常见的路径访问方式，并结合代码示例、注意事项以及实际使用场景，帮助开发者更好地理解和使用这些方法。同时，本文还会延伸出更多相关知识，帮助用户举一反三，解决实际开发中的问题。1
华为OD机试 - 手机App防沉迷系统（Python/JS/C/C++ 2024 D卷 100分）哪吒华为od python javascript 算法七日集训
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述智能手机方便了我们生活的同时，也侵占了我们不少的时间。“手机Ap
使用LangChain构建简单LLM翻译应用 fGVBSAbe langchain java 前端 python
技术背景介绍在本教程中，我们将学习如何使用LangChain构建一个简单的语言模型（LLM）应用程序，该应用程序用于将文本从英语翻译成其他语言。虽然这个应用程序比较简单，但它是学习LangChain的一个不错的开始，因为许多复杂功能都可以通过简单的提示和LLM调用构建。核心原理解析LangChain通过链式调用多个组件，使得复杂的语言处理任务变得简单易行。我们将使用LangChain的以下功能：语
021：为什么是卷积呢？董董灿是个攻城狮计算机视觉保姆级教程人工智能计算机视觉 CNN
本文为合集收录，欢迎查看合集/专栏链接进行全部合集的系统学习。合集完整版请查看这里。卷积算法非常重要，但是为什么是卷积呢?在进一步学习之前，先看一看神经网络(或者叫一个AI模型)是如何完成一张图片的推理的。你肯定听说过阿尔法狗大战柯洁的故事，当时新闻一出，不知大家什么反应，反正我是被震撼到了：AI模型竟然学到了那么多的棋谱，而且人类在AI的面前毫无还手可言。但是，你有没有想过一个问题：阿尔法狗学会
MySQL面试题泰山小张只吃荷园 mysql 数据库 java 面试后端
MySQL目录1.MySQL中的数据排序是怎么实现的？2.那怎么去优化ORDERBY呢？3.MySQL中的ChangeBuffer是什么?有什么作用？4.详细描述一下一条SQL语句在MySQL中的执行过程5.MySQL的存储引擎有哪些？6.MySQL的索引有哪些？7.MySQLInnoDB引擎中的聚集索引和非聚集索引有什么区别?8.MySQL索引的最左前缀匹配原则是什么?9.MySQL的覆盖索引是
AI Agent的技术选型：从个人项目到企业级应用人工智能机器学习
说实话，每次有人问我"开发AIAgent应该用什么技术栈？"，我都觉得挺难回答的。因为不同的场景，最佳的技术选择可能完全不同。今天就来聊聊我在不同项目中的技术选型经历，希望能给大家一些参考。从个人项目说起去年我开始研究AIAgent的时候，第一个练手项目是给自己做一个代码助手。需求很简单：能读懂我的项目代码，帮我重构和写测试。那时候，我的技术选型是这样的：模型选择：OpenAIGPT-3.5便宜，
软件工程的熵减：AI代码生成器如何降低系统复杂度前端
软件开发的世界，如同一个不断膨胀的宇宙。随着项目规模的增长，代码库日益庞大，系统复杂度也随之水涨船高。维护、扩展和协作的难度成倍增加，这如同物理学中的熵增原理一样，系统朝着混乱无序的方向发展。为了对抗这种“熵增”，我们需要寻找有效的手段，而AI代码生成器的出现，为我们提供了一种强大的武器。在传统的软件开发模式下，开发者花费大量时间处理重复性工作，例如编写大量的样板代码，这不仅效率低下，而且容易引入
AI驱动的翻译工具：自动化处理 Univer Sheets 单元格内容翻译
背景随着工作和学习的全球化，跨语言的沟通变得尤为重要。对于使用电子表格进行数据处理和分析的用户来说，表格中的内容可能涉及不同的语言。尤其是在处理多语言数据时，翻译表格内容成为了一个高频的需求。传统的翻译方法可能需要手动复制粘贴，或者依赖外部工具，这样的方式既繁琐又浪费时间。为了解决这个问题，我们开发了一个基于AI的自动翻译工具——AICellTranslator，它能在UniverSheets中自
在PyTorch框架上训练ImageNet时，Dataloader加载速度慢怎么解决？ cda2024 pytorch 人工智能 python
在深度学习领域，PyTorch因其灵活性和易用性而受到广泛欢迎。然而，在实际应用中，特别是在处理大规模数据集如ImageNet时，Dataloader的加载速度往往成为瓶颈。本文将深入探讨这一问题，并提供多种解决方案，帮助你在PyTorch框架上高效地训练ImageNet。1.问题背景ImageNet是一个包含超过1400万张图像的大规模数据集，被广泛用于图像分类任务的研究。在PyTorch中，D
Yocto项目-全面的工具链能力嵌入式Jerry Yocto linux 嵌入式硬件开发语言物联网系统架构
工具链是嵌入式系统开发中的核心组成部分，它决定了从源代码到可运行二进制文件的转化效率和最终质量。在诸多嵌入式构建系统中，Yocto项目以其灵活、强大且全面的工具链能力成为行业的佼佼者。本文将全面解析Yocto项目的工具链能力，同时对比其他常见构建系统，帮助读者更清晰地了解Yocto项目的优势和适用场景。1.什么是工具链？工具链（Toolchain）是嵌入式开发的核心，它由一组工具组成，用于将源代码
Python从0到100（七十三）：Python OpenCV-OpenCV实现手势虚拟拖拽是Dream呀 python opencv 开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
Flutter ListView进阶：如何实现根据索引值滚动到列表特定位置 md_1008 flutter javascript 前端
在Flutter开发中，ListView是一个非常常用的组件，它允许我们展示一系列的项目。然而，有时候我们需要根据特定的索引值滚动到ListView中的某个项目位置，以便提供更好的用户体验。本文将详细介绍如何在Flutter中实现这一功能。一、基础准备首先，我们需要确保我们的ListView是可滚动的。在Flutter中，常用的可滚动ListView包括ListView、ListView.buil
mybatis xml sql 媤纹琴獣 mybatis xml sql
1.mybatis根据某一个字段根据以及集合中的列表进行模糊匹配mapperListselectByLinkList(@Param("userId")StringuserId,@Param("messageName")StringmessageName,@Param("anJinGoodsNameList")ListanJinGoodsNameList,@Param("sjDate")Datesj
期末python试卷（1）泰山小张只吃荷园 python 网络开发语言开源汇编程序人生学习方法
目录一、判断题二、选择题三、填空题一、判断题1.Python是一种解释型、面向对象的编程语言。2.Python中的变量名只能由字母、下划线、数字组成，且不能以数字开头。3.Python中多分支可使用IF-ELIF和SWITCH-CASE语句来实现。4.表达式中包含多个运算符时，计算顺序取决于运算符的结合顺序和优先级。5.x=’Tom’，那么执行语句x+=’Tom’之后，x的id不变。6.Pytho
深入浅出：Go语言中的`bufio`包及其数据类型详解少林码僧 go开发工作经验汇总 golang 开发语言后端
深入浅出：Go语言中的bufio包及其数据类型详解Go语言以其简洁、高效和强大的库支持而闻名，其中bufio包作为标准库的一部分，为开发者提供了便捷的缓冲输入输出功能。本文将深入探讨bufio包中的数据类型及其使用方法，帮助读者更好地理解和应用这一工具。一、什么是bufio包？bufio包是Go语言标准库中用于处理缓冲输入输出的一个重要模块。它通过提供一系列的缓冲器（如Reader、Writer等
Spring Boot 分层解耦相关知识需要重新演唱 web spring boot 后端 java
SpringBoot分层解耦相关知识详解目录SpringBoot分层解耦相关知识详解1.概述2.控制反转（IOC）2.1概念解释2.2在SpringBoot中的实现3.依赖注入（DI）3.1概念解释3.2在SpringBoot中的实现3.2.1构造器注入3.2.2Setter注入3.2.3字段注入4.分层解耦的实践4.1分层架构4.2示例代码5.总结1.概述在现代软件开发中，分层解耦是一个核心概念
06FFMPEG的AVCodecContext结构体分析 Mango酱 FFMPEG ffmpeg 视频处理
06FFMPEG的AVCodecContext结构体分析概述：该结构体位于libavcodec库中的avcodec.h中。1AVCodecContext编解码上下文结构体位于libavcodec库里。AVFormatContext，AVInputFormat，AVOutputFormat，AVStream均位于libavformat库里。最长的结构体，将近两千行。但是新版本avformat58.d
什么是多任务，单线程，多线程，超线程 weixin_34378969 操作系统
单任务操作系统：就是一次只能运行一个程序，不能同时运行多个程序，比如DOS系统；多任务系统则可以同时运行多个程序，比如我们现在常用的WindowsXP、Win7等系统。举例子：在运行一个软件时，想要玩另一个软件就必须把上面运行的软件关掉才能运行新的软件，你玩×××游戏时，还想再开个cs游戏，就得关掉×××游戏！想再开个uc浏览器，就的把cs关掉，你不关，在开新程序时系统会替你关的！多任务系统嘛，如
python正则表达式re关于数字、字母、特殊字符、汉字的匹配方式乙龙 python 开发语言
在Python中，正则表达式是通过re模块来实现的。正则表达式是一种强大的文本处理工具，用于匹配、搜索、替换或分割字符串。以下是一些基本的正则表达式模式，用于筛选不同类型的字符：数字(\d):匹配任意数字（0-9）。示例：\d可以匹配“123”中的每个‘1’,‘2’,‘3’。字母([a-zA-Z]):匹配任意大小写的英文字母。示例：[a-zA-Z]可以匹配“HelloWorld”中的每个‘H’,‘
python中的两种循环怎么昵称都被占用啊 python 练习 python
python中的两种循环for循环（计数循环）while循环（条件循环）两种循环的区别range函数跳出循环break示例continue示例循环嵌套循环练习循环，三大语言结构之一，当它满足条件时反复执行某一段代码的过程，在python中有两种循环命令，分别为for循环和while循环for循环（计数循环）python中常用的循环结构之一，可以遍历一个可迭代对象中的元素。因为for循环的循环次数是
K-means聚类：解锁数据隐藏结构的钥匙陈辰学长 kmeans 聚类机器学习
K-means聚类：解锁数据隐藏结构的钥匙在机器学习的广阔领域中，无监督学习以其独特的魅力吸引了众多研究者和实践者。其中，K-means聚类作为一种经典且实用的无监督学习算法，以其简单高效的特点，广泛应用于市场细分、图像分割和基因聚类等领域。本文将深入探讨K-means聚类的工作原理、应用实例及其在这些领域中的具体应用，旨在揭示其如何智能划分数据，解锁隐藏结构，为相关领域提供精准导航。一、K-me
Docker Image 详细讲解陈辰学长 docker 容器运维
DockerImage详细讲解DockerImage是Docker生态系统中的核心概念之一，它作为容器运行的基础，封装了应用运行所需的环境和依赖。本文将详细讲解DockerImage的定义、构建、存储、管理以及使用，帮助读者全面理解DockerImage。一、DockerImage概述DockerImage是一个轻量级、可执行的独立软件包，包含了运行某个软件所需要的所有内容，包括代码、运行时、库、
ACNet：深度学习中的自适应卷积网络新星郎轶诺
ACNet：深度学习中的自适应卷积网络新星项目地址:https://gitcode.com/gh_mirrors/ac/ACNet在深度学习领域，卷积神经网络（CNN）一直是图像处理和计算机视觉任务的核心技术。然而，传统的固定大小的卷积核无法灵活适应不同区域的信息密度。针对这一问题，ACNet（AdaptiveConvolutionNetwork）项目应运而生，它引入了一种新型的自适应卷积层，旨在
《一个月教你玩转C++》系列第十章：C++中的while循环 c++布丁 C++c++开发语言
第十章：C++中的while循环这一章，布丁将会介绍C++中的while循环，以及两个实用的运算符：++和--。这些工具能帮助我们更有效地控制程序的流程。while循环基本格式while循环是C++中实现重复执行的一种方式。它根据一个条件来决定是否继续执行循环体内的代码。这个条件可以是任何可以评估为真或假（真就是大于0的数，假就是0）的表达式哟！while循环的基本格式是这样的：while(条件)
工作中常用springboot启动后执行的方法 begei spring boot java 后端
前言：工作中难免会遇到一些，程序启动之后需要提前执行的需求。例如：初始化缓存：在启动时加载必要的缓存数据。定时任务创建或启动：程序启动后创建或启动定时任务。程序启动完成通知：程序启动完成后通过邮件、短信等方式通知运维人员。外部系统同步：启动后与外部系统同步数据。下面介绍几种常见方式：1.使用@PostConstruct注解：使用@PostConstruct注解可以在Spring容器初始化bean之
与机器学习的邂逅--自适应神经网络结构的深度解析想成为高手499 机器学习与人工智能机器学习神经网络人工智能
引言随着人工智能的发展，神经网络已成为许多应用领域的重要工具。自适应神经网络（AdaptiveNeuralNetworks，ANN）因其出色的学习能力和灵活性，逐渐成为研究的热点。本文将详细探讨自适应神经网络的基本概念、工作原理、关键技术、C++实现示例及其应用案例，最后展望未来的发展趋势。自适应神经网络的基本概念什么是自适应神经网络？自适应神经网络是一种能够根据输入数据的变化和环境的动态特性自动
Spring Boot中的响应与分层解耦架构陈辰学长 spring boot 架构后端
SpringBoot中的响应与分层解耦架构在SpringBoot框架中，响应与分层解耦架构是两个核心概念，它们共同促进了应用程序的高效性、可维护性和可扩展性。下面将详细探讨这两个方面，包括SpringBoot的响应机制、分层解耦的三层架构以及它们在实际开发中的应用。一、SpringBoot的响应机制SpringBoot的响应机制主要依赖于其内置的Servlet容器（如Tomcat）和SpringM
MCP（Model Context Protocol）模型上下文协议进阶篇4 - 发展计划 AIQL MCP(Model Context Protocol)MCP ai language model 开源协议人工智能
ModelContextProtocol（MCP）正在快速发展。这一章概述了2025年上半年关键优先事项和未来方向的当前思考，尽管这些内容可能会随着项目的进展而发生显著变化。目前MCP的主要内容，除实战篇外（包括理论篇、番外篇和进阶篇）均已进入收尾阶段。在官方未发布重大更新前，预计短期不会新增其他篇章。远程MCP支持（RemoteMCPSupport）我们的首要任务是启用远程MCP连接，允许客户端
自适应神经网络架构：原理解析与代码示例 chian-ocean 机器学习神经网络人工智能深度学习
个人主页：chian-ocean文章专栏自适应神经网络结构：深入探讨与代码实现1.引言随着深度学习的不断发展，传统神经网络模型在处理复杂任务时的局限性逐渐显现。固定的网络结构和参数对于动态变化的环境和多样化的数据往往难以适应，导致了过拟合或欠拟合的问题。自适应神经网络（AdaptiveNeuralNetworks,ANN）为此提供了一种新的解决方案，它可以根据数据特征和训练情况自动调整网络结构，从
深度解析智能问答系统：如何打造精准、高效的AI对话架构？和老莫一起学AI 人工智能架构自然语言处理产品经理语言模型学习 ai
在人工智能的飞速发展中，智能问答系统（QA系统）逐渐成为了企业内部管理、客户服务、搜索引擎等多个领域中的关键技术。今天，我们将深入探讨一个基于大模型、自然语言处理、知识检索的智能问答系统的架构，详细介绍其技术原理、流程以及未来应用前景。一、系统整体概览在这个智能问答系统中，整个流程可以大致划分为两大部分：前端问答生成与后端离线数据处理。前端部分是用户交互的核心，通过用户的输入、关键词提取、检索和问
微信开发者验证接口开发 362217990 微信开发者 token 验证
微信开发者接口验证。 Token，自己随便定义，与微信填写一致就可以了。根据微信接入指南描述 http://mp.weixin.qq.com/wiki/17/2d4265491f12608cd170a95559800f2d.html 第一步：填写服务器配置第二步：验证服务器地址的有效性第三步：依据接口文档实现业务逻辑这里主要讲第二步验证服务器有效性。建一个
一个小编程题-类似约瑟夫环问题 BrokenDreams 编程
今天群友出了一题：一个数列,把第一个元素删除,然后把第二个元素放到数列的最后,依次操作下去,直到把数列中所有的数都删除,要求依次打印出这个过程中删除的数。 &
linux复习笔记之bash shell (5) 关于减号-的作用 eksliang linux关于减号“-”的含义 linux关于减号“-”的用途 linux关于“-”的含义 linux关于减号的含义
转载请出自出处： http://eksliang.iteye.com/blog/2105677 管道命令在bash的连续处理程序中是相当重要的，尤其在使用到前一个命令的studout（标准输出）作为这次的stdin（标准输入）时，就显得太重要了，某些命令需要用到文件名，例如上篇文档的的切割命令（split）、还有
Unix(3) 18289753290 unix ksh
1)若该变量需要在其他子进程执行，则可用"$变量名称"或${变量}累加内容什么是子进程？在我目前这个shell情况下，去打开一个新的shell，新的那个shell就是子进程。一般状态下，父进程的自定义变量是无法在子进程内使用的，但通过export将变量变成环境变量后就能够在子进程里面应用了。 2)条件判断： &&代表and ||代表or&nbs
关于ListView中性能优化中图片加载问题酷的飞上天空 ListView
ListView的性能优化网上很多信息，但是涉及到异步加载图片问题就会出现问题。具体参看上篇文章http://314858770.iteye.com/admin/blogs/1217594 如果每次都重新inflate一个新的View出来肯定会造成性能损失严重，可能会出现listview滚动是很卡的情况，还会出现内存溢出。现在想出一个方法就是每次都添加一个标识，然后设置图
德国总理默多克：给国人的一堂“震撼教育”课永夜-极光教育
http://bbs.voc.com.cn/topic-2443617-1-1.html德国总理默多克：给国人的一堂“震撼教育”课　安吉拉—默克尔，一位经历过社会主义的东德人，她利用自己的博客，发表一番来华前的谈话，该说的话，都在上面说了，全世界想看想传播——去看看默克尔总理的博客吧！　　德国总理默克尔以她的低调、朴素、谦和、平易近人等品格给国人留下了深刻印象。她以实际行动为中国人上了一堂
关于Java继承的一个小问题。。。随便小屋 java
今天看Java 编程思想的时候遇见一个问题，运行的结果和自己想想的完全不一样。先把代码贴出来！ //CanFight接口 interface Canfight { void fight(); } //ActionCharacter类 class ActionCharacter { public void fight() { System.out.pr
23种基本的设计模式 aijuans 设计模式
Abstract Factory：提供一个创建一系列相关或相互依赖对象的接口，而无需指定它们具体的类。　　Adapter：将一个类的接口转换成客户希望的另外一个接口。A d a p t e r模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作。　　Bridge：将抽象部分与它的实现部分分离，使它们都可以独立地变化。　　Builder：将一个复杂对象的构建与它的表示分离，使得同
《周鸿祎自述：我的互联网方法论》读书笔记 aoyouzi 读书笔记
从用户的角度来看,能解决问题的产品才是好产品,能方便/快速地解决问题的产品,就是一流产品. 商业模式不是赚钱模式一款产品免费获得海量用户后,它的边际成本趋于0,然后再通过广告或者增值服务的方式赚钱,实际上就是创造了新的价值链. 商业模式的基础是用户,木有用户,任何商业模式都是浮云.商业模式的核心是产品,本质是通过产品为用户创造价值. 商业模式还包括寻找需求
JavaScript动态改变样式访问技术百合不是茶 JavaScript style属性 ClassName属性
一:style属性格式: HTML元素.style.样式属性="值"; 创建菜单:在html标签中创建或者在head标签中用数组创建 <html> <head> <title>style改变样式</title> </head> &l
jQuery的deferred对象详解 bijian1013 jquery deferred对象
jQuery的开发速度很快，几乎每半年一个大版本，每两个月一个小版本。每个版本都会引入一些新功能，从jQuery 1.5.0版本开始引入的一个新功能----deferred对象。 &nb
淘宝开放平台TOP Bill_chen C++c 物流 C#
淘宝网开放平台首页：http://open.taobao.com/ 淘宝开放平台是淘宝TOP团队的产品，TOP即TaoBao Open Platform，是淘宝合作伙伴开发、发布、交易其服务的平台。支撑TOP的三条主线为： 1.开放数据和业务流程 * 以API数据形式开放商品、交易、物流等业务； &
【大型网站架构一】大型网站架构概述 bit1129 网站架构
大型互联网特点面对海量用户、海量数据大型互联网架构的关键指标高并发高性能高可用高可扩展性线性伸缩性安全性大型互联网技术要点前端优化 CDN缓存反向代理 KV缓存消息系统分布式存储 NoSQL数据库搜索监控安全想到的问题： 1.对于订单系统这种事务型系统，如
eclipse插件hibernate tools安装白糖_ Hibernate
eclipse helios(3.6)版 1.启动eclipse 2.选择 Help > Install New Software...> 3.添加如下地址： http://download.jboss.org/jbosstools/updates/stable/helios/ 4.选择性安装：hibernate tools在All Jboss tool
Jquery easyui Form表单提交注意事项 bozch jquery easyui
jquery easyui对表单的提交进行了封装，提交的方式采用的是ajax的方式，在开发的时候应该注意的事项如下： 1、在定义form标签的时候，要将method属性设置成post或者get，特别是进行大字段的文本信息提交的时候，要将method设置成post方式提交，否则页面会抛出跨域访问等异常。所以这个要
Trie tree(字典树)的Java实现及其应用-统计以某字符串为前缀的单词的数量 bylijinnan java实现
import java.util.LinkedList; public class CaseInsensitiveTrie { /** 字典树的Java实现。实现了插入、查询以及深度优先遍历。 Trie tree's java implementation.(Insert,Search,DFS) Problem Description Igna
html css 鼠标形状样式汇总 chenbowen00 html css
css鼠标手型cursor中hand与pointer Example：CSS鼠标手型效果 <a href="#" style="cursor:hand">CSS鼠标手型效果</a><br/> Example：CSS鼠标手型效果 <a href="#" style=&qu
[IT与投资]IT投资的几个原则 comsci it
无论是想在电商,软件,硬件还是互联网领域投资,都需要大量资金,虽然各个国家政府在媒体上都给予大家承诺,既要让市场的流动性宽松,又要保持经济的高速增长....但是,事实上,整个市场和社会对于真正的资金投入是非常渴望的,也就是说,表面上看起来,市场很活跃,但是投入的资金并不是很充足的......
oracle with语句详解 daizj oracle with with as
oracle with语句详解转在oracle中，select 查询语句，可以使用with,就是一个子查询，oracle 会把子查询的结果放到临时表中，可以反复使用例子:注意，这是sql语句，不是pl/sql语句，可以直接放到jdbc执行的 ----------------------------------------------------------------
hbase的简单操作 deng520159 数据库 hbase
近期公司用hbase来存储日志,然后再来分析 ,把hbase开发经常要用的命令找了出来. 用ssh登陆安装hbase那台linux后用hbase shell进行hbase命令控制台! 表的管理 1）查看有哪些表 hbase(main)> list 2）创建表 # 语法：create <table>, {NAME => <family&g
C语言scanf继续学习、算术运算符学习和逻辑运算符 dcj3sjt126com c
/* 2013年3月11日20:37:32 地点：北京潘家园功能：完成用户格式化输入多个值目的：学习scanf函数的使用 */ # include <stdio.h> int main(void) { int i, j, k; printf("please input three number:\n"); //提示用
2015越来越好 dcj3sjt126com 歌曲
越来越好房子大了电话小了感觉越来越好假期多了收入高了工作越来越好商品精了价格活了心情越来越好天更蓝了水更清了环境越来越好活得有奔头人会步步高想做到你要努力去做到幸福的笑容天天挂眉梢越来越好婆媳和了家庭暖了生活越来越好孩子高了懂事多了学习越来越好朋友多了心相通了大家越来越好道路宽了心气顺了日子越来越好活的有精神人就不显
java.sql.SQLException: Value '0000-00-00' can not be represented as java.sql.Tim feiteyizu mysql
数据表中有记录的time字段（属性为timestamp）其值为：“0000-00-00 00:00:00” 程序使用select 语句从中取数据时出现以下异常： java.sql.SQLException:Value '0000-00-00' can not be represented as java.sql.Date java.sql.SQLException: Valu
Ehcache（07）——Ehcache对并发的支持 234390216 并发 ehcache 锁 ReadLock WriteLock
Ehcache对并发的支持在高并发的情况下，使用Ehcache缓存时，由于并发的读与写，我们读的数据有可能是错误的，我们写的数据也有可能意外的被覆盖。所幸的是Ehcache为我们提供了针对于缓存元素Key的Read（读）、Write（写）锁。当一个线程获取了某一Key的Read锁之后，其它线程获取针对于同
mysql中blob,text字段的合成索引 jackyrong mysql
在mysql中，原来有一个叫合成索引的，可以提高blob,text字段的效率性能，但只能用在精确查询，核心是增加一个列，然后可以用md5进行散列，用散列值查找则速度快比如： create table abc(id varchar(10),context blog,hash_value varchar(40)); insert into abc(1,rep
逻辑运算与移位运算 latty 位运算逻辑运算
源码：正数的补码与原码相同例+7 源码：00000111 补码：00000111 （用8位二进制表示一个数）负数的补码：符号位为1，其余位为该数绝对值的原码按位取反；然后整个数加1。 -7 源码： 10000111 ，其绝对值为00000111 取反加一：11111001 为-7补码已知一个数的补码，求原码的操作分两种情况：
利用XSD 验证XML文件 newerdragon java xml xsd
XSD文件（XML Schema 语言也称作 XML Schema 定义（XML Schema Definition，XSD）。具体使用方法和定义请参看： http://www.w3school.com.cn/schema/index.asp java自jdk1.5以上新增了SchemaFactory类可以实现对XSD验证的支持，使用起来也很方便。以下代码可用在J
搭建 CentOS 6 服务器(12) - Samba rensanning centos
（1）安装 # yum -y install samba Installed: samba.i686 0:3.6.9-169.el6_5 # pdbedit -a rensn new password:123456 retype new password:123456 …… （2）Home文件夹 # mkdir /etc
Learn Nodejs 01 toknowme nodejs
（1）下载nodejs https://nodejs.org/download/ 选择相应的版本进行下载（2）安装nodejs 安装的方式比较多，请baidu下我这边下载的是“node-v0.12.7-linux-x64.tar.gz”这个版本（1）上传服务器（2）解压 tar -zxvf node-v0.12.
jquery控制自动刷新的代码举例 xp9802 jquery
1、html内容部分复制代码代码示例: <div id='log_reload'> <select name="id_s" size="1"> <option value='2'>-2s-</option> <option value='3'>-3s-</option

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他

PyTorch中的神经网络 Mnist 分类任务

目录

一、Mnist 分类任务简介

二、Mnist 数据集的读取

三、 Mnist 分类任务实现

四、使用 TensorDataset 和 DataLoader 简化

你可能感兴趣的:(PyTorch中的神经网络 Mnist 分类任务)