zzu菜

从零开始pytorch手写字母识别

因为研一的人工智能大作业-手写字母识别，在学习之余，综合一些文章和代码实现了本文，针对数据集Chars74K dataset。

数据集介绍：
（1）、数据集来源于Chars74K dataset，本项目选用数据集EnglishFnt中的一部分。Chars74K dataset网址链接 http://www.ee.surrey.ac.uk/CVSSP/demos/chars74k/；
（2）、A-Z共26种英文字母，每种字母对应一个文件夹（Sample011对应字母A, Sample012对应字母B,…, Sample036对应字母Z）；
　　（3）、Sample011到Sample036每个文件夹下相同字母不同字体的图片约1000张，PNG格式；
（4）、本项目数据集请从以下链接下载:
https://pan.baidu.com/s/1HEsbvusyYCni7MVGKUk4bA，提取码：dhix

要求：
1.每种字母当成一类，利用卷积神经元网络构建26类分类器；
2.每个类别中随机选择80%作为训练数据集，剩余20%作为测试数据集。采用训练集进行模型训练，采用测试集进行模型测试，并给出测试集准确率结果。

Bonus:
1、Bonus文件夹下为手写A-Z的字母图片。请将之前训练好的分类器迁移学习到Bonus数据集上，重新构建分类器，Bonus数据集中随机选择80%作为训练数据集，剩余20%作为测试数据集，并给出测试集准确率结果。
2、将Bonus文件夹下的图片当作未标注类别的数据，联合之前的标注图片，采用半监督学习的方法构建分类器。
其它。

前置知识体系

目前学习的稍微的前置知识

安装虚拟环境
安装pytorch
…等一系列前置工作
python 基础语法
- 函数
- 类
- pandas库等
卷积神经网络基础 —可见机器学习 -吴恩达-yyq
- 卷积
- 池化
- 全连接
pytorch 的基础使用
关于pytorch 对于数据的预处理
关于pytroch cnn网络的构建

pytorch步骤

一、前言

在我们要用pytorch构建自己的深度学习模型的时候，基本上都是下面这个流程步骤，写在这里让一些新手童鞋学习的时候有一个大局感觉，无论是从自己写，还是阅读他人代码，按照这个步骤思想（默念4大步骤，

找数据定义、
找model定义、(找损失函数、优化器定义)，
主循环代码逻辑，
直接去找对应的代码块，会简单很多。

二、基本步骤思想

所有的深度学习模型过程都可以形式化如下图：

分为四大步骤：

1、输入处理模块 (X 输入数据，变成网络能够处理的Tensor类型)

进行预处理 input - dataset - dataloader

2、模型构建模块 (主要负责从输入的数据，得到预测的y^, 这就是我们经常说的前向过程)

3、定义代价函数和优化器模块 (注意，前向过程只会得到模型预测的结果，并不会自动求导和更新，是由这个模块进行处理)

4、构建训练过程（迭代训练过程，就是上图表情包的训练迭代过程）

这几个模块分别与上图的数字标号1，2，3，4进行一一对应！

三、实例讲解

知道了上面的宏观思想之后，后面给出每个模块稍微具体一点的解释和具体一个例子，再帮助大家熟悉对应的代码！

1.数据处理

对于数据处理，最为简单的⽅式就是将数据组织成为⼀个。但许多训练需要⽤到mini-batch，直接组织成Tensor不便于我们操作。pytorch为我们提供了Dataset和Dataloader两个类来方便的构建。

torch.utils.data.Dataset

继承Dataset 类需要override 以下⽅法：

torch.utils.data.DataLoader

torch.utils.data.DataLoader(dataset, batch_size=1, shuffle=False)

DataLoader Batch。如果选择shuffle = True，每⼀个epoch 后，mini-Batch batch_size 常⻅的使⽤⽅法如下：

2. 模型构建

所有的模型都需要继承torch.nn.Module ，需要实现以下⽅法：

其中forward() ⽅法是前向传播的过程。在实现模型时，我们不需要考虑反向传播。

3. 定义代价函数和优化器

这部分根据⾃⼰的需求去参照doc

4、构建训练过程

pytorch的训练循环⼤致如下：

下面再用一个简单例子，来巩固一下：

slides来自https://www.bilibili.com/video/BV1Y7411d7Ys?from=search&amp;amp;seid=3765076366663992699

数据集预处理

文件处理

针对文件夹中都是图片的数据集处理

例如 : data文件夹内包含26个文件夹，分别包含a,b,c,d…各种相关图片

利用这些图片做出自己的数据集

./data/A/a_0.jpg
./data/A/a_1.jpg
./data/A/a_2.jpg
…
./data/B/b_0.jpg
./data/B/b_1.jpg
…

生成train.txt和test.txt 如下图地址与标签相对应

！！！！！

自己踩得坑，自己解决,数据集预处理问题，先获取总的数据，打乱，在获取训练集和测试集

import os
import random

'''
处理文件夹中的图片，并自动分类

'''

# 定义训练集和数据集比例
# 训练集 0.8
# 测试集 0.2
train_ratio = 0.8
test_ratio = 1 - train_ratio

# 定义文件路径
root_path = "./data"
DataList = []

# 定义训练列表
trainData_list = []
# 定义测试列表
testData_list = []

# 为什么flag=-1 因为第一轮for循环获取了root路径下的文件夹，并没有获取文件
flag = -1
for root, dirs, files in os.walk(root_path):
    # 每轮扫描获得路径和文件列表
    # 获取该轮文件的长度
    # root 也会随之改变
    length = files.__len__()
    for i in range(0, length):
        img_path = os.path.join(root, files[i]) + "\t" + str(flag) + "\n"
        DataList.append(img_path)
    flag = flag + 1;
#打乱数据集
random.shuffle(DataList)
length = len(DataList)
print(length)
print(DataList)

for i in range(0, int(length * train_ratio)):
    trainData_list.append(DataList[i])
for i in range(int(length * train_ratio), length):
    testData_list.append(DataList[i])

# 对列表打乱次序


with open("./res/train.txt", "w", encoding="utf-8") as f:
    for data in trainData_list:
        f.write(data)

with open("./res/test.txt", "w", encoding="utf-8") as f:
    for data in testData_list:
        f.write(data)

主要使用的函数 os.walk(rootdata)

举例：

读取rootdata=./data

 for root,dirs,files in os.walk(root_path):

第一轮：

root = ./data
dirs = [sample011…sample038 ]
files = [] #因为data目录下没有文件

第二轮：

root = ./data/Sample011
dirs = [] #因为Sample011里面没有文件夹
files = [ a.jpg…a100.jpg ]

第三轮

root = ./data/Sample012
dirs = [] #因为Sample012里面没有文件夹
files = [ b.jpg…b100.jpg ]

…

DataSet

DataSet需要被继承

实现 __ init __（self）
- 构造器提前生成一些数据或者获取一些数据
  - 比如 imgPaths列表 [ [imagesPath,label],[imagesPath,label],[imagesPath,label]… ]
  - train.txt文件路径
实现 __ getitem __ (self， index)
- 获取第index号的数据和标签
- 使用transforms 转化为–tensor
实现 __ len __(self)
- 获取数据的长度

其中用Dataset实现的类可以直接看作列表使用

[ [ x , y ],[ x , y ] ,[ x , y ], [ x , y ] … ]

获取 x y
- x，y = myDataset[0]
- x=myDataset[0] [0]
- y=myDataset[0] [1]
获取长度
- myDataset.__ len __

import torch
from torch.utils.data import Dataset
from torch.utils.data import DataLoader
import torchvision.transforms as transforms
from torch.utils.tensorboard import SummaryWriter
from PIL import Image
import numpy as np


# 数据归一化与标准化
# 图像标准化


class Mydataset(Dataset):

    def getImgInfo(self):
        imginfo = []
        with open(self.textpath, "r", encoding="utf-8") as f:
            img_str = f.readlines()
            # map( func , list[]) 相当于利用function对list中每个元素进行操作 返回值为函数结果
            # 这里返回的是一个列表
            # 参考：https://blog.csdn.net/qq_29666899/article/details/88623026
            # list()
            # lambda
            # list(     map(lambda x: x * x, [y for y in range(3)])    )
            imginfo = list(map(lambda x: x.strip().split("\t"), img_str))
        return imginfo

    # 构造器self相当于java-this
    # 其引用的为全局变量

    def __init__(self, textpath):
        # 文件路径
        self.textpath = textpath
        # 获取图片list(-list[data,label]----)集合
        self.imgInfo = self.getImgInfo()
        # 定义transforms
        # 需要输入 PIL img -> tensor -> ..
        self.tf = transforms.Compose([
            transforms.ToTensor(),
            transforms.Normalize(
                mean=[0.5, 0.5, 0.5],  # 取决于数据集
                std=[0.5, 0.5, 0.5]
            )
        ])

    # 获取第 index 的 数据 标签
    def __getitem__(self, index):
        img_path, label = self.imgInfo[index]
        img = Image.open(img_path)
        img = img.convert('RGB')
        data = self.tf(img)
        lable = int(label)
        return data, lable

    def __len__(self):
        return len(self.imgInfo)


if __name__ == '__main__':
    # 一次传多少个照片
    batch_size = 10
    train_Dataset = Mydataset("./res/train.txt")
    test_Dataset = Mydataset("./res/test.txt")
    print(len(train_Dataset))
    print(len(test_Dataset))

知识点

self 相当于java的this ， self.data 为类中的全局变量
transformer.Compose 注意使用的顺序
- PIL -> tensor ->…

DataLoader

 #使用DataLoader
    train_dataloader = DataLoader(dataset=train_Dataset, num_workers=4, pin_memory=True, batch_size=batch_size,
                        shuffle=True)
    test_dataloader = DataLoader(dataset=test_Dataset, num_workers=4, pin_memory=True, batch_size=batch_size,
                        shuffle=True)
    
    # 使用Tensorboard --查看每步存放的图片
    writer = SummaryWriter("logs")
    i=1
    #这里imgs.shape -> (10-照片个数,3-通道数,128-H,128-W)
    for data in train_dataloader:
        imgs,label=data
        print(imgs.shape)
        print(label)
        #这里是add_imges!!!!
        writer.add_images("test-dataloader",imgs,i)
        i+=i

TensorBoard

–port 可以修改端口号

from torch.utils.tensorboard import SummaryWriter
from PIL import Image
import numpy as np
writer = SummaryWriter("logs")
imgepath=r"D:\机器学习\pytorch\数据预处理\dataset\不导电\不导电20180830131551对照样本.jpg"
img=Image.open(imgepath)
img=np.array(img)
#参数 tag名称 tensor ndarray
writer.add_image("test",img,2,dataformats="HWC")
# y = 2x
for i in range(100):
    writer.add_scalar("y=2x",2*i, i)

writer.close()

常用的语句

writer = SummaryWriter(“logs”)
- logs代表文件夹
writer.add_image(“test”,img,2,dataformats=“HWC”)
- tag 名称
- img 图片数据需要是tensor narray 类型
- dataformats 需要是 hwc
  - H 高度 w宽度 c 通道
writer.add_scalar(“y=2x”,2*i, i)
- 画图嘛
- tag
- y
- x
writer.close()

控制行执行指令

tensorboard --logdir=./study/logs --port=6000

DONE!

搭建卷积神经网络

预训练模型地址

C:\Users\yyq\.cache\torch\hub\checkpoints

可以手动下载放到那里即可

参考搭建网络-1

上图少写了两个全连接层

64@4×4 -Flatten-> 1024 -FC-> 64 -FC-> 10

所有的模型都需要继承torch.nn.Module ，需要实现以下⽅法：

其中forward() ⽅法是前向传播的过程。在实现模型时，我们不需要考虑反向传播。

这里使用到的Api

Sequential
Module
nn.Conv2d
nn.MaxPool2d
nn.Linear
SummaryWriter -from torch.utils.tensorboard import SummaryWriter
实现 3@ 32 * 32 分类-10卷积神经网络

import torch
from torch import nn
from torch.nn import Sequential
from torch.utils.tensorboard import SummaryWriter


class yyq_module(nn.Module):
    def __init__(self):
        super(yyq_module, self).__init__()
        self.module=Sequential(
            nn.Conv2d(in_channels=3, out_channels=32, kernel_size=5 , padding="same"),
            nn.MaxPool2d(kernel_size=2),
            nn.Conv2d(in_channels=32, out_channels=32, kernel_size=5, padding="same"),
            nn.MaxPool2d(kernel_size=2),
            nn.Conv2d(in_channels=32, out_channels=64, kernel_size=5, padding="same"),
            nn.MaxPool2d(kernel_size=2),
            nn.Flatten(),
            #隐藏层 两个线性层 即全连接层
            nn.Linear(in_features=1024,out_features=64),
            nn.Linear(in_features=64, out_features=10)
        )

    def forward(self,input):
        output=self.module(input)
        return output

#测试一下网络
module=yyq_module()
x=torch.zeros((64,3,32,32))
print(x.shape)
y=module(x)
print(module)
print(y.shape)

#利用SummaryWriter保存网络结构图
#logs文件夹
writer = SummaryWriter("./logs")
writer.add_graph(model=module, input_to_model=x)
writer.close()

参考搭建网络 -2

此模型用于字母识别-26

参考地址:https://www.cnblogs.com/Liu-xing-wu/p/14770473.html

但是输入的图片尺寸不同，所以做了修改输入改为 128

网络结构

实现代码

import torch
from torch import nn
from torch.nn import Sequential
from torch.utils.tensorboard import SummaryWriter


class yyq_module(nn.Module):
    def __init__(self):
        super(yyq_module, self).__init__()
        self.module=Sequential(
            #3 * 128 * 128
            nn.Conv2d(in_channels=3, out_channels=16, kernel_size=5 , padding="same"),
            nn.BatchNorm2d(16),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2),
            #16 * 64 * 64
            nn.Conv2d(in_channels=16, out_channels=32, kernel_size=5, padding="same"),
            nn.BatchNorm2d(32),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2),
            #32 *32 *32
            nn.Conv2d(in_channels=32, out_channels=32, kernel_size=5, padding="same"),
            nn.BatchNorm2d(32),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2),
            #32 * 16 * 16
            nn.Flatten(),
            # #隐藏层 两个线性层 即全连接层
            nn.Linear(in_features=8192,out_features=400),
            nn.Dropout(p=0.5),
            nn.ReLU(),
            nn.Linear(in_features=400, out_features=80),
            nn.ReLU(),
            nn.Linear(80, 26)
        )

    def forward(self,input):
        output = self.module(input)
        return output

#测试一下网络
module=yyq_module()
x=torch.zeros((64,3,128,128))
print(x.shape)
y=module(x)
print(module)
print(y.shape)

网络模型的修改

修改方法一：最后加一层全连接
修改方法二：直接在最后一层修改

import torchvision.models
from torch import nn

vgg16_pre_false=torchvision.models.vgg16(pretrained=False)
print(vgg16_pre_false)
'''
    对网络的修改
'''
# 这里我们可以看出最后的输出为 1000
# 修改方法一 ： 最后加一层全连接
# vgg16_pre_false.classifier.add_module("7",nn.Linear(in_features=1000, out_features=10))
# print(vgg16_pre_false)

#修改方法二 ：直接在最后一层修改
vgg16_pre_false.classifier[6]=nn.Linear(in_features=4096,out_features=10)
print(vgg16_pre_false)

模型的保存和加载

保存模型

import torch
import torchvision
from torch import nn

vgg16 = torchvision.models.vgg16(pretrained=False)
# 保存方式1,模型结构+模型参数
torch.save(vgg16, "vgg16_method1.pth")

# 保存方式2，模型参数（官方推荐）
torch.save(vgg16.state_dict(), "vgg16_method2.pth")

# 陷阱
class Tudui(nn.Module):
    def __init__(self):
        super(Tudui, self).__init__()
        self.conv1 = nn.Conv2d(3, 64, kernel_size=3)

    def forward(self, x):
        x = self.conv1(x)
        return x

tudui = Tudui()
torch.save(tudui, "tudui_method1.pth")

加载模型

import torch
from model_save import *
# 方式1-》保存方式1，加载模型
# 坑是需要导入定义的模型那个类 from model_save import *
import torchvision
from torch import nn

model = torch.load("vgg16_method1.pth")
# print(model)

# 方式2，加载模型
vgg16 = torchvision.models.vgg16(pretrained=False)
vgg16.load_state_dict(torch.load("vgg16_method2.pth"))
# model = torch.load("vgg16_method2.pth")
# print(vgg16)

# 陷阱1
# class Tudui(nn.Module):
#     def __init__(self):
#         super(Tudui, self).__init__()
#         self.conv1 = nn.Conv2d(3, 64, kernel_size=3)
#
#     def forward(self, x):
#         x = self.conv1(x)
#         return x

model = torch.load('tudui_method1.pth')
print(model)

使用GPU

可以使用GPU的

网络模型
损失函数
数据（输入，标注）
.cuda()
.to(device)

方法一

if torch.cuda.is_is_available():

	module = module.cuda()
	lossFun = lossFun.cuda()
	imgs = imgs.cuda()
  tagerts = tagerts.cuda()

import torchvision
from torch.utils.data import DataLoader
from module import *
from torch.utils.tensorboard import SummaryWriter
import datetime
import time
start_time = time.time()
# 导入数据集
train_dataset = torchvision.datasets.CIFAR10("../study/data", train=True, transform=torchvision.transforms.ToTensor(),
                                       download=True)
test_dataset = torchvision.datasets.CIFAR10("../study/data", train=False, transform=torchvision.transforms.ToTensor(),
                                       download=True)
# 数据集长度
train_len=len(train_dataset)
test_len=len(test_dataset)

print("训练集数据集长度{}".format(len(train_dataset)))
print("测试集数据集长度{}".format(len(test_dataset)))

# 创建dataLoader
train_dataloader=DataLoader(train_dataset,batch_size=64, shuffle=True)
test_dataloader=DataLoader(test_dataset,batch_size=64, shuffle=True)

# 引入模型
module=yyq_module()
module = module.cuda()

# 定义损失函数
lossFun = torch.nn.CrossEntropyLoss()
lossFun = lossFun.cuda()
# 学习率
learning_rate=1e-2
# 定义优化器
optim = torch.optim.SGD(module.parameters(), lr=learning_rate)


# 训练轮数 每一轮是对整个数据集的一次遍历
epoch = 10
# 图像化 指定文件夹 ./yyq/logs
writer = SummaryWriter("./logs")
# 总的训练次数
total_train_num = 0
total_test_num = 0
for i in range(0,epoch):
    
    # 定义训练次数
    total_train_step = 0
    total_test_step = 0

    # 训练
    for data in train_dataloader:
        imgs, tagerts = data
        imgs = imgs.cuda()
        tagerts = tagerts.cuda()
        outputs = module(imgs)
        loss = lossFun(outputs,tagerts)

        # 优化器优化
        optim.zero_grad()
        loss.backward()
        optim.step()

        total_train_step = total_train_step+1
        total_train_num = total_train_num+1
        if total_train_step%100==0:
            print(str(time.time()-start_time)+"s")
            print("训练次数:{}, Loss:{}".format(total_train_step, loss))
            writer.add_scalar("train_loss", loss, total_train_num)
    # 训练集的总损失
    total_test_loss = 0
    # 预测正确次数
    total_accuracy = 0

    # 测试
    # 不需要梯度 不要更新参数
    with torch.no_grad():
        for data in test_dataloader:
            imgs, targets = data
            imgs = imgs.cuda()
            tagerts = tagerts.cuda()
            outputs = module(imgs)
            loss = lossFun(outputs, targets)

            # 总损失
            total_test_loss = total_test_loss+loss

            # 计算准确率
            accuracy = (outputs.argmax(1) == targets).sum()
            total_accuracy = total_accuracy + accuracy
            # 总测试次数
            total_test_num=total_test_num+1
            writer.add_scalar("test_loss", loss, total_test_num)

    print("整体测试集上AvgLoss: {}".format(total_test_loss / len(test_dataloader)))
    print("整体测试集上的Accuracy: {}%".format(100*total_accuracy / test_len))
    writer.add_scalar("test_accuracy", 100*total_accuracy / test_len, i)


writer.close()
torch.save(module, "module_{}_{}.pth".format(epoch, 20211117))

方法二

注意：

模型和损失函数可以直接to(device) 而不重新赋值，但是数据必须重新赋值

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print("device:"+device.type)
# 引入模型
module=yyq_module()
module.to(device)

# 定义损失函数
lossFun = torch.nn.CrossEntropyLoss()
lossFun.to(device)
    # 训练
    for data in train_dataloader:
        imgs, tagerts = data
        imgs = imgs.to(device)
        tagerts = tagerts.to(device)

import torchvision
from torch.utils.data import DataLoader
from module import *
from torch.utils.tensorboard import SummaryWriter
import datetime
import time
start_time = time.time()
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
print("device:"+device.type)
# 导入数据集
train_dataset = torchvision.datasets.CIFAR10("../study/data", train=True, transform=torchvision.transforms.ToTensor(),
                                       download=True)
test_dataset = torchvision.datasets.CIFAR10("../study/data", train=False, transform=torchvision.transforms.ToTensor(),
                                       download=True)
# 数据集长度
train_len=len(train_dataset)
test_len=len(test_dataset)

print("训练集数据集长度{}".format(len(train_dataset)))
print("测试集数据集长度{}".format(len(test_dataset)))

# 创建dataLoader
train_dataloader=DataLoader(train_dataset,batch_size=64, shuffle=True)
test_dataloader=DataLoader(test_dataset,batch_size=64, shuffle=True)

# 引入模型
module=yyq_module()
module.to(device)

# 定义损失函数
lossFun = torch.nn.CrossEntropyLoss()
lossFun.to(device)
# 学习率
learning_rate=1e-2
# 定义优化器
optim = torch.optim.SGD(module.parameters(), lr=learning_rate)


# 训练轮数 每一轮是对整个数据集的一次遍历
epoch = 10
# 图像化 指定文件夹 ./yyq/logs
writer = SummaryWriter("./logs")
# 总的训练次数
total_train_num = 0
total_test_num = 0
for i in range(0,epoch):
    
    # 定义训练次数
    total_train_step = 0
    total_test_step = 0

    # 训练
    for data in train_dataloader:
        imgs, targets = data
        imgs = imgs.to(device)
        targets = targets.to(device)
        outputs = module(imgs)
        loss = lossFun(outputs, targets)

        # 优化器优化
        optim.zero_grad()
        loss.backward()
        optim.step()

        total_train_step = total_train_step+1
        total_train_num = total_train_num+1
        if total_train_step%100==0:
            print(str(time.time()-start_time)+"s")
            print("训练次数:{}, Loss:{}".format(total_train_step, loss))
            writer.add_scalar("train_loss", loss, total_train_num)
    # 训练集的总损失
    total_test_loss = 0
    # 预测正确次数
    total_accuracy = 0

    # 测试
    # 不需要梯度 不要更新参数
    with torch.no_grad():
        for data in test_dataloader:
            imgs, targets = data
            imgs = imgs.to(device)
            targets = targets.to(device)
            outputs = module(imgs)
            loss = lossFun(outputs, targets)

            # 总损失
            total_test_loss = total_test_loss+loss

            # 计算准确率
            accuracy = (outputs.argmax(1) == targets).sum()
            total_accuracy = total_accuracy + accuracy
            # 总测试次数
            total_test_num=total_test_num+1
            writer.add_scalar("test_loss", loss, total_test_num)

    print("整体测试集上AvgLoss: {}".format(total_test_loss / len(test_dataloader)))
    print("整体测试集上的Accuracy: {}%".format(100*total_accuracy / test_len))
    writer.add_scalar("test_accuracy", 100*total_accuracy / test_len, i)


writer.close()
torch.save(module, "module_{}_{}.pth".format(epoch, 20211117))

各种网络小问题

注意原来模型的输入Size

比如原来的图像尺寸128 * 128

self.tf = transforms.Compose([
            #尝试灰度化
            # transforms.Grayscale(num_output_channels=1),  # 彩色图像转灰度图像num_output_channels默认1
            transforms.Resize((224,224)),
            transforms.ToTensor(),
            transforms.Normalize(
                mean=[0.5, 0.5, 0.5],  # 取决于数据集
                std=[0.5, 0.5, 0.5]
            )
        ])

图片与模型通道数不同

比如：resnet默认输入尺寸为224X224，三维图片，但是想输入的数据集图片尺寸是32X32，以为图片

我们可以在处理尺寸大小时在预处理的地方将其resize为32X32，transforms.Resize(224)

然后在使用resnet之前用一次1X1网络修改图片通道，conv = nn.Conv2d(1, 3, kernel_size=1)即可传入
在

resnet之前加一个

优化器和loss函数-反向传播

损失函数

这部分根据⾃⼰的需求去参照doc

loss = nn.CrossEntropyLoss()

for data in dataloader:
    imgs,target=data
    output=module(imgs)
    result_loss=loss(output,target)
    result_loss.backward()
    #进行反向传播 算出每个参数的梯度 利用优化器去调整参数
    print(result_loss)

优化器的使用

#创建优化器
optimizer=SGD(module.parameters(), lr=0.01)
for epoch in range(10):

    for data in dataloader:
        imgs,target=data
        output=module(imgs)
        result_loss=loss(output, target)
        # 梯度值清零
        optimizer.zero_grad()
        # 计算出新的梯度值
        result_loss.backward()
        # 优化参数
        optimizer.step()
        print("epoch:" + str(epoch))
        print(result_loss)

添加优化器损失函数后的完整训练网络

#优化器
import torch
import torchvision
from torch import nn
from torch.nn import Sequential
from torch.optim import SGD
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

dataset = torchvision.datasets.CIFAR10("./data", train=False, transform=torchvision.transforms.ToTensor(),
                                       download=True)
dataloader=DataLoader(dataset,batch_size=64, shuffle=True)

class yyq_module(nn.Module):
    def __init__(self):
        super(yyq_module, self).__init__()
        self.module=Sequential(
            nn.Conv2d(in_channels=3, out_channels=32, kernel_size=5 , padding="same"),
            nn.MaxPool2d(kernel_size=2),
            nn.Conv2d(in_channels=32, out_channels=32, kernel_size=5, padding="same"),
            nn.MaxPool2d(kernel_size=2),
            nn.Conv2d(in_channels=32, out_channels=64, kernel_size=5, padding="same"),
            nn.MaxPool2d(kernel_size=2),
            nn.Flatten(),
            #隐藏层 两个线性层 即全连接层
            nn.Linear(in_features=1024,out_features=64),
            nn.Linear(in_features=64, out_features=10)
        )

    def forward(self,input):
        output=self.module(input)
        return output
module = yyq_module()
loss = nn.CrossEntropyLoss()
optimizer=SGD(module.parameters(), lr=0.01)
for epoch in range(10):

    for data in dataloader:
        imgs,target=data
        output=module(imgs)
        result_loss=loss(output, target)
        # 梯度值清零
        optimizer.zero_grad()
        # 计算出新的梯度值
        result_loss.backward()
        # 优化参数
        optimizer.step()
        print("epoch:" + str(epoch))
        print(result_loss)

实例基于CIFAR10数据集的卷积神经网络

数据集 CIFAR10

模型代码

import torch
from torch import nn
from torch.nn import Sequential



class yyq_module(nn.Module):
    def __init__(self):
        super(yyq_module, self).__init__()
        self.module=Sequential(
            nn.Conv2d(in_channels=3, out_channels=32, kernel_size=5 , padding="same"),
            nn.MaxPool2d(kernel_size=2),
            nn.Conv2d(in_channels=32, out_channels=32, kernel_size=5, padding="same"),
            nn.MaxPool2d(kernel_size=2),
            nn.Conv2d(in_channels=32, out_channels=64, kernel_size=5, padding="same"),
            nn.MaxPool2d(kernel_size=2),
            nn.Flatten(),
            #隐藏层 两个线性层 即全连接层
            nn.Linear(in_features=1024,out_features=64),
            nn.Linear(in_features=64, out_features=10)
        )

    def forward(self,input):
        output=self.module(input)
        return output

if __name__ == '__main__':
    # 测试网络
    module=yyq_module()
    input=torch.zeros((64,3,32,32))
    output=module(input)
    print(output.shape)

训练代码-CPU

这里目前是使用cpu进行训练…

更新使用GPU代码在搭建卷积神经网络 -使用GPU章节中

import torchvision
from torch.utils.data import DataLoader
from module import *
from torch.utils.tensorboard import SummaryWriter
import datetime
# 导入数据集
train_dataset = torchvision.datasets.CIFAR10("../study/data", train=True, transform=torchvision.transforms.ToTensor(),
                                       download=True)
test_dataset = torchvision.datasets.CIFAR10("../study/data", train=False, transform=torchvision.transforms.ToTensor(),
                                       download=True)
# 数据集长度
train_len=len(train_dataset)
test_len=len(test_dataset)

print("训练集数据集长度{}".format(len(train_dataset)))
print("测试集数据集长度{}".format(len(test_dataset)))

# 创建dataLoader
train_dataloader=DataLoader(train_dataset,batch_size=64, shuffle=True)
test_dataloader=DataLoader(test_dataset,batch_size=64, shuffle=True)

# 引入模型
module=yyq_module()

# 定义损失函数
lossFun = torch.nn.CrossEntropyLoss()

# 学习率
learning_rate=1e-2
# 定义优化器
optim = torch.optim.SGD(module.parameters(), lr=learning_rate)


# 训练轮数 每一轮是对整个数据集的一次遍历
epoch = 10
# 图像化 指定文件夹 ./yyq/logs
writer = SummaryWriter("./logs")
# 总的训练次数
total_train_num = 0
total_test_num = 0
for i in range(0,epoch):
    
    # 定义训练次数
    total_train_step = 0
    total_test_step = 0

    # 训练
    # module.train() 
    for data in train_dataloader:
        imgs, tagerts = data
        outputs = module(imgs)
        loss = lossFun(outputs,tagerts)

        # 优化器优化
        optim.zero_grad()
        loss.backward()
        optim.step()

        total_train_step = total_train_step+1
        total_train_num = total_train_num+1
        if total_train_step%100==0:
            print("训练次数:{}, Loss:{}".format(total_train_step, loss))
            writer.add_scalar("train_loss", loss, total_train_num)
    # 训练集的总损失
    total_test_loss = 0
    # 预测正确次数
    total_accuracy = 0

    # 测试
    # 不需要梯度 不要更新参数
    # module.eval()
    with torch.no_grad():
        for data in test_dataloader:
            imgs, targets = data
            outputs = module(imgs)
            loss = lossFun(outputs, targets)

            # 总损失
            total_test_loss = total_test_loss+loss

            # 计算准确率
            accuracy = (outputs.argmax(1) == targets).sum()
            total_accuracy = total_accuracy + accuracy
            # 总测试次数
            total_test_num=total_test_num+1
            writer.add_scalar("test_loss", loss, total_test_num)

    print("整体测试集上AvgLoss: {}".format(total_test_loss / len(test_dataloader)))
    print("整体测试集上的Accuracy: {}%".format(100*total_accuracy / test_len))
    writer.add_scalar("test_accuracy", 100*total_accuracy / test_len, i)


writer.close()
torch.save(module, "module_{}_{}.pth".format(epoch, datetime.datetime.now()))

module.train()使用与否看模型中是否有–>官方文档

module.train()
This has any effect only on certain modules. See documentations of particular modules for details of their behaviors in training/evaluation mode, if they are affected, e.g. Dropout, BatchNorm, etc.

module.eval()
This has any effect only on certain modules. See documentations of particular modules for details of their behaviors in training/evaluation mode, if they are affected, e.g. Dropout, BatchNorm, etc.

测试模型

实例手写字母识别

图像文件处理

import os
import random

'''
处理文件夹中的图片，并自动分类

'''

# 定义训练集和数据集比例
# 训练集 0.8
# 测试集 0.2
train_ratio = 0.8
test_ratio = 1 - train_ratio

# 定义文件路径
root_path = "./data"

# 定义训练列表
trainData_list = []
# 定义测试列表
testData_list = []

# 为什么flag=-1 因为第一轮for循环获取了root路径下的文件夹，并没有获取文件
flag = -1
for root, dirs, files in os.walk(root_path):
    print(flag)
    # 每轮扫描获得路径和文件列表
    # 获取该轮文件的长度
    # root 也会随之改变
    length = files.__len__()
    for i in range(0, int(length * train_ratio)):
        # 拼接 root路径和文件名 加上分隔符 和标签值
        img_path = os.path.join(root, files[i]) + "\t" + str(flag) + "\n"
        trainData_list.append(img_path)
    for i in range(int(length * train_ratio), length):
        img_path = os.path.join(root, files[i]) + "\t" + str(flag) + "\n"
        testData_list.append(img_path)
    flag = flag + 1;
print(trainData_list)

# 对列表打乱次序
random.shuffle(trainData_list)

with open("./res/train.txt", "w", encoding="utf-8") as f:
    for data in trainData_list:
        f.write(data)

with open("./res/test.txt", "w", encoding="utf-8") as f:
    for data in testData_list:
        f.write(data)

DataSetAndDataLoader

import torch
from torch.utils.data import Dataset
from torch.utils.data import DataLoader
import torchvision.transforms as transforms
from torch.utils.tensorboard import SummaryWriter
from PIL import Image
import numpy as np


# 数据归一化与标准化
# 图像标准化


class Mydataset(Dataset):

    def getImgInfo(self):
        imginfo = []
        with open(self.textpath, "r", encoding="utf-8") as f:
            img_str = f.readlines()
            # map( func , list[]) 相当于利用function对list中每个元素进行操作 返回值为函数结果
            # 这里返回的是一个列表
            # 参考：https://blog.csdn.net/qq_29666899/article/details/88623026
            # list()
            # lambda
            # list(     map(lambda x: x * x, [y for y in range(3)])    )
            imginfo = list(map(lambda x: x.strip().split("\t"), img_str))
        return imginfo

    # 构造器self相当于java-this
    # 其引用的为全局变量

    def __init__(self, textpath):
        # 文件路径
        self.textpath = textpath
        # 获取图片list(-list[data,label]----)集合
        self.imgInfo = self.getImgInfo()
        # 定义transforms
        # 需要输入 PIL img -> tensor -> ..
        self.tf = transforms.Compose([
            transforms.ToTensor(),
            transforms.Normalize(
                mean=[0.5, 0.5, 0.5],  # 取决于数据集
                std=[0.5, 0.5, 0.5]
            )
        ])

    # 获取第 index 的 数据 标签
    def __getitem__(self, index):
        img_path, label = self.imgInfo[index]
        img = Image.open(img_path)
        img = img.convert('RGB')
        data = self.tf(img)
        lable = int(label)
        return data, lable

    def __len__(self):
        return len(self.imgInfo)


if __name__ == '__main__':
    # 一次传多少个照片
    batch_size = 10
    train_Dataset = Mydataset("./res/train.txt")
    test_Dataset = Mydataset("./res/test.txt")
    print(len(train_Dataset))
    print(len(test_Dataset))

训练

from dataLoader import Mydataset
from torch.utils.data.dataloader import DataLoader
import torchvision.models as models
from torch.utils.tensorboard import SummaryWriter
import torch
import time
import os

os.environ["CUDA_VISIBLE_DEVICES"] = "0"
start_time = time.time()
# 设备
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print("device use {}".format(device))

"""
    构建自己的数据集
"""
batchSize = 32
# dataset
trainDataSet = Mydataset(textpath="./res/train.txt")
testDataSet = Mydataset(textpath="./res/test.txt")
train_len = len(trainDataSet)
test_len = len(testDataSet)
print("训练集大小{}".format(train_len))
print("测试集大小{}".format(test_len))


# 导入dataLoader
trainDataLoader = DataLoader(dataset=trainDataSet, batch_size=batchSize, shuffle=True)
testDataLoader = DataLoader(dataset=testDataSet, batch_size=batchSize, shuffle=True)

"""
    创建网络-修改vgg16网络
"""
vgg16 = models.vgg16(pretrained=True, progress=True)
# vgg16 classifier多一层全连接 1000 - 26
vgg16.classifier.add_module("7", torch.nn.Linear(in_features=1000, out_features=26, bias=True))
# GPU
vgg16.to(device)
print("网络结构")
print(vgg16)

"""
    定义损失函数
"""
lossFun = torch.nn.CrossEntropyLoss()
lossFun.to(device)

"""
    定义优化器
"""
learning_rate = 1e-2
optim = torch.optim.SGD(params=vgg16.parameters(), lr=learning_rate)


"""
    训练
"""
# 训练轮数 每一轮是对整个数据集的一次遍历
epoch = 10
# 图像化 指定文件夹 ./logs
writer = SummaryWriter("./logs")
# 总的训练次数
total_train_num = 0
total_test_num = 0
for i in range(0, epoch):
    print("开始第{}轮-epoch".format(i+1))
    # 定义训练次数
    total_train_step = 0
    total_test_step = 0

    # 训练
    for data in trainDataLoader:
        imgs, tagerts = data
        imgs = imgs.to(device)
        tagerts = tagerts.to(device)
        outputs = vgg16(imgs)
        loss = lossFun(outputs, tagerts)

        # 优化器优化
        optim.zero_grad()
        loss.backward()
        optim.step()

        total_train_step = total_train_step + 1
        total_train_num = total_train_num + 1
        if total_train_step % 100 == 0:
            print("训练次数:{}/{}, Loss:{}".format(total_train_step*batchSize, train_len, loss))
            writer.add_scalar("train_loss", loss, total_train_num)
    # 训练集的总损失
    total_test_loss = 0
    # 预测正确次数
    total_accuracy = 0

    # 测试
    # 不需要梯度 不要更新参数
    with torch.no_grad():
        for data in testDataLoader:
            imgs, targets = data
            imgs = imgs.to(device)
            targets = targets.to(device)
            outputs = vgg16(imgs)
            loss = lossFun(outputs, targets)

            # 总损失
            total_test_loss = total_test_loss + loss

            # 计算准确率
            accuracy = (outputs.argmax(1) == targets).sum()
            total_accuracy = total_accuracy + accuracy
            # 总测试次数
            total_test_num = total_test_num + 1
            writer.add_scalar("test_loss", loss, total_test_num)

    print("整体测试集上AvgLoss: {}".format(total_test_loss / len(testDataLoader)))
    print("整体测试集上的Accuracy: {}%".format(100 * total_accuracy / test_len))
    writer.add_scalar("test_accuracy", 100 * total_accuracy / test_len, i+1)
    end_time = time.time()
    print("第{}轮-epoch-用时{:.2f}".format(i+1, end_time-start_time))
    start_time = end_time
    torch.save(vgg16.state_dict(), "vgg16_dict_module_{}.pth".format(i))

writer.close()

测试模型

import torch
import torchvision.models as models
from dataLoader import Mydataset
from torch.utils.data.dataloader import DataLoader
from module import yyq_module


"""
    加载数据
"""

testDataSet = Mydataset(textpath="./res/test.txt")
testDataLoader = DataLoader(dataset=testDataSet, batch_size=16, pin_memory=True)
test_len = len(testDataSet)

"""
    加载网络
"""

yyq = yyq_module()

# path = "yyq_dict_module_ep4_ac93.42.pth"
path = "./模型/yyq_dict_module_ep42_ac99.32.pth"


yyq.load_state_dict(torch.load(path),strict=False)

yyq.cuda()
print(yyq)


"""
    开始测试
"""
sum_acc = 0.0

yyq.eval()
with torch.no_grad():
    for data in testDataLoader:
        imgs, targets = data
        imgs = imgs.cuda()
        targets = targets.cuda()
        outputs = yyq(imgs)
        print(outputs.argmax(1))
        sum=(outputs.argmax(1) == targets).sum()
        sum_acc = sum_acc+sum
print("准确率:{:.4f}%".format(sum_acc/test_len*100))

import torch
import torchvision.models as models
from dataLoader import Mydataset
from torch.utils.data.dataloader import DataLoader


"""
    加载数据
"""

testDataSet = Mydataset(textpath="./res/test.txt")
testDataLoader = DataLoader(dataset=testDataSet, batch_size=16, pin_memory=True)
test_len = len(testDataSet)

"""
    加载网络
"""

vgg16 = models.vgg16(pretrained=False)
vgg16.classifier.add_module("7", torch.nn.Linear(in_features=1000, out_features=26, bias=True))
vgg16.load_state_dict(torch.load("vgg16_dict_module_0.pth"))
vgg16.cuda()
print(vgg16)

"""
    开始测试
"""
sum_acc = 0.0
vgg16.eval()
with torch.no_grad():
    for data in testDataLoader:
        imgs, targets = data
        imgs = imgs.cuda()
        targets = targets.cuda()
        outputs = vgg16(imgs)
        sum=(outputs.argmax(1) == targets).sum()
        sum_acc = sum_acc+sum
print("准确率:{:.2f}".format(sum_acc/test_len))

Bonus-1

bonus-1任务

任务1 -测试原先模型在该数据集的准确率
任务2 -迁移学习- 把之前训练好的模型用在bonus数据集上，接着进行训练，查看训练后模型在bonus测试集的准确率

任务一

预处理

这里不用对数据集进行划分，只要输出一个文本文件包含测试所需要的全部信息就行了。

import os
import random

'''
处理文件夹中的图片，并自动分类

'''
# 定义文件路径
root_path = "./data"

# 定义测试列表
testData_list = []

# 为什么flag=-1 因为第一轮for循环获取了root路径下的文件夹，并没有获取文件
flag = -1
for root, dirs, files in os.walk(root_path):
    print(flag)
    # 每轮扫描获得路径和文件列表
    # 获取该轮文件的长度
    # root 也会随之改变
    length = files.__len__()
    for i in range(0, length):
        img_path = os.path.join(root, files[i]) + "\t" + str(flag) + "\n"
        testData_list.append(img_path)
    flag = flag + 1;


# 对列表打乱次序


with open("./res/test.txt", "w", encoding="utf-8") as f:
    for data in testData_list:
        f.write(data)

DataSetAndDataLoader

这里需要对dataSet修改，修改图片size

import torch
from torch.utils.data import Dataset
from torch.utils.data import DataLoader
import torchvision.transforms as transforms
from torch.utils.tensorboard import SummaryWriter
from PIL import Image
import numpy as np


# 数据归一化与标准化
# 图像标准化


class Mydataset(Dataset):

    def getImgInfo(self):
        imginfo = []
        with open(self.textpath, "r", encoding="utf-8") as f:
            img_str = f.readlines()
            # map( func , list[]) 相当于利用function对list中每个元素进行操作 返回值为函数结果
            # 这里返回的是一个列表
            # 参考：https://blog.csdn.net/qq_29666899/article/details/88623026
            # list()
            # lambda
            # list(     map(lambda x: x * x, [y for y in range(3)])    )
            imginfo = list(map(lambda x: x.strip().split("\t"), img_str))
        return imginfo

    # 构造器self相当于java-this
    # 其引用的为全局变量

    def __init__(self, textpath):
        # 文件路径
        self.textpath = textpath
        # 获取图片list(-list[data,label]----)集合
        self.imgInfo = self.getImgInfo()
        # 定义transforms
        # 需要输入 PIL img -> tensor -> ..
        self.tf = transforms.Compose([
            transforms.ToTensor(),
            transforms.Normalize(
                mean=[0.5, 0.5, 0.5],  # 取决于数据集
                std=[0.5, 0.5, 0.5]
            )
        ])

    # 获取第 index 的 数据 标签
    def __getitem__(self, index):
        img_path, label = self.imgInfo[index]
        img = Image.open(img_path)
        img = img.convert('RGB')
        data = self.tf(img)
        lable = int(label)
        return data, lable

    def __len__(self):
        return len(self.imgInfo)


if __name__ == '__main__':
    test_Dataset = Mydataset("./res/test.txt")
    print(len(test_Dataset))

测试模型准确率

找不到代码了
简述:
	1 加载数据集
	2 加载模型
	3 跑模型，并统计正确率
	4 输出正确率

任务二

与上面源数据集c处理方式雷同不在赘述

Bonus-2

目标: 利用半监督学习，联合源数据集和bonus数据集，训练一个新的模型

step 1：利用源数据集训练的模型，得到bonus数据集的标签

step 2: 联合两个数据集，重新训练模型

step-1 数据预处理

预处理，获取所有图片位置信息，但是假设label = -1

import os
import random

'''
处理文件夹中的图片，这里假设标签都是-1 创建未标记数据集

'''

# 定义文件路径
root_path = "../data"

# 定义测试列表
testData_list = []

# 为什么flag=-1 因为目前不知道label值
flag = -1
for root, dirs, files in os.walk(root_path):
    print(flag)
    # 每轮扫描获得路径和文件列表
    # 获取该轮文件的长度
    # root 也会随之改变
    length = files.__len__()
    for i in range(0, length):
        img_path = os.path.join(root, files[i]) + "\t" + str(flag) + "\n"
        testData_list.append(img_path)


# 对列表打乱次序


with open("res/alldata.txt", "w", encoding="utf-8") as f:
    for data in testData_list:
        f.write(data)

获取数据，利用源数据集训练的模型获取bonus数据集的标签, 并按比例划分为训练集和测试集

import torchvision.models as models
import torch
from torch.utils.data import DataLoader
from dataSet import Mydataset
from module import yyq_module
import random
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
"""
    通过半监督学习获取未标记的数据
    input : bounsdata
    output : img_path  -  label
"""
train_ratio =0.8
test_ratio = 1 - train_ratio
train_imgInfoList = []
test_imgInfoList = []

dataList = []
"""
step 1 : 读取数据
"""
batch_size = 32
textpath = "./res/alldata.txt"
allDataset = Mydataset(textpath=textpath)
allDataLoader = DataLoader(dataset=allDataset, batch_size=batch_size , pin_memory=True)
dataLength = len(allDataset)
print("数据集长度{}".format(dataLength))


"""
step 2 : 读取模型
"""
module_path = "../yyq_dict_module_ep47_ac99.39.pth"
yyq = yyq_module()
yyq.load_state_dict(torch.load(module_path))
yyq.to(device)
print("模型结构")
print(yyq)

"""
step 3 : 读取数据，并且创建新文件 输出文件的标签值
"""
yyq.eval()
with torch.no_grad():
    for data in allDataLoader:
        imgs , img_paths = data
        imgs = imgs.to(device)
        outputs = yyq(imgs)
        targets = outputs.argmax(1)
        lenth = len(targets)
        for i in range(0,lenth):
            imgInfo = img_paths[i] + "\t" + str(targets[i].item()) + "\n"
            dataList.append(imgInfo)
length = len(dataList)
print("datalist长度:{}".format(length))
random.shuffle(dataList)
for i in range(0, int( length * train_ratio)):
    train_imgInfoList.append(dataList[i])
for i in range(int( length * train_ratio), length):
    test_imgInfoList.append(dataList[i])

print(train_imgInfoList[0])
print(test_imgInfoList[0])
with open("DealRes/train.txt", "w", encoding="utf-8") as f:
    for data in train_imgInfoList:
        f.write(data)
with open("DealRes/test.txt", "w", encoding="utf-8") as f:
    for data in test_imgInfoList:
        f.write(data)

创建dataset，这里的dataset有所不同，他要获取源数据集的train.txt和bonus数据集的train.txt

对两者进行加和。

import torch
from torch.utils.data import Dataset
from torch.utils.data import DataLoader
import torchvision.transforms as transforms
from torch.utils.tensorboard import SummaryWriter
from PIL import Image
import numpy as np

"""
 这里对数据处理:
 transforms.Resize((128,128)),
 transforms.ToTensor(),
"""


class Mydataset(Dataset):

    def getImgInfo(self):
        imginfo = []
        with open(self.textpath, "r", encoding="utf-8") as f:
            img_str = f.readlines()
            # map( func , list[]) 相当于利用function对list中每个元素进行操作 返回值为函数结果
            # 这里返回的是一个列表
            # 参考：https://blog.csdn.net/qq_29666899/article/details/88623026
            # list()
            # lambda
            # list(     map(lambda x: x * x, [y for y in range(3)])    )
            imginfo = list(map(lambda x: x.strip().split("\t"), img_str))
        return imginfo

    # 构造器self相当于java-this
    # 其引用的为全局变量

    def __init__(self, textpath):
        # 文件路径
        self.textpath = textpath
        # 获取图片list(-list[data,label]----)集合
        self.imgInfo = self.getImgInfo()
        # 定义transforms
        # 需要输入 PIL img -> tensor -> ..
        self.tf = transforms.Compose([
            transforms.Resize((128,128)),
            transforms.ToTensor(),
            transforms.Normalize(
                mean=[0.5, 0.5, 0.5],  # 取决于数据集
                std=[0.5, 0.5, 0.5]
            )
        ])

    # 获取第 index 的 数据 标签
    def __getitem__(self, index):
        img_path, label = self.imgInfo[index]
        img = Image.open(img_path)
        img = img.convert('RGB')
        data = self.tf(img)
        lable = int(label)
        return data, img_path

    def __len__(self):
        return len(self.imgInfo)


if __name__ == '__main__':
    test_Dataset = Mydataset("./res/alldata.txt")
    print(test_Dataset[0])

到这里对数据预处理已经结束。

step -2 训练模型

大同小异不在赘述

import torch
from torch.utils.data import Dataset
from torch.utils.data import DataLoader
import torchvision.transforms as transforms
from torch.utils.tensorboard import SummaryWriter
from PIL import Image
import numpy as np
from torch.utils.data.dataloader import DataLoader
import torchvision.models as models
from torch.utils.tensorboard import SummaryWriter
import torch
import time
import os
from module import yyq_module

"""
 这里对数据处理:
 transforms.Resize((128,128)),
 transforms.ToTensor(),
"""


class Mydataset(Dataset):

    def getImgInfo(self):
        imginfo = []
        with open(self.textpath, "r", encoding="utf-8") as f:
            img_str = f.readlines()
            # map( func , list[]) 相当于利用function对list中每个元素进行操作 返回值为函数结果
            # 这里返回的是一个列表
            # 参考：https://blog.csdn.net/qq_29666899/article/details/88623026
            # list()
            # lambda
            # list(     map(lambda x: x * x, [y for y in range(3)])    )
            imginfo = list(map(lambda x: x.strip().split("\t"), img_str))
        with open(self.dealedTextPath, "r", encoding="utf-8") as f:
            img_str = f.readlines()
            for str in img_str:
                img=str.split("\t")
                imginfo.append(img)
        return imginfo

    # 构造器self相当于java-this
    # 其引用的为全局变量

    def __init__(self, dealedTextPath, textpath):
        # 文件路径
        self.dealedTextPath = dealedTextPath
        self.textpath = textpath
        # 获取图片list(-list[data,label]----)集合
        self.imgInfo = self.getImgInfo()
        # 定义transforms
        # 需要输入 PIL img -> tensor -> ..
        self.tf = transforms.Compose([
            transforms.Resize((128,128)),
            transforms.ToTensor(),
            transforms.Normalize(
                mean=[0.5, 0.5, 0.5],  # 取决于数据集
                std=[0.5, 0.5, 0.5]
            )
        ])

    # 获取第 index 的 数据 标签
    def __getitem__(self, index):
        img_path, label = self.imgInfo[index]
        img = Image.open(img_path)
        img = img.convert('RGB')
        data = self.tf(img)
        lable = int(label)
        return data, lable

    def __len__(self):
        return len(self.imgInfo)


"""
    训练模型
"""


if __name__ == '__main__':

    os.environ["CUDA_VISIBLE_DEVICES"] = "0"
    start_time = time.time()
    # 设备
    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
    print("device use {}".format(device))

    """
        构建自己的数据集
    """
    batchSize = 32
    # dataset
    trainDataSet = Mydataset("./DealRes/train.txt","./project2/res/train.txt")
    testDataSet =  Mydataset("./DealRes/test.txt","./project2/res/test.txt")
    train_len = len(trainDataSet)
    test_len = len(testDataSet)
    print("训练集大小{}".format(train_len))
    print("测试集大小{}".format(test_len))

    # 导入dataLoader
    trainDataLoader = DataLoader(dataset=trainDataSet, batch_size=batchSize, shuffle=True)
    testDataLoader = DataLoader(dataset=testDataSet, batch_size=batchSize, shuffle=True)

    """
        创建网络-修改yyq网络
    """
    yyq = yyq_module()
    # GPU
    yyq.to(device)
    print("网络结构")
    print(yyq)

    """
        定义损失函数
    """
    lossFun = torch.nn.CrossEntropyLoss()
    lossFun.to(device)

    """
        定义优化器
    """
    learning_rate = 1e-2
    optim = torch.optim.SGD(params=yyq.parameters(), lr=learning_rate)

    """
        训练
    """
    # 训练轮数 每一轮是对整个数据集的一次遍历
    epoch = 50
    # 图像化 指定文件夹 ./logs
    writer = SummaryWriter("./logs")
    # 总的训练次数
    total_train_num = 0
    total_test_num = 0
    for i in range(0, epoch):
        print("开始第{}轮-epoch".format(i + 1))
        # 定义训练次数
        total_train_step = 0
        total_test_step = 0

        # 训练
        yyq.train()
        for data in trainDataLoader:
            imgs, tagerts = data
            imgs = imgs.to(device)
            tagerts = tagerts.to(device)
            outputs = yyq(imgs)
            loss = lossFun(outputs, tagerts)

            # 优化器优化
            optim.zero_grad()
            loss.backward()
            optim.step()

            total_train_step = total_train_step + 1
            total_train_num = total_train_num + 1
            if total_train_step % 100 == 0:
                print("训练次数:{}/{}, Loss:{}".format(total_train_step * batchSize, train_len, loss))
                writer.add_scalar("train_loss", loss, total_train_num)
        # 训练集的总损失
        total_test_loss = 0
        # 预测正确次数
        total_accuracy = 0

        # 测试
        # 不需要梯度 不要更新参数
        yyq.eval()
        with torch.no_grad():
            for data in testDataLoader:
                imgs, targets = data
                imgs = imgs.to(device)
                targets = targets.to(device)
                outputs = yyq(imgs)
                loss = lossFun(outputs, targets)

                # 总损失
                total_test_loss = total_test_loss + loss

                # 计算准确率
                accuracy = (outputs.argmax(1) == targets).sum()
                total_accuracy = total_accuracy + accuracy
                # 总测试次数
                total_test_num = total_test_num + 1
                writer.add_scalar("test_loss", loss, total_test_num)

        print("整体测试集上AvgLoss: {}".format(total_test_loss / len(testDataLoader)))
        print("整体测试集上的Accuracy: {}%".format(100 * total_accuracy / test_len))
        writer.add_scalar("test_accuracy", 100 * total_accuracy / test_len, i + 1)
        end_time = time.time()
        print("第{}轮-epoch-用时{:.2f}".format(i + 1, end_time - start_time))
        start_time = end_time
        # if (100 * total_accuracy / test_len)>99:
        # torch.save(yyq.state_dict(),
        #            "yyq_dict_module_ep{}_ac{:.2f}.pth".format(i, (100 * total_accuracy / test_len)))

    writer.close()

学习资料

最后附上一些可供学习的资料，强烈推荐土堆B站视频！

1.PyTorch 深度学习:60分钟快速入门（官网翻译）

“PyTorch 深度学习:60分钟快速入门”为PyTorch官网教程，网上已经有部分翻译作品，随着PyTorch1.0版本的公布，这个教程有较大的代码改动，本人对教程进行重新翻译，并测试运行了官方代码，制作成Jupyter Notebook文件（中文注释）在github予以公布。

本文内容较多，可以在线学习，如果需要本地调试，请到github下载：

https://github.com/fengdu78/Data-Science-Notes/tree/master/8.deep-learning/PyTorch_beginner

此教程为翻译官方地址：
https://pytorch.org/tutorials/beginner/deep_learning_60min_blitz.html
**作者:**Soumith Chintala

本教程的目标：

2.土堆github

https://github.com/xiaotudui/pytorch-tutorial/tree/master/src

3.PyTorch 中文手册（pytorch handbook）（github标星7900+）

资源地址：

https://github.com/zergtant/pytorch-handbook

这是一本开源的书籍，目标是帮助那些希望和使用PyTorch进行深度学习开发和研究的朋友快速入门。我试了一下里面的ipynb代码，非常全面，值得推荐。

资源目录：

第一章：PyTorch入门

第一节 PyTorch 简介

第二节 PyTorch 环境搭建

第三节 PyTorch 深度学习：60分钟快速入门（官方）

张量

Autograd：自动求导

神经网络

训练一个分类器

选读：数据并行处理（多GPU）

4.相关资源介绍

第二章：基础

第一节 PyTorch 基础

张量自动求导神经网络包nn和优化器optm数据的加载和预处理

第二节深度学习基础及数学原理

深度学习基础及数学原理

第三节神经网络简介

神经网络简介

第四节卷积神经网络

卷积神经网络

第五节循环神经网络

循环神经网络

第三章：实践

第一节 logistic回归

logistic回归二元分类

第二节 CNN:MNIST数据集手写数字识别

CNN:MNIST数据集手写数字识别

第三节 RNN实例：通过Sin预测Cos

RNN实例：通过Sin预测Cos

第四章：提高

第一节 Fine-tuning

Fine-tuning

第二节可视化

visdomtensorboardx可视化理解卷积神经网络

第三节 Fast.ai

Fast.ai

第五节多GPU并行训练

多GPU并行计算

第五章：应用

第一节 Kaggle介绍

Kaggle介绍

第二节结构化数据

第三节计算机视觉

第四节自然语言处理

4.Pytorch教程（github标星13600+）

资源地址：

https://github.com/yunjey/pytorch-tutorial

资源介绍：

这个资源为深度学习研究人员提供了学习PyTorch的教程代码大多数模型都使用少于30行代码实现。在开始本教程之前，建议先看完Pytorch官方教程。（大部分教程是PyTorch0.4实现的，代码与1.0+稍微有点不同，总体影响不大）

配置环境：

python 2.7或者3.5以上，pytorch 0.4

资源目录：

1.基础知识

PyTorch基础知识
线性回归
Logistic回归
前馈神经网络

2.中级

卷积神经网络
深度残差网络
递归神经网络
双向递归神经网络
语言模型（RNN-LM）

3.高级

生成性对抗网络
变分自动编码器
神经风格转移
图像字幕（CNN-RNN）

4.工具

PyTorch中的TensorBoard

你可能感兴趣的:(pytorch,pytorch,机器学习,深度学习)

PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
vllm本地部署bge-reranker-v2-m3模型API服务实战教程雷电法王大模型部署 linux python vscode language model
文章目录一、说明二、配置环境2.1安装虚拟环境2.2安装vllm2.3对应版本的pytorch安装2.4安装flash_attn2.5下载模型三、运行代码3.1启动服务3.2调用代码验证一、说明本文主要介绍vllm本地部署BAAI/bge-reranker-v2-m3模型API服务实战教程本文是在Ubuntu24.04+CUDA12.8+Python3.12环境下复现成功的二、配置环境2.1安装虚
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
NumPy-@运算符详解 GG不是gg numpy numpy
NumPy-@运算符详解一、@运算符的起源与设计目标1.从数学到代码：符号的统一2.设计目标二、@运算符的核心语法与运算规则1.基础用法：二维矩阵乘法2.一维向量的矩阵语义3.高维数组：批次矩阵运算4.广播机制：灵活的形状匹配三、@运算符与其他乘法方式的核心区别1.对比`np.dot()`2.对比元素级乘法`*`3.对比`np.matrix`的`*`运算符四、典型应用场景：从基础到高阶1.深度学习
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
解决 Python 包安装失败问题：以 accelerate 为例
在使用Python开发项目时，我们经常会遇到依赖包安装失败的问题。今天，我们就以accelerate包为例，详细探讨一下可能的原因以及解决方法。通过这篇文章，你将了解到Python包安装失败的常见原因、如何切换镜像源、如何手动安装包，以及一些实用的注意事项。一、问题背景在开发一个深度学习项目时，我需要安装accelerate包来优化模型的训练过程。然而，当我运行以下命令时：bash复制pipins
在mac m1基于llama.cpp运行deepseek
lama.cpp是一个高效的机器学习推理库，目标是在各种硬件上实现LLM推断，保持最小设置和最先进性能。llama.cpp支持1.5位、2位、3位、4位、5位、6位和8位整数量化，通过ARMNEON、Accelerate和Metal支持Apple芯片，使得在MACM1处理器上运行Deepseek大模型成为可能。1下载llama.cppgitclonehttps://github.com/ggerg
从RNN循环神经网络到Transformer注意力机制：解析神经网络架构的华丽蜕变熊猫钓鱼>_> 神经网络 rnn transformer
1.引言在自然语言处理和序列建模领域，神经网络架构经历了显著的演变。从早期的循环神经网络（RNN）到现代的Transformer架构，这一演变代表了深度学习方法在处理序列数据方面的重大进步。本文将深入比较这两种架构，分析它们的工作原理、优缺点，并通过实验结果展示它们在实际应用中的性能差异。2.循环神经网络（RNN）2.1基本原理循环神经网络是专门为处理序列数据而设计的神经网络架构。RNN的核心思想
【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
pycharm无法识别conda环境（已解决） Reborker pycharm conda ide
文章目录前言研究过程解决办法前言好久不用pycharm了，打开后提示更新，更新到了2023.1版本。安装conda后在新建了一个虚拟环境pytorch，但是无论是基础环境还是虚拟环境，pycharm都识别不出conda里的python.exe(如图)。如果不想看啰嗦直接看后面的解决办法，比较闲的话可以看看我的研究过程。研究过程看了很多博客，尝试了以下解决办法：加载conda.bat文件，虽然出现了
jetson agx orin 刷机、cuda、pytorch配置指南【亲测有效】
jetsonagxorin刷机指南注意事项刷机具体指南cuda环境配置指南Anconda、Pytorch配置注意事项1.使用设备自带usbtoc的传输线时，注意c口插到orin左侧的口，右侧的口不支持数据传输；2.刷机时需准备ubuntu系统，可以是虚拟机，注意安装SDKManager刷机时，JetPack版本要选对，JetPack6.0的对应ubuntu22，cuda12版本，对应pytorch
如何使用Python实现交通工具识别
如何使用Python实现交通工具识别文章目录技术架构功能流程识别逻辑用户界面增强特性依赖项主要类别内容展示该系统是一个基于深度学习的交通工具识别工具，具备以下核心功能与特点：技术架构使用预训练的ResNet50卷积神经网络模型（来自ImageNet数据集）集成图像增强预处理技术（随机裁剪、旋转、翻转等）采用多数投票机制提升预测稳定性基于置信度评分的结果筛选策略功能流程用户通过GUI界面选择待识别图
Yolov5-obb(旋转目标poly_nms_cuda.cu编译bug记录及解决方案)
关于在执行pythonsetup.pydevelop#or"pipinstall-v-e."时poly_nms_cuda.cu报错问题。前面步骤严格按照install.md环境1.pytorch版本较低时（我的是1.10）：poly_nms_cuda.cu文件添加”#defineeps1e-8“，删除“constdoubleeps=1E-8;”这句2.pytorch版本较高时（我用的是1.27）h
Python OpenCV教程从入门到精通的全面指南【文末送书】一键难忘 python opencv 开发语言
文章目录PythonOpenCV从入门到精通1.安装OpenCV2.基本操作2.1读取和显示图像2.2图像基本操作3.图像处理3.1图像转换3.2图像阈值处理3.3图像平滑4.边缘检测和轮廓4.1Canny边缘检测4.2轮廓检测5.高级操作5.1特征检测5.2目标跟踪5.3深度学习与OpenCVPythonOpenCV从入门到精通【文末送书】PythonOpenCV从入门到精通OpenCV(Ope
第八周 tensorflow实现猫狗识别降花绘 365天深度学习 tensorflow系列 tensorflow 深度学习人工智能
本文为365天深度学习训练营内部限免文章（版权归K同学啊所有）**参考文章地址：[TensorFlow入门实战｜365天深度学习训练营-第8周：猫狗识别（训练营内部成员可读）]**作者：K同学啊文章目录一、本周学习内容:1、自己搭建VGG16网络2、了解model.train_on_batch（）3、了解tqdm，并使用tqdm实现可视化进度条二、前言三、电脑环境四、前期准备1、导入相关依赖项2、
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
AI在垂直领域的深度应用：医疗、金融与自动驾驶的革新之路
AI在垂直领域的深度应用：医疗、金融与自动驾驶的革新之路一、医疗领域：AI驱动的精准诊疗与效率提升1.医学影像诊断AI算法通过深度学习技术，已实现对X光、CT、MRI等影像的快速分析，辅助医生检测癌症、骨折等疾病。例如，GoogleDeepMind的AI系统在乳腺癌筛查中，误检率比人类专家低9.4%；中国的推想医疗AI系统可在20秒内完成肺部CT扫描分析，为急诊救治争取黄金时间。2.药物研发传统药
专题：2025云计算与AI技术研究趋势报告|附200+份报告PDF、原数据表汇总下载
原文链接：https://tecdat.cn/?p=42935关键词：2025,云计算，AI技术，市场趋势，深度学习，公有云，研究报告云计算和AI技术正以肉眼可见的速度重塑商业世界。过去十年，全球云服务收入激增8倍，中国云计算市场规模突破6000亿元，而深度学习算法的应用量更是暴涨400倍。这些数字背后，是企业从“自建机房”到“云原生开发”的转型，是AI从“实验室”走向“产业级应用”的跨越。本报告
【大模型与机器学习解惑】什么是A/B测试，为何进行A/B测试？
以下内容将围绕机器学习中的A/B测试展开，从概念与背景到实施细节、示例代码、优化思路和未来建议，并在最后给出一个整体的“输出目录”供参考。目录什么是机器学习的A/B测试为何要进行A/B测试A/B测试的实施流程示例代码与详细解释优化方向与未来建议结语1.什么是机器学习的A/B测试A/B测试（也常被称作对照试验、SplitTest）最早多用于互联网产品的功能或界面迭代中，指的是将用户或样本随机分为两组
【深度学习解惑】在实践中如何发现和修正RNN训练过程中的数值不稳定？云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习 rnn 人工智能 tensorflow pytorch 神经网络机器学习
在实践中发现和修正RNN训练过程中的数值不稳定目录引言与背景介绍原理解释代码说明与实现应用场景与案例分析实验设计与结果分析性能分析与技术对比常见问题与解决方案创新性与差异性说明局限性与挑战未来建议和进一步研究扩展阅读与资源推荐图示与交互性内容语言风格与通俗化表达互动交流1.引言与背景介绍循环神经网络(RNN)在处理序列数据时表现出色，但训练过程中常面临梯度消失和梯度爆炸问题，导致数值不稳定。当网络
【深度学习实战】当前三个最佳图像分类模型的代码详解云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习人工智能分类模型机器学习 Transformer EfficientNet ConvNeXt
下面给出三个在当前图像分类任务中精度表现突出的模型示例，分别基于SwinTransformer、EfficientNet与ConvNeXt。每个模型均包含：训练代码（使用PyTorch）从预训练权重开始微调（也可注释掉预训练选项，从头训练）数据集目录结构：└──dataset_root├──buy#第一类图像└──nobuy#第二类图像随机拆分：80%训练，20%验证每个Epoch输出一次loss
第35周—————糖尿病预测模型优化探索
目录目录前言1.检查GPU2.查看数据编辑3.划分数据集4.创建模型与编译训练5.编译及训练模型6.结果可视化7.总结前言本文为365天深度学习训练营中的学习记录博客原作者：K同学啊1.检查GPUimporttorch.nnasnnimporttorch.nn.functionalasFimporttorchvision,torch#设置硬件设备，如果有GPU则使用，没有则使用cpudevice=
详解LLMOps，将DevOps用于大语言模型开发
大家好，在机器学习领域，随着技术的不断发展，将大型语言模型（LLMs）集成到商业产品中已成为一种趋势，同时也带来了许多挑战。为了有效应对这些挑战，数据科学家们转向了一种新型的DevOps实践LLM-OPS，专为大型语言模型的开发和维护而设计。本文将介绍LLM-OPS的核心思想，并分析这一策略如何帮助数据科学家更高效地运用DevOps的优秀实践，从而在语言模型的开发和部署过程中，提升工作效率和成果的
搜广推校招面经九十一
美团机器学习/数据挖掘算法工程师_二面一、介绍一下ESMM模型，是否有进行过函数推导传统的转化率建模方式：只用发生点击（click=1）的样本来训练CVR模型。CVR定义如下：CVR=P(y=1∣x,z=1)CVR=P(y=1|x,z=1)CVR=P(y=1∣x,z=1)y=1表示用户发生了转化（如购买）z=1表示用户点击了广告这样做的问题：样本选择偏差（SampleSelectionBias,S
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI PHP android linux
╔-----------------------------------╗┆
各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。 bozch .net .net mvc
在.net mvc5中，在执行某一操作的时候，出现了如下错误：各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。经查询当前的操作与错误内容无关，经过对错误信息的排查发现，事故出现在数据库迁移上。回想过去：在迁移之前已经对数据库进行了添加字段操作，再次进行迁移插入XXX字段的时候，就会提示如上错误。 &
Java 对象大小的计算 e200702084 java
Java对象的大小如何计算一个对象的大小呢？
Mybatis Spring 171815164 mybatis
ApplicationContext ac = new ClassPathXmlApplicationContext("applicationContext.xml"); CustomerService userService = (CustomerService) ac.getBean("customerService"); Customer cust
JVM 不稳定参数 g21121 jvm
-XX 参数被称为不稳定参数，之所以这么叫是因为此类参数的设置很容易引起JVM 性能上的差异，使JVM 存在极大的不稳定性。当然这是在非合理设置的前提下，如果此类参数设置合理讲大大提高JVM 的性能及稳定性。可以说“不稳定参数”
用户自动登录网站永夜-极光用户
1.目标:实现用户登录后,再次登录就自动登录,无需用户名和密码 2.思路:将用户的信息保存为cookie 每次用户访问网站,通过filter拦截所有请求,在filter中读取所有的cookie,如果找到了保存登录信息的cookie,那么在cookie中读取登录信息,然后直接
centos7 安装后失去win7的引导记录程序员是怎么炼成的操作系统
1.使用root身份(必须)打开 /boot/grub2/grub.cfg 2.找到 ### BEGIN /etc/grub.d/30_os-prober ### 在后面添加 menuentry "Windows 7 (loader) (on /dev/sda1)" {
Oracle 10g 官方中文安装帮助文档以及Oracle官方中文教程文档下载 aijuans oracle
Oracle 10g 官方中文安装帮助文档下载：http://download.csdn.net/tag/Oracle%E4%B8%AD%E6%96%87API%EF%BC%8COracle%E4%B8%AD%E6%96%87%E6%96%87%E6%A1%A3%EF%BC%8Coracle%E5%AD%A6%E4%B9%A0%E6%96%87%E6%A1%A3 Oracle 10g 官方中文教程
JavaEE开源快速开发平台G4Studio_V3.2发布了無為子 AOP oracle mysql javaee G4Studio
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V3.2版本已经正式发布。大家可以通过如下地址下载。访问G4Studio网站 http://www.g4it.org G4Studio_V3.2版本变更日志功能新增 (1).新增了系统右下角滑出提示窗口功能。 (2).新增了文件资源的Zip压缩和解压缩
Oracle常用的单行函数应用技巧总结百合不是茶日期函数转换函数(核心)数字函数通用函数(核心)字符函数
单行函数; 字符函数,数字函数,日期函数,转换函数(核心),通用函数(核心) 一:字符函数: .UPPER(字符串) 将字符串转为大写 .LOWER (字符串) 将字符串转为小写 .INITCAP(字符串) 将首字母大写 .LENGTH (字符串) 字符串的长度 .REPLACE(字符串,'A','_') 将字符串字符A转换成_
Mockito异常测试实例 bijian1013 java 单元测试 mockito
Mockito异常测试实例： package com.bijian.study; import static org.mockito.Mockito.mock; import static org.mockito.Mockito.when; import org.junit.Assert; import org.junit.Test; import org.mockito.
GA与量子恒道统计 Bill_chen JavaScript 浏览器百度 Google 防火墙
前一阵子，统计**网址时，Google Analytics（GA）和量子恒道统计（也称量子统计），数据有较大的偏差，仔细找相关资料研究了下，总结如下：为何GA和量子网站统计（量子统计前身为雅虎统计）结果不同？首先：没有一种网站统计工具能保证百分之百的准确出现该问题可能有以下几个原因：（1）不同的统计分析系统的算法机制不同；（2）统计代码放置的位置和前后
【Linux命令三】Top命令 bit1129 linux命令
Linux的Top命令类似于Windows的任务管理器，可以查看当前系统的运行情况，包括CPU、内存的使用情况等。如下是一个Top命令的执行结果： top - 21:22:04 up 1 day, 23:49, 1 user, load average: 1.10, 1.66, 1.99 Tasks: 202 total, 4 running, 198 sl
spring四种依赖注入方式白糖_ spring
平常的java开发中，程序员在某个类中需要依赖其它类的方法，则通常是new一个依赖类再调用类实例的方法，这种开发存在的问题是new的类实例不好统一管理，spring提出了依赖注入的思想，即依赖类不由程序员实例化，而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中。依赖注入的另一种说法是“控制反转”，通俗的理解是：平常我们new一个实例，这个实例的控制权是我
angular.injector boyitech AngularJS AngularJS API
angular.injector 描述: 创建一个injector对象, 调用injector对象的方法可以获得angular的service, 或者用来做依赖注入. 使用方法: angular.injector(modules, [strictDi]) 参数详解: Param Type Details mod
java-同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待 bylijinnan Integer
public class PC { /** * 题目：生产者-消费者。 * 同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待。 */ private static final Integer[] val=new Integer[10]; private static
使用Struts2.2.1配置 Chen.H apache spring Web xml struts
Struts2.2.1 需要如下 jar包: commons-fileupload-1.2.1.jar commons-io-1.3.2.jar commons-logging-1.0.4.jar freemarker-2.3.16.jar javassist-3.7.ga.jar ognl-3.0.jar spring.jar struts2-core-2.2.1.jar struts2-sp
[职业与教育]青春之歌 comsci 教育
每个人都有自己的青春之歌............但是我要说的却不是青春... 大家如果在自己的职业生涯没有给自己以后创业留一点点机会,仅仅凭学历和人脉关系,是难以在竞争激烈的市场中生存下去的.... &nbs
oracle连接(join)中使用using关键字 daizj JOIN oracle sql using
在oracle连接(join)中使用using关键字 34. View the Exhibit and examine the structure of the ORDERS and ORDER_ITEMS tables. Evaluate the following SQL statement: SELECT oi.order_id, product_id, order_date FRO
NIO示例 daysinsun nio
NIO服务端代码： public class NIOServer { private Selector selector; public void startServer(int port) throws IOException { ServerSocketChannel serverChannel = ServerSocketChannel.open(
C语言学习homework1 dcj3sjt126com c homework
0、课堂练习做完 1、使用sizeof计算出你所知道的所有的类型占用的空间。 int x; sizeof(x); sizeof(int); # include <stdio.h> int main(void) { int x1; char x2; double x3; float x4; printf(&quo
select in order by , mysql排序 dcj3sjt126com mysql
If i select like this: SELECT id FROM users WHERE id IN(3,4,8,1); This by default will select users in this order 1,3,4,8, I would like to select them in the same order that i put IN() values so:
页面校验-新建项目 fanxiaolong 页面校验
$(document).ready( function() { var flag = true; $('#changeform').submit(function() { var projectScValNull = true; var s =""; var parent_id = $("#parent_id").v
Ehcache（02）——ehcache.xml简介 234390216 ehcache ehcache.xml 简介
ehcache.xml简介 ehcache.xml文件是用来定义Ehcache的配置信息的，更准确的来说它是定义CacheManager的配置信息的。根据之前我们在《Ehcache简介》一文中对CacheManager的介绍我们知道一切Ehcache的应用都是从CacheManager开始的。在不指定配置信
junit 4.11中三个新功能 jackyrong java
junit 4.11中两个新增的功能，首先是注解中可以参数化，比如 import static org.junit.Assert.assertEquals; import java.util.Arrays; import org.junit.Test; import org.junit.runner.RunWith; import org.junit.runn
国外程序员爱用苹果Mac电脑的10大理由 php教程分享 windows PHP unix Microsoft perl
Mac 在国外很受欢迎，尤其是在设计/web开发/IT 人员圈子里。普通用户喜欢 Mac 可以理解，毕竟 Mac 设计美观，简单好用，没有病毒。那么为什么专业人士也对 Mac 情有独钟呢？从个人使用经验来看我想有下面几个原因： 1、Mac OS X 是基于 Unix 的这一点太重要了，尤其是对开发人员，至少对于我来说很重要，这意味着Unix 下一堆好用的工具都可以随手捡到。如果你是个 wi
位运算、异或的实际应用 wenjinglian 位运算
一．位操作基础，用一张表描述位操作符的应用规则并详细解释。二．常用位操作小技巧，有判断奇偶、交换两数、变换符号、求绝对值。三．位操作与空间压缩，针对筛素数进行空间压缩。 &n
weblogic部署项目出现的一些问题（持续补充中……） Everyday都不同 weblogic部署失败
好吧，weblogic的问题确实…… 问题一： org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: URL [zip:E:/weblogic/user_projects/domains/base_domain/serve
tomcat7性能调优（01） toknowme tomcat7
Tomcat优化： 1、最大连接数最大线程等设置 <Connector port="8082" protocol="HTTP/1.1" useBodyEncodingForURI="t
PO VO DAO DTO BO TO概念与区别 xp9802 java DAO 设计模式 bean 领域模型
O/R Mapping 是 Object Relational Mapping（对象关系映射）的缩写。通俗点讲，就是将对象与关系数据库绑定，用对象来表示关系数据。在O/R Mapping的世界里，有两个基本的也是重要的东东需要了解，即VO，PO。它们的关系应该是相互独立的，一个VO可以只是PO的部分，也可以是多个PO构成，同样也可以等同于一个PO（指的是他们的属性）。这样，PO独立出来，数据持

从零开始pytorch手写字母识别

前置知识体系

pytorch步骤

一、前言

二、基本步骤思想

三、实例讲解

1.数据处理

2. 模型构建

3. 定义代价函数和优化器

4、构建训练过程

数据集预处理

文件处理

DataSet

DataLoader

TensorBoard

搭建卷积神经网络

预训练模型地址

参考搭建网络-1

参考搭建网络 -2

网络模型的修改

模型的保存和加载

使用GPU

方法一

方法二

各种网络小问题

注意原来模型的输入Size

图片与模型通道数不同

优化器和loss函数-反向传播

损失函数

优化器的使用

实例 基于CIFAR10数据集的卷积神经网络

模型代码

训练代码-CPU

测试模型

实例 手写字母识别

图像文件处理

DataSetAndDataLoader

训练

测试模型

Bonus-1

bonus-1任务

任务一

预处理

DataSetAndDataLoader

测试模型准确率

任务二

Bonus-2

step-1 数据预处理

step -2 训练模型

学习资料

1.PyTorch 深度学习:60分钟快速入门（官网翻译）

2.土堆github

3.PyTorch 中文手册（pytorch handbook）（github标星7900+）

4.Pytorch教程（github标星13600+）

你可能感兴趣的:(pytorch,pytorch,机器学习,深度学习)

实例基于CIFAR10数据集的卷积神经网络

实例手写字母识别