咬树羊

Pytorch学习

B站小土堆教程小土堆

查看pytorch是否可用 pycharm的一个技巧，在函数的括号里按ctrl+P可以看要写哪些参数。

import torch
print( torch.cuda.is_available() )

如何在pytorch环境中安装jupyter notebook和使用教程

学习和使用中的两个常用的辅助查询函数
dir():打开package库看看里面有什么，例如dir(torch)，看看torch里有什么
help():说明书，例如help(torch.cuda.is_available)

pytorch加载数据

Dataset （一般来说Dataset都自己写，然后继承自Dataset）

提供一种方式去获取数据及其label

如何获取每一个数据及其label

告诉我们总共有多少的数据

from torch.utils.data import Dataset

读取一张图片

路径的话用相对路径比较好，因为这样假如换电脑换系统跑代码，绝对路径会发生变化，但只要项目文件不变，相对路径就不会变。另外要注意使用相对路径要保证在同一目录下，如果不是同一目录就要加../，. / 代表目前所在的目录； . . / 代表上一层目录； / 代表根目录。win系统下路径斜杠最好换成/，这样就不会有转义符了。

#读取一张图片的代码
from PIL import Image

img_path = "D:\\Python\Projects_all\\小土堆课程\\hymenoptera_data\\train\\ants\\0013035.jpg" 
                          #win系统记得加两个斜杠\\,表示转义
img = Image.open(img_path) #根据路径读取图片给img变量，可以用python控制台，里面可以显示很多变量信息
print(img.size) #查看图片尺寸，好像并不能看到通道数
img.show()      #打开图片

读取一个文件夹里的所有图片的文件名，并放到一个列表

from PIL import Image
import os

dir_path = "D:\\Python\\Projects_all\\小土堆课程\\hymenoptera_data\\train\\ants" 
            #win系统要加双斜杠，转义符号
img_path_list = os.listdir(dir_path)  #把文件夹里的所有东西的名字变成一个列表
print(img_path_list)  
img0_path = dir_path + "\\" + img_path_list[0]  #第一张图片的路径，手动写路径
img0_path = os.path.join(dir_path,img_path_list[0]) 
            #这个函数可以根据不同系统自动合并路径，两种方法，第二种更好
img0 = Image.open(img0_path)  #读取第一张图片
img0.show()               #打开 查看第一张图片

img0_path = os.path.join(dir_path,img_path_list[0]) #这个函数可以根据不同系统自动合并路径，不同系统斜杠不同

创建数据集（一般来说Dataset都自己写，然后继承自Dataset）

from torch.utils.data import Dataset
from PIL import Image
import os

class MyData(Dataset):  #创建一个MyData类，继承自Dataset类，这样就继承了Dataset的一部分资源，自己也可以添加一些资源
    def __init__(self,root_dir,label_dir):
        self.root_dir = root_dir
        self.label_dir = label_dir
        self.dir_path = os.path.join(self.root_dir, self.label_dir)
        self.img_path = os.listdir(self.dir_path)  #把文件里的所有东西的名字做成列表

    def __getitem__(self, idx):
        img_name = self.img_path[idx]  #找到对应索引号的图片名字
        img_idx_path = os.path.join(self.root_dir, self.label_dir, img_name) #写出完整路径
        img = Image.open(img_idx_path)  #读取图片
        label = self.label_dir  #图片标签
        return img, label

    def __len__(self):
        return len(self.img_path)

root_dir = "D:\\Python\\Projects_all\\小土堆课程\hymenoptera_data\\train"
ants_label_dir = "ants"
bees_label_dir = "bees"
ants_dataset = MyData(root_dir, ants_label_dir)
bees_dataset = MyData(root_dir, bees_label_dir)

print(len(ants_dataset)) #输出124
print(len(bees_dataset)) #输出121

img0, label = ants_dataset[0]
img0.show() #显示蚂蚁数据集的第一张图片

train_dataset = ants_dataset + bees_dataset  #两个数据集合并了，
           # 试了下必须用MyData(Dataset)继承Dataset才行，普通类实例化出来的是不行的
print(len(train_dataset)) #输出245

from torch.utils.data import Dataset可以合并数据集

Dataloader （拆分成多个batch）（输出的tensor都是NCHW维度的）

为后面的网络提供不同的数据形式。DataLoader是一个可迭代的数据装载器，组合了数据集和采样器，并在给定数据集上提供可迭代对象。可以完成对数据集中多个对象的集成。官方文档

CLASS DataLoader
torch.utils.data.DataLoader(dataset, batch_size=1, shuffle=None, sampler=None,
batch_sampler=None, num_workers=0, collate_fn=None, pin_memory=False,
drop_last=False, timeout=0, worker_init_fn=None, multiprocessing_context=None,
generator=None, *, prefetch_factor=2, persistent_workers=False, pin_memory_device='')

先导概念介绍：转自
Epoch：所有训练样本都已输入到模型中，称为一个epoch
Iteration：一批样本（batch_size）输入到模型中，称为一个Iteration
Batchsize：一批样本的大小，决定一个epoch有多少个Iteration
常用的主要有以下五个参数：
dataset（数据集）：需要提取数据的数据集， Dataset对象
batch_size（批大小）：每一次装载样本的个数，int型
shuffle（洗牌）：进行新一轮epoch时是否要重新洗牌，Boolean型
num_workers：是否多进程读取机制
drop_last：当样本数不能被batchsize整除时，是否舍弃最后一批数据

官方文档

DataLoader的使用

使用CIFAR10的测试数据集来完成DataLoader的使用。

导入并实例化DataLoader

创建一个dataloader,设置批大小为4，每一个epoch重新洗牌，不进行多进程读取机制，不舍弃不能被整除的批次。

#导入数据集的包
import torchvision.datasets
#导入dataloader的包
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter
#创建测试数据集
test_dataset = torchvision.datasets.CIFAR10(root="./CIRFA10",train=False,transform=torchvision.transforms.ToTensor())
#创建一个dataloader,设置批大小为4，每一个epoch重新洗牌，不进行多进程读取机制，不舍弃不能被整除的批次
test_dataloader = DataLoader(dataset=test_dataset,batch_size=4,shuffle=True,num_workers=0,drop_last=False)

数据集中数据的读取

由于数据集中的数据已经被我们转换成了tensor型，我们用dataset[0]输出第一张图片，使用shape属性输出tensor类型的大小，target代表图片的标签。

img,target = test_dataset[0]
print(img.shape,target)
输出：torch.Size([3，32，32]) 3  图片有RGB3个通道，大小为32*32，标签target为3。

DataLoader中数据的读取

在dataset中，每一个数据样本元组由一张图片对象img和一个标签target组成；

而dataloader中会分别对一个批次中的图片和标签进行打包，因此dataloader中，每一个对象元组由batchsize张图片对象imgs和batchsize个标签targets组成。（注意取数据的时候并不是按顺序取的，采样器sampler默认是随机采样，也就是说抓取四张图片的时候是随机取的）

对一个batchsize批次中的所有图片对象进行打包，形成一个对象，我们叫它imgs

对一个batchsize批次中所有的标签进行打包，形成一个对象，我们叫它targets

我们需要通过for循环来取出loader中的对象，loader中的对象个数=数据集中对象个数/batch_size，故应为10000/4=2500个对象。

#导入数据集的包
import torchvision.datasets
#导入dataloader的包
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter
#创建测试数据集
test_dataset = torchvision.datasets.CIFAR10(root="./CIRFA10",train=False,transform=torchvision.transforms.ToTensor())
#创建一个dataloader,设置批大小为4，每一个epoch重新洗牌，不进行多进程读取机制，不舍弃不能被整除的批次
test_dataloader = DataLoader(dataset=test_dataset,batch_size=4,shuffle=True,num_workers=0,drop_last=False)
 
#测试数据集中第一张图片对象
img,target = test_dataset[0]
print(img.shape,target)
 
#打印数据集中图片数量
print(len(test_dataset))
 
#loader中对象
for data in test_dataloader:
    imgs,targets = data
    print(imgs.shape)
    print(targets)
 
#dataloader中对象个数
print(len(test_dataloader))

loader中的对象格式：

imgs的维度变成了4*3*32*32，即四张图片，每张图片3个通道，每张图片大小为32*32。

targets里有4个target，分别是四张图片的标签target，组合到一起了。

使用tensorboard可视化效果

修改数据集的batchsize为64，writer中调用的方法为add_images()，因为需要读取的图片有多张。

#导入数据集的包
import torchvision.datasets
#导入dataloader的包
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter
#创建测试数据集
test_dataset = torchvision.datasets.CIFAR10(root="./CIRFA10",train=False,transform=torchvision.transforms.ToTensor())
#创建一个dataloader,设置批大小为64，每一个epoch重新洗牌，不进行多进程读取机制，不舍弃不能被整除的批次
test_dataloader = DataLoader(dataset=test_dataset,batch_size=64,shuffle=True,num_workers=0,drop_last=False)
 
writer = SummaryWriter("log")
 
#loader中对象
step = 0
for data in test_dataloader:
    imgs,targets = data
    writer.add_images("loader",imgs,step)
    step+=1
 
writer.close()

结果如下所示，可以看到一个step中有64张图片。

改变shuffle

每一轮epoch之后就是分配完了一次数据，而shuffle决定了是否在新一轮epoch开始时打乱所有图片的属性进行分配。

在代码中epoch就是最外层的循环，假设我们的epoch=2，即需要分配两次数据：

shuffle=TRUE代表第一轮循环结束后会打乱数据集中所有图片的顺序重新进行分配。

shuffle=FALSE代表第一轮循环结束后不打乱数据集中所有图片的顺序，还是按原顺序进行分配。

#导入数据集的包
import torchvision.datasets
#导入dataloader的包
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter
 
#创建测试数据集
test_dataset = torchvision.datasets.CIFAR10(root="./CIRFA10",train=False,transform=torchvision.transforms.ToTensor())
#创建一个dataloader,设置批大小为64，每一个epoch重新洗牌，不进行多进程读取机制，不舍弃不能被整除的批次
test_dataloader = DataLoader(dataset=test_dataset,batch_size=64,shuffle=True,num_workers=0,drop_last=True)
 
writer = SummaryWriter("log")
 
#loader中对象
 
for epoch in range(2):
    step = 0
    for data in test_dataloader:
        imgs, targets = data
        writer.add_images("Epoch:{}".format(epoch), imgs, step)
        step += 1
 
writer.close()

可以看到shuffle=True时epoch=0和epoch=1的每一个step中的图片不同了，说明每一轮大循环开始前都在数据集中重新打乱了顺序。

import os os库的用法

img_path_list = os.listdir(dir_path) #把文件夹里的所有东西的名字变成一个列表 os.listdir用法，如何找到文件里的jpg

os.listdir(path)返回文件列表的顺序是任意的，sort排序方法

img0_path = os.path.join(dir_path,img_path_list[0]) #这个函数可以根据不同系统自动合并路径

TensorBoard

conda install tensorboard 安装

from torch.utils.tensorboard import SummaryWriter

writer.add_scalar( ) 遇到报错或者不知道参数可以点进去看看函数注释

from torch.utils.tensorboard import SummaryWriter

writer = SummaryWriter("logs") # 把对应的事件文件存到logs目录里，如果没有会自动创建

# writer.add_image()
# y = 2x
for i in range(100):
    writer.add_scalar("y=2x", 2*i, i) #第一个参数是图表标题，第二个参数是y轴数值，第三个
                              #参数是步数，相对于x轴。具体参数可以ctrl+左键 点进去看看
writer.close()

代码写好之后先run一下，然后当前目录下就会多一个logs目录，里面存了tensorboard保存的事件文件。

接下来用终端terminal打开这个事件文件，

tensorboard --logdir=D:\Python\Projects_all\小土堆课程\代码\logs

logdir后面是事件文件所在的目录，绝对路径和相对路径都行但是要正确。然后打开http://localhost:6006/ 这个链接就行了。

tensorboard --logdir=D:\Python\Projects_all\小土堆课程\代码\logs --port=6007

用的人太多的话也可以修改端口的。

注意：对于标题一样的图，tensorboard会保存上一次运行的数据，也就是说图上会有上次的数据和这次的数据，全部乱套了。解决方法：一、更换标题，重新运行，刷新tensorboard图表界面，会生成新的图表；二、删除logs下面所有的事件文件，然后重新运行，并且重新进入终端输入命令。

writer.add_image( ) 遇到报错或者不知道参数可以点进去看看函数注释

可接受的图像格式：img_tensor (torch.Tensor, numpy.array, or string/blobname): Image data

from PIL import Image
img_path = "D:\Python\Projects_all\小土堆课程\hymenoptera_data\\train\\ants\\0013035.jpg"
img = Image.open(img_path)
print(type(img))

可见用PIL这个包来读取图片并不满足tensorboard的格式输入要求。

可以利用Opencv读取图片，获得numpy型图片数据。

这里小土堆直接用numpy对图片格式进行了转化。

from torch.utils.tensorboard import SummaryWriter
from PIL import Image
import numpy as np

writer = SummaryWriter("logs") # 把对应的事件文件存到logs目录里，如果没有会自动创建
img_path = "D:\Python\Projects_all\小土堆课程\hymenoptera_data\\train\\ants\\0013035.jpg"
img_PIL = Image.open(img_path)
img_array = np.array(img_PIL)
print(img_array.shape)
# print(np.transpose(2, 0, 1))  # [H, W, C] -> [C, H, W]

writer.add_image("test", img_array, global_step= 1, dataformats="HWC")  # 如果想换一张图片显示，要么就是换标题，
                                                            # 要么不换标题改一下global_step，会有一个滑动的效果
# y = 2x
for i in range(100):
    writer.add_scalar("y=x", 4*i, i) #第一个参数是图表标题，第二个参数是y轴数值，第三个
                              #参数是步数，相对于x轴。具体参数可以ctrl+左键 点进去看看
writer.close()

运行，然后在terminal中输入tensorboard --logdir=D:\Python\Projects_all\小土堆课程\代码\logs。打开链接就能看到图片了。

torchvision

torchvision 中的 transforms

from torchvision import transforms

transforms是一个处理图片的工具箱。

ToTensor

用PIL和cv2读取的图片都是HWC格式的(0~255)，ToTensor会自动转换成CHW格式(0~1)。

class ToTensor:
"""Convert a ``PIL Image`` or ``numpy.ndarray`` to tensor. """

用PIL的Image来读取图片读取出来是RGB格式，HWC格式, 0~255

from PIL import Image
from torchvision import transforms

img_path = "../hymenoptera_data/train/ants/0013035.jpg"
img_PIL = Image.open(img_path)
tensor_trans = transforms.ToTensor()
tensor_img = tensor_trans(img_PIL)
print(tensor_img.shape)
输出：torch.Size([3, 512, 768])

用opencv的CV2的imread来读取图片读取出来是BGR格式，HWC格式，0-255

opencv读出来的图片是numpy格式,opencv读取时路径中不可以有中文 opencv读取图片的方法

import cv2
from torchvision import transforms
img_path = "../hymenoptera_data/train/ants/0013035.jpg"
img_cv2 = cv2.imread(img_path)
tensor_trans = transforms.ToTensor()
tensor_img = tensor_trans(img_cv2)
print(tensor_img.shape)
输出：torch.Size([3, 512, 768])

用tensorboard来显示tensor格式的图片

from torch.utils.tensorboard import SummaryWriter
import cv2
from torchvision import transforms
img_path = "../hymenoptera_data/train/ants/0013035.jpg"
img_cv2 = cv2.imread(img_path)
tensor_trans = transforms.ToTensor()
tensor_img = tensor_trans(img_cv2)

writer = SummaryWriter("logs")
writer.add_image("tensor_image", tensor_img)
writer.close()

然后在python console输入命令打开tensorboard查看。

Normalize输入图片归一化

输入必须是tensor，图片tensor的数据范围是0-1。

公式是output[channel] = (input[channel] - mean[channel]) / std[channel]

trans_norm = transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5]) #均值和方差，图片的三个通道都要归一化
img_norm_PIL = trans_norm(tensor_img_PIL_RGB) #输入必须是tensor类型，注意格式是RGB
img_norm_cv2 = trans_norm(tensor_img_cv2_RGB)

第一张图经过了归一化处理，第二张图是原图

Resize修改图片尺寸

输入必须是PIL读取的图片

如果输入的参数是一个序列，即长和宽两个整数，则图像会按该长和宽进行resize。

如果输入的参数是一个整数x，将图片短边缩放至x，长宽比保持不变。

新版的Resize的输入图形类型可以是PIL型或者tensor型

注意：输出图像可能根据其类型不同而不同:当下采样时，PIL图像的插值和张量略有不同，因为PIL应用了抗锯齿。这可能会导致显著的差异在网络的性能中。因此，最好是训练和服务一个具有相同输入的模型类型。转自

trans_resize = transforms.Resize((512, 512))
img_resize = trans_resize(img_PIL_RGB)  # 必须输入PIL读取的图片，输出的也是PIL格式的图片
print(img_PIL_RGB.size)  输出：(768, 512)
print(img_resize.size)   输出：(512, 512)

Compose组合

可以把几个tranforms组合在一起使用，相当于一个组合器，可以对输入图片一次进行多个transforms的操作。

Compose()用法：Compose()中的参数需要是一个列表，Python中，列表的表示形式为[数据1，数据2，...]，在Compose中，数据需要是 transforms类型，所以得到，Compose([transforms参数1， transforms参数2,...])。

Compose中传入的参数需要是一个列表，列表中的数据类型是transforms型。

参数1的输出类型必须与参数2的输入类型匹配。（因为compose的工作顺序是从左到右的，第一个参数transform介绍之后再进行第二个transform的操作，所以需要前一个的输出和后一个的输入匹配。）

我们结合上面resize的学习进行一个compose的使用，这次resize的参数只输入一个数字，300，即会等比例缩放为短边为300大小的图片。

compose负责把ToTensor和resize组合起来，一步到位实现PIL图形到resize后的tensor图形的转换。

注：
为了测试参数顺序对compose的影响，代码中我写了2个compose，分别调换了ToTensor和resize的顺序，结果完全一致，这是因为ToTensor的输出tensor可以作为resize的输入，而resize的输出PIL也可以作为ToTensor的输入，因此无影响。转自

from PIL import Image
from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms
 
writer = SummaryWriter("logs")
img_path = "image/dog.jpg"
#创建PIL对象
img_PIL = Image.open(img_path)
#创建totensor和resize工具
trans_totensor_tool =transforms.ToTensor()
trans_resize_tool =transforms.Resize(300)
#compose
trans_compose_tool1 = transforms.Compose([trans_totensor_tool,trans_resize_tool])
trans_compose_tool2 = transforms.Compose([trans_resize_tool,trans_totensor_tool])
#图形转换
img_tensor_resized = trans_compose_tool1(img_PIL)
 
writer.add_image("compose",img_tensor_resized)
writer.add_image("compose",img_tensor_resized,1)
 
writer.close()

RandomCrop 随机裁剪

作用：把图像按照随机位置进行裁剪。

参数需要输入想要裁剪成的图片大小。

如果输入的是序列（h,w），会按照该长和宽进行裁剪。

如果输入的是一个整数x，则会按照（x,x）的大小裁剪。

结合Compose进行使用，完成10张大小为512*512的图片的随机裁剪。

from PIL import Image
from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms
 
writer = SummaryWriter("log")
img_path = "image/dog.jpg"
#创建PIL对象
img_PIL = Image.open(img_path)
#创建工具
trans_totensor_tool = transforms.ToTensor()
trans_randomcrop_tool = transforms.RandomCrop(512)
#compose
trans_compose_tool = transforms.Compose([trans_totensor_tool,trans_randomcrop_tool])
for i in range(10):
    img_tensor_ramdomcroped = trans_compose_tool(img_PIL)
    writer.add_image("randomcrop",img_tensor_ramdomcroped,i)
 
writer.close()

总结

关注输入和输出类型

多看官方文档

关注方法需要什么参数

不知道返回值的时候 Print( ) Print(type( )) debug

torchvision中的标准数据集Datasets

torchvision官方提供了一些标准数据集，可以直接在代码里写然后下载使用，官方文档。

Datasets模块提供了需要常用的数据集以及其具体的使用方法，比如下图所示的图像分类中常用的CIFAR10数据集，图像检测中常用的COCO数据集等。

以CIFAR10为例

CIFAR-10是一个更接近普适物体的彩色图像的小型数据集。一共包含10 个类别的RGB 彩色图片：飞机（ airplane ）、汽车（ automobile ）、鸟类（ bird ）、猫（ cat ）、鹿（ deer ）、狗（ dog ）、蛙类（ frog ）、马（ horse ）、船（ ship ）和卡车（ truck ）。每个图片的尺寸为32 × 32 ，每个类别有6000个图像，数据集中一共有50000 张训练图片和10000 张测试图片。

需要设定的5个参数：

1. root（字符串型）：把数据集下载到的位置路径。

2. train（布尔型）：是否把该数据集作为训练数据集使用。

True: 作为训练数据集创建

False:不作为训练数据集，作为测试数据集创建

3. transform：图像需要进行的变换操作，一般使用compose把所需的transforms结合起来。

4. target_transform：对于标签需要做的变换

5. download（布尔型）：是否下载数据集。

True：把数据集下载到root指定的对应位置；如果数据集以及进行过下载，则不会再一次下载

False：不下载数据集

数据集下载

pycharm在线下载（下载速度较快时）

1. 导入torchvision包，然后依次创建训练数据集和测试数据集。注意：训练数据集的train参数要设置为True，测试数据集的train设置为False

import torchvision
#创建训练数据集
train_set = torchvision.datasets.CIFAR10(root="./dataset3",train=True,download=True)
#创建测试数据集
test_set = torchvision.datasets.CIFAR10(root="./dataset3",train=False,download=True)

2. 点击运行，等待一段时间后显示下载成功

3. 观察项目包目录，可以发现自动创建了名为dataset3的文件夹，下载的解压文件和解压好的数据集都在其中。

第三方下载

如果在pycharm中下载速度很慢的话，可以找到pycharm所用的下载链接，然后自己使用迅雷等下载软件进行快速下载。

如何找到下载链接？

把鼠标移动到想要下载的数据集名称上，然后Ctrl+C，进入该数据集的帮助文档。

2. 可以看到对应的下载文件名和下载链接。

3. 使用迅雷或者浏览器下载，然后把下载过后的压缩文件按照root中定义的路径创建文件夹，然后把文件放入文件夹中，注意，自己创建的文件夹一定要和root中定义的文件夹姓名相同才行，否则后期扫描不到该数据集。

4. 运行上面在线下载中定义的语句，可以发现程序不会再次下载数据集文件，而是会帮你解压好数据集。

数据集的下载总结

无论是否需要在线下载数据集，都推荐把download参数值设为True。
因为程序可以帮你自动完成下载解压工作，就算自己下载过文件，也可以提供解压功能，因此更加方便。

CIFAR10的具体使用

数据集对象的显示（PIL型）

import torchvision
#创建训练数据集
train_set = torchvision.datasets.CIFAR10(root="./dataset3",train=True,download=True)
#创建测试数据集
test_set = torchvision.datasets.CIFAR10(root="./dataset3",train=False,download=True)
 
#1. 查看数据集的图片
#输出所有类别
print(test_set.classes)
#输出数据集第一张图片的类型
print(test_set[0])
#输出图片的PIL型格式和标签
img,label = test_set[0]
print(label,test_set.classes[label])
img.show()

1. 数据集所有类别的查看
图片有十个类，对应的类别名称存储在dataset.classes列表中。
2. 数据集中单个具体对象的查看
想要输出数据集中具体的某一张图片，使用下标调用方式dataset[x]即可显示第x+1张图片；输出的对象类型为一个元组，里面第一项是PIL类型的图片，第二项是图片的标签。
3. 数据集中图片对象和标签的定义
可以使用 img,label = dataset[x] 的方式接收对象中的图片和label，然后可以用print进行对label的输出，也可以用 dataset. classes[label]的格式进行对该类别名称的显示。
4. 数据集中图片的可视化
使用img.show()方法进行图片的可视化显示

把数据集中的图片对象转换为tensor型

转换所需transform的定义

因为需要完成数据集中所有图片类型从PIL到tensor的转换，我们需要用到transforms工具，也需要设定数据集中的transform参数。

我们在数据集定义的语句之前定义我们需要的transform。在这里我们只需要一个ToTensor即可。

下面代码给出使用compose定义transform和不使用compose的两个版本，都可以完成成功运行。

使用compose：

import torchvision
#定义transforms
dataset_transform = torchvision.transforms.Compose([
    #定义totensor
    torchvision.transforms.ToTensor()
])
#创建训练数据集
train_set = torchvision.datasets.CIFAR10(root="./dataset3",train=True,transform=dataset_transform,download=True)
#创建测试数据集
test_set = torchvision.datasets.CIFAR10(root="./dataset3",train=False,transform=dataset_transform,download=True)

不使用compose：

import torchvision
#定义transforms
from torch.utils.tensorboard import SummaryWriter
 
trans_totensor_tool = torchvision.transforms.ToTensor()
#创建训练数据集
train_set = torchvision.datasets.CIFAR10(root="./dataset3",train=True,transform=trans_totensor_tool,download=True)
#创建测试数据集
test_set = torchvision.datasets.CIFAR10(root="./dataset3",train=False,transform=trans_totensor_tool,download=True)

torchvision中现有网络模型的使用与修改

VGG地址可以分类1000个类别，因为ImageNet就是1000类。

pretrained为True指权重预训练好了已经；progress为True开启下载进度条。

因为ImageNet太大了，所以用CIFAR10数据集来演示，但是CIFAR10只有10个类别，所以需要对VGG网络结构进行修改。两种方法：

在VGG的全连接层最后一层把1000改成10

在VGG的全连接层的最后一层后面再加一层，输出是10

VGG的模型代码中分为feature和classifier。

import torchvision
from torch import nn

vgg16_flase = torchvision.models.vgg16(pretrained = False) # 不下载预训练权重
vgg16_ture = torchvision.models.vgg16(pretrained = True) # 下载预训练权重，运行就会自动下载权重了
print(vgg16_ture) # 看看模型结构

train_data = torchvision.datasets.CIFAR10('data', train=True, transform=torchvision.transforms.ToTensor(), download=True)

#添加新的一层
vgg16_ture.add_module('add_linear', nn.Linear(1000, 10)) # 在提特征层和分类层外面加
vgg16_ture.classifier.add_module('add_linear', nn.Linear(1000, 10)) # 加到分类层里面
print(vgg16_ture)

#修改
vgg16_flase.classifier[6] = nn.Linear(4096, 10) # 把模型打印出来再修改比较直观
print(vgg16_flase)

RGB格式和BGR格式之间的互相转换

cv2.cvtColor(img_PIL_RGB_np, cv2.COLOR_RGB2BGR) 转换函数

opencv读出来的图片是numpy格式,opencv读取时路径中不可以有中文

from PIL import Image
import cv2
from torchvision import transforms
import numpy as np

img_path = "../hymenoptera_data/train/ants/0013035.jpg"
img_PIL_RGB = Image.open(img_path)  # RGB 格式 HWC 0~255
img_cv2_BGR = cv2.imread(img_path)  # BGR 格式 HWC 0~255

# 如果想用cv2显示图片，图片必须是BGR格式的才能正常显示
img_PIL_RGB_np = np.array(img_PIL_RGB)  # 512X768x3 HWC  变成numpy格式
img_PIL_BGR_np = cv2.cvtColor(img_PIL_RGB_np, cv2.COLOR_RGB2BGR)  # 把RGB转换成BGR
cv2.imshow("img_PIL_BGR", img_PIL_BGR_np)  # cv2显示的图片必须是BGR格式的才能正常显示
cv2.imshow("img_cv2_RGB", img_PIL_RGB_np)  # RGB的是显示不正常的
cv2.imshow("img_cv2_BGR", img_cv2_BGR)
cv2.waitKey(0)  # 一直显示图片，直到按下任意键才关掉继续执行程序。里面的参数是显示的时间，单位ms

tensor_trans = transforms.ToTensor() # 会自动把HWC变成CHW，把0-255变成0-1，但是不会改变RGB和BGR格式
tensor_img_PIL_RGB = tensor_trans(img_PIL_RGB)

img_cv2_RGB = cv2.cvtColor(img_cv2_BGR, cv2.COLOR_BGR2RGB)  # BGR 转换成 RGB  HWC

def bgr2rgb(image):  # 自己写的BGR转换成RGB格式的函数，用numpy切片索引实现
    # 输入图片是HWC
    b_channel = image[:, :, 0].copy()  # copy表述b_channel现在和image没有关系了，image怎么变都影响不了b_channel了
    r_channel = image[:, :, 2].copy()
    image[:, :, 0] = r_channel   # 不copy的话这里image变了，b_channel会跟着改变
    image[:, :, 2] = b_channel
    return image

img_cv2_RGB = bgr2rgb(img_cv2_BGR)  # 用自己写的函数来BGR 转换成 RGB

tensor_img_cv2_RGB = tensor_trans(img_cv2_RGB)
print(tensor_img_PIL_RGB)
print(tensor_img_cv2_RGB)

PNG格式的图片需要去掉透明度通道

PNG图片HWC的C有4个通道，其中一个是透明度通道。

import numpy as np
from PIL import Image
import cv2

img_PIL = Image.open("0324204803.png") # 用PIL打开有4个通道
img_np = np.array(img_PIL)
print(img_np.shape)   # 输出(275, 115, 4)

img_cv = cv2.imread("0324204803.png") # 用cv2不加任何参数打开会变成3通道，(275, 115, 3)
img_cv = cv2.imread("0324204803.png",cv2.IMREAD_UNCHANGED) #用cv2加参数打开是4通道
cv2.imshow("img_cv", img_cv) # 我感觉cv2打开应该是BGR，但是显示是正常的
cv2.waitKey(0)
print(img_cv.shape) # 输出(275, 115, 4)

PNG格式图片4通道变RGB3通道方法

img_PIL = Image.open("0324204803.png") # 4通道(275, 115, 4)
img_PIL = img_PIL.convert('RGB')
img_np = np.array(img_PIL)
print(img_np.shape) # 输出(275, 115, 3)

如果原来就是RGB3通道，那加上这个.convert('RGB')也没事。

或者直接用opencv不加任何参数，读进来会变成3通道，但不一定是RGB

img_cv = cv2.imread("0324204803.png") # 用cv2不加任何参数打开会变成3通道，(275, 115, 3)

神经网络基本骨架 torch.nn.Module 官方文档

我们自己定义的神经网络需要继承nn.Module类，需要重写以下两个方法：

init方法：初始化

forward方法：前向传播

在官方文档给出的示例中，在init方法中进行了卷积操作，在forward方法中进行了ReLu非线性处理操作，代码如下所示。

对输入的x进行第一次卷积，再进行第一次非线性操作；

再第二次进行卷积，然后第二次非线性操作。

import torch.nn as nn
import torch.nn.functional as F
 
class Model(nn.Module):
    def __init__(self):
        super(Model, self).__init__()
        self.conv1 = nn.Conv2d(1, 20, 5) # 卷积核
        self.conv2 = nn.Conv2d(20, 20, 5)
 
    def forward(self, x):
        x = F.relu(self.conv1(x))
        return F.relu(self.conv2(x))

自定义搭建神经网络

自定义名为Ysy的神经网络，继承自nn.Module

重写init和forward两个方法，在forward中定义该神经网络的规则，即输入+1为输出

实例化神经网络

把tensor类型的值x放入神经网络中进行输出

成功输出结果为 x+1

import torch
from torch import nn

class Ysy(nn.Module):
    def __init__(self):
        super(Ysy, self).__init__()
 
    def forward(self,input):
        output = input + 1;
        return output
 
# 创建神经网络
ysy = Ysy()
# 输入的值为x，tensor型，数值为1
x = torch.tensor(1.0)
# 输出为output
output = ysy(x)
print(output)

这里在计算的时候并没有调用forward方法，学长说就理解成nn.Module里面的__call__里面调用了forward就行。

神经网络之卷积操作

两种2d卷积的实现方式

torch.nn Conv2d是类

CLASS torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True, padding_mode='zeros', device=None, dtype=None)

torch.nn.functional conv2d是函数

torch.nn.functional.conv2d(input, weight, bias=None, stride=1, padding=0, dilation=1, groups=1) → Tensor

import torch.nn.functional as F

torch.nn.functional.conv2d方法介绍

使用该方法需要引入的参数

torch.nn.functional.conv2d( input, weight, bias=None, stride=1, padding=0,
dilation=1, groups=1) → Tensor

https://pytorch.org/docs/stable/generated/torch.nn.functional.conv2d.html#torch.nn.functional.conv2d

weight就是卷积核。

stride步长参数可以是元组，一个是H方向的步长，一个是W方向的步长。

padding可以是一个元组，纵向和横向padding的参数。

关于对input和weight的shape详解

方法中对input和weight要求的shape都需要是4维的。

input的shape要求：

minibatch：batch中的样例个数

in_channels：每个样例数据的通道数

iH：每个样例的高（行数）

iW：每个样例的宽（列数）

weight的shape要求：

out_channels：卷积核的个数

in_channels/groups：每个卷积核的通道数

kH：每个卷积核的高（行数）

kW：每个卷积核的宽（列数）

正常定义的tensor型shape为二维，即只有长和宽，因此需要使用reshape方法进行尺寸重定义。

import torch
import torch.nn.functional as F

# 输入
input = torch.tensor([[1,2,0,3,1],
                      [0,1,2,3,1],
                      [1,2,1,0,0],
                      [5,2,3,1,1],
                      [2,1,0,1,1]])
# 卷积核
kernel = torch.tensor([[1,2,1],
                       [0,1,0],
                       [2,1,0]])
print(input.shape)
print(kernel.shape)
 
# 重新定义尺寸，把尺寸改成四个数，1个batchsize，1个通道，长和宽和之前一样
input = torch.reshape(input,(1,1,5,5))
kernel = torch.reshape(kernel,(1,1,3,3))
 
print(input.shape)
print(kernel.shape)
 
#stride=1或2时的输出
output1 = F.conv2d(input,kernel,stride=1)
print(output1)
output2 = F.conv2d(input,kernel,stride=2)
print(output2)
 
# padding=1或2时的
output3 = F.conv2d(input,kernel,stride=1,padding=1)
print(output3)
output4 = F.conv2d(input,kernel,stride=1,padding=2)
print(output4)

torch.nn.Conv2d

CLASS torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True, padding_mode='zeros', device=None, dtype=None)

参数介绍

in_channels ( int ) – Number of channels in the input image，输入图片的通道数
out_channels ( int ) – Number of channels produced by the convolution，输出图片的通道数, 代表卷积核的个数，使用n个卷积核输出的特征矩阵深度即channel就是n
kernel_size ( int or tuple ) – Size of the convolving kernel，卷积核的大小
e.g. if kernel size = 3, 则卷积核的大小是3*3
stride ( int or tuple , optional) – Stride of the convolution. Default: 1，步径大小
padding ( int , tuple or str , optional) – Padding added to all four sides of the input. Default: 0
padding_mode ( str , optional) – 'zeros', 'reflect', 'replicate' or 'circular'. Default: 'zeros'
dilation ( int or tuple , optional) – Spacing between kernel elements. Default: 1
groups ( int , optional) – Number of blocked connections from input channels to output channels. Default: 1
bias ( bool , optional) – If True, adds a learnable bias to the output. Default: True

输出的尺寸大小

dilation：空洞卷积，进行卷积操作时会隔n个取一个。

import torch
import torchvision
from torch.nn import Conv2d
from torch.utils.data import DataLoader
# 数据集下载
from torch.utils.tensorboard import SummaryWriter
 
dataset = torchvision.datasets.CIFAR10(root=".\CIFAR10", train=False, transform=torchvision.transforms.ToTensor(),
                                       download=True)
# 数据加载器
dataloader = DataLoader(dataset, batch_size=64)
 
class Ysy(torch.nn.Module):
    def __init__(self):
        super(Ysy, self).__init__()
        # 卷积层
        self.conv1 = Conv2d(in_channels=3, out_channels=6, kernel_size=3, stride=1, padding=0)
 
    def forward(self, x):
        x = self.conv1(x)
        return x
 
ysy = Ysy()

writer = SummaryWriter("logs")
step = 0
for data in dataloader:
    imgs, labels = data
    # 卷积操作
    output = ysy(imgs) # 卷积核权重是随机生成的
    print(imgs.shape)
    print(output.shape)
    writer.add_images("input", imgs, step)
 
    output = torch.reshape(output, (-1, 3, 30, 30)) #输出有6个通道但是为了可视化以下强行reshape成3个通道，没什么卵用
    writer.add_images("output", output, step)
    step = step + 1

writer.close()

ReflectionPad2d--利用输入边界的反射来padding输入张量链接

最大池化（下采样）

MaxPool2d是下采样；MaxUnpool是上采样

CLASS torch.nn.MaxPool2d(kernel_size, stride=None, padding=0, dilation=1, return_indices=False, ceil_mode=False)

stride的默认大小为池化核的大小

ceil_mode：

遇到这种不足9个数的情况时是否要对这6个数进行池化，默认False就不管了，True就要池化这6个数。

MaxPool2d不支持输入的tensor的数据类型是long，会报错。

最大池化的作用和目的

作用：最大限度的保留图片特征，同时减少数据量,加速训练速度。

import torch
from torch.nn import MaxPool2d
#输入的矩阵 
input = torch.tensor([
    [1,2,0,3,1],
    [0,1,2,3,1],
    [1,2,1,0,0],
    [5,2,3,1,1],
    [2,1,0,1,1]
],dtype=torch.float32)
 
input = torch.reshape(input,(-1,1,5,5))
print(input.shape)
 
class Ysy(torch.nn.Module):
    def __init__(self):
        super(Ysy, self).__init__()
        # 设置池化
        self.maxpool1 = MaxPool2d(kernel_size=3,ceil_mode=False)
 
    def forward(self,input):
        output = self.maxpool1(input)
        return output
 
ysy = Ysy()
output = ysy(input)
print(output)

import torch
import torchvision.datasets
from torch.nn import MaxPool2d
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

dataset = torchvision.datasets.CIFAR10(root=".\CIFAR10",train=False,transform=torchvision.transforms.ToTensor(),download=True)
dataloader = DataLoader(dataset,batch_size=64)

class Ysy(torch.nn.Module):
    def __init__(self):
        super(Ysy, self).__init__()
        # 设置池化
        self.maxpool1 = MaxPool2d(kernel_size=3,ceil_mode=False)
 
    def forward(self,input):
        output = self.maxpool1(input)
        return output
 
writer = SummaryWriter("logs")
step = 0
ysy = Ysy()
 
for data in dataloader:
    imgs,labels=data
    writer.add_images("inputs",imgs,step)
    output = ysy(imgs)
    writer.add_images("output",output,step)
    step+=1
 
writer.close()

torch.cat([feature_B,feature_D],1)

一般卷积网络里的tensor的shape都是(N,C,H,W)，所以concatenate的时候想拼接通道就应该是dim=1，在C的维度进行拼接。

非线性激活

作用：非线性变换的主要目的就是给网中加入一些非线性特征，非线性越多才能训练出符合各种特征的模型。

ReLu

CLASStorch.nn.ReLU(inplace=False)

inplace代表是否替换/保留原输入的意思

inplace = True，代表确定替换，即不保留非线性激活之前的值，会把输入值直接替换为激活后的值。

inplace = False（默认），代表不替换，即保留非线性激活之前的值，会把输入值保留下来，再另存一个输出值。

import torch
from torch.nn import ReLU
 
input = torch.tensor([
    [1,-0.5],
    [-1,3]])
 
input= torch.reshape(input,(-1,1,2,2))
 
class Ysy(torch.nn.Module):
    def __init__(self):
        super(Ysy, self).__init__()
        # inplace默认为FALSE，可以不进行设置
        self.relu = ReLU()
 
    def forward(self,input):
        output = self.relu(input)
        return output
 
ysy = Ysy()
output = ysy(input)
print(output)

Sigmoid

CLASStorch.nn.Sigmoid(*args, **kwargs)

import torch
import torchvision.datasets
from torch.nn import ReLU, Sigmoid
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

dataset = torchvision.datasets.CIFAR10(root=".\CIFAR10",train=True,transform=torchvision.transforms.ToTensor(),download=True)
dataloader = DataLoader(dataset,batch_size=64)

class Ysy(torch.nn.Module):
    def __init__(self):
        super(Ysy, self).__init__()
        # inplace默认为FALSE，可以不进行设置
        self.relu = ReLU()
        #设置sigmoid激活
        self.sigmoid1 = Sigmoid()
 
    def forward(self,input):
        output = self.sigmoid1(input)
        return output
 
ysy = Ysy()
 
writer = SummaryWriter("logs")
step = 0
for data in dataloader:
    imgs,labels = data
    writer.add_images("inputs",imgs,step)
    outputs = ysy(imgs)
    writer.add_images("outputs",outputs,step)
    step+=1
 
writer.close()

Batch-norm 官方文档

CLASS torch.nn.BatchNorm2d(num_features, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True, device=None, dtype=None)

nn.BatchNorm2d(channel)

BN层里的参数也是可以学习的。

全连接层

基于公式y=wx+b计算，w为权重，x为输入，b为偏置值。

参数:
in_features，输入特征 ( int ) – size of each input sample，输入的tensor大小
out_features，输出特征 ( int ) – size of each output sample，输出的tensor大小
bias ( bool ) – If set to False, the layer will not learn an additive bias. Default: True

import torch
import torchvision.datasets
from torch.nn import Linear
from torch.utils.data import DataLoader
 
dataset = torchvision.datasets.CIFAR10(root="./CIFAR10", train=False, transform=torchvision.transforms.ToTensor(),
                                       download=True)
dataloader = DataLoader(dataset, batch_size=64)
 
class Ysy(torch.nn.Module):
    def __init__(self):
        super(Ysy, self).__init__()
        self.linear1 = Linear(196608, 10)
 
    def forward(self, input):
        output = self.linear1(input)
        return output
 
ysy = Ysy()
for data in dataloader:
    imgs, lables = data
    print(imgs.shape)
    input = torch.flatten(imgs) 或者 out = torch.reshape(imgs, (1, 1, 1, -1))
    print(input.shape)  # 这里的展平有点问题，不应该把batch的所有图片展平到一起，应该分开展平
    output = ysy(input)
    print(output.shape)

展平特征用这个更多CLASS torch.nn.Flatten(start_dim=1, end_dim=- 1)

input = torch.randn(32, 1, 5, 5)
# With default parameters
m = nn.Flatten()
output = m(input)
output.size()  # torch.Size([32, 25])
# With non-default parameters
m = nn.Flatten(0, 2)
output = m(input)
output.size()  # torch.Size([160, 5])

Sequential的使用

构建一个序列化的container，可以把想要在神经网络中添加的操作都放进去，按顺序进行执行。

Example

把卷积、非线性激活、卷积、非线性激活使用sequantial进行组合，一起放在构建的model中。

model = nn.Sequential(
          nn.Conv2d(1,20,5),
          nn.ReLU(),
          nn.Conv2d(20,64,5),
          nn.ReLU()
        )
 
# Using Sequential with OrderedDict. This is functionally the
# same as the above code
model = nn.Sequential(OrderedDict([
          ('conv1', nn.Conv2d(1,20,5)),
          ('relu1', nn.ReLU()),
          ('conv2', nn.Conv2d(20,64,5)),
          ('relu2', nn.ReLU())
        ]))

实战神经网络搭建以及sequential的使用

不使用sequential

import torch.nn
from torch.nn import Conv2d, MaxPool2d, Flatten, Linear
 
class Maweiyi(torch.nn.Module):
    def __init__(self):
        super(Maweiyi, self).__init__()
        self.conv1 = Conv2d(in_channels=3, out_channels=32, kernel_size=5, padding=2)
        self.maxpool1 = MaxPool2d(kernel_size=2)
        self.conv2 = Conv2d(in_channels=32, out_channels=32, kernel_size=5, padding=2)
        self.maxpool2 = MaxPool2d(kernel_size=2)
        self.conv3 = Conv2d(in_channels=32, out_channels=64, kernel_size=5, padding=2)
        self.maxpool3 = MaxPool2d(kernel_size=2)
        self.flatten = Flatten()
        self.linear1 = Linear(in_features=1024, out_features=64)
        self.linear2 = Linear(in_features=64, out_features=10)
 
    def forward(self, x):
        x = self.conv1(x)
        x = self.maxpool1(x)
        x = self.conv2(x)
        x = self.maxpool2(x)
        x = self.conv3(x)
        x = self.maxpool3(x)
        x = self.linear1(x)
        x = self.linear2(x)
        return x

使用sequential

class Maweiyi(torch.nn.Module):
    def __init__(self):
        super(Maweiyi, self).__init__()
        self.model1 = Sequential(
            Conv2d(in_channels=3, out_channels=32, kernel_size=5, padding=2),
            MaxPool2d(kernel_size=2),
            Conv2d(in_channels=32, out_channels=32, kernel_size=5, padding=2),
            MaxPool2d(kernel_size=2),
            Conv2d(in_channels=32, out_channels=64, kernel_size=5, padding=2),
            MaxPool2d(kernel_size=2),
            Flatten(),
            Linear(in_features=1024, out_features=64),
            Linear(in_features=64, out_features=10)
        )
 
    def forward(self, x):
         x = self.model1(x)
         return x

tensorboard SummaryWriter中的add_gragh可视化神经网络模型

import torch.nn
from torch.nn import Conv2d, MaxPool2d, Flatten, Linear, Sequential
from torch.utils.tensorboard import SummaryWriter
 
class Maweiyi(torch.nn.Module):
    def __init__(self):
        super(Maweiyi, self).__init__()
        self.model1 = Sequential(
            Conv2d(in_channels=3, out_channels=32, kernel_size=5, padding=2),
            MaxPool2d(kernel_size=2),
            Conv2d(in_channels=32, out_channels=32, kernel_size=5, padding=2),
            MaxPool2d(kernel_size=2),
            Conv2d(in_channels=32, out_channels=64, kernel_size=5, padding=2),
            MaxPool2d(kernel_size=2),
            Flatten(),
            Linear(in_features=1024, out_features=64),
            Linear(in_features=64, out_features=10)
        )
 
    def forward(self, x):
         x = self.model1(x)
         return x

maweiyi = Maweiyi()
print(maweiyi)
 
input = torch.ones((64,3,32,32))
output = maweiyi(input)
print(output.shape)
 
writer = SummaryWriter("logs")
writer.add_graph(maweiyi,input)
writer.close()

损失函数

L1loss nn.L1Loss 绝对值误差

CLASS torch.nn.L1Loss(size_average=None, reduce=None, reduction='mean')

import torch
from torch.nn import L1Loss
 
inputs = torch.tensor([1,2,3],dtype=torch.float32)
targets = torch.tensor([1,2,5],dtype=torch.float32)
inputs = torch.reshape(inputs,(1,1,1,3))
targets = torch.reshape(targets,(1,1,1,3))
loss2 = L1Loss(reduction="sum")
result2 = loss2(inputs,targets)
print(result2)

MSE损失函数（均方误差）MSELoss

CLASS torch.nn.MSELoss(size_average=None, reduce=None, reduction='mean')

import torch
from torch.nn import L1Loss, MSELoss
 
inputs = torch.tensor([1,2,3],dtype=torch.float32)
targets = torch.tensor([1,2,5],dtype=torch.float32)
 
inputs = torch.reshape(inputs,(1,1,1,3))
targets = torch.reshape(targets,(1,1,1,3))
 
loss_mse1 = MSELoss()
result1 = loss_mse1(inputs,targets)
print(result1)

使用交叉熵损失函数CrossEntropyLoss

注意这个交叉熵函数里面包括了softmax最后的归一化处理，所以输入给它的数得是没经过softmax归一化的数据。

CLASS torch.nn.CrossEntropyLoss(weight=None, size_average=None, ignore_index=- 100, reduce=None, reduction='mean', label_smoothing=0.0)

这张图用softmax的交叉熵来演示，至于为什么写的这么复杂，是因为这里写的[0.1，0.2，0.3]并不是softmax归一化之后的概率，而是输入给softmax的数（得分），因此损失函数也要加一个softmax归一化，softmax的损失函数就是-log y_hat。

参数说明

输入输出说明

import torch.nn
from torch import nn
import torchvision.datasets
from torch.nn import Conv2d, MaxPool2d, Flatten, Linear, Sequential
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter
 
dataset = torchvision.datasets.CIFAR10(root="./CIFAR10",train=False,transform=torchvision.transforms.ToTensor(),download=True)
dataloader = DataLoader(dataset,batch_size=1)

class Maweiyi(torch.nn.Module):
    def __init__(self):
        super(Maweiyi, self).__init__()
        self.model1 = Sequential(
            Conv2d(in_channels=3, out_channels=32, kernel_size=5, padding=2),
            MaxPool2d(kernel_size=2),
            Conv2d(in_channels=32, out_channels=32, kernel_size=5, padding=2),
            MaxPool2d(kernel_size=2),
            Conv2d(in_channels=32, out_channels=64, kernel_size=5, padding=2),
            MaxPool2d(kernel_size=2),
            Flatten(),
            Linear(in_features=1024, out_features=64),
            Linear(in_features=64, out_features=10)
        )
 
    def forward(self, x):
         x = self.model1(x)
         return x
 
maweiyi = Maweiyi()
# 使用交叉熵损失函数
loss_cross = nn.CrossEntropyLoss()
 
for data in dataloader:
    imgs,labels = data
    outputs = maweiyi(imgs)
    results = loss_cross(outputs,labels)
    results.backward()  # 反向传播

优化器，梯度下降

import torch
import torchvision
from torch import nn
from torch.nn import Conv2d, MaxPool2d, Flatten, Linear, Sequential, ReLU, Sigmoid
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

dataset = torchvision.datasets.CIFAR10(root="dataset", train=False, transform=torchvision.transforms.ToTensor()
                                       ,download=False)
dataloader = DataLoader(dataset, batch_size=1)

class ZYJ(nn.Module):
    def __init__(self):
        super(ZYJ, self).__init__()
        self.model = Sequential(
            Conv2d(3, 32, 5, padding=2),
            MaxPool2d(2),
            ReLU(),
            Conv2d(32, 32, 5, padding=2),
            Sigmoid(),
            MaxPool2d(2),
            Conv2d(32, 64, 5, padding=2),
            MaxPool2d(2),
            Flatten(),
            Linear(1024, 64),
            Linear(64, 10)
        )
    def forward(self, input):
        output = self.model(input)
        return output

zyj = ZYJ()
loss = nn.CrossEntropyLoss()
optim = torch.optim.SGD(zyj.parameters(), lr=0.01)
for epoch in range(50):
    running_loss = 0.0

    for data in dataloader:
        imgs, targets = data
        output = zyj(imgs)  # 边计算，边创建计算图
        result_loss = loss(output, targets) #边计算，边创建计算图
        optim.zero_grad() # 梯度清零，pytorch默认梯度会累加，清除上一次的梯度
        result_loss.backward()  # 获得每个参数的梯度，后续用优化器进行优化参数
        optim.step() # 梯度下降，更新参数，默认会删除计算图
        running_loss = running_loss + result_loss # 把一个batch里的所有小块的loss加起来了
    print(running_loss)

Pytorch的动态图、自动求导

Pytorch的自动求导系统要注意：梯度不自动清零：就是每一次反向传播，梯度都会叠加上去。所以迭代的时候要清零。

模型的保存与加载

import torch
import torchvision
from torch import nn

vgg16 = torchvision.models.vgg16(pretraned = False)

#保存方式1，保存网络模型和权重
torch.save(vgg16, "vgg16_method1.pth") # 第二个参数是保存路径

#保存方式1，保存网络模型和权重→对应的模型加载
model = torch.load("vgg16_method1.pth")

#保存方式2，只保存权重，不保存模型 (官方推荐)
torch.save(vgg16.state_dict(), "vgg16_method2.pth")

#保存方式2，只保存权重，不保存模型 (官方推荐)→对应的模型加载
vgg16 = torchvision.models.vgg16(pretrained = False)
vgg16.load_state_dict(torch.load("vgg16_method2.pth"))
print(vgg16)

#保存方式1  注意陷阱！ 在加载模型的时候，需要有模型定义！
class Tudui(nn.Module):
    def __init__(self):
        super(Tudui, self).__init__()
        self.model1 = nn.Sequential(
            nn.Linear(64, 10)
        )
    def forward(self, x):
        x = self.model1(x)
        return x

tudui = Tudui()
torch.save(tudui, "model/tudui_method.pth")  #按照保存方式1，保存模型和权重

# 加载模型
class Tudui(nn.Module):
    def __init__(self):
        super(Tudui, self).__init__()
        self.model1 = nn.Sequential(
            nn.Linear(64, 10)
        )

    def forward(self, x):
        x = self.model1(x)
        return x

model = torch.load("model/tudui_method.pth") # 可以省略tudui = Tudui()实例化这一步，但是模型定义不能缺
print(model)
#不过一般都不会有这种问题，因为我们一般把模型放在一个单独的文件里 from model_save import *

保存和加载checkpoint

保存的checkpoint里面除了保存了权重还可能保存了优化器参数，epoch，loss等等参数。为啥我保存的权重文件那么大？如何保存与加载checkpoints

保存checkpoints

EPOCH = 5
PATH = "model.pt"
LOSS = 0.4

torch.save({
            'epoch': EPOCH,
            'model_state_dict': net.state_dict(),
            'optimizer_state_dict': optimizer.state_dict(),
            'loss': LOSS,
            }, PATH)

加载checkpoints

model = Net()
optimizer = optim.SGD(net.parameters(), lr=0.001, momentum=0.9)

checkpoint = torch.load(PATH)
model.load_state_dict(checkpoint['model_state_dict'])
optimizer.load_state_dict(checkpoint['optimizer_state_dict'])
epoch = checkpoint['epoch']
loss = checkpoint['loss']
 
model.eval()
# - or -
model.train()

pytorch模型的保存和加载、checkpoint pytorch实现加载保存查看checkpoint文件

完整的模型小项目

用上面这个简单模型给CIFAR10数据集分类，10个类别。

通常模型都单独放在一个python文件里一般是model

model.py

import torch
from torch import nn

#搭建神经网络
class Tudui(nn.Module):
    def __init__(self):
        super(Tudui, self).__init__()
        self.model = nn.Sequential(
            nn.Conv2d(3, 32, 5, 1, 2),
            nn.MaxPool2d(2),
            nn.Conv2d(32, 32, 5, 1, 2),
            nn.MaxPool2d(2),
            nn.Conv2d(32, 64, 5, 1, 2),
            nn.MaxPool2d(2),
            nn.Flatten(),
            nn.Linear(1024, 64),
            nn.Linear(64, 10)
        )

    def forward(self, x):
        x = self.model(x)
        return x

if __name__ == '__main__': # 测试一下模型对不对
     tudui = Tudui()
     input = torch.ones((64, 3, 32, 32))
     output = tudui(input)
     print(output.shape) # shape和size功能一样

model.py和train.py必须在同一目录下

train.py （CPU训练）

import torch
import torchvision
from torch import nn
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter
from model import *

#准备数据集
train_data = torchvision.datasets.CIFAR10('data', train=True, transform=torchvision.transforms.ToTensor(), download=True)
test_data = torchvision.datasets.CIFAR10('data', train=False, transform=torchvision.transforms.ToTensor(), download=True)

#数据集长度
train_data_size = len(train_data)
test_data_size = len(test_data)
print("训练数据集长度：{}".format(train_data_size))
print("测试数据集长度：{}".format(test_data_size))

#加载数据集（Dataloader）
train_dataloader = DataLoader(train_data, batch_size=64)
test_dataloader = DataLoader(test_data, batch_size=64)

#创建网络模型
tudui = Tudui()

#损失函数
loss_fn = nn.CrossEntropyLoss()

#优化器
#learning_rate = 0.01
learning_rate = 1e-2
optimizer = torch.optim.SGD(tudui.parameters(), lr=learning_rate)

#参数
total_train_step = 0
total_test_step = 0
epoch = 10

#添加tensorbooard
writer = SummaryWriter("logs/trainlogs")

for i in range(epoch):
    print("-----第{}轮训练-----".format(i+1))

    #训练开始
    tudui.train() # 让模型进入训练状态
    for data in train_dataloader:
        imgs, targets = data
        outputs = tudui(imgs)
        loss = loss_fn(outputs, targets)

        #优化器调优
        optimizer.zero_grad() #梯度清零
        loss.backward() # 求梯度
        optimizer.step() # 梯度下降

        total_train_step = total_train_step + 1
        if total_train_step % 100 == 0:
            print("训练次数：{}，Loss：{}".format(total_train_step, loss.item()))
            writer.add_scalar("train_loss", loss.item(), total_train_step)

    #一轮训练过后我要看看模型训练的效果如何，所以要在验证集上评估一下
    tudui.eval() # 让模型进入验证评估状态
    total_test_loss = 0
    total_accuracy = 0
    with torch.no_grad(): # 去掉梯度，只有前向推理
        for data in test_dataloader:
            imgs, targets = data
            outputs = tudui(imgs)
            loss = loss_fn(outputs, targets) #看一下验证集上的loss
            total_test_loss = total_test_loss + loss.item()#把所有验证集batch的loss加起来
            accuracy = (outputs.argmax(1) == targets).sum() #求准确率
            total_accuracy = total_accuracy + accuracy #整体验证集的准确率，但是我觉得应该不能是直接累加

    print("整体验证集的loss：{}".format(total_test_loss))
    print("验证集正确率: {}".format(total_accuracy / test_data_size))
    total_test_step = total_test_step + 1
    writer.add_scalar("test_loss", total_test_loss, total_test_step)
    writer.add_scalar("test_accuracy", total_accuracy / test_data_size, total_test_step)

    torch.save(tudui, "model/tudui_{}.pth".format(i))
    # torch.save(tudui.state_dict(), "tudui_{}.pth".format(i))
writer.close()

一维或零维张量.item( )方法是，取一个张量里面的具体元素值并返回该值，可以将一个零维张量转换成int型或者float型，在计算loss，accuracy时常用到。

张量.argmax(1)的用法，返回最大值对应的序号

import torch

output = torch.tensor([[0.2, 0.8],
                       [0.4,0.6]])
print(output.argmax(0)) # tensor([1, 0])竖着找最大值的序号
print(output.argmax(1)) # tensor([1, 1])横着找最大值的序号

tudui.train() # 让模型进入训练状态

对BN和dropout有作用，其他的好像没什么用

tudui.eval() # 让模型进入验证评估状态

对BN和dropout有作用，其他的好像没什么用

利用GPU来训练

方法一：

在这些东西后面加.cuda( )

网络模型 tudui = tudui.cuda( ) tudui是模型

数据（输入数据，标签） imgs = imgs.cuda() targets = targets.cuda() 是在训练的for循环里加

损失函数 loss_fn = loss_fn.cuda()

师兄说只要是tensor张量和模型就可以加.cuda

import torch
import torchvision
from torch import nn
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

from model import *

#准备数据集
train_data = torchvision.datasets.CIFAR10('data', train=True, transform=torchvision.transforms.ToTensor(), download=True)
test_data = torchvision.datasets.CIFAR10('data', train=False, transform=torchvision.transforms.ToTensor(), download=True)

#数据集长度
train_data_size = len(train_data)
test_data_size = len(test_data)
print("训练数据集长度：{}".format(train_data_size))
print("测试数据集长度：{}".format(test_data_size))

#加载数据集（Dataloader）
train_dataloader = DataLoader(train_data, batch_size=64)
test_dataloader = DataLoader(test_data, batch_size=64)

#创建网络模型
tudui = Tudui()
if torch.cuda.is_available():#1、网络模型后面加.cuda
    tudui = tudui.cuda()

#损失函数
loss_fn = nn.CrossEntropyLoss()
if torch.cuda.is_available():#2、损失函数后面加.cuda
    loss_fn = loss_fn.cuda()

#优化器
#learning_rate = 0.01
learning_rate = 1e-2
optimizer = torch.optim.SGD(tudui.parameters(), lr=learning_rate)

#参数
total_train_step = 0
total_test_step = 0
epoch = 10

#添加tensorbooard
writer = SummaryWriter("logs/trainlogs")

for i in range(epoch):
    print("-----第{}轮训练-----".format(i+1))

    #训练开始
    tudui.train()#模型进入训练状态
    for data in train_dataloader:
        imgs, targets = data
        if torch.cuda.is_available():#3、数据后面加.cuda
            imgs = imgs.cuda()
            targets = targets.cuda()
        outputs = tudui(imgs)
        loss = loss_fn(outputs, targets)

        #优化器调优
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        total_train_step = total_train_step + 1
        if total_train_step % 100 == 0:
            print("训练次数：{}，Loss：{}".format(total_train_step, loss.item()))
            writer.add_scalar("train_loss", loss.item(), total_train_step)

    #验证集评估
    tudui.eval()#模型进入评估状态
    total_test_loss = 0
    total_accuracy = 0
    with torch.no_grad():
        for data in test_dataloader:
            imgs, targets = data
            if torch.cuda.is_available():#3、数据后面加.cuda
                imgs = imgs.cuda()
                targets = targets.cuda()
            outputs = tudui(imgs)
            loss = loss_fn(outputs, targets)
            total_test_loss = total_test_loss + loss.item()
            accuracy = (outputs.argmax(1) == targets).sum()
            total_accuracy = total_accuracy + accuracy

    print("测试集loss：{}".format(total_test_loss))
    print("测试集正确率: {}".format(total_accuracy / test_data_size))
    total_test_step = total_test_step + 1
    writer.add_scalar("test_loss", total_test_loss, total_test_step)
    writer.add_scalar("test_accuracy", total_accuracy / test_data_size, total_test_step)

    torch.save(tudui, "model/tudui_{}.pth".format(i))

writer.close()

方法二：（常用，可以选择显卡）

#定义训练的设备

device = torch.device("cuda")

device = torch.device("cuda:0") # 对于单显卡来说这两句话是没有区别的

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

tudui = tudui.to(device)

loss_fn = loss_fn.to(device)

imgs = imgs.to(device)

targets = targets.to(device)

import torch
import torchvision
from torch import nn
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

from model import *

#定义训练的设备
#device = torch.device("cpu")
device = torch.device("cuda:0")
#device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

#准备数据集
train_data = torchvision.datasets.CIFAR10('data', train=True, transform=torchvision.transforms.ToTensor(), download=True)
test_data = torchvision.datasets.CIFAR10('data', train=False, transform=torchvision.transforms.ToTensor(), download=True)

#数据集长度
train_data_size = len(train_data)
test_data_size = len(test_data)
print("训练数据集长度：{}".format(train_data_size))
print("测试数据集长度：{}".format(test_data_size))

#加载数据集（Dataloader）
train_dataloader = DataLoader(train_data, batch_size=64)
test_dataloader = DataLoader(test_data, batch_size=64)

#创建网络模型
tudui = Tudui()
tudui = tudui.to(device)

#损失函数
loss_fn = nn.CrossEntropyLoss()
loss_fn = loss_fn.to(device)

#优化器
#learning_rate = 0.01
learning_rate = 1e-2
optimizer = torch.optim.SGD(tudui.parameters(), lr=learning_rate)

#参数
total_train_step = 0
total_test_step = 0
epoh = 10

#添加tensorbooard
writer = SummaryWriter("logs/trainlogs")

for i in range(epoh):
    print("-----第{}轮训练-----".format(i+1))

    #训练开始
    tudui.train()#模型状态
    for data in train_dataloader:
        imgs, targets = data
        imgs = imgs.to(device)
        targets = targets.to(device)
        outputs = tudui(imgs)
        loss = loss_fn(outputs, targets)

        #优化器调优
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        total_train_step = total_train_step + 1
        if total_train_step % 100 == 0:
            print("训练次数：{}，Loss：{}".format(total_train_step, loss.item()))
            writer.add_scalar("train_loss", loss.item(), total_train_step)

    #测试
    tudui.eval()#模型状态
    total_test_loss = 0
    total_accuracy = 0
    with torch.no_grad():
        for data in test_dataloader:
            imgs, targets = data
            imgs = imgs.to(device)
            targets = targets.to(device)
            outputs = tudui(imgs)
            loss = loss_fn(outputs, targets)
            total_test_loss = total_test_loss + loss.item()
            accuracy = (outputs.argmax(1) == targets).sum()
            total_accuracy = total_accuracy + accuracy

    print("测试集loss：{}".format(total_test_loss))
    print("测试集正确率: {}".format(total_accuracy / test_data_size))
    total_test_step = total_test_step + 1
    writer.add_scalar("test_loss", total_test_loss, total_test_step)
    writer.add_scalar("test_accuracy", total_accuracy / test_data_size, total_test_step)

    torch.save(tudui, "model/tudui_{}.pth".format(i))

writer.close()

模型正向推理

模型推理(测试、demo)，利用已经训练好的模型，然后给它提供输入。

import torch
import torchvision
from PIL import Image
from model import *

img_path = "test_imgs/1.jpg"
image = Image.open(img_path)
image = image.convert('RGB') # 变成3通道

transform = torchvision.transforms.Compose([torchvision.transforms.Resize((32, 32)),
                                            torchvision.transforms.ToTensor()])
image = transform(image)

# class Tudui(nn.Module):
#     def __init__(self):
#         super(Tudui, self).__init__()
#         self.model = nn.Sequential(
#             nn.Conv2d(3, 32, 5, 1, 2),
#             nn.MaxPool2d(2),
#             nn.Conv2d(32, 32, 5, 1, 2),
#             nn.MaxPool2d(2),
#             nn.Conv2d(32, 64, 5, 1, 2),
#             nn.MaxPool2d(2),
#             nn.Flatten(),
#             nn.Linear(1024, 64),
#             nn.Linear(64, 10)
#         )
# 
#     def forward(self, x):
#         x = self.model(x)
#         return x

model = torch.load("model/tudui_9.pth", map_location=torch.device('cpu'))
#如果权重是在GPU上训练的，现在要在CPU上做前向推理，那么就要加上这个参数map_location=torch.device('cpu')

image = torch.reshape(image, (1, 3, 32, 32)) #模型的输入必须有一个batchsize
model.eval() #进入推理状态，防止有BN或者Dropout推理出现问题
with torch.no_grad(): # 节约内存和性能
    output = model(image)
print(output)
print(output.argmax(1)) # 返回概率最大的类别序号
所有类别序号：
'airplane'=0，'automobile'=1，'brid'=2，'cat'=3，'deer'=4，
'dog'=5，'frog'=6，'horse'=7，'ship'=8，'truck'=9

开源项目

运行python文件除了在pycharm里运行以外，还可以通过指令在终端直接运行。小土堆最后一节课简单讲了

我的理解是前面的python train.py是让我的代码运行起来，后面的dataroot等等是一些参数传入进去，如果想省事简单一点，就修改代码里的参数，全部加一个default默认值，这样就不需要指定参数传入了，自动使用默认值。

你可能感兴趣的:(深度学习自学,python,学习)

python if用法 IT技术土狗 python从入门到入狱 python
pythonif用法流程控制流程控制即控制流程，具体指控制程序的执行流程，而程序的执行流程分为三种结构：顺序结构（之前我们写的代码都是顺序结构）、分支结构（用到if判断）、循环结构（用到while与for）1、分支结构分支结构就是根据条件判断的真假去执行不同分支对应的子代码2、为什么需要分支结构人类某些时候需要根据条件来决定做什么事情，比如：如果今天下雨，就带伞所以程序中必须有相应的机制来控制计算
嵌入式音频框架alsa学习之pcm状态 Liu-Eleven linux声音框架音视频学习 pcm
/**PCMstate*/typedefenum_snd_pcm_state{/**Open*/SND_PCM_STATE_OPEN=0,/**Setupinstalled*/SND_PCM_STATE_SETUP,/**Readytostart*/SND_PCM_STATE_PREPARED,/**Running*/SND_PCM_STATE_RUNNING,/**Stopped:underru
Effective Modern C++ 条款6：auto推导若非己愿，使用显式类型初始化惯用法举个栗子2 Effective Modern C++c++
更多C++学习笔记，关注wx公众号：cpp读书笔记Item6:Usetheexplicitlytypedinitializeridiomwhenautodeducesundesiredtypes在Item5中解释了比起显式指定类型使用auto声明变量有若干技术优势，但是有时当你想向左转auto却向右转。举个例子，假如我有一个函数，参数为Widget，返回一个std::vector，这里的bool表
python与数值有关的问题 cbxjsdg python
1.复数的问题x=123+456j#后面没加j部分为实数，加j部分为虚数print('实数部分',x.real)#表示实数print('虚数部分',x.imag)#表示虚数2.查看数值的类型a=10b=10.0c=1.99E2#表示1.99*10的二次方的意思，这是科学计数法print('数值为',a,'数值类型为',type(a))print('数值为',b,'数值类型为',type(b))pr
一文看懂PCB和集成电路的关系 boyueqiu9000
一文看懂PCB和集成电路的关系在学习电子的过程中，我们经常看到印制电路板（PCB）和集成电路（IC），很多人对这两个概念“傻傻分不清楚”。其实，他们并没有那么复杂，今天我们就来理清下PCB和集成电路的区别。什么是PCB？PCB（PrintedCircuitBoard），中文名称为印制电路板，又称印刷线路板，是重要的电子部件，是电子元器件的支撑体，是电子元器件电气连接的载体。由于它是采用电子印刷术制
【架构设计】前置知识 GIS程序媛—椰子架构设计架构设计
架构设计是软件开发的进阶技能，需要结合理论知识和实践经验。以下是掌握架构设计所需的前置知识及其重要性，以及学习路径建议：一、基础编程能力1.编程语言与核心概念掌握至少一门主流语言（如Java、Python、C#、Go等），理解其语法、特性及生态。核心概念：面向对象（OOP）、函数式编程（FP）、并发/异步、内存管理等。示例：通过Java理解接口、多态、设计模式。通过Go学习并发模型（Gorouti
Python, C ++开发家庭开支 Geeker-2025 python c++
开发一款**家庭开支数字化记录与结算App**是一个非常有意义的项目，旨在帮助家庭用户高效管理开支、记录消费、分析财务状况，并提供结算和预算管理功能。以下是基于**Python**和**C++**的开发方案，结合两者在数据处理、实时通信和系统开发中的优势。---##1.**项目需求分析**家庭开支数字化记录与结算App的核心功能包括：1.**用户管理**：-用户注册、登录，支持家庭成员管理。2.*
Linux骨灰级玩家修炼秘籍！从零基础到精通，收藏这篇就够了！程序员肉肉 linux 运维服务器网络学习 oracle 数据库
Linux骨灰级玩家修炼秘籍！99.99%的人已跪！Linux运维？想玩转它？那可得经历九九八十一难！咱得把这事儿分成四个阶段：新手村、进阶副本、高手进阶、以及最终的封神之路！之前爆肝半年，搞了篇云计算学习路线，新手直接起飞，从小白到大神！第一阶段：新手村新手村里，你得先把Linux这游戏的基本操作摸透。别急，一步一个脚印，咱得有个路线图。新手上路：Linux的前世今生、基本指令（比如cp、ls、
linux执行python脚本conda库_Pycharm使用远程linux服务器conda/python环境在本地运行的方法(图解）)... weixin_39992462
Pycharm使用远程linux服务器conda/python环境在本地运行的方法(图解))1.首先在PycharmTools->Deployment->Configurations打开新建SFTP输入host:ip地址username密码然后点击TestConnection出现下图，则测试成功因为已经连接成功，这时候已经可以读取远程服务器的目录了：2.选择项目mapping(可以跳过3.在Set
brew mysql client_Mac安装mysqlclient过程解析 weixin_39630440 brew mysql client
尝试在虚拟环境下通过pip安装：pipinstallmysqlclient然后报错：OSError:mysql_confignotfound找到官方文档https://github.com/PyMySQL/mysqlclient-python，解释说安装前需安装另一个模块：brewinstallmysql-connector-c但是报错：查看报错信息，在安装mysql-connector-c前先b
macos安装python-nodejs_MAC平台基于Python Appium环境搭建过程图解 weixin_39612038
前言最近笔者要为python+appium课程做准备，mac在2019年重新安装了一次系统，这次重新在mac下搭建appium环境，刚好顺带写个文稿给大家分享分享搭建过程。一、环境和所需软件概述1.1目前环境：MacOS(10.15.3)1.2所需软件:jdk-8u91-macosx-x64.dmg(jdk1.8及以上版本应该都可以)android-sdk_r24.4.1-macosx.zip(m
python接口自动化全世界最帅的男人 python 自动化开发语言
Python是一种非常流行的编程语言，也是许多接口自动化测试框架的首选语言。下面是一个简单的接口自动化测试框架的思路：1.安装必要的库和工具：在Python中，我们可以使用requests库来发送HTTP请求，使用unittest库来编写测试用例，使用HTMLTestRunner库来生成测试报告。此外，我们还需要安装一个代码编辑器，如PyCharm或VSCode。2.创建测试用例：编写测试用例是接
Python接口自动化花落同学 Python自动化从入门到放弃 python 自动化
4接口自动化4.1使用python实现接口自动化如果不了解接口测试可参考https://ke.qq.com/course/4092904使用Python的request库实现接口测试：importjsonimportrequests#使用session管理：#1.可以自动关联set-cookie里面的内容#2.可以加快与服务器的连接速度session=requests.session()#auth
LLM 大模型技术知识最佳学习路径图发布！ AGI-杠哥学习人工智能语言模型 agi 自然语言处理
近日，经常有小伙伴私信我，大模型知识太多了，有点懵啊，我该如何学习LLM大模型？今天我们就来剖析下LLM大模型技术知识的学习路径。如果你是一个LLM大模型的“技术小白”，我们建议的学习路径如下：技术交流群前沿技术资讯、算法交流、求职内推、算法竞赛、面试交流(校招、社招、实习)等、与10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企开发者互动交流~我们建了大模型技术与面试交流群
人生建议往死里学网络安全！零基础也能跨行学习！！漏洞挖掘还能做副业程序媛西米网络安全网络 web安全安全网络安全计算机
一、网络安全的重要性：从‘不学会被黑’到‘学会保护别人’网络安全的概念现在不再是技术圈的独立话题，它已经渗透到社会的各个领域。从个人的隐私保护、企业的数据安全，到国家的信息防护，网络安全几乎影响了每一个人的生活。无论是黑客攻击、勒索病毒、数据泄露，还是国家间的信息战，网络安全已经成为现代社会的基础设施之一。所以，首先要明白学习网络安全的重要性：你不仅是在学习技术，更多的是在为自己和他人的安全“筑城
Python异步编程：从基础到高级 CarlowZJ python 网络数据库
前言在现代软件开发中，异步编程已经成为一种必不可少的技能。Python的异步编程模型（基于asyncio）为开发者提供了一种高效的方式来处理高并发任务，而无需依赖多线程或多进程。异步编程不仅可以提高程序的性能，还能简化并发代码的复杂性。本文将带你从异步编程的基础概念出发，逐步深入到高级应用，帮助你掌握Python异步编程的核心技能。一、异步编程的基础概念1.1什么是异步编程？异步编程是一种编程范式
[从零开始学习JAVA] Stream流 Cools0613 从0开始学Java 学习
前言：本文我们将学习Stream流，他就像流水线一样，可以对我们要处理的对象进行逐步处理，最终达到我们想要的效果，是JAVA中的一大好帮手，值得我们了解和掌握。（通常和lambda匿名内部类方法引用相配合）Stram流：Stream流的核心思想是函数式编程（注意返回值必须是对象本身才能），它倡导将数据处理过程看作是一系列的转换操作。这种思想与传统的命令式编程方式不同，传统的命令式编程方式强调对数据
python实现接口自动化一只小H呀の python 自动化开发语言
代码实现自动化相关理论代码编写脚本和工具实现脚本区别是啥?代码：优点：代码灵活方便缺点：学习成本高工具：优点：易上手缺点：灵活度低，有局限性。总结：功能脚本：工具自动化脚本：代码代码接口自动化怎么做的？第一步：python+request+unittest;具体描述？第二步：封装、调用、数据驱动、日志、报告;详细举例:第三步：api\scripts\data\log\report\until…脚本
探索Python中的集成方法：Stacking Echo_Wish Python 笔记 Python 算法 python 开发语言
在机器学习领域，Stacking是一种高级的集成学习方法，它通过将多个基本模型的预测结果作为新的特征输入到一个元模型中，从而提高整体模型的性能和鲁棒性。本文将深入介绍Stacking的原理、实现方式以及如何在Python中应用。什么是Stacking？Stacking，又称为堆叠泛化（StackedGeneralization），是一种模型集成方法，与Bagging和Boosting不同，它并不直
【Python】 Stacking: 强大的集成学习方法音乐学家方大刚 Python python 集成学习开发语言
我们都找到天使了说好了心事不能偷藏着什么都一起做幸福得没话说把坏脾气变成了好沟通我们都找到天使了约好了负责对方的快乐阳光下的山坡你素描的以后怎么抄袭我脑袋想的薛凯琪《找到天使了》在机器学习中，单一模型的性能可能会受到其局限性和数据的影响。为了解决这个问题，我们可以使用集成学习（EnsembleLearning）方法。集成学习通过结合多个基模型的预测结果，来提高整体模型的准确性和稳健性。Stacki
llama源码学习·model.py[3]ROPE旋转位置编码(2)旋转角度生成代码小杜不吃糖 llama
一、源码注释defprecompute_freqs_cis(dim:int,end:int,theta:float=1000.0):'''预先计算频率和复数的cosine和sine值，用于后续的PositionalEncodingdim:维度end:一个序列的最大长度或位置的最大值theta:用于计算频率的超参数，默认值为1000.0'''#生成一个等比数列，即频率（frequencies），这种
minimind2学习：（1）训练溯源006 minimind学习学习深度学习生成模型
1、数据下载参考：https://github.com/jingyaogong/minimind/tree/master2、预训练训练6个epochspythontrain_pretrain.py--epochs6训练过程：LLM总参数量：25.830百万Epoch:[1/6](0/11040)loss:8.940lr:0.000550000000epoch_Time:106.0min:Epoch
使用Seaborn库中的`violinplot`函数绘制水平小提琴图（Violin Plot）是一种常见的数据可视化方法 code_welike 信息可视化数据分析数据挖掘 Python
使用Seaborn库中的violinplot函数绘制水平小提琴图（ViolinPlot）是一种常见的数据可视化方法。水平小提琴图可以展示数据的分布特征，并可以对比不同组别之间的差异。本文将介绍如何使用Python和Seaborn库绘制水平小提琴图，并提供相应的源代码示例。首先，我们需要确保已经安装了Seaborn库。可以使用以下命令在Python中安装Seaborn：pipinstallseabo
Stacking算法：集成学习的终极武器 civilpy 算法集成学习机器学习
Stacking算法：集成学习的终极武器在机器学习的竞技场中，集成学习方法以其卓越的性能而闻名。其中，Stacking（堆叠泛化）作为一种高级集成技术，更是被誉为“集成学习的终极武器”。本文将带你深入了解Stacking算法的原理和实现，并提供一些实战技巧和最佳实践。1.Stacking算法原理探秘Stacking算法的核心思想是训练多个不同的基模型，并将它们的预测结果作为新模型的输入特征，以此来
MiniMind 亚伯拉罕·黄肯大模型人工智能
数据集分类：tokenizer训练集：这个数据集用于训练分词器（tokenizer），是文本处理中的一个重要步骤。它可以帮助模型更好地理解文本数据的结构。Pretrain数据：这是用于预训练模型的数据集，它可以帮助模型学习语言的基本结构和特征。SFT数据：SFT（SupervisedFine-Tuning）数据集，用于监督式微调，可以提高模型在特定任务上的性能。DPO数据1和DPO数据2：这两个数
集成学习（上）：Bagging集成方法万事可爱^ 机器学习修仙之旅 #监督学习集成学习机器学习人工智能 Bagging 随机森林
一、什么是集成学习？在机器学习的世界里，没有哪个模型是完美无缺的。就像古希腊神话中的"盲人摸象"，单个模型往往只能捕捉到数据特征的某个侧面。但当我们把多个模型的智慧集合起来，就能像拼图一样还原出完整的真相，接下来我们就来介绍一种“拼图”算法——集成学习。集成学习是一种机器学习技术，它通过组合多个模型（通常称为“弱学习器”或“基础模型”）的预测结果，构建出更强、更准确的学习算法。这种方法的主要思想是
直方图梯度提升：大数据时代的极速决策引擎万事可爱^ 大数据机器学习深度学习直方图梯度提升 GBDT 算法
一、为什么需要直方图梯度提升？在Kaggle竞赛的冠军解决方案中，超过70%的获奖方案都使用了梯度提升算法。但当数据量突破百万级时，传统梯度提升树（GBDT）面临三大致命瓶颈：训练耗时剧增：每个特征的分割点计算都需要全量数据排序内存消耗爆炸：存储排序后的特征值需要额外空间处理效率低下：无法有效利用现代CPU的多核特性而梯度提升决策树（GBDT）作为集成学习的代表算法，通过迭代构建决策树实现预测能力
【集成学习】：Stacking原理以及Python代码实现 Geeksongs 机器学习 python 机器学习深度学习人工智能算法
Stacking集成学习在各类机器学习竞赛当中得到了广泛的应用，尤其是在结构化的机器学习竞赛当中表现非常好。今天我们就来介绍下stacking这个在机器学习模型融合当中的大杀器的原理。并在博文的后面附有相关代码实现。总体来说，stacking集成算法主要是一种基于“标签”的学习，有以下的特点：用法：模型利用交叉验证，对训练集进行预测，从而实现二次学习优点：可以结合不同的模型缺点：增加了时间开销，容
使用Seaborn绘制水平小提琴图 YOUFDJ python 开发语言 Python
使用Seaborn绘制水平小提琴图水平小提琴图是一种常用的数据可视化工具，可以用于展示不同类别之间的分布情况。在Python中，我们可以使用Seaborn库的catplot函数来轻松地绘制水平小提琴图。本文将介绍如何使用Seaborn绘制水平小提琴图，并附带相应的源代码示例。首先，确保你已经安装了Seaborn库。如果没有安装，可以使用以下命令在命令行中安装：pipinstallseaborn安装
Python文件与格式化：编程世界的“读写之道“（技术深挖版）被窝妄想家 python进阶指南 python 数据库开发语言
一、文件操作：Python的"读写之眼"1.1文件基础哲学在计算机世界中，文件就像一本本等待翻阅的典籍。Python的open()函数如同手持放大镜，让我们能精确控制阅读和书写：#经典打开模式组合withopen("data.txt","r+",encoding="utf-8")asf:#r+模式：可读可写，文件指针初始位置在开头content=f.read(10)#读取前10个字节f.seek(
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S

Pytorch学习

pytorch加载数据

Dataset （一般来说Dataset都自己写，然后继承自Dataset）

读取一张图片

读取一个文件夹里的所有图片的文件名，并放到一个列表

创建数据集（一般来说Dataset都自己写，然后继承自Dataset）

Dataloader （拆分成多个batch）（输出的tensor都是NCHW维度的）

DataLoader的使用

导入并实例化DataLoader

数据集中数据的读取

DataLoader中数据的读取

使用tensorboard可视化效果

改变shuffle

import os os库的用法

TensorBoard

writer.add_scalar( ) 遇到报错或者不知道参数可以点进去看看函数注释

writer.add_image( ) 遇到报错或者不知道参数可以点进去看看函数注释

torchvision

torchvision 中的 transforms

ToTensor

用PIL的Image来读取图片 读取出来是RGB格式，HWC格式, 0~255

用opencv的CV2的imread来读取图片 读取出来是BGR格式，HWC格式，0-255

用tensorboard来显示tensor格式的图片

Normalize输入图片归一化

Resize修改图片尺寸

Compose组合

RandomCrop 随机裁剪

总结

torchvision中的标准数据集Datasets

数据集下载

pycharm在线下载（下载速度较快时）

第三方下载

数据集的下载总结

CIFAR10的具体使用

数据集对象的显示（PIL型）

把数据集中的图片对象转换为tensor型

转换所需transform的定义

torchvision中现有网络模型的使用与修改

RGB格式和BGR格式之间的互相转换

PNG格式的图片需要去掉透明度通道

PNG格式图片4通道变RGB3通道方法

神经网络基本骨架 torch.nn.Module 官方文档

自定义搭建神经网络

神经网络之卷积操作

两种2d卷积的实现方式

torch.nn.functional.conv2d方法介绍

使用该方法需要引入的参数

关于对input和weight的shape详解

input的shape要求：

weight的shape要求：

torch.nn.Conv2d

最大池化（下采样）

torch.cat([feature_B,feature_D],1)

非线性激活

ReLu

Sigmoid

Batch-norm 官方文档

全连接层

Sequential的使用

Example

实战神经网络搭建以及sequential的使用

tensorboard SummaryWriter中的add_gragh可视化神经网络模型

损失函数

L1loss nn.L1Loss 绝对值误差

MSE损失函数（均方误差）MSELoss

使用交叉熵损失函数CrossEntropyLoss

优化器，梯度下降

模型的保存与加载

保存和加载checkpoint

保存checkpoints

加载checkpoints

完整的模型小项目

model.py

train.py （CPU训练）

张量.argmax(1)的用法，返回最大值对应的序号

tudui.train() # 让模型进入训练状态

tudui.eval() # 让模型进入验证评估状态

利用GPU来训练

方法一：

方法二：（常用，可以选择显卡）

用PIL的Image来读取图片读取出来是RGB格式，HWC格式, 0~255

用opencv的CV2的imread来读取图片读取出来是BGR格式，HWC格式，0-255