AnZhiJiaShu

Pytorch个人学习笔记

Pytorch 个人学习笔记

Pytorch官方文档
Pytorch中文官方文档
参考哔哩哔哩的up主：我是土堆，视频链接
代码均来自：我是土堆，视频链接

文章目录

Pytorch 个人学习笔记
1. Pytorch 环境配置
- 1.1 安装 anaconda
- - 1.1.1 管理conda
  - 1.1.2 管理环境
- 1.2 配置显卡
- 1.3 安装 pytorch
- - 1.3.1 准备工作
  - 1.3.2 安装pytorch
  - 1.3.3 检验gpu是否可用
  - 1.3.4 解决安装时下载慢的问题：
  - 1.3.5 python学习中的两大法宝函数
  - 1.3.6 安装 jupyter
2. Pytorch入门实战
- 2.1 Pytorch加载数据初识
- - 2.1.1 Dataset
  - 2.1.2 Dataloader
- 2.2 Tensorboard 的使用
- 2.3 Transformers 的使用
- - 2.3.1 Transforms 简介
  - 2.3.2 Transforms 运行机制
  - 2.3.3 土堆 Transforms 的例子
  - 2.3.4 常见的Transformers
  - 2.3.5 使用Transformers需要注意的点
- 2.4 torchvision中的数据集使用
- 2.5 神经网络基础
- - 2.5.1 神经网络的基本骨架——nn.Module 的使用
  - 2.5.2 神经网络——卷积层
  - 2.5.3 神经网络——最大池化的使用
  - 2.5.4 神经网络——非线性激活
  - 2.5.5 神经网络——线性层
  - 2.5.6 神经网络——torch.nn.Sequential
  - 2.5.7 神经网络——搭建小实战
  - 2.5.8 损失函数与反向传播
  - 2.5.9 优化器
  - 2.5.10 现有网络模型的使用及修改
  - 2.5.11 网络模型的保存与读取
- 2.6 完整的模型训练套路
- 2.7 GPU训练
- - 2.7.1 GPU训练方式1：
  - 2.7.2 GPU训练方式2：
  - 2.7.3 GPU训练note：
- 2.8 完整的模型验证套路

1. Pytorch 环境配置

1.1 安装 anaconda

anaconda installer 网站
安装anaconda可参考该文章
Anaconda是一个包含180+的工具包及其依赖项的发行版本，其包含的工具包包括：conda, numpy, scipy, ipython notebook等。也就是说安装了anaconda 就安装了许多 package，包括 python之类的。

1.从官网下载 anaconda3
①. 我本机的 windows系统的 python 版本是：python 3.8.10，因此我下载的anaconda 是：Anaconda3-2021.05-Windows-x86_64.exe 。
②. 远程服务器是linux系统，我下载的是：Anaconda3-2021.05-Linux-x86_64.sh

2.安装anaconda：
a. windows下安装
windows下安装anaconda时需要注意：（1）记住安装路径（2）跳过Visual Stutio Code，剩下的选项默认即可。

b. linux下安装anaconda
①下载安装包

wget https://repo.anaconda.com/archive/Anaconda3-2021.05-Linux-x86_64.sh

② 需要首先赋权再执行安装程序，依次输入下面两条命令：

chmod +x Anaconda3-2021.05-Linux-x86_64.sh
./Anaconda3-2021.05-Linux-x86_64.sh

③ 设置环境变量：

export PATH="/disk/wangzy/anaconda3/bin:$PATH"
export PATH="$PATH: /disk/wangzy//anaconda/bin"

3. 检验是否安装成功
点击 Anaconda Prompt，有"(base)"则表明安装成功。

或者在终端中输入命令 conda list ，如果Anaconda被成功安装，则会显示已经安装的包名和版本号。

1.1.1 管理conda

Windows打开“Anaconda Prompt”；macOS和Linux用户打开“Terminal”（“终端”）进行操作。

1.验证conda已被安装

在终端输入如下指令：

conda --version

终端上将会以 conda 版本号的形式显示当前安装conda的版本号。

2. 更新conda至最新版本

conda update conda

执行命令后，conda将会对版本进行比较并列出可以升级的版本。同时，也会告知用户其他相关包也会升级到相应版本。
当较新的版本可以用于升级时，终端会显示 Proceed ([y]/n)? ，此时输入 y 即可进行升级。

3.查看conda帮助信息

conda --help

或

conda -h

4.卸载conda

① Linux 或 macOS

rm -rf ~/anaconda3

即删除Anaconda的安装目录。

② Windows
控制面板 → 添加或删除程序 → 选择“Python X.X (Anaconda)” → 点击“删除程序”
注意：
① Python X.X：即Python的版本，如：Python 3.8。
② Windows 10的删除有所不同。

1.1.2 管理环境

1.创建新环境

conda create --name <env_name> <package_names>

▫ 即创建的环境名。建议以英文命名，且不加空格，名称两边不加尖括号“<>”。
▫ 即安装在环境中的包名。名称两边不加尖括号“<>”。

① 如果要安装指定的版本号，则只需要在包名后面以 = 版本号的形式执行。如： conda create --name/n pytorch python=3.8 ，即创建一个名为“pytorch”的环境，环境中安装版本为3.8的python。

② 如果要在新创建的环境中创建多个包，则直接在后以空格隔开，添加多个包名即可。如： conda create -n pytorch python=3.5 numpy pandas ，即创建一个名为 "pytorch” 的环境，环境中安装版本为3.5的python，同时也安装了numpy和pandas。
▫ --name 同样可以替换为 --n 。

note：默认情况下，新创建的环境将会被保存在 /Users//anaconda3/env 目录下，其中，为当前用户的用户名。

2.激活环境

conda activate <env_name>

3.退出环境至root

conda deactivate

4.显示已创建环境

conda info --envs

或

conda info -e

或

conda env list

结果中星号“*”所在行即为当前所在环境。

5.复制环境

conda create --name <new_env_name> --clone <copied_env_name>

注意：
① 即为被复制/克隆环境名。环境名两边不加尖括号“<>”。
② 即为复制之后新环境的名称。环境名两边不加尖括号“<>”。
③ conda create --name py2 --clone python2 ，即为克隆名为“python2”的环境，克隆后的新环境名为“py2”。此时，环境中将同时存在“python2”和“py2”环境，且两个环境的配置相同。

6.删除环境

conda remove --name <env_name> --all

注意：为被删除环境的名称。环境名两边不加尖括号“<>”。

1.2 配置显卡

gpu适合于张量计算，能加速深度学习模型的训练过程，配置显卡主要是：
显卡驱动+CUDA Tookit，CUDA Tookit 能够根据 pytorch 一键安装，所以这里我们主要检查显卡的驱动是否正确安装。
1.检查显卡驱动是否正确安装
打开任务管理器，在性能选项卡中查看，如果GPU正常运转则表明显卡驱动安装成功。

1.3 安装 pytorch

1.3.1 准备工作

1.创建一个名为pytorch（也可以叫别的名字）的虚拟环境

conda create --n pytorch python=3.8

2.激活pytorch环境

conda activate pytorch

3.查看该环境中所装的包

pip list

最开始没安装pytorch的时候，会发现没有名字为 ”torch“ 的包，所以接下来要安装pytorch

1.3.2 安装pytorch

pytorch官网进行安装

note: cuda
首先需要了解我们的GPU的型号，以及是否支持cuda
①. 点击任务管理器查看自己GPU的型号（NVIDA是独立显卡）：

②. 点击官网看自己的GPU是否支持CUDA
③. 重要！！！！ 看自己的驱动版本
在命令行敲 nvidia-smi，查看驱动版本Driver Version，cuda 9.2以上只支持驱动版本大于392.26，否则需要升级驱动。升级驱动可以在英伟达的官网下载驱动进行下载安装。
下图是我本机的驱动版本

下图是实验室服务器的驱动版本：

在windows上安装pytorch，本机我安装的pytorch版本是1.8.0，cudatookit是10.2

conda install pytorch==1.8.0 torchvision==0.9.0 torchaudio==0.8.0 cudatoolkit=10.2 -c pytorch

安装完成后，输入pip list，查看是否安装成功

在服务器上我安装的是：

conda install pytorch==1.7.0 torchvision==0.8.0 torchaudio==0.7.0 cudatoolkit=10.1 -c pytorch

1.3.3 检验gpu是否可用

敲如下命令：

python
import torch
torch.cuda.is_available()

输出为 true 则可用

1.3.4 解决安装时下载慢的问题：

方法① 加载清华源：在 base环境中输入如下命令

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/

安装pytorch时，官网命令：

conda install pytorch==1.8.0 torchvision==0.9.0 torchaudio==0.8.0 cudatoolkit=10.2 -c pytorch

若用清华源下载的话把 -c pytorch 去掉

方法② 自己将安装包下载后放到anaconda 的 pkgs目录

1.3.5 python学习中的两大法宝函数

dir() 函数，能让我们知道工具箱以及工具箱中的分隔区有什么东西。
help()函数，能让我们知道每个工具箱是如何使用的，工具的使用方法。
实例：dir(torch)，能够看到里面有很多工具箱，其中有一个cuda

我们还想知道’cuda’ 里面有什么，继续使用

import torch
dir(torch.cuda)

可以看到里面有’is_available‘，继续查看

import torch
dir(torch.cuda.is_available)

可以看到里面有很多前后双下划线，是一种规范，表示不能修改。

这说明 is_available 不再是一个分隔区，而是一个确确实实的函数，函数是一个道具，我们就能够用help()查看他的使用方法。

1.3.6 安装 jupyter

1.anaconda下自带jupyter，但是仍需要在pytorch环境中安装一下。
激活pytorch环境之后，输入如下指令：

conda install nb_conda

2.启动jupyter notebook

jupyter notebook

3.启动jupyter notebook后核选择pytorch

2. Pytorch入门实战

ctrl+p 能知道方法需要哪些参数

2.1 Pytorch加载数据初识

下图来自：https://blog.csdn.net/weixin_43135178/article/details/115230710

Dataset 与 Dataloader:

Dataset：提供一种方式去获取数据及其 label。需要实现以下两个方法：
①：如何获取每一个数据及其label
②：告诉我们总共有多少数据。（这样在神经网络训练时才知道如何去迭代）
Dataset的一个示例：有图片有label
Dataloader：为后面的网络提供不同的数据形式。

PyTorch为我们提供的两个Dataset和DataLoader类分别负责可被Pytorhc使用的数据集的创建以及向训练传递数据的任务。如果想个性化自己的数据集或者数据传递方式，也可以自己重写子类。

2.1.1 Dataset

1.Pytorch内置数据集
如CIFAR10在PyTorch中CIFAR10是一个写好的Dataset，在使用时只需以下代码：

data = torchvision.datasets.CIFAR10("./data/", transform=transform, train=True, download=True)

torchvision.datasets.CIFAR10就是一个Datasets子类，data是这个类的一个实例。

我们有的时候需要用自己在一个文件夹中的数据作为数据集，这个时候，我们可以使用ImageFolder这个方便的API。

FaceDataset = torchvision.datasets.ImageFolder('./data', transform=img_transform)

如何自定义一个数据集
torch.utils.data.dataset 是一个表示数据集的抽象类。任何自定义的数据集都需要继承这个类并覆写相关方法。
数据集其实就是一个负责处理索引(index)到样本(sample)映射的一个类(class)。

Pytorch提供两种数据集:

Map式数据集
一个Map式的数据集必须要重写__getitem__(self, index),len(self) 两个内建方法，用来表示从索引到样本的映射（Map)。举个例子，dataset[idx]表示从硬盘中读取数据集中第 idx 张图片及其标签；len(dataset)会返回这个数据集的容量。
Iterable式数据集
一个Iterable（迭代）式数据集是抽象类data.IterableDataset的子类，并且覆写了__iter__方法成为一个迭代器。这种数据集主要用于数据大小未知，或者以流的形式的输入，本地文件不固定的情况，需要以迭代的方式来获取样本索引。

自定义数据集示例，新建一个read_data.py文件，运行以下代码，运行结果是数据集的长度。

from torch.utils.data import Dataset #这个包是必须的
from PIL import Image
import os #python中的一个系统库，用于获取地址
class MyData(Dataset): #集成Dataset类
    def __init__(self, root_dir, label_dir): #初始化函数，当创建类时，必运行的函数，为整个class提供一个全局变量
        self.root_dir=root_dir     #初始化root_dir
        self.label_dir=label_dir   #初始化label_dir
        self.path=os.path.join(self.root_dir,self.label_dir) #初始化图片地址
        self.img_path=os.listdir(self.path) # 返回一个包含文件夹中所有文件名的一个list

    #__getitem__：supporting fetching a data sample for a given key.
    def __getitem__(self, idx): #第二个参数默认是item，将其改为idx，表示索引
        img_name=self.img_path[idx] #通过索引获取图片名称（img_path是一个list）
        img_item_path=os.path.join(self.root_dir,self.label_dir,img_name) #获取一个具体样本的路径
        img=Image.open(img_item_path) #打开图片，#打开图片，Image.open打开的img是PIL数据类型
        label=self.label_dir #获取图片的标签
        return img,label  #返回图片与标签，img是tensor数据类型

    #返回列表list的长度，即获取数据集长度
    def __len__(self):
        return len(self.img_path)

root_dir = '../dataset/train'
ants_label_dir = "ants_image"
bees_label_dir = "bees_image"
ants_dataset = MyData(root_dir,ants_label_dir) #实例化一个蚂蚁数据集，传入root_dir与label_dir
bees_dataset = MyData(root_dir,bees_label_dir) #实例化一个蜜蜂数据集，传入root_dir与label_dir
train_dataset = ants_dataset+bees_dataset #将两个数据集合并为一个训练集
img,label=train_dataset[0]
print(type(img)) #
print(len(train_dataset)) #输出数据集长度：245

运行结果：

2.1.2 Dataloader

1.torch.utils.data.DataLoade功能： Combines a dataset and a sampler, and provides an iterable over the given dataset。构建可迭代的数据装载器。
dataset只是告诉程序data的位置。可以想象成我们在打扑克牌，那么dataset就是这一幅扑克牌。dataloader是一个loader，把数据加载到神经网络中，比如将手看作神经网络，那么dataloader做的事就是没错从dataset中取数据，那么每次取多少，如何取数据这个过程是由dataloader中的参数设置的。
一般来说PyTorch中深度学习训练的流程是这样的：

创建Dateset Dataset
传递给DataLoader
DataLoader迭代产生训练数据提供给模型

对应的一般都会有这三部分代码

# 创建Dateset(可以自定义)     
dataset = MyData #2.1.1节定义的
#Dataset传递给DataLoader     
dataloader = torch.utils.data.DataLoader(dataset,batch_size=64,shuffle=False,num_workers=0)
# DataLoader迭代产生训练数据提供给模型     
for i in range(epoch):
        for index,(img,label) in enumerate(dataloader):
            pass ##DataLoader迭代产生训练数据提供给模型

Dataset负责建立索引到样本的映射，DataLoader负责以特定的方式从数据集中迭代的产生一个个batch的样本集合。在enumerate过程中实际上是dataloader按照其参数sampler规定的策略调用了其dataset的getitem方法。

2. 参数介绍

DataLoader(dataset, batch_size=1, shuffle=False, sampler=None,
           batch_sampler=None, num_workers=0, collate_fn=None,
           pin_memory=False, drop_last=False, timeout=0,
           worker_init_fn=None)

参数介绍：

dataset (Dataset) – 定义好的Map式或者Iterable式数据集。
batch_size (python:int, optional) – 一个batch含有多少样本（每次打牌取几张） (default: 1)。
shuffle (bool, optional) – 每一个epoch的batch样本是相同还是随机（洗牌）(default: False)。
sampler (Sampler, optional) – 决定数据集中采样的方法. 如果有，则shuffle参数必须为False。
batch_sampler (Sampler,optional) – 和 sampler 类似，但是一次返回的是一个batch内所有样本的index。和 shuffle, sampler, and drop_last 三个参数互斥。
num_workers (python:int, optional) – 多少个子程序同时工作来获取数据，多线程。 (default: 0)
collate_fn (callable, optional) – 合并样本列表以形成小批量。
pin_memory (bool, optional) –如果为True，数据加载器在返回前将张量复制到CUDA固定内存中。
drop_last (bool, optional) –如果数据集大小不能被batch_size整除，设置为True可删除最后一个不完整的批处理。如果设为False并且数据集的大小不能被batch_size整除，则最后一个batch将更小。(default: False)
timeout (numeric, optional) –如果是正数，表明等待从worker进程中收集一个batch等待的时间，若超出设定的时间还没有收集到，那就不收集这个内容了。这个numeric应总是大于等于0。(default: 0)
worker_init_fn (callable, optional) – 每个worker初始化函数(default: None)

其中，采样器 sampler 是重点参数，它是一个迭代器。PyTorch提供了多种采样器，用户也可以自定义采样器。所有sampler都是继承 torch.utils.data.sampler.Sampler这个抽象类。

参考：https://www.cnblogs.com/yanghh/p/14074744.html
DataLoader 本质上就是一个 iterable（内部定义了 __iter__ 方法），__iter__ 被定义成生成器，使用 yield 来返回数据，并利用多进程来加速 batch data 的处理，DataLoader 组装好数据后返回的是 Tensor 类型的数据。
note：DataLoader 是间接通过 Dataset 来获得数据的，然后进行组装成一个 batch 返回，因为采用了生成器，所以每次只会组装一个 batch 返回，不会一次性组装好全部的 batch，所以 DataLoader 节省的是 batch 的内存，并不是指数据集的内存，数据集可以一开始就全部加载到内存里，也可以分批加载，这取决于 Dataset 中 __init__ 函数的实现。

示例代码1：来自：https://www.cnblogs.com/yanghh/p/14074744.html

import torch
import numpy as np
from torch.utils.data import Dataset
from torch.utils.data import DataLoader
 
class DiabetesDataset(Dataset):
    def __init__(self, filepath):
        # 因为数据集比较小，所以全部加载到内存里了
        data = np.loadtxt(filepath, delimiter=',', dtype=np.float32)
        self.len = data.shape[0]
        self.x_data = torch.from_numpy(data[:,:-1])
        self.y_data = torch.from_numpy(data[:,[-1]])
 
    def __getitem__(self, index):
        return self.x_data[index], self.y_data[index]
 
    def __len__(self):
        return self.len
 
dataset = DiabetesDataset('diabetes.csv.gz')
train_loader = DataLoader(dataset=dataset,   # 传递数据集
                          batch_size=32,     # 小批量的数据大小，每次加载一batch数据
                          shuffle=True,      # 打乱数据之间的顺序
                          num_workers=2)     # 使用多少个子进程来加载数据，默认为0, 代表使用主线程加载batch数据
 
for epoch in range(100):  # 训练 100 轮
    for i, data in enumerate(train_loader, 0):  # 每次惰性返回一个 batch 数据
        iuputs, label = data

示例代码2：来自土堆
新建一个test_dataloader.py文件

import torchvision
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

#准备的测试数据集,并且通过torchvision.transforms.ToTensor()将数据集转化为tensor类型
test_data=torchvision.datasets.CIFAR10("./dataset",train=False,transform=torchvision.transforms.ToTensor())

#每批64张图片，drop_last=False代表如果最后一批不满64张也列出来，shuffle代表洗牌
test_loader=DataLoader(dataset=test_data,batch_size=64,shuffle=True,num_workers=0,drop_last=False)

#测试数据集中第一张图片及label
img,label=test_data[0]
print(img.shape) #torch.Size([3, 32, 32]) RGB图像，3通道，大小为52×52
print(type(img)) #tensor数据类型，
print(label)    #输出图片的label

writer=SummaryWriter("dataloader") #在这里dataloader是一个存放日志记录的文件夹，即日志保存的路径名
'''
SummaryWriter 将entries直接写入日志目录中的事件文件，以供TensorBoard使用。
“SummaryWriter”类提供了一个高级API，用于在给定目录中创建事件文件，并向其中添加摘要和事件。
该类异步更新文件内容。这允许训练程序调用方法，直接从训练循环向文件添加数据，而不会减慢训练速度。
'''
step=0
for data in test_loader:
    imgs,labels=data #，img是tensor数据类型
    writer.add_images(tag="testdata",img_tensor=imgs,global_step=step) #Add batched image data to summary，"testdata"是一个tag,每批是64张图片，将这64张图片进行叠加.
    step+=1
print(step) #输出为157

#测试shuffle，每轮epoch都洗一次牌
for epoch in range(2):
    step = 0
    for data in test_loader:
        imgs, labels = data  # ，img是tensor数据类型
        writer.add_images("Epoch{}".format(epoch), imgs,step)  # Add batched image data to summary，"testdata"是一个tag,每批是64张图片，将这64张图片进行叠加.
        step += 1

writer.close()

在终端打开tensorboard

tensorboard --logdir="test1\dataloader" --port=6008

点击链接，在tensorboard中进行查看
1.testdata：因为drop_last=False，所以最后一个step不满64张。

2.Epoch0，Epoch1：因为shuffle=True，所以每个Epoch相同 step 的图片也不一样。

2.2 Tensorboard 的使用

tensorBoard 作为一款与Tensorflow配套的可视化工具，其目的是方便用户理解、调试与优化深度神经网络，其记录了训练过程的相关信息，并将其可视化表现。利用它，我们可以直观地感受网络参数的变化与分布，Loss值的下降，训练集与验证集Accuracy在模型更新过程中的变化。
TensorBoard 是 TensorFlow 中强大的可视化工具，支持标量、文本、图像、音频、视频和 Embedding 等多种数据可视化。
在 PyTorch 中也可以使用 TensorBoard，具体是使用 TensorboardX 来调用 TensorBoard。除了安装 TensorboardX，还要安装 TensorFlow 和 TensorBoard，其中 TensorFlow 和 TensorBoard 需要一致。
TensorBoardX 可视化的流程需要首先编写 Python 代码把需要可视化的数据保存到 event file 文件中，然后再使用 TensorBoardX 读取 event file 展示到网页中。

安装tensorboard:

pip install tensorboard

测试tensorbaord，创建一个test_tensorboard.py文件，输入以下代码

from torch.utils.tensorboard import SummaryWriter
import numpy as np
from PIL import Image

'''
SummaryWriter 将entries直接写入日志目录中的事件文件，以供TensorBoard使用。
“SummaryWriter”类提供了一个高级API，用于在给定目录中创建事件文件，并向其中添加摘要和事件。
该类异步更新文件内容。这允许训练程序调用方法，直接从训练循环向文件添加数据，而不会减慢训练速度。
'''
writer=SummaryWriter("logs") #将事件写入logs文件夹中

'''在tensorbaord中写入一个scalar标量'''
#scalar_value对应y轴，global_step对应x轴，绘制y=2x
for i in range(100):
    writer.add_scalar(tag="y=2x" ,scalar_value=2*i, global_step=i)


'''在tensorbaord中写入一个图片'''
image_path ="../dataset/train/ants_image/5650366_e22b7e1065.jpg"
image_PIL=Image.open(image_path) #打开图片，在这里，image_PIL是一个PIL数据类型，不满足add_image的数据类型要求
print(type(image_PIL))#
image_array=np.array(image_PIL) #因此要将image_PIL数据类型转换为 numpy.array
print(type(image_array))#
writer.add_image(tag="test",img_tensor=image_array,global_step=1,dataformats='HWC')
#img_tensor可以是这几种数据类型：torch.Tensor, numpy.array, or string/blobname
#img_tensor默认形状是“（3，H,W）”
# You can use ``torchvision.utils.make_grid()`` to convert a batch of tensor into 3xHxW format or call ``add_images`` and let us do the job.
# Tensor with :math:`(1, H, W)`, :math:`(H, W)`, :math:`(H, W, 3)` is also suitable as long as corresponding ``dataformats`` argument is passed, e.g. ``CHW``, ``HWC``, ``HW``
#因为numpy.arry是(HWC),所以将dataformats设置为'HWC'

writer.close()

在终端敲tensorboard --logdir="test1\logs" --port=6008

点击链接，查看tensorboard内容

若在服务器上运行的 tensorboard，需要在本地查看时，需要在本地连接服务器，打开cmd，敲如下命令：

ssh -L 16007:127.0.0.1:6006 -p server_port username@server_ip

16007是服务器上运行的tensorboard的端口号，6007是映射到本地的端口号，例如，我敲的是：
ssh -L 6008:127.0.0.1:6008 -p 23765 [email protected]

然后在本地的浏览器输入:http://localhost:6008

2.3 Transformers 的使用

torchvision中的transforms主要是对图片进行一些变换
· 图片——>transform工具包处理——>结果

2.3.1 Transforms 简介

transforms在计算机视觉工具包torchvision下：

torchvision.transforms : 常用的图像预处理方法
torchvision.datasets : 常用数据集的dataset实现，MNIST，CIFAR-10，ImageNet等
torchvision.model : 常用的模型预训练，AlexNet，VGG， ResNet，GoogLeNet等

torchvision.transforms : 常用的图像预处理方法，提高泛化能力：• 数据中心化 • 数据标准化 • 缩放 • 裁剪 • 旋转 • 翻转 • 填充 • 噪声添加 • 灰度变换 • 线性变换 • 仿射变换 • 亮度、饱和度及对比度变换

相当于真正高考前做的三年高考五年模拟，五年高考是原始数据，三年模拟是在原题基础上改的模拟题。

2.3.2 Transforms 运行机制

采用transforms.Compose()，将一系列的transforms有序组合，实现时按照这些方法依次对图像操作。

train_transform = transforms.Compose([
    transforms.Resize((32, 32)),  # 缩放
    transforms.RandomCrop(32, padding=4),  # 随机裁剪
    transforms.ToTensor(),  # 图片转张量，同时归一化0-255 ---》 0-1
    transforms.Normalize(norm_mean, norm_std),  # 标准化均值为0标准差为1
])

2.3.3 土堆 Transforms 的例子

在这里通过transfrom.totensor去回答两个问题：

tranasforms如何使用
为何需要tensor数据类型

① 问题1：transform如何使用。新建一个test_transform.py文件，输入以下代码：

from torchvision import transforms
from PIL import Image
from torch.utils.tensorboard import SummaryWriter

img_path="../dataset/train/ants_image/0013035.jpg"
img=Image.open(img_path) #Image是python内置的,open根据路径打开图片
print(type(img))  #因为image是from PIL import Image，所以img是个PIL类型，不满足SummaryWriter.add_image中的参数“img_tensor”所要求的类型，所以需要转换

writer=SummaryWriter("transform_logs") #将日志文件记录在 transform_logs文件夹下

'''class ToTensor: Convert a ``PIL Image`` or ``numpy.ndarray`` to tensor.'''
to_tensor=transforms.ToTensor()#ToTensor必须声明，否则会报错。利用transforms.ToTensor()将 img转换为tensor数据类型
tensor_image=to_tensor(img)#利用transforms.ToTensor()将 img转换为tensor数据类型
print(type(tensor_image))#输出tensor数据类型

writer.add_image(tag="tensorimage",img_tensor=tensor_image)
writer.close()

tensorboard打开日志文件查看：
tensorboard --logdir="test1\transform_logs"

上述transforms的用法可以用下图进行描述：

② 问题2：为何需要tensor数据类型。
tensor数据类型包装了神经网络所需要的一系列参数。 ，所以在神经网络中必定会用到 tensor 数据类型。
图源：https://pytorch.zhangxiann.com/1-ji-ben-gai-nian/1.2-tensor-zhang-liang-jie-shao

新建一个test_totensor.py文件，输入下列代码

import cv2
from PIL import Image
from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms

img_pth="../dataset/train/ants_image/0013035.jpg" #图片路径
img=Image.open(img_pth)
print(type(img)) #

#ToTensor：Convert a ``PIL Image`` or ``numpy.ndarray`` to tensor. This transform does not support torchscript.
#numpy.ndarray这种数据类型可以通过opencv来创建,要import cv2
img_np=cv2.imread(img_pth) #opencv的imread打开图片是np形式的
print(type(img_np)) #

writer=SummaryWriter("tensor_logs")#记录日志文件
trans_totensor=transforms.ToTensor() #Totensor必须声明否则会报错
img_tensor=trans_totensor(img) #转化为tensor数据类型

writer.add_image(tag="ToTensor",img_tensor=img_tensor)
writer.add_image(tag="ndarray",img_tensor=img_np,dataformats='HWC') #img_tensor默认形状是“（3，H,W）,用np数据类型时必须用dataformats='HWC'声明

writer.close()

tensorboard打开日志文件查看：
tensorboard --logdir="test1\tensor_logs"

2.3.4 常见的Transformers

使用transformers时需要关注输入输出的类型。

Image.open() ——> 返回 PIL数据类型
transformers.ToTensor() ——>返回tensor数据类型
cv.imread() ——>返回numpy.narrys数据类型

—————————————————插入土堆小课堂————————————————
Python 中的 __call__ 的用法： __call__() 的功能类似于在类中重载 () 运算符（也就是说 对象名() = 对象名.__call__()），使得类实例对象可以像调用普通函数那样，以 “对象名()” 的形式使用。也就是说，利用内置call，可以不用点的调用，直接对象+()。对于可调用对象，实际上“名称()”可以理解为是“名称.__call__()”的简写。
例子，新建一个testCall.py文件，输入下列代码：

class Person:
    def __call__(self, name):
        print("__call__"+"Hello"+name)

    def hello(self,name):
        print("hello"+name)

person=Person()
#利用内置call，可以不用 点 的调用，直接对象+()
person("zhangsan")  #__call__Hellozhangsan
person.__call__("wangwu") #__call__Hellowangwu
person.hello("lisi") # hellolisi

运行结果：

—————————————————土堆小课堂 end———————————————

① 测试normalize和resize，新建一个test_transforms_usual.py文件，输入以下代码：

from PIL import Image
from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms

img_pth="../dataset/train/ants_image/0013035.jpg" #图片路径
img=Image.open(img_pth)

writer=SummaryWriter("transformsusual_logs")#记录日志文件
#ToTensor：Convert a ``PIL Image`` or ``numpy.ndarray`` to tensor. This transform does not support torchscript.
trans_totensor=transforms.ToTensor() #Totensor必须声明否则会报错
img_tensor=trans_totensor(img)
writer.add_image(tag="ToTensor",img_tensor=img_tensor)

#Normalize正则化
'''Normalize a tensor image with mean平均值 and standard deviation标准差.
    Given mean均值: ``(M1,...,Mn)`` and std标准差: ``(S1,..,Sn)`` for ``n``个 channels, this transform
    will normalize each channel of the input ``torch.*Tensor`` i.e.
    ``output[channel] = (input[channel] - mean[channel]) / std[channel]``
'''
print(img_tensor[0][0][0]) #tensor(0.3137)
tensor_norm=transforms.Normalize(mean=[0.5,0.5,0.5],std=[0.5,0.5,0.5]) #均值，标准差（RGB三通道）
img_norm=tensor_norm(img_tensor)
print(img_norm[0][0][0]) #tensor(-0.3725)=(0.3137-0.5)*2
writer.add_image(tag="Normalize",img_tensor=img_norm)

#resize
print(img.size) #(768, 512)
trans_resize=transforms.Resize((512,512))

img_resize1=trans_resize(img)#img PIL->resize->img_resize PIL类型
print(img_resize1.size) #(512, 512)

img_resize=trans_totensor(img_resize1)#img_resize PIL->img_resize->totensor tensor类型
print(img_resize.size) #
writer.add_image(tag="Resize",img_tensor=img_resize)
writer.close()

运行结果：-0.3725=(0.3137-0.5)*2

tensorboard打开日志文件查看：
tensorboard --logdir="test1\transformsusual_logs"

② 测试compose，compose用法：
在test_transforms_usual.py文件，输入以下代码：

#compose
trans_resize2 = transforms.Resize(256) #声明
trans_compose =transforms.Compose([trans_resize2,trans_totensor])
img_resize2= trans_compose(img) #输入的必须是PIL image
writer.add_image(tag="compose_size",img_tensor=img_resize2)

tensorboard打开日志文件查看：
tensorboard --logdir="test1\transformsusual_logs"

2.3.5 使用Transformers需要注意的点

关注输入输出的数据类型；
多看官方文档；
关注方法需要什么参数；
不知道返回值时，可以：print、print(type())、debug

2.4 torchvision中的数据集使用

torchvision中内置了一些数据集，如CIFAR10、MNIST等，下面介绍torchvision数据集与transforms的联合使用。新建一个dataset_transforms.py文件，输入以下代码：

import torchvision
from torch.utils.tensorboard import SummaryWriter

#compose
dataset_transform=torchvision.transforms.Compose([
    torchvision.transforms.ToTensor()
])
print(type(dataset_transform)) #

#root是保存数据集的文件夹，train默认为True指的是训练数据集，transform参数是可选的，非必要，download设置为true就是自动下载数据集
train_set=torchvision.datasets.CIFAR10(root="./dataset",train=True,transform=dataset_transform, download=True)
test_set=torchvision.datasets.CIFAR10(root="./dataset",train=False,transform=dataset_transform, download=True)

writer=SummaryWriter("dataset_transform_log")
for i in range(10):
    img,target=test_set[i]
    writer.add_image(tag="test_set",img_tensor=img,global_step=i)

writer.close()

tensorboard打开日志文件查看：
tensorboard --logdir="test1\dataset_transform_log"

2.5 神经网络基础

2.5.1 神经网络的基本骨架——nn.Module 的使用

神经网络的一些工具主要在 torch.nn 里面，nn来自于神经网络的英文 neural network。本节主要学习 nn里面的Containers，containers翻译为容器，但是可以将其理解为是一个骨架。有了骨架就需要往里面填充一些东西，比如卷积层、池化层、非线性激活层等等。如下图所示，Containers主要有6个模块：

其中，Moudle是一个基本的类，主要为神经网络提供一个基本的骨架。模型必须继承这个类。pytorch里面一切自定义操作基本上都是继承nn.Module类来实现的。我们在定义自已的网络的时候，需要继承nn.Module类，并重新实现构造函数__init__构造函数和 forward() 方法。但有一些注意技巧：

一般把网络中具有可学习参数的层（如全连接层、卷积层等）放在构造函数__init__()中，当然我也可以吧不具有参数的层也放在里面；
一般把不具有可学习参数的层(如ReLU、dropout、BatchNormanation层)可放在构造函数中，也可不放在构造函数中，如果不放在构造函数__init__里面，则在forward方法里面可以使用nn.functional来代替。
forward()方法是必须要重写的，它是实现模型的功能，实现各个层之间的连接关系的核心。
所有放在构造函数__init__里面的层的都是这个模型的“固有属性”。

示例代码，新建一个nn_moudle.py文件，写下列代码：

import torch
from torch import nn

class Tudui(nn.Module):#定义一个名为Tudui的神经网络模板
    def __init__(self):
        super().__init__() ##必要的，调用父类的初始化函数

    def forward(self,input): #前向传播函数
        output=input+1
        return output

tutui=Tudui() #实例化一个神经网络
x=torch.tensor(1.0)
output=tutui(x) #把x输入到神经网络中，会自动执行forward
print(output)

输出如下图所示：

2.5.2 神经网络——卷积层

① torch.nn.functional 中的 Convolution functions

卷积有一维卷积、二维卷积、三维卷积。conv1d代表1维卷积，conv2d代表2维卷积，一般情况下，卷积核在几个维度上滑动，就是几维卷积。比如在图片上的卷积就是二维卷积。所以主要是conv2d，因为主要针对图像，图像是一个二维的矩阵。

torch.nn.functional.conv2d(input, weight, bias=None, stride=1, padding=0, dilation=1, groups=1) → Tensor

示例代码，新建一个nn_conv.py文件

import torch
import torch.nn.functional as F

input=torch.tensor([[1,2,0,3,1],
                    [0,1,2,3,1],
                    [1,2,1,0,0],
                    [5,2,3,1,1],
                    [2,1,0,1,1]]) #输入shape为：5*5 (1个([])里面5个[] 每个[]里面5个,
print("input.shape：",input.shape) #torch.Size([5, 5])

kernel=torch.tensor([[1,2,1],
                     [0,1,0],
                     [2,1,0]]) #卷积核shape为：3*3
print("kernel.shape：",kernel.shape)#torch.Size([5, 5])

#因为conv2d的input tensor 的shape是(minibatch,in_channels,iH,iW),所以需要reshape
input=torch.reshape(input,(1,1,5,5)) #将input(5*5) reshape 为(1*1*5*5)
print("reshape_input.shape：",input.shape)#torch.Size([1, 1, 5, 5])

#因为weight – filters of shape (out_channels,in_channels/groups,kH,kW)(groups默认=1)
kernel=torch.reshape(kernel,(1,1,3,3)) # 将kernel(3*3) reshape为(1*1*3*3)
print("reshape_kernel.shape：",kernel.shape)#torch.Size([1, 1, 3, 3])

output=F.conv2d(input=input,weight=kernel,stride=1) #conv2d2维卷积
print("stride=1，output为:\n",output)
'''
stride=1，output为:
 tensor([[[[10, 12, 12],
          [18, 16, 16],
          [13,  9,  3]]]])
'''
print("stride=1，output.shape为:",output.shape) #torch.Size([1, 1, 3, 3]),([])里面有一个[[[]]],[[[]]]里面有一个[[]],[[]]里面有3个[],每个[]里面3个，

output2=F.conv2d(input=input,weight=kernel,stride=2)
print("stride=2，output为:\n",output2)
'''
stride=2，output为:
 tensor([[[[10, 12],
          [13,  3]]]])
'''
print("stride=2，output.shape为:",output2.shape)#torch.Size([1, 1, 2, 2]),

output3=F.conv2d(input=input,weight=kernel,stride=2,padding=1)
print("stride=2，padding=1，output为:\n",output3)
'''
stride=2，padding=1，output为:
 tensor([[[[ 1,  4,  8],
          [ 7, 16,  8],
          [14,  9,  4]]]])
'''
print("stride=2，padding=1，output.shape为:",output3.shape)# torch.Size([1, 1, 3, 3])

运行结果：

② torch.nn 中的 Convolution Layers

主要也是 nn.Conv2d，点击 nn.Conv2d 进行查看。

示例代码，新建一个 nn_conv2.py文件，写入下列代码：

import torch
import torchvision
from torch import nn
from torch.nn import Conv2d
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

dataset=torchvision.datasets.CIFAR10("./dataset",train=False,transform=torchvision.transforms.ToTensor(),download=True)
dataloader=DataLoader(dataset=dataset,batch_size=64) #载入数据

class Tudui(nn.Module): #实现自己的一个网络模型，必须重载nn.Module
    def __init__(self):
        super(Tudui,self).__init__() ##必要的，调用父类的初始化函数
        self.conv1=Conv2d(in_channels=3,out_channels=6,kernel_size=3,stride=1,padding=0)

    def forward(self,x): #前向传播
        x=self.conv1(x)
        return x

tudui=Tudui() ##实例化一个模型
writer=SummaryWriter("nnlogs") #记录到日志中

#这里进行1个epoch,batch_size=64,也就是是个batch 64张图片，所以N=64
step=0
for data in dataloader:
    imgs,targets=data
    output=tudui(imgs)
    print(imgs.shape)#torch.Size([64, 3, 32, 32]) N=batch_size=64,in_channel=3,w=32,h=32

    # (inputsize-kernelsize+2padding)/stride+1=(32-3+0)/1+1=30
    print(output.shape)#torch.Size([64, 6, 30, 30]) N=batch_size=64,out_channel=6,w=30,h=30

    writer.add_images(tag="input",img_tensor=imgs,global_step=step)

    '''writer.add_images(tag="output", img_tensor=output, global_step=step)
    这样会报错，因为output_channel=6，图像是3个channel,所以tensorboard不知道如何显示，所以需要将其reshape为3个channel
    '''

    # reshape，-1代表会根据后面的值自动计算
    output=torch.reshape(output,(-1,3,30,30))#torch.size([64, 6, 30, 30])->([128,3,30,30)(-1代表会自动计算）
    print(output.shape) #torch.size([128, 6, 30, 30])

    writer.add_images(tag="output",img_tensor=output,global_step=step)
    step+=1

writer.close()

运行结果：

tensorboard打开日志文件查看：
tensorboard --logdir="test1\nnlogs"

2.5.3 神经网络——最大池化的使用

torch.nn 的 Pooling layers，最大池化就是为了下采样，减少数据量，加速训练。

maxpooling也称作下采样，最常用的是 MaxPool2d，点进去之后可看到：

主要是一个kernel_size

ceil_mode 如果为True，将使用ceil (天花板模式) 而不是floor (地板模式) 来计算输出形状，默认为False，也就是说若走到末尾不满足池化核大小则抛弃。
示例代码，新建一个nn_maxpooling.py文件，写入如下代码测试一个给定的tensor的maxpool结果，以及CIFAR10数据集的maxpool结果

import torch
import torchvision
from torch import nn
from torch.nn import MaxPool2d
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

class Tudui(nn.Module): #定义自己的模型，必须继承nn.Module
    def __init__(self):
        super(Tudui,self).__init__() ##必要的，调用父类的初始化函数
        self.maxpool1=MaxPool2d(kernel_size=3,ceil_mode=True) #天花板模式，不抛弃不满足kernel_size的块
    def forward(self,input):
        output=self.maxpool1(input)
        return output

tudui=Tudui() #实例化神经网络

#------------------用给定的tensor测试 maxpool-------------------#
input=torch.tensor([[1,2,0,3,1],
                    [0,1,2,3,1],
                    [1,2,1,0,0],
                    [5,2,3,1,1],
                    [2,1,0,1,1]],dtype=torch.float32) #不加dtype会报错
print(input.shape)#torch.Size([5, 5]),一个([])里面5个[]，每个[]里面5个,
input=torch.reshape(input,(-1,1,5,5))# 将input reshape为 torch.Size([1, 1, 5, 5])，-1代表会根据后面的值自动计算
print(input.shape) #torch.Size([1, 1, 5, 5])

output1=tudui(input)
print(output1)
'''
tensor([[[[2., 3.],
          [5., 1.]]]])
'''
print(output1.shape) #torch.Size([1, 1, 2, 2]),([])里面 1 个[[[]]]，每个[[[]]]里面 1 个[[]]，每个 [[]]里面 2 个[]，每个[]里面 2 个，

#------------------用给定的数据集测试 maxpool-------------------#
dataset=torchvision.datasets.CIFAR10("./dataset",train=False,transform=torchvision.transforms.ToTensor(),download=True)
dataloader=DataLoader(dataset,batch_size=64)

writer=SummaryWriter("logs_maxpool") ##用summary记录日志
#测试一个epoch
step=0
for data in dataloader:
    imgs,target=data
    writer.add_images(tag="input",img_tensor=imgs,global_step=step)
    output=tudui(imgs)
    writer.add_images(tag="output", img_tensor=output, global_step=step)
    step+=1

writer.close()

运行结果如下图所示

tensorboard打开日志文件查看：
tensorboard --logdir="test1\logs_maxpool"

2.5.4 神经网络——非线性激活

torch.nn 的 Non-linear Activations (weighted sum, nonlinearity)，非线性变换主要是为网络引入非线性特征，非线性越多才能训练出符合各种特征的模型。

以ReLU激活函数为例，点进去可看到

示例代码，新建一个nn_relu.py文件，输入以下代码，测试一个给定的tensor以及数据集CIFAR10

import torch
from torch import nn
import torchvision
from torch.nn import ReLU, Sigmoid
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

class Tudui(nn.Module): #定义自己的模型，必须继承nn.Module
    def __init__(self):
        super(Tudui,self).__init__() ##必要的，调用父类的初始化函数
        self.relu=ReLU() #Relu激活函数,参数inplace默认为False，也就是说不改变输入

    def forward(self,input): #前向传播进行计算
        output=self.relu(input)
        return output
tudui=Tudui() #实例化一个模型

#----------以给定的一个tensor为例---------------
input = torch.tensor([[1,-0.5],
                      [-1,3]]) #torch.Size([2,2])
input_reshape=torch.reshape(input,(-1,1,2,2))
print(input_reshape.shape) #torch.Size([1,1,2,2])
output=tudui(input_reshape)
print(output)
'''
tensor([[[[1., 0.],
          [0., 3.]]]])
'''
print(output.shape) #torch.Size([1, 1, 2, 2])

#-----------------------以给定的数据集为例-----------------------------------
dataset=torchvision.datasets.CIFAR10("./dataset",train=False,transform=torchvision.transforms.ToTensor(),download=True)
dataloader=DataLoader(dataset,batch_size=64) #dataloader加载数据集，batch_size=64
writer=SummaryWriter("logsrelu")
#-----测试一个epoch-----------
step=0
for data in dataloader:
    imgs,target=data
    writer.add_images("input",imgs,step)
    output=tudui(imgs)
    writer.add_images("output",output,step)
    step+=1

writer.close()

运行结果如下所示：

tensorboard打开日志文件查看：（relu测试数据集的结果不明显，可换成sigmoid）
tensorboard --logdir="test1\logsrelu"

2.5.5 神经网络——线性层

torch.nn 的 Linear Layers。线性链接层就是全连接层。

点进去 Linear 进行查看。线性链接层就是全连接层。
![在这里插入图片描述](https://img-blog.csdnimg.cn/2758b397992449e6a31cc4d8d9d7daeb.png =500x#pic_center)
示例代码，新建一个nn_linear.py文件，写下如下代码：

import torch
from torch import nn
import torchvision
from torch.nn import Linear
from torch.utils.data import DataLoader

dataset=torchvision.datasets.CIFAR10("./dataset",train=False,transform=torchvision.transforms.ToTensor(),download=True)
dataloader=DataLoader(dataset,batch_size=64,drop_last=True) #抛弃最后不满足64的

class Tudui(nn.Module): #构建自己的一个模型用于测试linear层，必须继承nn.Module
    def __init__(self):
        super(Tudui,self).__init__() #必要的，调用父类的初始化方法
        self.linear=Linear(in_features=196608,out_features=10)#infeature,outfeature,分成10类

    def forward(self,input): #前向传播
        output=self.linear(input)
        return output

tudui=Tudui() #实例化一个模型

#---------------------测试一个epoch--------------------------
step=0
for data in dataloader:
    imgs,target=data
    print(imgs.shape) #torch.Size([64, 3, 32, 32]),我们想将其变为(1,1,1,*)

    output1=torch.reshape(imgs,(1,1,1,-1)) # -1代表根据后面的值自动计算
    print(output1.shape) #torch.Size([1, 1, 1, 196608])

    output2=torch.flatten(imgs) #也可以用flatten处理，input是个tensor数据类型
    print(output2.shape) #torch.Size([196608])

    output3 = tudui(output1)
    print(output3.shape)  # torch.Size([1, 1, 1, 10])

    output4=tudui(output2)
    print(output4.shape) #torch.Size([10])

    step+=1

运行结果如下所示：

2.5.6 神经网络——torch.nn.Sequential

Sequential是一个顺序容器。模块将按照在构造函数中传递的顺序添加到它。或者，可以传入一系列模块。Sequential的forward（）方法接受任何输入，并将其转发到它包含的第一个模块。然后，它将输出按顺序“链接”到每个后续模块的输入，最后返回最后一个模块的输出。

官方示例

# Using Sequential to create a small model. When `model` is run,
# input will first be passed to `Conv2d(1,20,5)`. The output of
# `Conv2d(1,20,5)` will be used as the input to the first
# `ReLU`; the output of the first `ReLU` will become the input
# for `Conv2d(20,64,5)`. Finally, the output of
# `Conv2d(20,64,5)` will be used as input to the second `ReLU`
model = nn.Sequential(
          nn.Conv2d(1,20,5),
          nn.ReLU(),
          nn.Conv2d(20,64,5),
          nn.ReLU()
        )

# Using Sequential with OrderedDict. This is functionally the
# same as the above code
model = nn.Sequential(OrderedDict([
          ('conv1', nn.Conv2d(1,20,5)),
          ('relu1', nn.ReLU()),
          ('conv2', nn.Conv2d(20,64,5)),
          ('relu2', nn.ReLU())
        ]))

2.5.7 神经网络——搭建小实战

搭建一个如下图所示的小型网络

新建一个nn_seq.py文件，并写下如下代码，从代码可以看出，使用Sequential时定义的网络模型更简介

import torch
from torch import nn
from torch.nn import Conv2d, MaxPool2d, Linear, Sequential
from torch.nn.modules import Flatten
from torch.utils.tensorboard import SummaryWriter


class Tudui_raw(nn.Module): #不使用Sequential进行搭建
    def __init__(self):
        super(Tudui_raw,self).__init__()
        self.conv1=Conv2d(in_channels=3,out_channels=32,kernel_size=5,stride=1,padding=2)
        self.maxpool1=MaxPool2d(kernel_size=2)
        self.conv2 = Conv2d(in_channels=32, out_channels=32, kernel_size=5, stride=1, padding=2)
        self.maxpool2 = MaxPool2d(kernel_size=2)
        self.conv3 = Conv2d(in_channels=32, out_channels=64, kernel_size=5, stride=1, padding=2)
        self.maxpool3 = MaxPool2d(kernel_size=2)
        self.flatten=Flatten()
        self.linear1=Linear(in_features=1024,out_features=64)
        self.linear2=Linear(in_features=64,out_features=10)

    def forward(self,x):
        x=self.conv1(x)
        x=self.maxpool1(x)
        x=self.conv2(x)
        x=self.maxpool2(x)
        x=self.conv3(x)
        x=self.maxpool3(x)
        x=self.flatten(x)
        x=self.linear1(x)
        x=self.linear2(x)
        return x

#使用Sequential进行搭建
class Tudui(nn.Module):
    def __init__(self):
        super(Tudui,self).__init__()
        self.module1 = Sequential(
            Conv2d(in_channels=3,out_channels=32,kernel_size=5,stride=1,padding=2),
            MaxPool2d(kernel_size=2),
            Conv2d(in_channels=32, out_channels=32, kernel_size=5, stride=1, padding=2),
            MaxPool2d(kernel_size=2),
            Conv2d(in_channels=32, out_channels=64, kernel_size=5, stride=1, padding=2),
            MaxPool2d(kernel_size=2),
            Flatten(),
            Linear(in_features=1024,out_features=64),
            Linear(in_features=64,out_features=10)
        )

    def forward(self,x):
        x=self.module1(x)
        return x

input=torch.ones((64,3,32,32))


#----------------测试不使用Sequential进行搭建的模型-------------------
tuduiraw=Tudui_raw()
print(tuduiraw)
output1=tuduiraw(input)
print(output1.shape) #torch.Size([64, 10])

#----------------测试使用Sequential进行搭建的模型，并写入tensorboard-------------------
tudui=Tudui()
print(tudui)
output=tudui(input)
print(output.shape) #torch.Size([64, 10])

writer=SummaryWriter("logs_seq")
writer.add_graph(tudui,input)
writer.close()

输出结果：

tensorboard打开日志文件查看：
tensorboard --logdir="testCIFAR10\logs_seq"

2.5.8 损失函数与反向传播

loss function的作用：

用于衡量预测与真实之间的误差，loss越小越好。
通过loss来提高预测，为更新输出提供一定的依据（反向传播）。

loss function在torch.nn里面：

①：示例代码1：一些loss的示例，新建一个nn_loss.py文件，并写下如下代码：

import torch
from torch import nn
from torch.nn import L1Loss

input=torch.tensor([1,2,3],dtype=torch.float32)
target=torch.tensor([1,2,5],dtype=torch.float32) #GT

print(input.shape)#torch.Size([3])
print(target.shape)#torch.Size([3])

input=torch.reshape(input,(1,1,1,3))
target=torch.reshape(target,(1,1,1,3))

#-------------------L1Loss--------------------
loss=L1Loss(reduction="sum")
result=loss(input,target)
print(result) #tensor(2.)

#--------------------MSELoss----------------------
loss_mse=nn.MSELoss()
result_mse=loss_mse(input,target)
print(result_mse) #tensor(1.3333)

#--------------------CrossEntropyLoss----------------------
x=torch.tensor([0.1,0.2,0.3])
y=torch.tensor([1])
x=torch.reshape(x,(1,3))
print(x) #tensor([[0.1000, 0.2000, 0.3000]])
loss_cross=nn.CrossEntropyLoss()
result_cross=loss_cross(x,y)
print(result_cross) #tensor(1.1019)

运行结果如下所示：

②示例代码2： 在具体模型训练中使用loss，新建一个nn_loss_network.py文件，并写下如下代码：

import torchvision
from torch import nn
from torch.nn import Conv2d, MaxPool2d, Linear, Sequential
from torch.nn.modules import Flatten
from torch.utils.data import DataLoader

dataset=torchvision.datasets.CIFAR10("./dataset",train=False,transform=torchvision.transforms.ToTensor(),download=True)
daraloader=DataLoader(dataset,batch_size=1)

class Tudui(nn.Module):
    def __init__(self):
        super(Tudui,self).__init__()
        self.module1 = Sequential(
            Conv2d(3, 32, 5, padding=2),
            MaxPool2d(2),
            Conv2d(32, 32, 5, padding=2),
            MaxPool2d(2),
            Conv2d(32, 64, 5, padding=2),
            MaxPool2d(2),
            Flatten(),
            Linear(1024, 64),
            Linear(64, 10)
        )

    def forward(self,x):
        x=self.module1(x)
        return x

#-----------定义一个交叉熵损失函数-------------------
loss=nn.CrossEntropyLoss()
tudui=Tudui()

#-------------测试一个epoch-------------------
for data in daraloader:
    imgs,target=data #target就是标签
    output=tudui(imgs)

    #----------计算模型输出output与真实target之间的loss--------------
    result_loss=loss(output,target)
    print(result_loss)
    #------------反向传播-----------------
    result_loss.backward()#反向传播计算梯度grad

运行结果如下所示：

2.5.9 优化器

torch.optim。torch.optim是一个实现了各种优化算法的库。
使用optimizer
使用torch.optim，需要构建一个optimizer对象。该对象能够保持当前参数状态并基于“计算得到的梯度”进行参数更新。

构建
构建一个Optimizer，需要给它一个包含了需要优化的参数（必须都是Variable对象）的iterable。然后，可以设置optimizer的参数选项，比如学习率，权重衰减，等等。

例子：

optimizer = optim.SGD(model.parameters(), lr = 0.01, momentum=0.9)
optimizer = optim.Adam([var1, var2], lr = 0.0001)

为每个参数单独设置选项
Optimizer也支持为每个参数单独设置选项。若想这么做，不要直接传入Variable 的 iterable，而是传入 dict 的 iterable，每一个 dict 都分别定义了一组参数，并且包含一个 param键，这个键对应参数的列表。
注意：你仍然能够传递选项作为关键字参数。在未重写这些选项的组中，它们会被用作默认值。当你只想改动一个参数组的选项，但其他参数组的选项不变时，这是非常有用的。
例如，当我们想指定每一层的学习率时，这是非常有用的：

optim.SGD([
                {'params': model.base.parameters()},
                {'params': model.classifier.parameters(), 'lr': 1e-3}
            ], lr=1e-2, momentum=0.9)

这意味着 model.base 的参数将会使用 1e-2 的学习率，model.classifier 的参数将会使用 1e-3 的学习率，并且 0.9 的 momentum 将会被用于所有的参数。

进行单次优化
所有的 optimizer 都实现了 step() 方法，这个方法会更新所有的参数。它能按两种方式来使用：
optimizer.step()：是大多数optimizer所支持的简化版本。一旦梯度被如backward()之类的函数计算好后，我们就可以调用这个函数。

例子

for input, target in dataset:
    optimizer.zero_grad()
    output = model(input)
    loss = loss_fn(output, target)
    loss.backward()
    optimizer.step()

optimizer.step(closure)：一些优化算法例如 Conjugate Gradient 和 LBFGS 需要重复多次计算函数，因此你需要传入一个闭包去允许它们重新计算你的模型。这个闭包应当清空梯度，计算损失，然后返回。

例子：

for input, target in dataset:
    def closure():
        optimizer.zero_grad()
        output = model(input)
        loss = loss_fn(output, target)
        loss.backward()
        return loss
    optimizer.step(closure)

土堆的示例代码，新建一个nn_optim.py文件，写下如下代码：

import torch
import torchvision
from torch import nn
from torch.nn import Conv2d, MaxPool2d, Linear, Sequential
from torch.nn.modules import Flatten
from torch.utils.data import DataLoader

#把数据集转化为tensor
dataset=torchvision.datasets.CIFAR10("./dataset",train=False,transform=torchvision.transforms.ToTensor(),download=True)
daraloader=DataLoader(dataset,batch_size=64)

class Tudui(nn.Module):
    def __init__(self):
        super(Tudui,self).__init__()
        self.module1 = Sequential(
            Conv2d(3, 32, 5, padding=2),
            MaxPool2d(2),
            Conv2d(32, 32, 5, padding=2),
            MaxPool2d(2),
            Conv2d(32, 64, 5, padding=2),
            MaxPool2d(2),
            Flatten(),
            Linear(1024, 64),
            Linear(64, 10)
        )
    def forward(self,x):
        x=self.module1(x)
        return x


loss=nn.CrossEntropyLoss() #定义一个交叉熵Loss
tudui=Tudui()            #实例化模型

'''定义一个SGD优化器，需要给它一个包含了需要优化的参数（必须都是`Variable`对象）的`iterable，在这里就是模型的参数：tudui.parameters()'''
optim=torch.optim.SGD(tudui.parameters(),lr=0.01)#优化器,lr是学习率，学习速率一开始比较大，后面比较小

#----------训练----------------------
for epoch in range(20):
    running_loss=0.0 #计算每一个 epoch的 loss的和
    for data in daraloader: #依次从dataloader中取数据
        imgs, target = data
        output = tudui(imgs) #将图片数据送入模型进行训练
        result_loss = loss(output, target) #计算输出与目标之间的损失

        #-----------------优化器--------------------------------
        '''优化是每一步先清0，再反向传播'''
        optim.zero_grad() #必须先把网络中可以调节的参数对应的梯度调为0
        '''设置为0之后，需要优化器对每一个参数进行优化，优化器需要每一个参数的梯度，所以需要计算梯度'''
        result_loss.backward() #反向传播计算每一个参数的梯度
        optim.step() #调用step对每个参数进行调优
        # -----------------优化器--------------------------------

        running_loss=running_loss+result_loss
    print(running_loss)

Debug查看优化器是如何进行的：
debug查看参数：
tudui->Protected Attributes->modules->‘module1’->Protected Attributes->module->‘0’->weight

① 执行完optim.zero_grad()后，梯度被清0

②：执行result_loss.backward()反向传播计算梯度

③调用step对每个参数进行调优

程序运行结果：

2.5.10 现有网络模型的使用及修改

torchvision.models模块的子模块中主要包含关于图像的网络模型，例如VGG、AlexNet、ResNet等。可以使用随机初始化的权重来创建这些模型。
例如：

import torchvision.models as models
resnet18 = models.resnet18()
alexnet = models.alexnet()
squeezenet = models.squeezenet1_0()
densenet = models.densenet_161()

torchvision也提供了预训练(pre-trained)的模型。pretrained=True就可以使用预训练的模型

import torchvision.models as models
#pretrained=True就可以使用预训练的模型
resnet18 = models.resnet18(pretrained=True)
alexnet = models.alexnet(pretrained=True)

本节主要以VGG16为例：（progress设置为true会显示下载进度条）

数据集选择CIFAR10，该数据集有10个类别，但是VGG16最后会将数据集分为1000类，所以需要对模型进行修改，新建一个nn_vgg16_module.py文件，写下如下代码：

import torchvision
from torch import nn

#----------------------实例化VGG16网络模型
vgg16_false = torchvision.models.vgg16(pretrained=False) #如果pretrained为False，不需要下载预训练的模型
#vgg16_true=torchvision.models.vgg16(pretrained=True)  #如果pretrained为True，则返回在ImageNet上预先训练的模型，需要下载预训练的模型
print("vgg16_false:\n",vgg16_false)
#print("vgg16_true:\n",vgg16_true)
#-------------下载数据集，并用torchvision.transforms.ToTensor()将数据类型转换为tensor--------------------------
train_data=torchvision.datasets.CIFAR10("./dataset",train=True,transform=torchvision.transforms.ToTensor(),download=True)

'''因为CIFAR10数据集是10类，但是VGG16模型分成了1000个类，所以需要对模型进行修改'''
vgg16_false.classifier.add_module('add_linear',nn.Linear(1000,10)) ##加一个线性层名为“add_linear”，将最后一层分类层输出修改为10
print("增加线性层的vgg16_flase:\n",vgg16_false)

'''对模型进行修改方法2'''
vgg16_false2 = torchvision.models.vgg16(pretrained=False) #如果pretrained为False，不需要下载预训练的模型
vgg16_false2.classifier[6]=nn.Linear(4096,10) #也可以直接对最后一个分类层进行修改，使其输出为10
print("修改最后一层的vgg16_false:\n",vgg16_false2)

运行结果：
①添加add_linear的模型：

②直接对模型最后一层分类层进行修改：

2.5.11 网络模型的保存与读取

模型的保存和加载各有两种方法：
①：模型保存方法1 ：模型结构+模型参数（不推荐，有陷阱）

vgg16=torchvision.models.vgg16(pretrained=False)
#保存方式1,保存模型结构＋模型参数
torch.save(vgg16,"vgg16_method1.pth") #第一个参数是网络模型，第二个参数是保存的路径

方法①对应的加载模型的方式：

model=torch.load("vgg16_method1.pth")

②：模型保存方式2：模型参数（官方推荐），因为这个方式，储存量小
state_dic()相当于把模型的状态保存成一种字典格式，也就是将网络模型的参数保存成字典格式，不保存网络结构。

vgg16=torchvision.models.vgg16(pretrained=False)
#保存方式2，保存模型参数（官方推荐）
torch.save(vgg16.state_dict(),"vgg16_method2.pth")

方法②对应的模型加载方式：1. 新实例化一个网络结构，2. 然后再进行加载恢复，直接恢复的话加载出来的是字典形式的：

'''新建一个网络结构，然后再进行加载恢复，直接恢复的话加载出来的是字典形式的'''
vgg16 = torchvision.models.vgg16(pretrained=False) #实例化一个网络结构
model2 = vgg16.load_state_dict(torch.load("vgg16_method2.pth")) #加载模型

2.6 完整的模型训练套路

以CIFAR10数据集为例，完成对他的分类（10分类问题）。
步骤① 准备数据集： 新建一个nn_dataset.py文件，并写下如下代码利用dataset和dataloader加载数据集：

import torchvision
from torch.utils.tensorboard import SummaryWriter
from test_network.nn_network import *

#准备数据集
from torch import nn
from torch.utils.data import DataLoader

#加载训练集与测试集，并将数据格式转化为tensor数据类型，target_transform=None 指不对 target 做修改
train_data=torchvision.datasets.CIFAR10("./dataset",train=True,transform=torchvision.transforms.ToTensor(),target_transform=None, download=True)
test_data=torchvision.datasets.CIFAR10("./dataset",train=False,transform=torchvision.transforms.ToTensor(),target_transform=None,download=True)

#查看数据集长度
train_data_size=len(train_data)
test_data_size=len(test_data)
print("训练数据集长度为：{}".format(train_data_size)) #50000
print("测试数据集长度为：{}".format(test_data_size)) #10000

#利用dataloader 加载数据，batchsize=64
train_dataloader=DataLoader(train_data,batch_size=64)
test_dataloader=DataLoader(test_data,batch_size=64)

步骤② 建立一个网络模型： 搭建一个如下图所示的网络模型：

新建一个nn_network.py文件，写下如下代码利用 nn.Sequential 建立一个与网络模型：

#神经网络
import torch
from torch import nn

#搭建一个网络模型
class Tudui(nn.Module):
    def __init__(self):
        super(Tudui, self).__init__()
        self.model = nn.Sequential(
            nn.Conv2d(in_channels=3, out_channels=32, kernel_size=5, stride=1, padding=2), #卷积层
            nn.MaxPool2d(kernel_size=2), #池化层
            nn.Conv2d(in_channels=32,out_channels=32, kernel_size=5, stride=1, padding=2), #卷积层
            nn.MaxPool2d(kernel_size=2), #池化层
            nn.Conv2d(in_channels=32, out_channels=64, kernel_size=5, stride=1, padding=2), #卷积层
            nn.MaxPool2d(kernel_size=2), #池化层
            nn.Flatten(), #展平64*4*4=1024(2^10)
            nn.Linear(in_features=1024, out_features=64),#线性层
            nn.Linear(in_features=64, out_features=10) #线性层
        )

    def forward(self, x): #前向传播
        x = self.model(x)
        return x

'''
测试神经网络是否正确
'''
if __name__=='__main__':
    tudui=Tudui()
    input=torch.ones((64,3,32,32))#torch.Size([64, 3, 32, 32])，用于模拟每个batch的数据集，N=batchsize=64，channel=3，size=32*32
    print(input.shape) # torch.Size([64, 3, 32, 32])
    output=tudui(input)
    print(output.shape) #torch.Size([64, 10])

#----------下面这样写是不对的，因为torch.tensor([64,3,32,32])就是一个数据为[64,3,32,32]的tensor，其torch.size=([4])-----------------------
    # input=torch.tensor([64,3,32,32])#torch.Size([4])
    # input=torch.reshape(input,(-1,3,32,32))
    # print(input.shape)

测试网络模型是否正确的输出结果：

步骤③ 实例化一个网络模型： 在nn_dataset.py文件中补充如下代码来实例化一个网络模型：

'''----------搭建神经网络,实例化网络模型----------'''
tudui=Tudui()

步骤④ 定义损失函数与优化器：** 在nn_dataset.py文件中补充如下代码来定义一个交叉熵损失函数与SGD优化器：

'''---------定义一个交叉熵损失函数--------'''
loss_fn=nn.CrossEntropyLoss()
'''---------定义一个SGD优化器------------'''
learning_rate=1e-2  #学习率 1*10^(-2）
optimizer=torch.optim.SGD(tudui.parameters(),lr=learning_rate)

步骤⑤ 设置训练的一些参数：** 在nn_dataset.py文件中补充如下代码来设置训练的轮数epoch，总的训练次数与总的测试次数。

'''-------设置训练的一些参数-------'''
total_train_step=0 #记录训练的次数
total_test_step=0 #记录测试的次数
epoch=10 #记录训练的轮数

步骤⑥ 开始训练：每次训练时需要计算loss，然后进行反向传播计算梯度，并利用优化器更新参数，同时，模型训练时如何知道模型是否训练好，因此每次训练完一轮（1个epoch） 都需要进行一次测试，以测试数据集上的损失进行评估。在测试过程中，利用现有的模型进行测试，无梯度，无调优。在nn_dataset.py文件中补充如下代码来进行训练：
1. 代码1： 无tensorboard和准确率：

for i in range(epoch):
    print("----第{}轮训练开始------".format(i))
    #--------------start 不添加tensorboard----------------------------
    #训练步骤开始
    for data in train_dataloader: #从train_dataloader中获取 data
        imgs,targets=data #从data中获取图片及标签
        output=tudui(imgs) #将图片送入模型
        loss=loss_fn(output,targets) #计算预测与目标之间的loss

        #优化器处理模型,分3步，清零，反向传播，递进
        optimizer.zero_grad() #调用优化器将梯度清零
        loss.backward()   #反向传播
        optimizer.step()  #优化器更新参数

        total_train_step+=1 #总训练次数+1
        if total_train_step%100==0: #每100次输出一个loss
           print("训练次数:{},loss:{}".format(total_train_step,loss.item()))

    #测试，模型训练时如何知道模型是否训练好，因此每次训练完一轮都需要进行一次测试，以测试数据集上的损失进行评估
    #测试步骤开始
    total_test_loss=0
    with torch.no_grad(): #利用现有的模型进行测试，torch.no_grad()保证无梯度，无调优
        for data in test_dataloader: #从测试集中获得数据
            imgs,targets=data
            output=tudui(imgs)  #将图片用训练的模型进行测试
            loss=loss_fn(output,targets) #计算测试的loss
            total_test_loss+=loss.item() #因为loss是tensor数据类型，而total_test_loss是普通的数字，所以需要loss.item()

    print("整体测试集上的loss为：{}".format(total_test_loss))

2. 代码2： 加上 tensorboard 对训练及测试的 loss 进行可视化：

#添加tensorboard
writer=SummaryWriter("mynetworklogs")
for i in range(epoch):
    print("----第{}轮训练开始------".format(i))
    #------------start 添加tensorboard---------------------------------------------
    #训练步骤开始
    for data in train_dataloader:
        imgs,targets=data
        output=tudui(imgs)
        loss=loss_fn(output,targets)

        #优化器处理模型,分3步，清零，反向传播，递进
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        total_train_step+=1
        if total_train_step % 100 == 0:
            print("训练次数:{},loss:{}".format(total_train_step, loss.item()))
            writer.add_scalar(tag="train_loss",scalar_value=loss.item(),global_step=total_train_step) #画train_loss图,每逢100画一次

    #测试，模型训练时如何知道模型是否训练好，因此每次训练完一轮都需要进行一次测试，以测试数据集上的损失进行评估
    #测试步骤开始
    total_test_loss=0
    with torch.no_grad(): #利用现有的模型进行测试，无梯度，无调优
        for data in test_dataloader:
            imgs,targets=data
            output=tudui(imgs)
            loss=loss_fn(output,targets)
            total_test_loss+=loss.item()

    print("整体测试集上的loss为：{}".format(total_test_loss))
    writer.add_scalar(tag="test_loss",scalar_value=total_test_loss,total_test_step) #每一个epoch画一次loss
    total_test_step+=1
    torch.save(tudui,"tuidui_{}.pth".format(i)) #每训练一个epoch，保存一次模型
    print("模型已保存")
    #-------------end 添加tensorboard-------------------------
writer.close()

3. 代码3： 加上 tensorboard 对训练及测试的 loss 进行可视化以及加上正确率查看分类效果：
——————————————start 土堆小课堂分类问题的正确率————————————————
AP = TP/(TP+FP) = TP/ALL，pytorch中引入argmax来查看tensor每个维度的最大值的位置进而计算TP。

    output=torch.tensor([[0.1,0.2],
                         [0.3,0.4]])
    preds=output.argmax(1) #参数1是指横着看，0指竖着看,0.3和0.4最大，得([1,1])
    targets=torch.tensor([0,1]) #设置标签是(0, 1)
    print((preds==targets).sum())#tensor(1) #当预测=GT时为TP

—————————————end 土堆小课堂分类问题的正确率———————————————————
加tensorboard 和准确率的代码为：

#-----------------------开始训练---------------------------------
#添加tensorboard
writer=SummaryWriter("mynetworklogs")
for i in range(epoch):
    print("----第{}轮训练开始------".format(i))
    #----------------start 添加tensorboard 以及正确率---------------------------
    #训练步骤开始
    for data in train_dataloader:
        imgs,targets=data
        output=tudui(imgs)
        loss=loss_fn(output,targets)

        #优化器处理模型,分3步，清零，反向传播，递进
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        total_train_step+=1
        if total_train_step % 100 == 0:
            print("训练次数:{},loss:{}".format(total_train_step, loss.item()))
            writer.add_scalar(tag="train_loss",scalar_value=loss.item(),global_step=total_train_step) #每逢100画一次

    #测试，模型训练时如何知道模型是否训练好，因此每次训练完一轮都需要进行一次测试，以测试数据集上的损失进行评估
    #测试步骤开始
    total_test_loss=0
    total_accuracy=0
    with torch.no_grad(): #利用现有的模型进行测试，无梯度，无调优
        for data in test_dataloader:
            imgs,targets=data
            output=tudui(imgs)
            loss=loss_fn(output,targets)
            total_test_loss+=loss.item()

            accuracy=(output.argmax(1)==targets).sum() #当预测=目标时计算TP
            total_accuracy+=accuracy

    print("整体测试集上的loss为：{}".format(total_test_loss))
    ap=torch.true_divide(total_accuracy, test_data_size) #AP=TP/ALL
    print("整体测试集上的正确率为：{}".format(ap))

    writer.add_scalar(tag="test_loss",scalar_value=total_test_loss,global_step=total_test_step)
    writer.add_scalar(tag="test_accuracuy",scalar_value=ap, global_step=total_test_step)

    total_test_step+=1
    #torch.save(tudui,"tuidui_{}.pth".format(i))
    torch.save(tudui.state_dict(),"tudui_{}.pth".format(i)) #每一个epoch保存一次模型
    print("模型已保存")
    #-------------------end 添加tensorboard 以及正确率------------------------------------------
writer.close()

nn_dataset.py代码运行结果：

tensorboard打开日志文件查看：
tensorboard --logdir="test_network\mynetworklogs"

———————————————start 土堆小课堂 model.eval() 和 model.trian()作用————————————————

有时候会在训练之前加上 model.train() ，在测试之前加上 model.eval()

train(mode=True) ，将module设置为 training mode。仅仅当模型中有Dropout 和 BatchNorm是才会有影响。
eval() :将模型设置成evaluation模式，仅仅当模型中有Dropout和BatchNorm是才会有影响。

model.eval() 和 model.trian()
有些网络层在训练状态和测试状态是不一样的，如 dropout 层，在训练时 dropout 层是有效的，但是数据尺度会缩放，为了保持数据尺度不变，所有的权重需要除以 1-p。而在测试时 dropout 层是关闭的。因此在测试时需要先调用model.eval()设置各个网络层的的training属性为 False，在训练时需要先调用model.train()设置各个网络层的的training属性为 True。
—————————————————end 土堆小课堂model.eval() 和 model.trian()作用———————————————————

2.7 GPU训练

使用GPU训练有两种方式：

2.7.1 GPU训练方式1：

找出网络模型、数据（输入，标注）、损失函数这几个变量，直接调用他们的 .cuda()，例如 loss.cuda()，输入图片和标签都要调用，且必须是：img = img.cuda()。

示例代码：利用gup训练方式1进行训练，并计算每个epoch的训练时间，新建一个gpu_time1.py文件，写下如下代码：

import torch
import torchvision
from torch.utils.tensorboard import SummaryWriter
import time

#准备数据集
from torch import nn
from torch.utils.data import DataLoader

train_data=torchvision.datasets.CIFAR10("./dataset",train=True,transform=torchvision.transforms.ToTensor(),download=True)
test_data=torchvision.datasets.CIFAR10("./dataset",train=False,transform=torchvision.transforms.ToTensor(),download=True)

#数据集长度
train_data_size=len(train_data)
test_data_size=len(test_data)
print("训练数据集长度为：{}".format(train_data_size))
print("测试数据集长度为：{}".format(test_data_size))

#加载数据
train_dataloader=DataLoader(train_data,batch_size=64)
test_dataloader=DataLoader(test_data,batch_size=64)

#搭建神经网络
class Tudui(nn.Module):
    def __init__(self):
        super(Tudui, self).__init__()
        self.model = nn.Sequential(
            nn.Conv2d(in_channels=3, out_channels=32, kernel_size=5, stride=1, padding=2),
            nn.MaxPool2d(kernel_size=2),
            nn.Conv2d(32, 32, 5, 1, padding=2),
            nn.MaxPool2d(2),
            nn.Conv2d(32, 64, 5, stride=1, padding=2),
            nn.MaxPool2d(kernel_size=2),

            nn.Flatten(),
            nn.Linear(in_features=1024, out_features=64),
            nn.Linear(in_features=64, out_features=10)
        )

    def forward(self, x):
        x = self.model(x)
        return x


tudui=Tudui()
tudui=tudui.cuda()


#损失函数，交叉熵
loss_fn=nn.CrossEntropyLoss()
loss_fn=loss_fn.cuda()

#优化器
learning_rate=1e-2  #学习率 1*10^(-2）
optimizer=torch.optim.SGD(tudui.parameters(),lr=learning_rate)

#设置训练的一些参数
total_train_step=0 #记录训练的次数
total_test_step=0 #记录测试的次数
epoch=10 #记录训练的轮数

#添加tensorboard
writer=SummaryWriter("gpu_time1_logs")
for i in range(epoch):
    print("----第{}轮训练开始------".format(i))
    start_time = time.time()  # 记录训练开始时间
    #添加tensorboard 以及正确率
    #训练步骤开始
    for data in train_dataloader:
        imgs,targets=data
        imgs=imgs.cuda()
        targets=targets.cuda()
        output=tudui(imgs)
        loss=loss_fn(output,targets)

        #优化器处理模型,分3步，清零，反向传播，递进
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        total_train_step+=1
        if total_train_step % 100 == 0:
            print("训练次数:{},loss:{}".format(total_train_step, loss.item()))

        writer.add_scalar("train_loss",loss.item(),total_train_step)
    end_time = time.time()
    print("第{}轮训练时间".format(i), end_time - start_time)  # 输出每个epoch的训练时间
    
    #测试，模型训练时如何知道模型是否训练好，因此每次训练完一轮都需要进行一次测试，以测试数据集上的损失进行评估
    #测试步骤开始
    total_test_loss=0
    total_accuracy=0
    with torch.no_grad(): #利用现有的模型进行测试，无梯度，无调优
        for data in test_dataloader:
            imgs,targets=data
            imgs = imgs.cuda()
            targets = targets.cuda()
            output=tudui(imgs)
            loss=loss_fn(output,targets)
            total_test_loss+=loss.item()

            accuracy=(output.argmax(1)==targets).sum()
            total_accuracy+=accuracy

    print("整体测试集上的loss为：{}".format(total_test_loss))
    ap=torch.true_divide(total_accuracy, test_data_size)
    print("整体测试集上的正确率为：{}".format(ap))

    writer.add_scalar("test_loss",total_test_loss,total_test_step)
    writer.add_scalar("test_accuracu",ap, total_test_step)

    total_test_step+=1
torch.save(tudui.state_dict(),"tudui_gpu1.pth")
print("模型已保存")
writer.close()

代码运行结果，gpu第一次启动的时候比较慢：

2.7.2 GPU训练方式2：

找出 网络模型、数据（输入，标注）、损失函数这几个变量，调用它们的.to(device) 方法，例如 loss.to(device)，图片和标签都要调用。
tensor 和module的 to()方法的区别是：tensor.to()执行的不是 inplace 操作，因此需要赋值；module.to()执行的是 inplace 操作。
其中：

device=torch.device("cpu") '''CPU训练'''
device=torch.device("cuda") '''GPU训练'''
device=torch.device("cuda:0") '''指定一个显卡'''
device=torch.device("cuda:1") '''若电脑上多张显卡，想指定第二张显卡'''

示例代码：利用gup训练方式 2 进行训练，并计算每个epoch的训练时间，新建一个gpu_time2.py文件，写下如下代码：

import torch
import torchvision
from torch.utils.tensorboard import SummaryWriter
import time

#准备数据集
from torch import nn
from torch.utils.data import DataLoader

device=torch.device("cuda") #控制在GPU上进行训练
train_data=torchvision.datasets.CIFAR10("./dataset",train=True,transform=torchvision.transforms.ToTensor(),download=True)
test_data=torchvision.datasets.CIFAR10("./dataset",train=False,transform=torchvision.transforms.ToTensor(),download=True)

#数据集长度
train_data_size=len(train_data)
test_data_size=len(test_data)
print("训练数据集长度为：{}".format(train_data_size))
print("测试数据集长度为：{}".format(test_data_size))

#加载数据
train_dataloader=DataLoader(train_data,batch_size=64)
test_dataloader=DataLoader(test_data,batch_size=64)

#搭建神经网络
class Tudui(nn.Module):
    def __init__(self):
        super(Tudui, self).__init__()
        self.model = nn.Sequential(
            nn.Conv2d(in_channels=3, out_channels=32, kernel_size=5, stride=1, padding=2),
            nn.MaxPool2d(kernel_size=2),
            nn.Conv2d(32, 32, 5, 1, padding=2),
            nn.MaxPool2d(2),
            nn.Conv2d(32, 64, 5, stride=1, padding=2),
            nn.MaxPool2d(kernel_size=2),

            nn.Flatten(),
            nn.Linear(in_features=1024, out_features=64),
            nn.Linear(in_features=64, out_features=10)
        )

    def forward(self, x):
        x = self.model(x)
        return x


tudui=Tudui()
tudui=tudui.to(device)

#损失函数，交叉熵
loss_fn=nn.CrossEntropyLoss()
loss_fn=loss_fn.to(device)

#优化器
learning_rate=1e-2  #学习率 1*10^(-2）
optimizer=torch.optim.SGD(tudui.parameters(),lr=learning_rate)

#设置训练的一些参数
total_train_step=0 #记录训练的次数
total_test_step=0 #记录测试的次数
epoch=10 #记录训练的轮数

#添加tensorboard
writer=SummaryWriter("gpu_time2_logs")
start_time=time.time() #训练开始时间
for i in range(epoch):
    print("----第{}轮训练开始------".format(i))
    #添加tensorboard 以及正确率
    #训练步骤开始
    for data in train_dataloader:
        imgs,targets=data
        imgs=imgs.to(device) #将图片放在gpu上
        targets=targets.to(device) #将标签放在gpu上
        output=tudui(imgs)
        loss=loss_fn(output,targets)

        #优化器处理模型,分3步，清零，反向传播，递进
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        total_train_step+=1
        if total_train_step % 100 == 0:
            print("训练次数:{},loss:{}".format(total_train_step, loss.item()))
            writer.add_scalar("train_loss", loss.item(), total_train_step)
    end_time = time.time()
    print("第{}轮训练时间".format(i), end_time - start_time)  # 输出每个epoch的训练时间
    #测试，模型训练时如何知道模型是否训练好，因此每次训练完一轮都需要进行一次测试，以测试数据集上的损失进行评估
    #测试步骤开始
    total_test_loss=0
    total_accuracy=0
    with torch.no_grad(): #利用现有的模型进行测试，无梯度，无调优
        for data in test_dataloader:
            imgs,targets=data
            imgs = imgs.to(device)
            targets = targets.to(device)
            output=tudui(imgs)
            loss=loss_fn(output,targets)
            total_test_loss+=loss.item()

            accuracy=(output.argmax(1)==targets).sum()
            total_accuracy+=accuracy

    print("整体测试集上的loss为：{}".format(total_test_loss))
    print("整体测试集上的正确率为：{}".format(torch.true_divide(total_accuracy, test_data_size)))

    writer.add_scalar("test_loss",total_test_loss,total_test_step)
    writer.add_scalar("test_accuracu",torch.true_divide(total_accuracy, test_data_size), total_test_step)

    total_test_step+=1
torch.save(tudui.state_dict(),"tudui_gpu2.pth")
print("模型已保存")
writer.close()

2.7.3 GPU训练note：

在用gpu训练时模型和loss可以直接model.cuda()或model.to(device) 不必要 model=model.to(device)，但是数据必须重新赋值：img=img.to(device) target=target.to(device)

2.8 完整的模型验证套路

完整的模型验证套路-利用已经训练好的模型，然后给它提供输入。

准备一张测试的图片“cat.png”，将其放在images文件夹下：
新建一个train_model_test.py文件，并输入以下代码：

import torch
import torchvision
from PIL import Image
from test_network.nn_network import *

img_path="../images/cat.png"
image=Image.open(img_path) #Image.open是PIL数据类型的
image=image.convert('RGB')#png图像有四个通道

#利用torchvision.transforms.Compose集合图片的转换
# 先通过Resize将图片转换为32乘32大小的tensor数据类型
#再通过ToTensor将图片转换为Tentor数据类型
transform=torchvision.transforms.Compose([torchvision.transforms.Resize((32,32)),
                                          torchvision.transforms.ToTensor()])
image=transform(image) #转换图片
image=image.cuda() #将数据放在cuda上

#用方式2保存的模型，因此用方式2加载网络模型，先实例化一个模型，再进行加载
model=Tudui().cuda()
#在gpu上训练的模型需要加,map_location=torch.device("cpu")
model.load_state_dict(torch.load("tudui_end.pth"))
print(model)

image=torch.reshape(image,(1,3,32,32)) #将图片reshape，相当于batchsize=1

#------------进行验证------------------
model.eval()
with torch.no_grad():
    output=model(image)

print(output)
print(output.argmax(1))#tensor([3], device='cuda:0') tensor[3]对应的是cat

运行结果：

你可能感兴趣的:(pytorch,python)

理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
Python中深拷贝与浅拷贝的区别 yuxiaoyu.
转自：http://blog.csdn.net/u014745194/article/details/70271868定义：在Python中对象的赋值其实就是对象的引用。当创建一个对象，把它赋值给另一个变量的时候，python并没有拷贝这个对象，只是拷贝了这个对象的引用而已。浅拷贝：拷贝了最外围的对象本身，内部的元素都只是拷贝了一个引用而已。也就是，把对象复制一遍，但是该对象中引用的其他对象我不复
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python编译器鹿鹿~ Python编译器 Python python 开发语言后端
嘿嘿嘿我又来了啊有些小盆友可能不知道Python其实是有编译器的，也就是PyCharm。你们可能会问到这个是干嘛的又不可以吃也不可以穿好像没有什么用，其实你还说对了这个还真的不可以吃也不可以穿，但是它用来干嘛的呢。用来编译你所打出的代码进行运行（可能这里说的有点不对但是只是个人认为）现在我们来说说PyCharm是用来干嘛的。PyCharm是一种PythonIDE，带有一整套可以帮助用户在使用Pyt
一文掌握python面向对象魔术方法（二）程序员neil python python 开发语言
接上篇：一文掌握python面向对象魔术方法（一）-CSDN博客目录六、迭代和序列化：1、__iter__(self):定义迭代器，使得类可以被for循环迭代。2、__getitem__(self,key):定义索引操作，如obj[key]。3、__setitem__(self,key,value):定义赋值操作，如obj[key]=value。4、__delitem__(self,key):定义
一文掌握python常用的list（列表）操作程序员neil python python 开发语言
目录一、创建列表1.直接创建列表：2.使用list()构造器3.使用列表推导式4.创建空列表二、访问列表元素1.列表支持通过索引访问元素，索引从0开始：2.还可以使用切片操作访问列表的一部分：三、修改列表元素四、添加元素1.append()：在末尾添加元素2.insert()：在指定位置插入元素五、删除元素1.del：删除指定位置的元素2.remove()：删除指定值的第一个匹配项3.pop()：
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
python中的深拷贝与浅拷贝 anshejd70787 python
深拷贝和浅拷贝浅拷贝的时候，修改原来的对象，浅拷贝的对象不会发生改变。1、对象的赋值对象的赋值实际上是对象之间的引用：当创建一个对象，然后将这个对象赋值给另外一个变量的时候，python并没有拷贝这个对象，而只是拷贝了这个对象的引用。当对对象做赋值或者是参数传递或者作为返回值的时候，总是传递原始对象的引用，而不是一个副本。如下所示：>>>aList=["kel","abc",123]>>>bLis
用Python实现简单的猜数字游戏程序媛了了 python 游戏 java
猜数字游戏代码：importrandomdefpythonit():a=random.randint(1,100)n=int(input("输入你猜想的数字："))whilen!=a:ifn>a:print("很遗憾，猜大了")n=int(input("请再次输入你猜想的数字："))elifna::如果玩家猜的数字n大于随机数字a，则输出"很遗憾，猜大了"，并提示玩家再次输入。elifn
用Python实现读取统计单词个数程序媛了了 python 游戏 java
完整实例代码：fromcollectionsimportCounterdefpythonit():danci={}withopen("pythonit.txt","r",encoding="utf-8")asf:foriinf:words=i.strip().split()forwordinwords:ifwordnotindanci:danci[word]=1else:danci[word]+=
VMware Workstation 11 或者 VMware Player 7安装MAC OS X 10.10 Yosemite iwindyforest vmware mac os 10.10 workstation player
最近尝试了下VMware下安装MacOS 系统，安装过程中发现网上可供参考的文章都是VMware Workstation 10以下， MacOS X 10.9以下的文章，只能提供大概的思路，但是实际安装起来由于版本问题，走了不少弯路，所以我尝试写以下总结，希望能给有兴趣安装OSX的人提供一点帮助。写在前面的话：其实安装好后发现，由于我的th
关于《基于模型驱动的B/S在线开发平台》源代码开源的疑虑？ deathwknight JavaScript java 框架
本人从学习Java开发到现在已有10年整，从一个要自学 java买成javascript的小菜鸟，成长为只会java和javascript语言的老菜鸟（个人邮箱：[email protected]）一路走来，跌跌撞撞。用自己的三年多业余时间，瞎搞一个小东西（基于模型驱动的B/S在线开发平台，非MVC框架、非代码生成）。希望与大家一起分享，同时有许些疑虑，希望有人可以交流下平台
如何把maven项目转成web项目 Kai_Ge maven MyEclipse
创建Web工程，使用eclipse ee创建maven web工程 1.右键项目,选择Project Facets,点击Convert to faceted from 2.更改Dynamic Web Module的Version为2.5.(3.0为Java7的,Tomcat6不支持). 如果提示错误,可能需要在Java Compiler设置Compiler compl
主管？？？ Array_06 工作
转载：http://www.blogjava.net/fastzch/archive/2010/11/25/339054.html 很久以前跟同事参加的培训，同事整理得很详细，必须得转！前段时间，公司有组织中高阶主管及其培养干部进行了为期三天的管理训练培训。三天的课程下来，虽然内容较多，因对老师三天来的课程内容深有感触，故借着整理学习心得的机会，将三天来的培训课程做了一个
python内置函数大全 2002wmj python
最近一直在看python的document，打算在基础方面重点看一下python的keyword、Build-in Function、Build-in Constants、Build-in Types、Build-in Exception这四个方面，其实在看的时候发现整个《The Python Standard Library》章节都是很不错的，其中描述了很多不错的主题。先把Build-in Fu
JSP页面通过JQUERY合并行 357029540 JavaScript jquery
在写程序的过程中我们难免会遇到在页面上合并单元行的情况，如图所示如果对于会的同学可能很简单，但是对没有思路的同学来说还是比较麻烦的，提供一下用JQUERY实现的参考代码 function mergeCell(){ var trs = $("#table tr"); &nb
Java基础冰天百华 java基础
学习函数式编程 package base; import java.text.DecimalFormat; public class Main { public static void main(String[] args) { // Integer a = 4; // Double aa = (double)a / 100000; // Decimal
unix时间戳相互转换 adminjun 转换 unix 时间戳
如何在不同编程语言中获取现在的Unix时间戳(Unix timestamp)？ Java time JavaScript Math.round(new Date().getTime()/1000) getTime()返回数值的单位是毫秒 Microsoft .NET / C# epoch = (DateTime.Now.ToUniversalTime().Ticks - 62135
作为一个合格程序员该做的事 aijuans 程序员
作为一个合格程序员每天该做的事 1、总结自己一天任务的完成情况最好的方式是写工作日志，把自己今天完成了什么事情，遇见了什么问题都记录下来，日后翻看好处多多 2、考虑自己明天应该做的主要工作把明天要做的事情列出来，并按照优先级排列，第二天应该把自己效率最高的时间分配给最重要的工作 3、考虑自己一天工作中失误的地方，并想出避免下一次再犯的方法出错不要紧，最重
由html5视频播放引发的总结 ayaoxinchao html5 视频 video
前言项目中存在视频播放的功能，前期设计是以flash播放器播放视频的。但是现在由于需要兼容苹果的设备，必须采用html5的方式来播放视频。我就出于兴趣对html5播放视频做了简单的了解，不了解不知道，水真是很深。本文所记录的知识一些浅尝辄止的知识，说起来很惭愧。视频结构本该直接介绍html5的<video>的，但鉴于本人对视频
解决httpclient访问自签名https报javax.net.ssl.SSLHandshakeException: sun.security.validat bewithme httpclient
如果你构建了一个https协议的站点，而此站点的安全证书并不是合法的第三方证书颁发机构所签发，那么你用httpclient去访问此站点会报如下错误 javax.net.ssl.SSLHandshakeException: sun.security.validator.ValidatorException: PKIX path bu
Jedis连接池的入门级使用 bijian1013 redis redis数据库 jedis
Jedis连接池操作步骤如下： a.获取Jedis实例需要从JedisPool中获取； b.用完Jedis实例需要返还给JedisPool； c.如果Jedis在使用过程中出错，则也需要还给JedisPool； packag
变与不变 bingyingao 不变变亲情永恒
变与不变周末骑车转到了五年前租住的小区，曾经最爱吃的西北面馆、江西水饺、手工拉面早已不在，各种店铺都换了好几茬，这些是变的。三年前还很流行的一款手机在今天看起来已经落后的不像样子。三年前还运行的好好的一家公司，今天也已经不复存在。一座座高楼拔地而起，
【Scala十】Scala核心四：集合框架之List bit1129 scala
Spark的RDD作为一个分布式不可变的数据集合，它提供的转换操作，很多是借鉴于Scala的集合框架提供的一些函数，因此，有必要对Scala的集合进行详细的了解 1. 泛型集合都是协变的，对于List而言，如果B是A的子类，那么List[B]也是List[A]的子类，即可以把List[B]的实例赋值给List[A]变量 2. 给变量赋值(注意val关键字，a，b
Nested Functions in C bookjovi c closure
Nested Functions 又称closure，属于functional language中的概念，一直以为C中是不支持closure的，现在看来我错了，不过C标准中是不支持的，而GCC支持。既然GCC支持了closure，那么 lexical scoping自然也支持了，同时在C中label也是可以在nested functions中自由跳转的
Java-Collections Framework学习与总结-WeakHashMap BrokenDreams Collections
总结这个类之前，首先看一下Java引用的相关知识。Java的引用分为四种：强引用、软引用、弱引用和虚引用。强引用：就是常见的代码中的引用，如Object o = new Object();存在强引用的对象不会被垃圾收集
读《研磨设计模式》-代码笔记-解释器模式-Interpret bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 解释器（Interpreter）模式的意图是可以按照自己定义的组合规则集合来组合可执行对象 * * 代码示例实现XML里面1.读取单个元素的值 2.读取单个属性的值 * 多
After Effects操作&快捷键 cherishLC After Effects
1、快捷键官方文档中文版：https://helpx.adobe.com/cn/after-effects/using/keyboard-shortcuts-reference.html 英文版：https://helpx.adobe.com/after-effects/using/keyboard-shortcuts-reference.html 2、常用快捷键
Maven 常用命令 crabdave maven
Maven 常用命令 mvn archetype:generate mvn install mvn clean mvn clean complie mvn clean test mvn clean install mvn clean package mvn test mvn package mvn site mvn dependency:res
shell bad substitution daizj shell 脚本
#!/bin/sh /data/script/common/run_cmd.exp 192.168.13.168 "impala-shell -islave4 -q 'insert OVERWRITE table imeis.${tableName} select ${selectFields}, ds, fnv_hash(concat(cast(ds as string), im
Java SE 第二讲（原生数据类型 Primitive Data Type） dcj3sjt126com java
Java SE 第二讲： 1. Windows: notepad, editplus, ultraedit, gvim Linux: vi, vim, gedit 2. Java 中的数据类型分为两大类： 1）原生数据类型（Primitive Data Type） 2）引用类型（对象类型）（R
CGridView中实现批量删除 dcj3sjt126com PHP yii
1，CGridView中的columns添加 array( 'selectableRows' => 2, 'footer' => '<button type="button" onclick="GetCheckbox();" style=&
Java中泛型的各种使用 dyy_gusi java 泛型
Java中的泛型的使用：1.普通的泛型使用在使用类的时候后面的<>中的类型就是我们确定的类型。 public class MyClass1<T> {//此处定义的泛型是T private T var; public T getVar() { return var; } public void setVa
Web开发技术十年发展历程 gcq511120594 Web 浏览器数据挖掘
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
openSession()与getCurrentSession()区别： hetongfei java DAO Hibernate
来自 http://blog.csdn.net/dy511/article/details/6166134 1.getCurrentSession创建的session会和绑定到当前线程,而openSession不会。 2. getCurrentSession创建的线程会在事务回滚或事物提交后自动关闭,而openSession必须手动关闭。这里getCurrentSession本地事务(本地
第一章安装Nginx+Lua开发环境 jinnianshilongnian nginx lua openresty
首先我们选择使用OpenResty，其是由Nginx核心加很多第三方模块组成，其最大的亮点是默认集成了Lua开发环境，使得Nginx可以作为一个Web Server使用。借助于Nginx的事件驱动模型和非阻塞IO，可以实现高性能的Web应用程序。而且OpenResty提供了大量组件如Mysql、Redis、Memcached等等，使在Nginx上开发Web应用更方便更简单。目前在京东如实时价格、秒
HSQLDB In-Process方式访问内存数据库 liyonghui160com
HSQLDB一大特色就是能够在内存中建立数据库，当然它也能将这些内存数据库保存到文件中以便实现真正的持久化。先睹为快！下面是一个In-Process方式访问内存数据库的代码示例：下面代码需要引入hsqldb.jar包（hsqldb-2.2.8） import java.s
Java线程的5个使用技巧 pda158 java 数据结构
Java线程有哪些不太为人所知的技巧与用法？　　萝卜白菜各有所爱。像我就喜欢Java。学无止境，这也是我喜欢它的一个原因。日常工作中你所用到的工具，通常都有些你从来没有了解过的东西，比方说某个方法或者是一些有趣的用法。比如说线程。没错，就是线程。或者确切说是Thread这个类。当我们在构建高可扩展性系统的时候，通常会面临各种各样的并发编程的问题，不过我们现在所要讲的可能会略有不同。
开发资源大整合：编程语言篇——JavaScript（1） shoothao JavaScript
概述：本系列的资源整合来自于github中各个领域的大牛，来收藏你感兴趣的东西吧。程序包管理器管理javascript库并提供对这些库的快速使用与打包的服务。 Bower - 用于web的程序包管理。 component - 用于客户端的程序包管理，构建更好的web应用程序。 spm - 全新的静态的文件包管
避免使用终结函数 vahoa.ma java jvm C++
终结函数（finalizer）通常是不可预测的，常常也是很危险的，一般情况下不是必要的。使用终结函数会导致不稳定的行为、更差的性能，以及带来移植性问题。不要把终结函数当做C++中的析构函数（destructors）的对应物。我自己总结了一下这一条的综合性结论是这样的： 1）在涉及使用资源，使用完毕后要释放资源的情形下，首先要用一个显示的方