天狼啸月1990

深入浅出PyTorch: pytorch教程

5. pytorch tutorial

5.1 pytorch installation

5.1.1 Anaconda/miniconda installation

5.1.2 创建虚拟环境

5.1.3 change package source

5.1.4 查看显卡

5.1.5 install pytorch

5.1.6 pytorch 相关学习资源

5.2 pytorch 基础知识

5.2.1 tensor introduction

5.2.2 自动求导: autograd package

5.2.3 计算梯度：backward()方法

5.2.4 CUDA 并行计算

5.2.5 AI硬件加速设备

5.3 pytorch主要模块

5.3.1 基本配置

5.3.2 数据读入: Dataset读取、变换; DataLoader批加载数据

5.3.3 NN模型构建

5.3.4 nn.Parameter

5.3.5 模型初始化

5.3.6 损失函数

5.3.7 优化器optimizer

5.3.8 评价指标

5.3.9 训练和评估

5.3.10 可视化 visualization

6. pytorch基础实战: FashionMNIST

6.1 首先导入必要的包

6.2 配置训练环境和超参数

6.3 数据读入和加载

6.3.1 数据变换

6.3.2 数据读取方式一

6.3.3 数据读取方式二

6.3.4 模型设计

6.3.5 设定损失函数

6.3.6 设定优化器

6.3.7 训练和验证

6.3.8 模型保存

7. Extension: pytorch模型定义

7.1 三种模型定义方式

7.1.1 Sequential

7.1.2 ModuleList

7.1.3 ModuleDict

7.1.4 三种方法的比较与适用场景

7.2 使用模型块快速搭建复杂网络

7.3 pytorch修改模型

7.3.1 修改模型层

7.3.2 添加外部输入

7.3.3 添加额外输出

7.4 pytorch模型保存与读取

7.4.1 单卡保存+单卡加载

7.4.2 单卡保存+多卡加载

7.4.3 多卡保存+单卡加载

7.4.4 多卡保存+多卡加载

8. Extension: pytorch进阶训练技巧

8.1 自定义损失函数

8.1.1 以函数方式定义

8.1.2 以类方式定义

8.2 动态调整学习率

8.2.1 使用官方API

8.2.2 自定义scheduler

8.3 模型微调-torchvision、timm

8.3.1 训练特定层

8.4 半精度训练

8.5 数据增强-imgaug

8.6 使用argparse进行调参

8.6.1 argparse的使用

8.6.2 更加高效使用argparse修改超参数

9. Extension: pytorch可视化

9.1 可视化网络结构

10. pytorch生态

11. 使用ONNX进行部署并推理

5. pytorch tutorial

5.1 pytorch installation

PyTorch的安装是我们学习PyTorch的第一步，也是经常出错的一步。在安装PyTorch时，我们通常使用的是Anaconda/miniconda+Pytorch+ IDE 的流程

在数据科学和最近很火的深度学习中，要用到大量成熟的package。我们一个个安装 package 很麻烦，而且很容易出现包之间的依赖不适配的问题。

而Anaconda/miniconda的出现很好的解决了我们的问题，它集成了常用于科学分析（机器学习，深度学习）的大量package，并且借助于conda我们可以实现对虚拟Python环境的管理。

5.1.1 Anaconda/miniconda installation

登陆Anaconda | Individual Edition，选择相应系统DownLoad，此处以Windows为例（Linux可以点击链接选择合适的版本进行下载或者通过官方提供的shell脚本进行下载）

在开始页找到Anaconda Prompt，一般在Anaconda3的文件夹下,( Linux在终端下就行了）

5.1.2 创建虚拟环境

Linux在终端(Ctrl+Alt+T)进行，Windows在Anaconda Prompt进行

查看现存虚拟环境: conda env list

在深度学习和机器学习中，我们经常会创建不同版本的虚拟环境来满足我们的一些需求。下面我们介绍创建虚拟环境的命令。

个人原有的anaconda配置文件，在安装目录下 etc/profile.d/conda.sh。

创建anaconda虚拟环境：conda create -n env_name python==version

# 注：将env_name 替换成你的环境的名称，version替换成对应的版本号，eg：3.8

激活环境命令：conda activate env_name

安装包：conda install package_name

一种方式：conda install matplotlib==2.0.2

另一种方式：conda install pip; pip install matplotlib==2.0.2，因为安装miniconda后，miniconda指令地址会自动覆盖server home本地路径，指向自己。需要判断pip指令指向的是否是当前虚拟环境！这因为有时候source命令改变指令路径后，会造成指令混乱，在gcl_env虚拟环境下安装的python package会装到装到base env中。不会调.bashrc路径和miniconda路径，就重装miniconda。

卸载包：conda remove package_name

显示所有安装包：conda list

删除虚拟环境命令：conda remove -n env_name --all

退出当前环境：conda deactivate

关于更多的命令，我们可以查看Anaconda/miniconda官方提供的命令，官网链接：点击这里

5.1.3 change package source

在安装package时，我们经常会使用pip install package_name和conda install package_name 的命令，但是一些package下载速度会很慢，因此我们需要进行换源，换成国内源，加快我们的下载速度。

单次下载换源

pip install package_name -i https://pypi.tuna.tsinghua.edu.cn/simple

pip换源

Linux下的换源，我们首先需要在用户目录下新建文件夹.pip，并且在文件夹内新建文件pip.conf，具体命令如下

cd ~

mkdir .pip/

vi pip.conf

随后，我们需要在pip.conf添加下方的内容:

[global]

index-url = http://pypi.douban.com/simple

[install]

use-mirrors =true

mirrors =http://pypi.douban.com/simple/

trusted-host =pypi.douban.com

Windows下换源：

1) 文件管理器文件路径地址栏敲：%APPDATA% 回车，快速进入 C:\Users\电脑用户\AppData\Roaming 文件夹中

2) 新建 pip 文件夹并在文件夹中新建 pip.ini 配置文件

3) 我们需要在pip.ini 配置文件内容，我们可以选择使用记事本打开，输入以下内容，并按下ctrl+s保存，在这里我们使用的是豆瓣源为例子。

[global]

index-url = http://pypi.douban.com/simple

[install]

use-mirrors =true

mirrors =http://pypi.douban.com/simple/

trusted-host =pypi.douban.com

5.1.4 查看显卡

cmd/terminal中输入nvidia-smi（Linux和Win命令一样），查看自己是否有NVIDIA的独立显卡及其型号

Note that我们需要看下版本号，看自己可以兼容的CUDA版本，等会安装PyTorch时是可以向下兼容的。具体适配表如下图所示。

5.1.5 install pytorch

使用conda下载或者pip下载（建议conda安装）

在线下载

打开Terminal，输入conda activate env_name(env_name 为你对应的环境名称)，切换到对应的环境下面，我们就可以进行PyTorch的安装了。

Note：

Stable代表的是稳定版本，Preview代表的是先行版本

可以结合电脑是否有显卡，选择CPU版本还是CUDA版本，CUDA版本需要拥有独显且是NVIDIA的GPU

官方建议我们使用Anaconda/miniconda来进行管理

关于安装的系统要求

Windows：

Windows 7及更高版本；建议使用Windows 10或者更高的版本

Windows Server 2008 r2 及更高版本

Linux：以常见的CentOS和Ubuntu为例

CentOS, 最低版本7.3-1611

Ubuntu, 最低版本 13.04，这里会导致cuda安装的最大版本不同

macOS：

macOS 10.10及其以上

有些电脑所支持的cuda版本<10.2，此时我们需要进行手动降级，即就是cudatoolkit = 你所适合的版本，但是这里需要注意下一定要保持PyTorch和cudatoolkit的版本适配。查看Previous PyTorch Versions | PyTorch

离线下载

5.1.6 pytorch 相关学习资源

Awesome-pytorch-list：目前已获12K Star，包含了NLP,CV,常见库，论文实现以及Pytorch的其他项目。
PyTorch官方文档：官方发布的文档，十分丰富。
Pytorch-handbook：GitHub上已经收获14.8K，pytorch手中书。
PyTorch官方社区：PyTorch拥有一个活跃的社区，在这里你可以和开发pytorch的人们进行交流。
PyTorch官方tutorials：官方编写的tutorials，可以结合colab边动手边学习
动手学深度学习：动手学深度学习是由李沐老师主讲的一门深度学习入门课，拥有成熟的书籍资源和课程资源，在B站，Youtube均有回放。
Awesome-PyTorch-Chinese：常见的中文优质PyTorch资源
labml.ai Deep Learning Paper Implementations：手把手实现经典网络代码
YSDA course in Natural Language Processing:YSDA course in Natural Language Processing
huggingface:hugging face
ModelScope: 魔搭社区

5.2 pytorch 基础知识

5.2.1 tensor introduction

在PyTorch中， torch.Tensor 是存储和变换数据的主要工具。如果你之前用过NumPy，你会发现 Tensor 和NumPy的多维数组非常类似。然而，Tensor 提供GPU计算和自动求梯度等更多功能，这些使 Tensor 这一数据类型更加适合深度学习

几何代数中定义的张量是基于向量和矩阵的推广，比如我们可以将标量视为零阶张量，矢量可以视为一阶张量，矩阵就是二阶张量。

张量维度	代表含义
0维张量	代表的是标量（数字）
1维张量	代表的是向量
2维张量	代表的是矩阵
3维张量	时间序列数据股价文本数据单张彩色图片(RGB)
4维	图像
5维	视频

5.2.2 自动求导: autograd package

pytorch中，所有神经网络的核心是autograd package，也就是自动微分。autograd包为张量上所有操作提供了自动求导机制。它是一个在运行时定义(define-by-run)框架，这意味着反向传播是根据代码如何运行来决定的，并且每次迭代可以是不同的。

torch.Tensor是这个包的核心类。如果设置它的属性.requires_grad为True，那么它将会追踪对于该张量的所有操作。当完成计算后可以调用.backward()来自动计算所有的梯度。这个张量的所有梯度将会自动累加到.grad属性。-->注意：grad在反向传播过程中是累加的(accumulated)，这意味着每一次运行反向传播，梯度都会累加之前的梯度，所以一般在反向传播之前需把梯度清零。

Note，在y.backward()时，如果y是标量，则不需要为backward()传入任何参数；否则，需要传入一个与y同形的Tensor。

.detach()方法，要防止一个张量被跟踪历史，可以调用.detach()方法将其与计算历史分离，并阻止它未来的计算记录被跟踪。

with torch.no_grad()方法，为了防止跟踪历史记录，可以将代码块包装在with torch.no_grad():中。在评估模型时特别有用，因为模型可能具有requires_grad=True的可训练参数，但是我们不需要在此过程中对它们进行梯度计算。

还有一个类对于autograd的实现非常重要：Function。Tensor和Function互相连接生成了一个无环图(acyclic graph)，它编码了完整的计算历史。每个张量都有一个.grad_fn属性，该属性引用了创建Tensor自身的Function(除非这个tensor是用户手动创建的，即这个张量的grad_fn是None)

5.2.3 计算梯度：backward()方法

如果需要计算导数(梯度)，可以在Tensor上调用.backward()方法。如果Tensor是一个标量，则不需要为backward()指定任何参数，但如果它有更多的元素，则需要指定一个gradient参数，该参数是形状匹配的张量。

因此out.backward()和 out.backward(torch.tensor(1.)) 等价。

# 创建一个张量并设置requires_grad=True用来追踪其计算历史
x = torch.ones(2, 2, requires_grad=True)
print(x)

tensor([[1., 1.],
        [1., 1.]], requires_grad=True)

# 对这个张量做一次运算：
y = x**2
print(y)  # y是计算的结果，所以它有grad_fn属性。

tensor([[1., 1.],
        [1., 1.]], grad_fn=)

# 对 y 进行更多操作
z = y * y * 3
out = z.mean()

print(z, out)
tensor([[3., 3.],
        [3., 3.]], grad_fn=) tensor(3., grad_fn=)

# 现在开始进行反向传播
out.backward()

# 输出导数 d(out)/dx
print(x.grad)

tensor([[3., 3.],
        [3., 3.]])

5.2.4 CUDA 并行计算

pytorch做DL过程中，可能会遇到数据量较大无法在单块GPU上完成，或者需要提升计算速度的场景，这时就需要用到并行计算--多个GPU来参与训练，减少训练时间。

为什么需要CUDA？

CUDA是GPU提供商NVIDA提供的GPU并行计算框架。对于GPU本身的编程，使用的是CUDA语言来实现的。

在pytorch中，使用CUDA表示要开始要求我们的模型或数据开始使用GPU了。

在编写程序中，当我们使用了.cuda()时，其功能是让我们的model或data从CPU迁移到GPU(0)当中，通过GPU开始计算。

Note：

我们使用GPU时使用的是.cuda()而不是.gpu()。这是因为当前GPU的编程接口采用CUDA，但是市面上的GPU并不是都支持CUDA，只有部分NVIDA的GPU才支持，AMD的GPU编程接口采用的是OpenCL，在现阶段pytorch并不支持。

数据在GPU和CPU之间传递时会比较耗时，我们应当尽量避免数据的切换。

GPU运算很快，但是在使用简单的操作时，我们应该尽量使用CPU去完成。

当我们的服务器上有多个GPU，我们应该指明我们使用的GPU是哪一块，如果我们不设置的话，tensor.cuda()方法会默认将tensor保存到第一块GPU上，等价于tensor.cuda(0)，这将会导致out of memory的错误。

常见的并行方法

(详见原文)

设置CUDA加速训练

我们可以通过一下两种方式设置显卡

# CUDA GPU 设置方式

# 方案一：使用os.environ，这种情况如果使用GPU不需要设置
import os
os.environ['CUDA_VISIBLE_DEVICES'] = '0,1' # 指明调用的GPU为0,1号
-------------------------------------------------------
# 方案二：使用“device”，后续对要使用GPU的变量用.to(device)即可
device = torch.device("cuda:1" if torch.cuda.is_available() else "cpu") # 指明调用的GPU为1号

我们是需要显示的将数据和模型通过.duda()方法转移到GPU上就可以加速我们的孙连。

model = Net()
model.cuda() # 模型显示转移到CUDA上

for image,label in dataloader:
    # 图像和标签显示转移到CUDA上
    image = image.cuda() 
    label = label.cuda()

5.2.5 AI硬件加速设备

TPU, Tensor Processing Unit。google为为优化自身的Tensorflow框架而打造的一款计算神经网络专用芯片。
NPU, Neural-network Processing Unit。“数据驱动并行计算”的架构，中国寒武纪。

5.3 pytorch主要模块

机器学习任务的几个重要步骤：

数据预处理。数据格式的统一、异常数据的消除、必要的数据变换，同时划分训练集、验证集和测试集，常见的方法包括：按比例随机选取、KFold方法(可以使用sklearn中的test_train_split函数、kfold来是实现)
模型选择。
设定损失函数和优化方法、超参数。sklearn中自带的损失函数和优化器。
模型训练
模型验证/测试。在验证/测试集上计算模型表现。

深度学习与机器学习在流程上类似，在代码上有较大差异：

由于深度学习所需的样本量很大，一次加载全部数据运行可能会超出内存容量而无法实现；
同时还有batch训练等提高模型表现的策略，需要每次训练读取固定数量的样本送入模型中训练，因此deep learning在数据加载上需要有专门的设计。

深度学习与机器学习在模型表现上的差异：

深度神经网络往往需要“逐层”搭建，或者预先定义好可以实现特定功能的模块，再把这些模块组装起来。

损失函数和优化器要能够保证反向传播能够在用户自行定义的模型上实现。

程序默认是在cpu上运行的。因此在代码实现中，需要把模型和数据“放到”GPU上去做运算，同时还需要保证损失函数和优化器能够在GPU上工作。

深度学习中训练和验证过程最大的特点在于读入数据是按批的，每次读入一个批次的数据，放入GPU中训练，然后将损失函数反向传播回网络最前面的层，同时使用优化器调整网络参数。这里会涉及到各个模块配合的问题。训练/验证后还需要根据设定好的指标计算模型表现。

5.3.1 基本配置

导包和超参数设置

import os 
import numpy as np 
import torch
import torch.nn as nn
from torch.utils.data import Dataset, DataLoader
import torch.optim as optimizer

batch_size = 16
# 批次的大小
lr = 1e-4
# 优化器的学习率
max_epochs = 100

5.3.2 数据读入: Dataset读取、变换; DataLoader批加载数据

pytorch数据读入是通过Dataset + DataLoader的方式完成的，

Dataset定义好数据的格式和数据变换形式，
DataLoader用ieterative的方式不断入读批次数据。

我们可以定义自己的Dataset类来实现灵活的数据读取，定义的类需要继承pytorch自身的Dataset类。主要包含三个函数：

__init__: 用于向类中传入外部参数，同时定义样本集。
__getitem__: 用于逐个读取样本集合中的元素，可以进行一定的变换，并将返回训练/验证所需的数据。
__len__: 用于返回数据集的样本数。

class MyDataset(Dataset):
    def __init__(self, data_dir, info_csv, image_list, transform=None):
        """
        Args:
            data_dir: path to image directory.
            info_csv: path to the csv file containing image indexes
                with corresponding labels.
            image_list: path to the txt file contains image names to training/validation set
            transform: optional transform to be applied on a sample.
        """
        label_info = pd.read_csv(info_csv)
        image_file = open(image_list).readlines()
        self.data_dir = data_dir
        self.image_file = image_file
        self.label_info = label_info
        self.transform = transform

    def __getitem__(self, index):
        """
        Args:
            index: the index of item
        Returns:
            image and its labels
        """
        image_name = self.image_file[index].strip('\n')
        raw_label = self.label_info.loc[self.label_info['Image_index'] == image_name]
        label = raw_label.iloc[:,0]
        image_name = os.path.join(self.data_dir, image_name)
        image = Image.open(image_name).convert('RGB')
        if self.transform is not None:
            image = self.transform(image)
        return image, label

    def __len__(self):
        return len(self.image_file)

构建好Dataset后，就可以使用DataLoader来按批次读入数据了，实现代码如下：

from torch.utils.data import DataLoader

train_loader = torch.utils.data.DataLoader(train_data, batch_size=batch_size, 
num_workers=4, shuffle=True, drop_last=True)
val_loader = torch.utils.data.DataLoader(val_data, batch_size=batch_size, 
num_workers=4, shuffle=False)

batch_size: 样本是按“批”读入的，batch_size就是每次读入的样本数
num_workers: 有多少个进程用于读取数据，windows下该参数设置为0，linux下常见的为4或8，根据自己的电脑配置来设置。
shuffle: 是否将读入的数据打乱，一般在选training set中设置为True，在validation set中设置为False。
drop_last: 对于样本最后一部分没有达到批次数的样本，使其不在参与训练。

查看加载的数据。pytorch中DataLoader读取的数据可以使用next和iter来完成。

import matplotlib.pyplot as plt
images, labels = next(iter(val_loader))
print(images.shape)
plt.imshow(images[0].transpose(1,2,0))
plt.show()

5.3.3 NN模型构建

pytorch中的神经网络模型一般是基于nn.Module类的模型来完成的，它让模型构造更灵活。

Module类是torch.nn模块里提供的一个模型构造类，是所有神经网络模块的基类，我们可以继承它来定义我们想要的模型。下面是继承Module类构造的多层感知机。这里定义的MLP类重载了Module类的__init__函数和forward函数。他们分别用于创建模型参数和定义前向计算(正向传播)。

e.g. 一个具有两个隐藏层的多层感知机。

import torch
from torch import nn

class MLP(nn.Module):
  # 声明带有模型参数的层，这里声明了两个全连接层
  def __init__(self, **kwargs):
    # 调用MLP父类Block的构造函数来进行必要的初始化。这样在构造实例时还可以指定其他函数
    super(MLP, self).__init__(**kwargs)
    self.hidden = nn.Linear(784, 256)
    self.act = nn.ReLU()
    self.output = nn.Linear(256,10)
    
   # 定义模型的前向计算，即如何根据输入x计算返回所需要的模型输出
  def forward(self, x):
    o = self.act(self.hidden(x))
    return self.output(o)

上述MLP类中无需定义反向传播函数。系统将通过自动求梯度而自动生成反向传播所需的backward函数。

我们可以实例化MLP类得到模型变量net。下面的代码初始化net并传入数据x做一次前向计算。其中，net(x)会调用MLP继承自Module类的__call__函数，这个函数将调用MLP类定义的forward函数来完成前向计算。因此我们自己构造模型时需要明确定义模型的forward过程。

X = torch.rand(2,784) # 设置一个随机的输入张量
net = MLP() # 实例化模型
print(net) # 打印模型
net(X) # 前向计算

MLP(
  (hidden): Linear(in_features=784, out_features=256, bias=True)
  (act): ReLU()
  (output): Linear(in_features=256, out_features=10, bias=True)
)
tensor([[ 0.0149, -0.2641, -0.0040,  0.0945, -0.1277, -0.0092,  0.0343,  0.0627,
         -0.1742,  0.1866],
        [ 0.0738, -0.1409,  0.0790,  0.0597, -0.1572,  0.0479, -0.0519,  0.0211,
         -0.1435,  0.1958]], grad_fn=)

5.3.4 nn.Parameter

background：当我们的网络有一些其他的设计时，会需要一些额外的参数同样跟着整个网络的训练进行学习更新，最后得到最优的值

本质：torch.nn.Parameter(Tensor)的输入是tensor变量，用于生成参数矩阵W。将一个固定不可训练的tensor转化成一个可以训练改变的vector(即parameter)，并将parameter绑定到这个module里面。

Requires_grad=True表示可以训练(改变)，False表示值不可改变。

nn.Parameter类其实是Tensor的子类，所以它也会被自动记录计算历史和反向传播，如果一个Tensor是Parameter，那么它会自动被添加到模型的参数列表里。所以在自定义含模型参数的层时，我们应该将参数定义成Parameter，除了直接定义成Parameter类外，还可以使用ParameterList和ParameterDict分别定义参数的列表和字典。

class MyListDense(nn.Module):
    def __init__(self):
        super(MyListDense, self).__init__()
        self.params = nn.ParameterList([nn.Parameter(torch.randn(4, 4))
                                         for i in range(3)])
        self.params.append(nn.Parameter(torch.randn(4, 1)))

    def forward(self, x):
        for i in range(len(self.params)):
            x = torch.mm(x, self.params[i])
        return x
net = MyListDense()
print(net)

class MyDictDense(nn.Module):
    def __init__(self):
        super(MyDictDense, self).__init__()
        self.params = nn.ParameterDict({
                'linear1': nn.Parameter(torch.randn(4, 4)),
                'linear2': nn.Parameter(torch.randn(4, 1))
        })
        self.params.update({'linear3': nn.Parameter(torch.randn(4, 2))}) # 新增

    def forward(self, x, choice='linear1'):
        return torch.mm(x, self.params[choice])

net = MyDictDense()
print(net)

二维卷积层

二维卷积层将输入和卷积核做互相关运算，并加上一个标量偏差来得到输出。卷积层的模型参数草扩列卷积核和标量偏差。在训练模型的时候，通常我们先对卷积核随机初始化，然后不断迭代卷积核和偏差。

import torch
from torch import nn

# 卷积运算（二维互相关）
def corr2d(X, K): 
    h, w = K.shape
    X, K = X.float(), K.float()
    Y = torch.zeros((X.shape[0] - h + 1, X.shape[1] - w + 1))
    for i in range(Y.shape[0]):
        for j in range(Y.shape[1]):
            Y[i, j] = (X[i: i + h, j: j + w] * K).sum()
    return Y

# 二维卷积层
class Conv2D(nn.Module):
    def __init__(self, kernel_size):
        super(Conv2D, self).__init__()
        self.weight = nn.Parameter(torch.randn(kernel_size))
        self.bias = nn.Parameter(torch.randn(1))

    def forward(self, x):
        return corr2d(x, self.weight) + self.bias

5.3.5 模型初始化

在深度学习模型中，权重的初始化极为重要。一个好的初始值，会使模型收敛速度提高，使模型准确率更加精确。一般情况下，我们不适用全为0初始值训练网络。为了利于训练和减少收敛时间，我们需要对模型进行合理的初始化。

torch.nn.init为我们提供了常用的初始化方法。

带有下划线后缀的函数，意味着他们可以直接原地更改输入张量的值。

通过访问torch.nn.init的官方文档链接，我们发现torch.nn.init提供了以下初始化方法： 1 . torch.nn.init.uniform_(tensor, a=0.0, b=1.0) 2 . torch.nn.init.normal_(tensor, mean=0.0, std=1.0) 3 . torch.nn.init.constant_(tensor, val) 4 . torch.nn.init.ones_(tensor) 5 . torch.nn.init.zeros_(tensor) 6 . torch.nn.init.eye_(tensor) 7 . torch.nn.init.dirac_(tensor, groups=1) 8 . torch.nn.init.xavier_uniform_(tensor, gain=1.0) 9 . torch.nn.init.xavier_normal_(tensor, gain=1.0) 10 . torch.nn.init.kaiming_uniform_(tensor, a=0, mode='fan__in', nonlinearity='leaky_relu') 11 . torch.nn.init.kaiming_normal_(tensor, a=0, mode='fan_in', nonlinearity='leaky_relu') 12 . torch.nn.init.orthogonal_(tensor, gain=1) 13 . torch.nn.init.sparse_(tensor, sparsity, std=0.01) 14 . torch.nn.init.calculate_gain(nonlinearity, param=None) 关于计算增益如下表：

torch.nn.init使用

torch.nn.init需要根据实际模型来进行初始化，通常使用isinstance()来进行判断模块类型。

import torch
import torch.nn as nn

conv = nn.Conv2d(1,3,3)
linear = nn.Linear(10,1)

isinstance(conv,nn.Conv2d) # 判断conv是否是nn.Conv2d类型
isinstance(linear,nn.Conv2d) # 判断linear是否是nn.Conv2d类型

# 查看随机初始化的conv参数
conv.weight.data
# 查看linear的参数
linear.weight.data

# 对conv进行kaiming初始化
torch.nn.init.kaiming_normal_(conv.weight.data)
conv.weight.data
# 对linear进行常数初始化
torch.nn.init.constant_(linear.weight.data,0.3)
linear.weight.data

初始化函数的封装

人们常常将各种初始化方法定义为一个initialize_weights()的函数并在模型初始后进行使用。

def initialize_weights(self):
	for m in self.modules():
		# 判断是否属于Conv2d
		if isinstance(m, nn.Conv2d):
			torch.nn.init.xavier_normal_(m.weight.data)
			# 判断是否有偏置
			if m.bias is not None:
				torch.nn.init.constant_(m.bias.data,0.3)
		elif isinstance(m, nn.Linear):
			torch.nn.init.normal_(m.weight.data, 0.1)
			if m.bias is not None:
				torch.nn.init.zeros_(m.bias.data)
		elif isinstance(m, nn.BatchNorm2d):
			m.weight.data.fill_(1) 		 
			m.bias.data.zeros_()

# 模型的定义
class MLP(nn.Module):
  # 声明带有模型参数的层，这里声明了两个全连接层
  def __init__(self, **kwargs):
    # 调用MLP父类Block的构造函数来进行必要的初始化。这样在构造实例时还可以指定其他函数
    super(MLP, self).__init__(**kwargs)
    self.hidden = nn.Conv2d(1,1,3)
    self.act = nn.ReLU()
    self.output = nn.Linear(10,1)
    
   # 定义模型的前向计算，即如何根据输入x计算返回所需要的模型输出
  def forward(self, x):
    o = self.act(self.hidden(x))
    return self.output(o)

mlp = MLP()
print(list(mlp.parameters()))
print("-------初始化-------")

initialize_weights(mlp)
print(list(mlp.parameters()))

5.3.6 损失函数

模型好的training离不开优质的负反馈，这里的负反馈就是损失函数loss。

pytorch常用torch.nn来定义损失函数。

--》先解决实际问题的过程中可以进一步探索、借鉴现有工作，设计自己的损失函数。

二分类交叉熵损失函数
交叉熵损失函数
L1损失函数。计算输出y和真实标签target之间差值的绝对值。
MSE损失函数。用于计算regression问题的损失
平滑L1(Smooth L1)损失函数。减轻离群点带来的影响。
目标破松分布的负对数似然函数
KL散度。计算相对熵，用于连续分布的距离度量。
MarginRankingLoss。计算两个向量之间的相似度/差异，用于排序任务。
多标签边界损失函数。用于多标签分类问题计算。
二分类损失函数。计算二分类logistic loss。
多分类的折页损失。
三元组损失
HingEmbeddingLoss。对输出的embedding结果做Hing损失计算
预先相似度CTC损失函数。用于解决时序类数据的分类。

5.3.7 优化器optimizer

模型优化器 Optimizer

优化器optimizer是根据NN反向传播的梯度信息来更新网络参数，以起到降低loss函数计算值，使得模型输出更加接近真实标签。

Optimizer有三个属性：defaults存储优化器的超参数；state参数的缓存；para_groups管理的参数组，是一个list，其中每个元素是一个字典，顺序是params, lr, momentum, dampening, weight_decay, nesterov。

torch.optim.ASGD
torch.optim.Adadelta
torch.optim.Adagrad
torch.optim.Adam
torch.optim.AdamW
torch.optim.Adamax
torch.optim.LBFGS
torch.optim.RMSprop
torch.optim.Rprop
torch.optim.SGD
torch.optim.SparseAdam

Optimzer方法：

zero_grad(): 清空所管理参数的梯度。因为pytorch的特性是张量的梯度不自动清零，所以每次反向传播后都需要清空梯度。
step(): 执行一步梯度更新，参数更新。
add_param_group(): 添加参数组。
load_state_dict(): 加载状态参数字典，可以用来进行模型的断点续训练
state_dict(): 获取优化器当前状态信息字典。

Optimizer 使用流程：

1）定义优化器

2）梯度置零

3）梯度更新

# 每个优化器都是一个类，我们需要进行实例化才能使用
class Net(nn.Moddule):
    ···
net = Net()

optimizer = torch.optim.SGD(net.parameters(), lr=1e-5)
for epoch in range(EPOCH):
	...
	optimizer.zero_grad()  #梯度置零
	loss = ...             #计算loss
	loss.backward()        #BP反向传播
	optimizer.step()       #梯度更新

Optimizer给网络不同的层赋予不同的优化器参数。

from torch import optim
from torchvision.models import resnet18

net = resnet18()

optimizer = optim.SGD([
    {'params':net.fc.parameters()},#fc的lr使用默认的1e-5
    {'params':net.layer4[0].conv1.parameters(),'lr':1e-2}],lr=1e-5)

# 可以使用param_groups查看属性

Optimizer实际操作

import os
import torch

# 设置权重，服从正态分布  --> 2 x 2
weight = torch.randn((2, 2), requires_grad=True)
# 设置梯度为全1矩阵  --> 2 x 2
weight.grad = torch.ones((2, 2))
# 输出现有的weight和data
print("The data of weight before step:\n{}".format(weight.data))
print("The grad of weight before step:\n{}".format(weight.grad))
# 实例化优化器
optimizer = torch.optim.SGD([weight], lr=0.1, momentum=0.9)
# 进行一步操作
optimizer.step()
# 查看进行一步后的值，梯度
print("The data of weight after step:\n{}".format(weight.data))
print("The grad of weight after step:\n{}".format(weight.grad))
# 权重清零
optimizer.zero_grad()
# 检验权重是否为0
print("The grad of weight after optimizer.zero_grad():\n{}".format(weight.grad))
# 输出参数
print("optimizer.params_group is \n{}".format(optimizer.param_groups))
# 查看参数位置，optimizer和weight的位置一样，我觉得这里可以参考Python是基于值管理
print("weight in optimizer:{}\nweight in weight:{}\n".format(id(optimizer.param_groups[0]['params'][0]), id(weight)))
# 添加参数：weight2
weight2 = torch.randn((3, 3), requires_grad=True)
optimizer.add_param_group({"params": weight2, 'lr': 0.0001, 'nesterov': True})
# 查看现有的参数
print("optimizer.param_groups is\n{}".format(optimizer.param_groups))
# 查看当前状态信息
opt_state_dict = optimizer.state_dict()
print("state_dict before step:\n", opt_state_dict)
# 进行5次step操作
for _ in range(50):
    optimizer.step()
# 输出现有状态信息
print("state_dict after step:\n", optimizer.state_dict())
# 保存参数信息
torch.save(optimizer.state_dict(),os.path.join(r"D:\pythonProject\Attention_Unet", "optimizer_state_dict.pkl"))
print("----------done-----------")
# 加载参数信息
state_dict = torch.load(r"D:\pythonProject\Attention_Unet\optimizer_state_dict.pkl") # 需要修改为你自己的路径
optimizer.load_state_dict(state_dict)
print("load state_dict successfully\n{}".format(state_dict))
# 输出最后属性信息
print("\n{}".format(optimizer.defaults))
print("\n{}".format(optimizer.state))
print("\n{}".format(optimizer.param_groups))

5.3.8 评价指标

模型评价指标

混淆矩阵
Overall Accuracy
Average Accuracy
Kappa系数
Recall
Precision
F1
PR曲线
置信度
IOU
AP
mAP

5.3.9 训练和评估

我们在完成了模型的训练后，需要在测试集/验证集上完成模型的验证，以确保我们的模型具有泛化能力、不会出现过拟合等问题。在PyTorch中，训练和评估的流程是一致的，只是在训练过程中需要将模型的参数进行更新，而在评估过程中则不需要更新参数。

Learning Target:

pytorch的训练/评估模式的开启
完整的训练/评估流程

完成了上述设定后就可以加载数据开始训练模型了。

首先应该设置模型的状态：
- 如果是训练状态，那么模型的参数应该支持反向传播的修改；
- 如果是验证/测试状态，则不应该修改模型参数。

在pytorch中，模型的状态设置非常简便，如下的两个操作二选一即可：

model.train()   # 训练状态
model.eval()   # 验证/测试状态

我们前面在DataLoader构建完成后介绍了如何从中读取数据，在训练过程中使用类似的操作即可，区别在于此时要用for循环读取DataLoader中的全部数据。

for data, label in train_loader:

之后将数据放到GPU上用于后续计算，此处以.cuda()为例

data, label = data.cuda(), label.cuda()

开始用当前批次数据做训练时，应当先将优化器的梯度置零：

optimizer.zero_grad()

之后将data放入模型中训练：

output = model(data)

根据预先定义的criterion计算损失函数：

loss = criterion(output, label)

将loss反向传播回网络：

loss.backward()

使用优化器更新模型参数

optimizer.step()

这样一个训练过程就完成了，对于测试或验证过程，可以计算分类准确率，这部分会在下一节图像分类中介绍。

验证/测试的流程基本与训练过程一致，不同点在于：

需要预先设置torch.no_grad，以及将model调至eval模式

不需要将优化器的梯度置零

不需要将loss反向传播回到网络

不需要更新optimizer

一个完整的图像分类的训练过程如下所示：

def train(epoch):
    model.train()
    train_loss = 0
    for data, label in train_loader:
        data, label = data.cuda(), label.cuda()
        optimizer.zero_grad()
        output = model(data)
        loss = criterion(output, label)
        loss.backward()
        optimizer.step()
        train_loss += loss.item()*data.size(0)
    train_loss = train_loss/len(train_loader.dataset)
		print('Epoch: {} \tTraining Loss: {:.6f}'.format(epoch, train_loss))

对应的，一个完成图像分类的验证过程如下所示：

with torch.no_grad():

def val(epoch):       
    model.eval()
    val_loss = 0
    with torch.no_grad():
        for data, label in val_loader:
            data, label = data.cuda(), label.cuda()
            output = model(data)
            preds = torch.argmax(output, 1)
            loss = criterion(output, label)
            val_loss += loss.item()*data.size(0)
            running_accu += torch.sum(preds == label.data)
    val_loss = val_loss/len(val_loader.dataset)
    print('Epoch: {} \tTraining Loss: {:.6f}'.format(epoch, val_loss))

5.3.10 可视化 visualization

在pytorch深度学习中，可视化是一个可选项。指的是某些任务在训练完成后，需要对一些必要的内容进行可视化，比如分类的ROC曲线，卷积网络中的卷积核，一个训练/验证过程的损害函数曲线等。

6. pytorch基础实战: FashionMNIST

基础实战——FashionMNIST时装分类 — 深入浅出PyTorch

6.1 首先导入必要的包

import os
import numpy as np
import pandas as pd
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import Dataset, DataLoader

6.2 配置训练环境和超参数

# 配置GPU，这里有两种方式
## 方案一：使用os.environ
os.environ['CUDA_VISIBLE_DEVICES'] = '0'
# 方案二：使用“device”，后续对要使用GPU的变量用.to(device)即可
device = torch.device("cuda:1" if torch.cuda.is_available() else "cpu")

## 配置其他超参数，如batch_size, num_workers, learning rate, 以及总的epochs
batch_size = 256
num_workers = 4   # 对于Windows用户，这里应设置为0，否则会出现多线程错误
lr = 1e-4
epochs = 20

6.3 数据读入和加载

这里同时展示两种方式:

下载并使用PyTorch提供的内置数据集
从网站下载以csv格式存储的数据，读入并转成预期的格式
第一种数据读入方式只适用于常见的数据集，如MNIST，CIFAR10等，PyTorch官方提供了数据下载。这种方式往往适用于快速测试方法（比如测试下某个idea在MNIST数据集上是否有效）
第二种数据读入方式需要自己构建Dataset，这对于PyTorch应用于自己的工作中十分重要

6.3.1 数据变换

同时，还需要对数据进行必要的变换，比如说需要将图片统一为一致的大小，以便后续能够输入网络训练；需要将数据格式转为Tensor类，等等。

这些变换可以很方便地借助torchvision包来完成，这是PyTorch官方用于图像处理的工具库，上面提到的使用内置数据集的方式也要用到。PyTorch的一大方便之处就在于它是一整套“生态”，有着官方和第三方各个领域的支持。这些内容我们会在后续课程中详细介绍。

# 首先设置数据变换
from torchvision import transforms

image_size = 28
data_transform = transforms.Compose([
    transforms.ToPILImage(),  
     # 这一步取决于后续的数据读取方式，如果使用内置数据集读取方式则不需要
    transforms.Resize(image_size),
    transforms.ToTensor()
])

6.3.2 数据读取方式一

## 读取方式一：使用torchvision自带数据集，下载可能需要一段时间
from torchvision import datasets

train_data = datasets.FashionMNIST(root='./', train=True, download=True, transform=data_transform)
test_data = datasets.FashionMNIST(root='./', train=False, download=True, transform=data_transform)

6.3.3 数据读取方式二

## 读取方式二：读入csv格式的数据，自行构建Dataset类
# csv数据下载链接：https://www.kaggle.com/zalando-research/fashionmnist
class FMDataset(Dataset):
    def __init__(self, df, transform=None):
        self.df = df
        self.transform = transform
        self.images = df.iloc[:,1:].values.astype(np.uint8)
        self.labels = df.iloc[:, 0].values
        
    def __len__(self):
        return len(self.images)
    
    def __getitem__(self, idx):
        image = self.images[idx].reshape(28,28,1)
        label = int(self.labels[idx])
        if self.transform is not None:
            image = self.transform(image)
        else:
            image = torch.tensor(image/255., dtype=torch.float)
        label = torch.tensor(label, dtype=torch.long)
        return image, label

train_df = pd.read_csv("./FashionMNIST/fashion-mnist_train.csv")
test_df = pd.read_csv("./FashionMNIST/fashion-mnist_test.csv")
train_data = FMDataset(train_df, data_transform)
test_data = FMDataset(test_df, data_transform)

在构建训练和测试数据集完成后，需要定义DataLoader类，以便在训练和测试时加载数据

train_loader = DataLoader(train_data, batch_size=batch_size, shuffle=True, num_workers=num_workers, drop_last=True)
test_loader = DataLoader(test_data, batch_size=batch_size, shuffle=False, num_workers=num_workers)

读入后，我们可以做一些数据可视化操作，主要是验证我们读入的数据是否正确

import matplotlib.pyplot as plt
image, label = next(iter(train_loader))
print(image.shape, label.shape)
plt.imshow(image[0][0], cmap="gray")
------------------------------------------
torch.Size([256, 1, 28, 28]) 
torch.Size([256])

6.3.4 模型设计

手搭一个CNN，模型构建完成后，将模型放到GPU上用于训练。

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv = nn.Sequential(
            nn.Conv2d(1, 32, 5),
            nn.ReLU(),
            nn.MaxPool2d(2, stride=2),
            nn.Dropout(0.3),
            nn.Conv2d(32, 64, 5),
            nn.ReLU(),
            nn.MaxPool2d(2, stride=2),
            nn.Dropout(0.3)
        )
        self.fc = nn.Sequential(
            nn.Linear(64*4*4, 512),
            nn.ReLU(),
            nn.Linear(512, 10)
        )
        
    def forward(self, x):
        x = self.conv(x)
        x = x.view(-1, 64*4*4)
        x = self.fc(x)
        # x = nn.functional.normalize(x)
        return x

model = Net()
model = model.cuda()
# model = nn.DataParallel(model).cuda()   # 多卡训练时的写法，之后的课程中会进一步讲解

6.3.5 设定损失函数

使用torch.nn模块自带的CrossEntropy损失
PyTorch会自动把整数型的label转为one-hot型，用于计算CE loss
这里需要确保label是从0开始的，同时模型不加softmax层（使用logits计算）,这也说明了PyTorch训练中各个部分不是独立的，需要通盘考虑

criterion = nn.CrossEntropyLoss()
# criterion = nn.CrossEntropyLoss(weight=[1,1,1,1,3,1,1,1,1,1])

6.3.6 设定优化器

optimizer = optim.Adam(model.parameters(), lr=0.001)

6.3.7 训练和验证

各自封装成函数，方便后续调用
关注两者的主要区别：

模型状态设置
是否需要初始化优化器
是否需要将loss传回到网络
是否需要每步更新optimizer

此外，对于测试或验证过程，可以计算分类准确率

def train(epoch):
    model.train()
    train_loss = 0
    for data, label in train_loader:
        data, label = data.cuda(), label.cuda()
        optimizer.zero_grad()
        output = model(data)
        loss = criterion(output, label)
        loss.backward()
        optimizer.step()
        train_loss += loss.item()*data.size(0)
    train_loss = train_loss/len(train_loader.dataset)
    print('Epoch: {} \tTraining Loss: {:.6f}'.format(epoch, train_loss))

def val(epoch):       
    model.eval()
    val_loss = 0
    gt_labels = []
    pred_labels = []
    with torch.no_grad():
        for data, label in test_loader:
            data, label = data.cuda(), label.cuda()
            output = model(data)
            preds = torch.argmax(output, 1)
            gt_labels.append(label.cpu().data.numpy())
            pred_labels.append(preds.cpu().data.numpy())
            loss = criterion(output, label)
            val_loss += loss.item()*data.size(0)
    val_loss = val_loss/len(test_loader.dataset)
    gt_labels, pred_labels = np.concatenate(gt_labels), np.concatenate(pred_labels)
    acc = np.sum(gt_labels==pred_labels)/len(pred_labels)
    print('Epoch: {} \tValidation Loss: {:.6f}, Accuracy: {:6f}'.format(epoch, val_loss, acc))

for epoch in range(1, epochs+1):
    train(epoch)
    val(epoch)

6.3.8 模型保存

训练完成后，可以使用torch.save保存模型参数或者整个模型，也可以在训练过程中保存模型
这部分会在后面的课程中详细介绍

save_path = "./FahionModel.pkl"
torch.save(model, save_path)

7. Extension: pytorch模型定义

7.1 三种模型定义方式

Module类是torch.nn模块里提供的一个模型构造类(nn.Module)，是所有神经网络模块的基类，我们可以继承它来定义我们想要的模型
pytorch模型定义应包括两个主要部分：各个部分的初始化(__init__)；数据流向定义(forward)

基于nn.Module，我们可以通过Sequential, ModuleList和ModuleDict三种方式定义pytorch模型。

7.1.1 Sequential

对应的模块为nn.Sequential()。

当模型的前向计算为简单串联各个层的计算时，Sequential类可以通过更加简单的方式定义模型。它可以接收一个子模块的有序字典(OrderedDict)或者一系列子模块作为参数来逐一添加Module的实例，而模型的前向计算就是将这些实例按添加的顺序逐一计算。我们结合Sequential和定义方式加以理解：

from collections import OrderedDict
class MySequential(nn.Module):
    def __init__(self, *args):
        super(MySequential, self).__init__()
        if len(args) == 1 and isinstance(args[0], OrderedDict): # 如果传入的是一个OrderedDict
            for key, module in args[0].items():
                self.add_module(key, module)  
                # add_module方法会将module添加进self._modules(一个OrderedDict)
        else:  # 传入的是一些Module
            for idx, module in enumerate(args):
                self.add_module(str(idx), module)
    def forward(self, input):
        # self._modules返回一个 OrderedDict，保证会按照成员添加时的顺序遍历成
        for module in self._modules.values():
            input = module(input)
        return input

直接排列

import torch.nn as nn
net = nn.Sequential(
        nn.Linear(784, 256),
        nn.ReLU(),
        nn.Linear(256, 10), 
        )
print(net)
--------------------------
Sequential(
  (0): Linear(in_features=784, out_features=256, bias=True)
  (1): ReLU()
  (2): Linear(in_features=256, out_features=10, bias=True)
)

使用OrderedDict

import collections
import torch.nn as nn
net2 = nn.Sequential(collections.OrderedDict([
          ('fc1', nn.Linear(784, 256)),
          ('relu1', nn.ReLU()),
          ('fc2', nn.Linear(256, 10))
          ]))
print(net2)
----------------------------------------
Sequential(
  (fc1): Linear(in_features=784, out_features=256, bias=True)
  (relu1): ReLU()
  (fc2): Linear(in_features=256, out_features=10, bias=True)
)

我们可以看到，使用Sequential定义模型的好处在于简单、易读，同时使用Sequential定义的模型不需要在写forward，因为顺序已经定义好了。但使用Sequential也会使得模型定义丧失灵活性，比如需要在模型中间加入一个外部输入时就不适合用Sequential的方式实现。使用时需要根据实际需求加以选择。

7.1.2 ModuleList

对应模块为nn.ModuleList()。

ModuleList接收一个子模块(或层，需属于nn.Module类)的列表作为输入，然后也可以类似List那样进行append和extend操作。同时，子模块或层的权重也会自动添加到网络中来。

net = nn.ModuleList([nn.Linear(784, 256), nn.ReLU()])
net.append(nn.Linear(256, 10)) # # 类似List的append操作
print(net[-1])  # 类似List的索引访问
print(net)
------------------------------------------------------
Linear(in_features=256, out_features=10, bias=True)
ModuleList(
  (0): Linear(in_features=784, out_features=256, bias=True)
  (1): ReLU()
  (2): Linear(in_features=256, out_features=10, bias=True)
)

Note that，nn.ModuleList并没有定义一个网络，它只是将不同的模块储存在一起。Modulelist中元素的先后顺序并不代表其在网络中的真实位置顺序，需要经过forward函数指定各个层的先后顺序后才算完成了模型的定义。具体实现时用for循环可完成：

class model(nn.Module):
  def __init__(self, ...):
    super().__init__()
    self.modulelist = ...
    ...
    
  def forward(self, x):
    for layer in self.modulelist:
      x = layer(x)
    return x

7.1.3 ModuleDict

对应模块为nn.ModuleDict()。

ModuleDict和ModuleList的作用类似，只是ModuleDict能够更方便得作为神经网络的层添加名称。

net = nn.ModuleDict({
    'linear': nn.Linear(784, 256),
    'act': nn.ReLU(),
})
net['output'] = nn.Linear(256, 10) # 添加
print(net['linear']) # 访问
print(net.output)
print(net)
------------------------------------
Linear(in_features=784, out_features=256, bias=True)
Linear(in_features=256, out_features=10, bias=True)
ModuleDict(
  (act): ReLU()
  (linear): Linear(in_features=784, out_features=256, bias=True)
  (output): Linear(in_features=256, out_features=10, bias=True)
)

7.1.4 三种方法的比较与适用场景

Sequential适用于快速验证结果，因为已经明确了要用哪些层，直接写一下就好了，不需要同时写__init__和forward。

ModuleList和Dict在某个完全相同的层需要重复出现多次时，非常方便实现，可以"一行顶多行"。

当我们需要之前层的信息时，比如ResNets中的残差计算，当前层的结果需要和之前层中的结果进行融合，一般使用ModuleList/moduleDict比较方便。

7.2 使用模型块快速搭建复杂网络

problem：当模型深度非常大时，有几百行代码中很多重复出现的结构，使用起来很不方便。

solution：将这些重复出现的层定义为一个“模块”，若干层串联成的“模块”也有其输入和输出。

7.3 pytorch修改模型

7.3.1 修改模型层

将模型(net)最后名称为"fc"的层替换成了名称为"classifier"的结构。

import torchvision.models as models
net = models.resnet50()
print(net)

# 重新定义一个"模块"
from collections import OrderedDict
classifier = nn.Sequential(OrderedDict([('fc1', nn.Linear(2048, 128)),
                          ('relu1', nn.ReLU()), 
                          ('dropout1',nn.Dropout(0.5)),
                          ('fc2', nn.Linear(128, 10)),
                          ('output', nn.Softmax(dim=1))
                          ]))
    
net.fc = classifier

7.3.2 添加外部输入

将原模型作为一个整体参数输入到新模型中，新模型调整好原模型输入与后续添加输入、后续层之间的关系，从而完成模型修改。

import torchvision.models as models
net = models.resnet50()
print(net)

class Model(nn.Module):
    def __init__(self, net):
        super(Model, self).__init__()
        self.net = net
        self.relu = nn.ReLU()
        self.dropout = nn.Dropout(0.5)
        self.fc_add = nn.Linear(1001, 10, bias=True)
        self.output = nn.Softmax(dim=1)
        
    def forward(self, x, add_variable):
        x = self.net(x)
        x = torch.cat((self.dropout(self.relu(x)), add_variable.unsqueeze(1)),1)
        x = self.fc_add(x)
        x = self.output(x)
        return x

7.3.3 添加额外输出

target：输出模型某一中间层的结果，以施加额外的监督，获得更好的中间层结果。

idea：修改模型定义中forward函数的return变量。

import torchvision.models as models
net = models.resnet50()
print(net)

class Model(nn.Module):
    def __init__(self, net):
        super(Model, self).__init__()
        self.net = net
        self.relu = nn.ReLU()
        self.dropout = nn.Dropout(0.5)
        self.fc1 = nn.Linear(1000, 10, bias=True)
        self.output = nn.Softmax(dim=1)
        
    def forward(self, x, add_variable):
        x1000 = self.net(x)
        x10 = self.dropout(self.relu(x1000))
        x10 = self.fc1(x10)
        x10 = self.output(x10)
        return x10, x1000

7.4 pytorch模型保存与读取

pytorch存储模型主要采用pkl，pt，pth三种格式。就使用层面来说并没有区别。

一个pytorch模型主要包含两个部分：模型结构和权重。其中，模型时继承nn.Module的类，权重的数据结构是一个字典(keyi是层名，value是权重向量)。

因此，存储也由此分为两种形式：存储整个模型(包括结构和权重)，和只存储模型权重。

7.4.1 单卡保存+单卡加载

import os
import torch
from torchvision import models

os.environ['CUDA_VISIBLE_DEVICES'] = '0'   #这里替换成希望使用的GPU编号
model = models.resnet152(pretrained=True)
model.cuda()

save_dir = 'resnet152.pt'   #保存路径

# 保存+读取整个模型
torch.save(model, save_dir)
loaded_model = torch.load(save_dir)
loaded_model.cuda()

# 保存+读取模型权重
torch.save(model.state_dict(), save_dir)
loaded_model = models.resnet152()   #注意这里需要对模型结构有定义
loaded_model.load_state_dict(torch.load(save_dir))
loaded_model.cuda()

7.4.2 单卡保存+多卡加载

这种情况的处理比较简单，读取单卡保存的模型后，使用nn.DataParallel函数进行分布式训练设置即可（相当于3.1代码中.cuda()替换一下）：

import os
import torch
from torchvision import models

os.environ['CUDA_VISIBLE_DEVICES'] = '0'   #这里替换成希望使用的GPU编号
model = models.resnet152(pretrained=True)
model.cuda()

# 保存+读取整个模型
torch.save(model, save_dir)

os.environ['CUDA_VISIBLE_DEVICES'] = '1,2'   #这里替换成希望使用的GPU编号
loaded_model = torch.load(save_dir)
loaded_model = nn.DataParallel(loaded_model).cuda()

# 保存+读取模型权重
torch.save(model.state_dict(), save_dir)

os.environ['CUDA_VISIBLE_DEVICES'] = '1,2'   #这里替换成希望使用的GPU编号
loaded_model = models.resnet152()   #注意这里需要对模型结构有定义
loaded_model.load_state_dict(torch.load(save_dir))
loaded_model = nn.DataParallel(loaded_model).cuda()

7.4.3 多卡保存+单卡加载

import os
import torch
from torchvision import models

os.environ['CUDA_VISIBLE_DEVICES'] = '1,2'   #这里替换成希望使用的GPU编号

model = models.resnet152(pretrained=True)
model = nn.DataParallel(model).cuda()

# 保存+读取整个模型
torch.save(model, save_dir)

os.environ['CUDA_VISIBLE_DEVICES'] = '0'   #这里替换成希望使用的GPU编号
loaded_model = torch.load(save_dir).module

7.4.4 多卡保存+多卡加载

import os
import torch
from torchvision import models

os.environ['CUDA_VISIBLE_DEVICES'] = '0,1,2'   #这里替换成希望使用的GPU编号

model = models.resnet152(pretrained=True)
model = nn.DataParallel(model).cuda()

# 保存+读取模型权重，强烈建议！！
torch.save(model.state_dict(), save_dir)
loaded_model = models.resnet152()   #注意这里需要对模型结构有定义
loaded_model.load_state_dict(torch.load(save_dir)))
loaded_model = nn.DataParallel(loaded_model).cuda()

8. Extension: pytorch进阶训练技巧

8.1 自定义损失函数

8.1.1 以函数方式定义

def my_loss(output, target):
    loss = torch.mean((output - target)**2)
    return loss

8.1.2 以类方式定义

因为损失函数的_loss和_WeightedLoss继承自nn.Module，所以我们可以将其当做神经网络的一层来对待。

class DiceLoss(nn.Module):
    def __init__(self,weight=None,size_average=True):
        super(DiceLoss,self).__init__()
        
    def forward(self,inputs,targets,smooth=1):
        inputs = F.sigmoid(inputs)       
        inputs = inputs.view(-1)
        targets = targets.view(-1)
        intersection = (inputs * targets).sum()                   
        dice = (2.*intersection + smooth)/(inputs.sum() + targets.sum() + smooth)  
        return 1 - dice

# 使用方法    
criterion = DiceLoss()
loss = criterion(input,targets)

8.2 动态调整学习率

problem: 学习率的选择是DL中困扰人们许久的问题。

学习率设置过小，会极大降低收敛速度，增加训练时间；学习率太大，可能导致参数在最优解两侧来回震荡。
当我们选定了一个合适的学习率后，经过多伦训练后，可能会出现准确率震荡或loss不再下降等情况，说明当前学习率已不能满足模型调优的需求。

solution：可以通过一个适当的学习率衰减策略来改善这种现象，提高我们的精度。这种方式在pytorch中称为scheduler。

8.2.1 使用官方API

lr_scheduler.LambdaLR
lr_scheduler.MultiplicativeLR
lr_scheduler.StepLR
lr_scheduler.MultiStepLR
lr_scheduler.ExponentialLR
lr_scheduler.CosineAnnealingLR
lr_scheduler.ReduceLROnPlateau
lr_scheduler.CyclicLR
lr_scheduler.OneCycleLR
lr_scheduler.CosineAnnealingWarmRestarts

# 选择一种优化器
optimizer = torch.optim.Adam(...) 
# 选择上面提到的一种或多种动态调整学习率的方法
scheduler1 = torch.optim.lr_scheduler.... 
scheduler2 = torch.optim.lr_scheduler....
...
schedulern = torch.optim.lr_scheduler....
# 进行训练
for epoch in range(100):
    train(...)
    validate(...)
    optimizer.step()
    # 需要在优化器参数更新之后再动态调整学习率
# scheduler的优化是在每一轮后面进行的
scheduler1.step() 
...
schedulern.step()

8.2.2 自定义scheduler

自定义函数adjust_learning_rate来改变param_group中lr的值。

def adjust_learning_rate(optimizer, epoch):
    lr = args.lr * (0.1 ** (epoch // 30))
    for param_group in optimizer.param_groups:
        param_group['lr'] = lr

optimizer = torch.optim.SGD(model.parameters(),lr = args.lr,momentum = 0.9)
for epoch in range(10):
    train(...)
    validate(...)
    adjust_learning_rate(optimizer,epoch)

8.3 模型微调-torchvision、timm

problem: 在实际应用中，我们数据集可能只有几千张，这时从头开始训练具有几千万参数的大型神经网络是不现实的。

solution：迁移学习的一大应用场景--微调 finetuning。比如pytorch中预训练好的网络模型(VGG，ResNet系列，mobilenet系列)

在源数据集(如ImageNet数据集)上预训练一个神经网络模型，即源模型。

创建一个新的神经网络模型，即目标模型。它复制了源模型上除了输出层外的所有模型设计及其参数。我们假设这些模型参数包含了源数据集上学习到的知识，且这些知识同样适用于目标数据集。我们还假设源模型的输出层跟源数据集的标签紧密相关，因此在目标模型中不予采用。

为目标模型添加一个输出⼤小为⽬标数据集类别个数的输出层，并随机初始化该层的模型参数。

在目标数据集上训练目标模型。我们将从头训练输出层，而其余层的参数都是基于源模型的参数微调得到的。

8.3.1 训练特定层

在默认情况下，参数的属性.requires_grad=True，如果我们从头开始训练或微调不需要注意这里。但如果我们正在提取特征并且只想为新初始化的层计算梯度，其他参数不进行改变。我们就需要通过设置requires_grad=False来冻结部分层。

def set_parameter_requires_grad(model, feature_extracting):
    if feature_extracting:
        for param in model.parameters():
            param.requires_grad = False

import torchvision.models as models
# 冻结参数的梯度
feature_extract = True
model = models.resnet18(pretrained=True)
set_parameter_requires_grad(model, feature_extract)
# 修改模型
num_ftrs = model.fc.in_features
model.fc = nn.Linear(in_features=num_ftrs, out_features=4, bias=True)

8.4 半精度训练

为了节省显卡显存。

pytorch默认的浮点数存储方式是torch.float32，小数点后位数更多固然能保证数据的准确性，但绝大多数场景下不需要这么精确，只保留一半的信息也不会影响结果，即使用torch.float16格式。由于精度减了一半，所以被称为“半精度”。

import autocast

from torch.cuda.amp import autocast

模型设置

在模型定义中，使用python的装饰器方法，用autocast装饰模型中的forward函数。关于装饰器的使用，可以参考这里

@autocast()   
def forward(self, x):
    ...
    return x

训练过程

在训练过程中，只需在将数据输入模型及其之后的部分放入“with autocast():“即可：

 for x in train_loader:
	x = x.cuda()
	with autocast():
            output = model(x)
        ...

8.5 数据增强-imgaug

problem: 为了解决模型过拟合问题。

我们可以通过加入正则项或减少模型学习参数来解决。

但最直接的避免过拟合方法是增加数据。

但有些应用场景下我们无法获得大量数据，针对这种有限limited数据问题的解决方案

数据增强，提高训练数据集的大小和质量，以便我们可以用它们来构建更好的深度学习模型。

8.6 使用argparse进行调参

在服务器上跑模型时，如何更方便的修改超参数。

Argparse

8.6.1 argparse的使用

总的来说，我们可以将argparse的使用归纳为以下三个步骤。

创建ArgumentParser()对象
调用add_argument()方法添加参数
使用parse_args()解析参数在接下来的内容中，我们将以实际操作来学习argparse的使用方法。

# demo.py
import argparse

# 创建ArgumentParser()对象
parser = argparse.ArgumentParser()

# 添加参数
parser.add_argument('-o', '--output', action='store_true', 
    help="shows output")
# action = `store_true` 会将output参数记录为True
# type 规定了参数的格式
# default 规定了默认值
parser.add_argument('--lr', type=float, default=3e-5, help='select the learning rate, default=1e-3') 

parser.add_argument('--batch_size', type=int, required=True, help='input batch size')  
# 使用parse_args()解析函数
args = parser.parse_args()

if args.output:
    print("This is some output")
    print(f"learning rate:{args.lr} ")

---------------------------------------------------------------------------
我们在命令行使用python demo.py --lr 3e-4 --batch_size 32，就可以看到以下的输出
----------------------------------------------------------------------------
This is some output
learning rate: 3e-4

argparse的参数主要可以分为可选参数和必选参数。可选参数就跟我们的lr参数相类似，未输入的情况下会设置为默认值。必选参数就跟我们的batch_size参数相类似，当我们给参数设置required =True后，我们就必须传入该参数，否则就会报错。

8.6.2 更加高效使用argparse修改超参数

import argparse  
  
def get_options(parser=argparse.ArgumentParser()):  
  
    parser.add_argument('--workers', type=int, default=0,  
                        help='number of data loading workers, you had better put it '  
                              '4 times of your gpu')  
  
    parser.add_argument('--batch_size', type=int, default=4, help='input batch size, default=64')  
  
    parser.add_argument('--niter', type=int, default=10, help='number of epochs to train for, default=10')  
  
    parser.add_argument('--lr', type=float, default=3e-5, help='select the learning rate, default=1e-3')  
  
    parser.add_argument('--seed', type=int, default=118, help="random seed")  
  
    parser.add_argument('--cuda', action='store_true', default=True, help='enables cuda')  
    parser.add_argument('--checkpoint_path',type=str,default='',  
                        help='Path to load a previous trained model if not empty (default empty)')  
    parser.add_argument('--output',action='store_true',default=True,help="shows output")  
  
    opt = parser.parse_args()  
  
    if opt.output:  
        print(f'num_workers: {opt.workers}')  
        print(f'batch_size: {opt.batch_size}')  
        print(f'epochs (niters) : {opt.niter}')  
        print(f'learning rate : {opt.lr}')  
        print(f'manual_seed: {opt.seed}')  
        print(f'cuda enable: {opt.cuda}')  
        print(f'checkpoint_path: {opt.checkpoint_path}')  
  
    return opt  
  
if __name__ == '__main__':  
    opt = get_options()

我们可以在training文件中用argparse调用、修改参数

# 导入必要库
...
import config

opt = config.get_options()

manual_seed = opt.seed
num_workers = opt.workers
batch_size = opt.batch_size
lr = opt.lr
niters = opt.niters
checkpoint_path = opt.checkpoint_path

# 随机数的设置，保证复现结果
def set_seed(seed):
    torch.manual_seed(seed)
    torch.cuda.manual_seed_all(seed)
    random.seed(seed)
    np.random.seed(seed)
    torch.backends.cudnn.benchmark = False
    torch.backends.cudnn.deterministic = True

...


if __name__ == '__main__':
	set_seed(manual_seed)
	for epoch in range(niters):
		train(model,lr,batch_size,num_workers,checkpoint_path)
		val(model,lr,batch_size,num_workers,checkpoint_path)

9. Extension: pytorch可视化

9.1 可视化网络结构

随着深度神经网络做的的发展，网络的结构越来越复杂，我们也很难确定每一层的输入结构，输出结构以及参数等信息，这样导致我们很难在短时间内完成debug。因此掌握一个可以用来可视化网络结构的工具是十分有必要的。类似的功能在另一个深度学习库Keras中可以调用一个叫做model.summary()的API来很方便地实现，调用后就会显示我们的模型参数，输入大小，输出大小，模型的整体参数等，但是在PyTorch中没有这样一种便利的工具帮助我们可视化我们的模型结构。

torchinfo

torchinfo的安装

# 安装方法一
pip install torchinfo 
# 安装方法二
conda install -c conda-forge torchinfo

torchinfo的使用

trochinfo的使用也是十分简单，我们只需要使用torchinfo.summary()就行了，必需的参数分别是model，input_size[batch_size,channel,h,w]。

import torchvision.models as models
from torchinfo import summary
resnet18 = models.resnet18() # 实例化模型
summary(resnet18, (1, 3, 224, 224)) # 1：batch_size 3:图片的通道数 224: 图片的高宽

CNN可视化
tensorflow可视化。TensorBoard工具

10. pytorch生态

torchvision简介。计算机视觉
PyTorchVideo。专注于视频理解工作的深度学习库
torchtext。NLP工具包

11. 使用ONNX进行部署并推理

深度学习的最终目的是要实现模型的部署以方便我们的生活和解决传统方法不能解决的问题。通常人们会将模型部署在手机端、开发板，嵌入式设备上，但是这些设备上由于框架的规模，环境依赖，算力的限制，我们无法直接使用训练好的权重进行推理

我们会将PyTorch训练好的模型转换为ONNX( Open Neural Network Exchange) 格式，然后使用ONNX Runtime运行它进行推理。

参考

3.7 训练和评估 — 深入浅出PyTorch

你可能感兴趣的:(pytorch教程)

有限元分析学习——Anasys Workbanch第一阶段笔记梳理垂杨有暮鸦⊙_⊙ 有限元分析学习笔记有限元分析
第一阶段笔记主要源自于哔哩哔哩《ANSYS-workbench有限元分析应用基础教程》张晔主要内容导图：笔记导航如下：AnasysWorkbanch第一阶段笔记(1)基本信息与结果解读_有限元分析变形比例-CSDN博客AnasysWorkbanch第一阶段笔记(2)网格单元与应力奇异_应力图怎么看应力奇异-CSDN博客AnasysWorkbanch第一阶段笔记(3)装配体分析基本思路_ansys装
利用 PyTorch 动态计算图和自动求导机制实现自适应神经网络 drebander AI 编程 pytorch 神经网络人工智能
在深度学习任务中，不同任务的复杂度千差万别。为了解决复杂任务对模型容量的需求，同时避免简单任务因过度拟合导致的性能下降，我们可以构建一个能够根据任务自动调整网络结构的神经网络。在PyTorch中，动态计算图和自动求导机制为实现这一目标提供了强大的工具。动态网络结构设计PyTorch的动态计算图允许我们根据运行时的输入数据或任务复杂度，动态创建和修改网络结构。动态添加/移除层：可以在训练过程中根据需
用Github+hexo搭个人博客遇到的坑 hamster2021 github npm node.js git
我搭博客看的是知乎上这个教程：从零开始搭建个人博客（超详细）-知乎(zhihu.com)当我按教程第5篇在Blog文件夹里用gitbash输入以下命令时：npminstallhexo-deployer-git--save报出了以下错误：npmERR!codeEPERMnpmERR!syscallopennpmERR!pathD:\nodejs\node_cache\_cacache\tmp\5c2
uniapp - [全端兼容] 实现精美Editor富文本编辑器功能，uniApp全平台兼容的富文本插件组件用户可上传图片及对接服务器存储文件等，手机移动端H5网页富文本/小程序富文本/App富文本！王二红 +UniApp uni-app 富文本使用富文本编辑器插入图片图像 uni-app微信小程序富文本 uniapp网页h5端富文本 uniap安卓苹果app富文本富文本上传图片及服务器保存
前言网上的教程乱七八糟且兼容性太差，本文提供优质示例。在uni-app全平台兼容（H5网页网站、支付宝/微信小程序、安卓App、苹果App、nvue）开发中，详解引入使用富文本编辑器及图片上传显示等功能，用户可上传图片显示和服务器保存回显效果（插入图片），uniApp各平台都兼容的富文本editor插件，自定义富文本按钮功能及自由排版样式布局，uniapp富文本组件插件用于发布文章/发布资讯公告/
使用PyTorch实现逻辑回归：从训练到模型保存与加载 Luzem0319 pytorch 逻辑回归人工智能
1.引入必要的库首先，需要引入必要的库。PyTorch用于构建和训练模型，pandas和numpy用于数据处理，matplotlib用于结果的可视化。importtorchimporttorch.nnasnnimporttorch.optimasoptimfromtorch.utils.dataimportDataLoader,TensorDatasetimportpandasaspdimport
Flask教程5：flask数据库SQLAlchemy Cachel wood Flask入门教程数据库 flask oracle python 阿里云开发语言 LLM
文章目录SQLAlchemy为什么使用ORM初始化数据库配置表模型的定义与数据库映射数据的增、删、改、查操作数据的添加数据的查找数据的修改数据的删除init_app作用详解SQLAlchemySQLAlchemy是一个基于Python实现的ORM(ObjectRelationalMapping，对象关系映射）框架。该框架建立在DBAPI(数据库应用程序接口系统)之上，使用关系对象映射进行数据库操作
麒麟 V10（ky10.x86_64）无网环境下 openssl - 3.2.2 与 openssh - 9.8p1 升级【最全教程】寒冰碧海 Linux 服务器运维指南安全 linux 运维服务器网络
目录背景安装包下载上传解压安装包安装zlib安装OpenSSL安装OpenSSH验证背景近期，项目上线已进入倒计时阶段，然而在至关重要的安全检查环节中，却惊现现有的OpenSSH存在一系列令人担忧的漏洞：OpenSSH资源管理错误漏洞（CVE-2021-28041）OpenSSH信息泄露漏洞（CVE-2020-14145）OpenSSH输入验证错误漏洞（CVE-2020-12062）OpenSSH
探索游戏开发的新境界：Game Engine From Scratch 邹澜鹤Gardener
探索游戏开发的新境界：GameEngineFromScratch去发现同类优质开源项目:https://gitcode.com/在这个充满创新和无限可能的时代，如果你想踏入游戏开发的领域，或者想深入理解游戏引擎的工作原理，那么GameEngineFromScratch这个开源项目绝对值得你的关注。由作者在知乎专栏中详细讲解的手工打造次世代游戏引擎系列教程，结合此代码库，将引领你一步步走进游戏引擎的
Pytorch 基础之张量索引攻城狮随笔 Pytorch 机器学习 pytorch 深度学习 python
本次将介绍一下Tensor张量常用的索引与切片的方法：1.index索引index索引值表示相应维度值的对应索引a=torch.rand(4,3,28,28)print(a[0].shape)#返回维度一的第0索引tensorprint(a[0,0].shape)#返回维度一0索引位置，维度二0索引位置的tensorprint(a[0,0,0].shape)#返回维度一0索引，维度二0索引，维度三
Docker最新超详细教程——入门简介金鳞踏雨 Docker docker 容器运维命令
Docker最新超详细教程——入门简介微服务中存在的痛点什么是Docker？Docker如何解决依赖兼容问题？Docker如何解决不同系统环境问题？（生产环境差异）操作系统结构应用于计算机交互的流程Docker与虚拟机有什么区别？Docker架构镜像和容器DockerHub如何用Docker？下一节：Docker的安装与部署Docker最新超详细教程——入门简介微服务中存在的痛点之前学习了Spri
linux lamp环境源码搭建教程,Linux_Lamp环境(源码包)搭建详细教程林文曦 linux lamp环境源码搭建教程
LinuxLamp环境源码包搭建详细教程一：软件准备篇Apache:httpd-2.4.7.tar.gzMySql:mysql-5.5.35.tar.gzPHP:php-5.5.7.tar.gzApr:apr-1.5.0.tar.gzApr-Util:apr-util-1.5.3.tar.gzPcre:pcre-8.32.tar.gz其他软件请apt-getinstall安装：autoconf、c
SpringCloud系列教程：微服务的未来（十七）监听Nacos配置变更、更新路由、实现动态路由程序猿零零漆 SpringCloud专栏 spring cloud 微服务 java
前言在微服务架构中，API网关是各个服务之间的入口点，承担着路由、负载均衡、安全认证等重要功能。为了实现动态的路由配置管理，通常需要通过中心化的配置管理系统来实现灵活的路由更新，而无需重启网关服务。Nacos作为一个开源的动态服务发现与配置管理平台，可以方便地实现这一目标。本文将介绍如何利用Nacos配置中心来动态更新SpringCloudGateway的路由配置，确保路由信息的实时更新，并提升系
Qt-Ribbon-Widget 项目教程柯戈喻James
Qt-Ribbon-Widget项目教程Qt-Ribbon-WidgetARibbonwidgetforQt项目地址:https://gitcode.com/gh_mirrors/qt/Qt-Ribbon-Widget1、项目的目录结构及介绍Qt-Ribbon-Widget项目的目录结构如下：Qt-Ribbon-Widget/├──src/│├──main.cpp│├──mainwindow.cp
从零到手搓一个Agent：AI Agents新手入门精通大模型. 人工智能 chatgpt 大数据深度学习智能体算法大模型
今日主题：当什么是Agent，与LLM的区别又是啥这一天，你的女朋友问你（假设我们有女朋友），宝宝，什么是Agent啊，Agent和LLM有什么区别呀，最近大家都在说的Agent究竟是什么，包括很多文章都在写的Agent，还有之前谷歌发布的Agents白皮书究竟是什么，对我们有什么帮助，对我们有什么影响呢？现在，编者专门做了一个系列，从最简单的讲起，解开这个迷雾，这个系列的教程，会帮助你了解基本概
02-硬件入门学习/嵌入式教程-Type-C使用教程坏柠零基础DIY 学习 c语言开发语言
一、前言今天，我们将一起探索Type-C的基础知识及其在实际应用中的使用。无论你是电子爱好者还是刚刚接触嵌入式系统的朋友都能一定的帮助；。二、Type-C接口简介Type-C是一种新型的USB接口标准，由USBImplementersForum（USBIF）于2014年推出。它以其可逆插的设计、更高的数据传输速度和更强的电力传输能力而著称。Type-C接口不仅适用于智能手机、平板电脑等移动设备，也
构建级联下拉列表：AJAX和jQuery实战教程不胖的羊
本文还有配套的精品资源，点击获取简介：级联下拉列表是网页交互中常见的元素，用于根据用户的选择动态更新后续选项。本文通过示例展示如何利用AJAX和jQuery技术实现级联下拉列表，并简单介绍了Prototype框架和jquery.jar文件的可能用途。详细步骤包括HTML结构设置、事件监听、AJAX请求构建、服务器响应处理以及界面更新，同时提供了提高用户体验的额外功能。1.级联下拉列表概念及应用场景
.NET MAUI 教程：入门与配置束慧可Melville
.NETMAUI教程：入门与配置项目地址:https://gitcode.com/gh_mirrors/ma/maui1.项目的目录结构及介绍在.NETMulti-platformAppUI（简称.NETMAUI）项目中，目录结构通常如下：YourProject/├──Android/│└──...//Android平台相关的代码和资源├──iOS/│└──...//iOS平台相关的代码和资源├─
创建MAUI .NET 应用程序的详细教程 Tnp____ .net .NET
MAUI（多平台应用程序用户界面）是一个用于创建跨平台应用程序的开发框架。它是基于.NET平台的最新技术，可以让开发人员使用一个共享的代码库构建并运行在多个操作系统上的应用程序，如Android、iOS、Windows等。本文将详细介绍如何创建一个基于MAUI.NET的应用程序，并提供相应的源代码。步骤1：安装开发环境和工具首先，确保你的系统中已经安装了以下工具：.NET6SDK：前往Micros
chatgpt赋能python：在U盘上安装Python开发环境教程 tulingtest ChatGpt chatgpt python 开发语言计算机
在U盘上安装Python开发环境教程如果你是一位Python开发人员，那么你肯定知道，为了成功地开发和运行Python程序，需要安装Python开发环境。然而，对于很多人来说，它们的工作地点可能不支持安装软件，或者他们需要在多个设备上使用Python开发环境。针对这些情况，将Python开发环境安装到U盘上就成了必要的。优点使用U盘上Python开发环境的好处如下：灵活性：可以在任何地方使用Pyt
PyAutoGUI 使用教程 —— 喜欢你就 Copy 一下冰雪危境 Python python
前言PyAutoGUI是一个纯Python的GUI自动化工具，它可以让程序自动控制鼠标和键盘等一系列操作来达到自动化操作目的。使用PyAutoGUI脚本，在执行期间，应避免手动移动鼠标或进行键盘输入，以免干扰脚本的执行。全局暂停设置：通过设置全局变量pyautogui.PAUSE=“秒”，来每个延迟每个动作执行的暂停时间，以防止错误或干扰。自动防故障：将鼠标快速移到屏幕左上角，脚本会立即停止执行。
Docker最新安装教程基于centos7.9 Acerola- 菜鸡上路 docker
1.基本准备Docker要求内核版本3.10以上,请务必注意,安装教程基于centos7.9,内核版本3.10.0-1160.11.1.el7.x86_64#查看内核版本命令uname-r2.安装以下步骤依次进行#安装环境依赖yuminstall-yyum-utils#设置下载Docker的镜像源yum-config-manager\--add-repo\https://zfzbet67.mirr
记录一次nvm\node\npm安装，ubuntu18.04 imomsc_csdn npm 前端 node.js
问题：安装nvm时，curl或wget出现443连接失败；且用apt安装的nodejs出现GLIBC_2.28notfound。但网络好使，外网也能上。前提：nvm安装教程如下：Ubuntu安装NVM及简单使用-CSDN博客一、443连接失败——大佬原文如下：ubuntu18.04安装nvm、node.js、npm-简书(jianshu.com)二、nodejs不能用——大佬原文如下：(解决方案)
PyAutoGUI使用教程小剪子vv Python python
PyAutoGUI使用教程目录PyAutoGUI使用教程1基础知识2一般函数3故障保险4鼠标函数4.1鼠标移动4.2鼠标拖动4.3鼠标单击4.4鼠标滚动4.5鼠标按下4.6缓动/渐变（Tween/Easing）函数5键盘函数5.1文字输入5.2快捷键5.3hold()上下文管理器6消息框函数7截图函数7.1截屏7.2图像定位8参考PyAutoGUI允许Python脚本控制鼠标和键盘，并自动与其他应
CRM 微服务山猪打不过家猪 C#微服务架构云原生
文章目录项目地址一、项目地址教程作者：教程地址：代码仓库地址：所用到的框架和插件：dbtairflow一、用户与认证服务主要功能：用户注册、登录、注销。认证（OAuth、JWT等）。权限和角色管理（RBAC/ABAC）。单点登录（SSO）。技术亮点：集成第三方身份认证（如Google、AzureAD）。使用APIGateway统一进行身份认证。客户管理服务主要功能：存储和管理客户信息（姓名、联系方
影视仓—2025年最新源接口，最强大便捷的影视盒子工具 SunnyRun！智能电视电视盒子 tvbox 影视仓影视仓最新接口源 2025影视仓最新接口电视安装三方软件
《前端开发面试题进阶秘籍》：前端登顶-前端知识点梳理小米盒子丨小米丨红米电视安装第三方软件教程！华为荣耀电视智慧屏安装第三方软件教程！天猫魔盒安装第三方软件、设置第三方软件自启方法！海信电视安装第三方软件通用教程！创维电视安装第三方软件！影视仓配置教程与使用小技巧！影视仓最新接口,2025免费API接口,TVBox源,影视仓源,4K配置接口,免费数据调用,绛州速寄,五折快递,寄大件物流,TV盒子配
MAUI 入门教程系列(1.框架简介) dotNET跨平台 java android linux python 人工智能
前言在2020年5月,微软宣布了MAUI跨平台框架,MAUI是Xamarin.Forms演变而来,这也就意味着,如果你原来具备Xamarin.Forms开发经验,你可以流畅的过渡到MAUI开发当中。原本于2021年底发布的MAUI正式版被推迟到了2022年5月底发布。现在,你目前可以通过安装VS2022预览版进行安装MAUI开发选项。此版本中,将不会存在Xamarin.Forms项目模板。MAUI
Python简单Web开发 patrick_wang_bigdata python
WSGI介绍HTTP协议和HTML的介绍不在这里说明，可以去看廖雪峰老师的教程了解这方面内容。一个web应用的本质是：浏览器发送一个HTTP请求服务器收到请求，生成一个HTML文档服务器把HTML文档作为HTTP响应的Body发送给浏览器浏览器收到HTTP响应，从HTTP响应Body中取出HTML并显示最简单的web应用就是先把HTML保存好，然后需要时直接响应给HTTP请求。对Python而言，
Jenkins pipeline共享库的最佳实践 DevOps探索者 Jenkins jenkins 运维
Jenkins共享库使用教程Jenkins共享库（SharedLibraries）是一个功能强大的工具，旨在帮助团队在多个Jenkins项目中重用代码。这使得CI/CD流水线能够更加高效、简洁，并减少重复劳动。通过共享库，你可以将常用的Groovy脚本、步骤、函数等提取到一个公共的位置，使得多个项目都能引用它们。1.什么是Jenkins共享库？Jenkins共享库是一个包含可以在多个Jenkins
Python 3.9它来啦！！！ python程序员小'鹏 python 编程语言经验分享程序人生
Python3.9，来了！小编本身就是一名python开发工程师，我自己花了三天时间整理了一套python学习教程，从最基础的python脚本到web开发，爬虫，数据分析，数据可视化，机器学习，等，这些资料有想要的小伙伴"点击"即可领取过去一年，来自世界各地的开发者们一直在致力于Python3.8的改进。Python3.9beta版本已经存在了一段时间，第一个正式版本于2020年10月5日发布。每
AI软件外包需要注意什么外包开发AI软件的关键因素是什么如何选择AI外包开发语言北京动点飞扬软件 AI外包
1.定义目标与需求首先，要明确你希望AI智能体做什么。是自动化任务、数据分析、自然语言处理，还是其他功能？明确目标可以帮助你选择合适的技术和方法。2.选择开发平台与工具开发AI智能体的软件时，你需要选择适合的编程语言、框架和工具。例如：编程语言：Python是最常用的语言，因为它有强大的AI/ML库，如TensorFlow、PyTorch、scikit-learn等。开发平台：你可以使用本地环境、
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1