Le0v1n

[PaddlePaddle] [学习笔记] [下] 手写数字识别（VisualDL、可变学习率、动静转换、动态图、静态图、jit、jit.save、jit.load、paddle、保存模型、读取模型）

完整代码地址：Paddle_MNIST_Classification

如果对你有帮助，请 ⭐️ 一下。

1. 概述

从前几节的训练看，无论是波士顿房价预测任务还是 MNIST 手写字数字识别任务，训练好一个模型不会超过 10 分钟，主要原因是我们所使用的神经网络比较简单。但实际应用时，常会遇到更加复杂的机器学习或深度学习任务，需要运算速度更高的硬件（如 GPU、NPU），甚至同时使用多个机器共同训练一个任务（多卡训练和多机训练）。本节我们依旧横向展开"横纵式"教学方法，如下图所示，探讨在手写数字识别任务中，通过资源配置的优化，提升模型训练效率的方法。

前提条件：已阅读完上半部分 —— [PaddlePaddle] [学习笔记] [上] 手写数字识别（Warning:: 0D Tensor cannot be used as ‘Tensor.num、全流程、softmax、问题）

1. 单GPU训练

通过 paddle.device.set_device API，可以设置在 GPU 上训练还是 CPU 上训练。语法如下：

parser.add_argument("--device", type=str, default="gpu", help="cpu or cuda")

# 设置设备类型
paddle.device.set_device (args.device)

参数 device (str)：此参数确定特定的运行设备，可以是 cpu、 gpu:x 或者是 xpu:x。其中，x 是 GPU 或 XPU 的编号。

当 device 是 cpu 时，程序在 CPU 上运行
当 device 是 gpu:x 时，程序在GPU上运行

我们之前就一直在用单 GPU 进行训练，因此这里不再赘述。

2. 分布式训练

在工业实践中，很多较复杂的任务需要使用更强大的模型。强大模型加上海量的训练数据，经常导致模型训练耗时严重。比如在计算机视觉分类任务中，训练一个在 ImageNet 数据集上精度表现良好的模型，大概需要一周的时间，因为过程中我们需要不断尝试各种优化的思路和方案。如果每次训练均要耗时 1 周，这会大大降低模型迭代的速度。在机器资源充沛的情况下，建议采用分布式训练，大部分模型的训练时间可压缩到小时级别。

分布式训练有两种实现模式：①模型并行和②数据并行。

2.1 模型并行

模型并行是将一个网络模型拆分为多份，拆分后的模型分到多个设备上（GPU）训练，每个设备的训练数据是相同的。模型并行的实现模式可以节省内存，但是应用较为受限。

模型并行的方式一般适用于如下两个场景：

模型架构过大：完整的模型无法放入单个 GPU。如 2012 年 ImageNet 大赛的冠军模型 AlexNet 是模型并行的典型案例，由于当时 GPU 内存较小，单个 GPU 不足以承担 AlexNet，因此研究者将 AlexNet 拆分为两部分放到两个 GPU 上并行训练。
网络模型的结构设计相对独立：当网络模型的设计结构可以并行化时，采用模型并行的方式。如在计算机视觉目标检测任务中，一些模型（如 YOLO 9000：YOLO v2）的边界框回归和类别预测是独立的，可以将独立的部分放到不同的设备节点上完成分布式训练。

2.2 数据并行

数据并行与模型并行不同，数据并行每次读取多份数据，读取到的数据输入给多个设备（GPU）上的模型，每个设备上的模型是完全相同的，飞桨采用的就是这种方式。

说明：当前 GPU 硬件技术快速发展，深度学习使用的主流 GPU 的内存已经足以满足大多数的网络模型需求，所以大多数情况下使用数据并行的方式。

数据并行的方式与众人拾柴火焰高的道理类似，如果把训练数据比喻为砖头，把一个设备（GPU）比喻为一个人，那单 GPU 训练就是一个人在搬砖，多 GPU 训练就是多个人同时搬砖，每次搬砖的数量倍数增加，效率呈倍数提升。

值得注意的是，每个设备的模型是完全相同的，但是输入数据不同，因此每个设备的模型计算出的梯度是不同的。如果每个设备的梯度只更新当前设备的模型，就会导致下次训练时，每个模型的参数都不相同。因此我们还需要一个梯度同步机制，保证每个设备的梯度是完全相同的。

梯度同步有两种方式：①PRC 通信方式和 NCCL 2 通信方式（Nvidia Collective multi-GPU Communication Library）。

2.2.1 PRC 通信方式（Remote Procedure Call，远程过程调用）

PRC（Remote Procedure Call，远程过程调用）通信方式通常用于 CPU 分布式训练，它有两个节点：①参数服务器 Parameter server 和②训练节点 Trainer，结构如下图所示。

其中：

parameter server 收集来自每个设备的梯度更新信息，并计算出一个全局的梯度更新。
Trainer 用于训练，每个 Trainer 上的程序相同，但数据不同。

当 Parameter server 收到来自 Trainer 的梯度更新请求时，统一更新模型的梯度。

2.2.2 NCCL2 通信方式（NVIDIA Collective Communications Library version 2，NVIDIA 集合通信库第 2 版）

当前飞桨的 GPU 分布式训练使用的是基于 NCCL2（NVIDIA Collective Communications Library version 2，NVIDIA 集合通信库第 2 版）的通信方式，结构如下图所示。

相比 PRC 通信方式，使用 NCCL 2（Collective 通信方式）进行分布式训练，不需要启动 Parameter server 进程，每个 Trainer 进程保存一份完整的模型参数，在完成梯度计算之后通过 Trainer 之间的相互通信，Reduce 梯度数据到所有节点的所有设备，然后每个节点在各自完成参数更新。

飞桨提供了便利的数据并行训练方式，用户只需要对程序进行简单修改，即可实现在多 GPU 上并行训练。接下来将讲述如何将一个单机程序通过简单的改造，变成单机多卡程序。

2.3 单机多卡训练设置

2.3.1 修改对应代码

单机多卡程序通过如下两步改动即可完成：

初始化并行环境 —— paddle.distributed.init_parallel_env()
使用 paddle.DataParallel 封装模型 —— model = paddle.DataParallel(model)

注意：由于我们的数据是通过手动构造批次的方式输入给模型的，没有针对多卡情况进行划分，因此每个卡上会基于全量数据迭代训练。可通过继承 paddle.io.Dataset 的方式准备自己的数据，再通过 DistributedBatchSampler 实现分布式批采样器加载数据的一个子集。这样，每个进程可以传递给 DataLoader 一个 DistributedBatchSampler 的实例，每个进程加载原始数据的一个子集。

def train_multi_gpu():
    # [数据并行] 初始化并行环境
    dist.init_parallel_env()
    
    # 定义模型    
    if args.model_name == "FC":
        model = MNIST_FC_Model()
    elif args.model_name == "CNN":
        model = MNIST_CNN_Model()
    else:
        raise ModelNameError("请选择正确的模型(CNN或FC)!")
    
    # [数据并行] 使用 DataParallel 对模型进行封装
    model = paddle.DataParallel(layers=model)
    
    # 声明模型状态
    model.train()
    
    # 加载数据，获取 MNIST 训练数据集
    train_dataset = MNIST_Dataset(mode="train")
    val_dataset = MNIST_Dataset(mode="valid")
    # 使用paddle.io.DataLoader 定义DataLoader对象用于加载Python生成器产生的数据，
    # DataLoader 返回的是一个批次数据迭代器，并且是异步的；
    train_loader = io.DataLoader(train_dataset, batch_size=args.batch_size, shuffle=True, drop_last=True)
    val_loader = io.DataLoader(val_dataset, batch_size=args.batch_size, shuffle=False, drop_last=True)
    
    # 定义 SGD 优化器
    if args.optimizer == "sgd" or "SGD":
        optimizer = opt.SGD(learning_rate=args.lr, parameters=model.parameters())
    elif args.optimizer == "momentum" or "Momentum":
        optimizer = opt.Momentum(learning_rate=args.lr, parameters=model.parameters())
    elif args.optimizer == "adagrad" or "Adagrad":
        optimizer = opt.Adagrad(learning_rate=args.lr, parameters=model.parameters())
    elif args.optimizer == "adam" or "Adam":
        optimizer = opt.Adam(learning_rate=args.lr, parameters=model.parameters())
    else:
        raise KeyError("Please select correct optimizer in [sgd, momentum, adagrad, adam]!")
    
    # 保存loss
    loss_list = []
    acc_list = []
    
    for epoch in range(1, args.epochs+1):
        epoch_loss = []
        
        for data in train_loader():
            imgs, labels = data
            imgs = paddle.to_tensor(imgs)
            labels = paddle.to_tensor(labels)
            
            # 前向推理
            preds = model(imgs)
            
            # 计算损失
            loss = F.cross_entropy(preds, labels)
            avg_loss = paddle.mean(loss)
            
            # 反向传播
            avg_loss.backward()
            
            # 保存每次迭代的损失
            epoch_loss.append(avg_loss.item()) # type: ignore
        
            """
            Note: 
                对于一个0-D的Tensor而言，直接使用tensor.item()就行，别用tensor.numpy()
                0-D其实就是一个list, shape为 (165, )
            print(f"epoch_loss: {np.shape(epoch_loss)}")  # epoch_loss: (254,)
            print(f"type: {type(epoch_loss)}")  # type: 
            """

            # 优化器
            optimizer.step()

            # 清空梯度
            optimizer.clear_grad()
            
        # 保存模型和优化器参数
        if epoch % 10 == 0:
            paddle.save({
                "model_state_dict": model.state_dict(),
                "optimizer_state_dict": optimizer.state_dict()
            }, path=f"{args.save_path}/model_{args.model_name}_{epoch}_{args.optimizer}.pdparams")
        
        # 保存每个epoch的loss
        current_epoch_loss = np.mean(epoch_loss)
        loss_list.append(current_epoch_loss)
        epoch_loss.clear()
        acc_epoch = evaluation(model, val_loader)
        acc_list.append(acc_epoch)
        
        print(f"Epoch: {epoch}\tLoss: {current_epoch_loss:.4f}\tacc: {acc_epoch*100:.2f}%")
        
    print(f"模型最终loss为: {loss_list[-1]:.4f}")
    print(f"模型最终accuracy为: {acc_list[-1]*100:.2f}%")
    
    # 绘制Loss-Epoch曲线图
    plot_loss_curve(loss_list)
    
    print(model)

2.3.2 启动多GPU的训练

有两种方式：

基于 launch 启动
基于 spawn 方式启动

2.3.2.1 基于 launch 方式启动

需要在命令行中设置参数变量。打开终端，运行如下命令：

[情况 1]单机单卡启动，默认使用第 0 号卡

# 单机单卡启动，默认使用第 0 号卡
python train_multi_gpu.py

[情况 2]单机多卡启动，默认使用当前可见的所有卡

# 单机多卡启动，默认使用当前可见的所有卡
python -m paddle.distributed.launch train_multi_gpu.py

Q：python -m paddle.distributed.launch train_multi_gpu.py 的 -m 是什么意思？
A：在 Python 中，-m 是一个命令行选项，用于在运行脚本时指定模块。当你使用 python -m module_name 这样的命令时，Python 解释器会执行指定模块的代码。（具体来说，-m 选项的作用是让 Python 解释器将指定的模块作为主程序运行。它会搜索指定模块所在的目录，并从该目录开始执行模块的代码。）

[情况 3]单机多卡启动，设置当前使用的第 0 号和第 1 号卡

# [方法1]单机多卡启动，设置当前使用的第 0 号和第 1 号卡
CUDA_VISIABLE_DEVICES=0,1 python -m paddle.distributed.launch train.py

# [方法2]单机多卡启动，设置当前使用的第 0 号和第 1 号卡
python -m paddle.distributed.launch --gpus='0,1' --log_dir=log_info/multi_gpu train.py

GPU 索引加不加 '' 都可以

2.3.2.2 2 【不推荐】基于 spawn 方式启动

launch 方式启动训练，是以文件为单位启动多进程，需要用户在启动时调用 paddle.distributed.launch，对于进程的管理要求较高；飞桨最新版本中，增加了 spawn 启动方式，可以更好地控制进程，在日志打印、训练和退出时更加友好。spawn 方式和 launch 方式仅在启动上有所区别。

spawn; 英 [spɔːn] 美 [spɔːn]

v. 产卵; 引发; 导致; 造成; 引起;

n. (鱼、蛙等的)卵;

在计算机领域，“spawn” 是一个常用的术语，表示创建一个新的进程或线程。在多进程或多线程编程中，“spawn” 操作用于启动一个新的执行单元，使其能够独立地执行代码，并与其他进程或线程并发执行。

# 启动train多进程训练，默认使用所有可见的GPU卡。
if __name__ == '__main__':
    dist.spawn(train)

# 启动train函数2个进程训练，默认使用当前可见的前2张卡。
if __name__ == '__main__':
	# nprocess用于指定要启动的训练器（trainer）的数量，也就是要在多少个进程中并行执行训练
    dist.spawn(train, nprocs=2)  # nprocess = number of processing(进程数量)

# 启动train函数2个进程训练，默认使用第4号和第5号卡。
if __name__ == '__main__':
    dist.spawn(train, nprocs=2, selelcted_gpus='4,5')

2.3.3 代码

import os
import random
import numpy as np
import matplotlib.pyplot as plt
import gzip
import json
import paddle.nn as nn
import paddle.nn.functional as F
import paddle.io as io
import paddle.optimizer as opt
import paddle.metric as metric
import argparse
import PIL.Image as Image
import paddle.distributed as dist
import paddle


# 定义数据集读取器
def load_data(mode="train", batch_size=4):
    print("Loading MNIST dataset form {}...".format(args.dataset_path))
    data = json.load(gzip.open(args.dataset_path))
    print("MNIST Dataset has been loaded!")

    # 对数据集进行划分
    train_set, val_set, test_set = data
    
    img_rows = 28
    img_cols = 28
    
    if mode == "train":
        imgs, labels = train_set[0], train_set[1]
    elif mode == "valid":
        imgs, labels = val_set[0], val_set[1]
    elif mode == "eval":
        imgs, labels = test_set[0], test_set[1]
    else:
        raise Exception("mode can only be one of ['train', 'valid', 'eval']")
    
    # 校验数据
    imgs_length = len(imgs)
    assert len(imgs) == len(labels), "length of train_imgs({}) should be the same as train_labels({})".format(len(imgs), len(labels))
    
    # 定义数据集每个数据的序号，根据序号读取数据
    index_lst = list(range(imgs_length))
    
    
    # 定义数据生成器
    def data_generator():
        if mode == "train":
            random.shuffle(index_lst)
        imgs_lst = []
        labels_lst = []
        
        for i in index_lst:
            # 在深度学习中，常见的数据类型是32位浮点数（float32），因为这种数据类型在数值计算中具有较好的精度和效率
            # 并且在常见的深度学习框架中也是默认的数据类型
            img = np.array(imgs[i]).astype("float32")
            label = np.array(labels[i]).astype("float32")
            
            img = np.reshape(imgs[i], newshape=[1, img_rows, img_cols]).astype("float32")  # [H, W] -> [C, H, W]
            label = np.reshape(labels[i], newshape=[1]).astype("float32")
            
            imgs_lst.append(img)
            labels_lst.append(label)
            
            if len(imgs_lst) == batch_size:
                yield np.array(imgs_lst), np.array(labels_lst)  # 返回一个迭代器
                imgs_lst = []
                labels_lst = []
                
        # 如果剩余数据的数目小于batch size，则剩余数据一起构成一个大小为len(imgs_list)的mini-batch
        if len(imgs_lst) > 0:
            yield np.array(imgs_lst), np.array(labels_lst)
            
    return data_generator


class MNIST_Dataset(io.Dataset):
    """创建一个类MnistDataset，继承paddle.io.Dataset 这个类
        MnistDataset的作用和上面load_data()函数的作用相同，均是构建一个迭代器

    Args:
        io (_type_): _description_
    """
    def __init__(self, mode="train"):
        data = json.load(gzip.open(args.dataset_path))
        
        train_set, val_set, test_set = data
    
        if mode == "train":
            self.imgs, self.labels = train_set[0], train_set[1]
        elif mode == "valid":
            self.imgs, self.labels = val_set[0], val_set[1]
        elif mode == "eval":
            self.imgs, self.labels = test_set[0], test_set[1]
        else:
            raise Exception("mode can only be one of ['train', 'valid', 'eval']")
    
        # 校验数据
        assert len(self.imgs) == len(self.labels), "length of train_imgs({}) should be the same as train_labels({})".format(len(self.imgs), len(self.labels))
        
    def __getitem__(self, idx):
        # img = np.array(self.imgs[idx]).astype('float32')
        # label = np.array(self.labels[idx]).astype('int64')
        img = np.reshape(self.imgs[idx], newshape=[1, 28, 28]).astype("float32")
        label = np.reshape(self.labels[idx], newshape=[1]).astype("int64")
        
        return img, label
    
    def __len__(self):
        return len(self.imgs)


# 全连接层神经网络实现
class MNIST_FC_Model(nn.Layer):  
    def __init__(self):  
        super(MNIST_FC_Model, self).__init__()  
          
        # 定义两层全连接隐含层，输出维度是10，当前设定隐含节点数为10，可根据任务调整  
        self.classifier = nn.Sequential(nn.Linear(in_features=784, out_features=256),
                                        nn.Sigmoid(),
                                        nn.Linear(in_features=256, out_features=64),
                                        nn.Sigmoid())

        # 定义一层全连接输出层，输出维度是1  
        self.head = nn.Linear(in_features=64, out_features=10)  
          
    def forward(self, x):  
        # x.shape: [bath size, 1, 28, 28]
        x = paddle.flatten(x, start_axis=1)  # [bath size, 784]
        x = self.classifier(x)  
        y = self.head(x)
        return y
    
    
# 多层卷积神经网络实现
class MNIST_CNN_Model(nn.Layer):
     def __init__(self):
         super(MNIST_CNN_Model, self).__init__()
         
         self.classifier = nn.Sequential(
             nn.Conv2D( in_channels=1, out_channels=20, kernel_size=5, stride=1, padding=2),
             nn.ReLU(),
             nn.MaxPool2D(kernel_size=2, stride=2),
             nn.Conv2D(in_channels=20, out_channels=20, kernel_size=5, stride=1, padding=2),
             nn.ReLU(),
             nn.MaxPool2D(kernel_size=2, stride=2))
         
         self.head = nn.Linear(in_features=980, out_features=args.num_classes)
         
         
     def forward(self, x):
         # x.shape: [10, 1, 28, 28]
         x = self.classifier(x)  # [bath size, 20, 7, 7]
         x = x.flatten(1)  # [batch size, 980]
         x = self.head(x)  # [batch size, num_classes]
         return x
    
    
def plot_loss_curve(loss_list):
    plt.figure(figsize=(10,5))
    
    freqs = [i for i in range(1, len(loss_list) + 1)]
    # 绘制训练损失变化曲线
    plt.plot(freqs, loss_list, color='#e4007f', label="Train loss")
    
    # 绘制坐标轴和图例
    plt.ylabel("loss", fontsize='large')
    plt.xlabel("epoch", fontsize='large')
    plt.legend(loc='upper right', fontsize='x-large')
    
    plt.savefig(f"train_loss_curve for {args.model_name}_{args.optimizer}.png")
    

class ModelNameError(Exception):
    pass


def evaluation(model: nn.Layer, datasets):
    model.eval()
    
    acc_list = []
    for batch_idx, data in enumerate(datasets()):
        imgs, labels = data
        imgs = paddle.to_tensor(imgs)
        labels = paddle.to_tensor(labels)
        
        pred = model(imgs)
        acc = metric.accuracy(input=pred, label=labels)
        acc_list.append(acc.item()) # type: ignore
        
    # 计算多个batch的平均准确率
    acc_val_mean = np.array(acc_list).mean()
    return acc_val_mean
    
    
def train():
    # 定义模型
    if args.model_name == "FC":
        model = MNIST_FC_Model()
    elif args.model_name == "CNN":
        model = MNIST_CNN_Model()
    else:
        raise ModelNameError("请选择正确的模型(CNN或FC)!")
        
    model.train()
    
    # 加载数据，获取 MNIST 训练数据集
    train_dataset = MNIST_Dataset(mode="train")
    val_dataset = MNIST_Dataset(mode="valid")
    # 使用paddle.io.DataLoader 定义DataLoader对象用于加载Python生成器产生的数据，
    # DataLoader 返回的是一个批次数据迭代器，并且是异步的；
    train_loader = io.DataLoader(train_dataset, batch_size=args.batch_size, shuffle=True, drop_last=True)
    val_loader = io.DataLoader(val_dataset, batch_size=args.batch_size, shuffle=False, drop_last=True)
    
    # 定义 SGD 优化器
    if args.optimizer == "sgd" or "SGD":
        optimizer = opt.SGD(learning_rate=args.lr, parameters=model.parameters())
    elif args.optimizer == "momentum" or "Momentum":
        optimizer = opt.Momentum(learning_rate=args.lr, parameters=model.parameters())
    elif args.optimizer == "adagrad" or "Adagrad":
        optimizer = opt.Adagrad(learning_rate=args.lr, parameters=model.parameters())
    elif args.optimizer == "adam" or "Adam":
        optimizer = opt.Adam(learning_rate=args.lr, parameters=model.parameters())
    else:
        raise KeyError("Please select correct optimizer in [sgd, momentum, adagrad, adam]!")
    
    # 保存loss
    loss_list = []
    acc_list = []
    
    for epoch in range(1, args.epochs+1):
        epoch_loss = []
        
        for data in train_loader():
            imgs, labels = data
            imgs = paddle.to_tensor(imgs)
            labels = paddle.to_tensor(labels)
            
            # 前向推理
            preds = model(imgs)
            
            # 计算损失
            loss = F.cross_entropy(preds, labels)
            avg_loss = paddle.mean(loss)
            
            # 反向传播
            avg_loss.backward()
            
            # 保存每次迭代的损失
            epoch_loss.append(avg_loss.item()) # type: ignore
        
            """
            Note: 
                对于一个0-D的Tensor而言，直接使用tensor.item()就行，别用tensor.numpy()
                0-D其实就是一个list, shape为 (165, )
            print(f"epoch_loss: {np.shape(epoch_loss)}")  # epoch_loss: (254,)
            print(f"type: {type(epoch_loss)}")  # type: 
            """

            # 优化器
            optimizer.step()

            # 清空梯度
            optimizer.clear_grad()
            
        # 保存模型和优化器参数
        if epoch % 10 == 0:
            paddle.save({
                "model_state_dict": model.state_dict(),
                "optimizer_state_dict": optimizer.state_dict()
            }, path=f"{args.save_path}/model_{args.model_name}_{epoch}_{args.optimizer}.pdparams")
        
        # 保存每个epoch的loss
        current_epoch_loss = np.mean(epoch_loss)
        loss_list.append(current_epoch_loss)
        epoch_loss.clear()
        acc_epoch = evaluation(model, val_loader)
        acc_list.append(acc_epoch)
        
        print(f"Epoch: {epoch}\tLoss: {current_epoch_loss:.4f}\tacc: {acc_epoch*100:.2f}%")
        
    print(f"模型最终loss为: {loss_list[-1]:.4f}")
    print(f"模型最终accuracy为: {acc_list[-1]*100:.2f}%")
    
    # 绘制Loss-Epoch曲线图
    plot_loss_curve(loss_list)
    
    print(model)
    
    
def train_multi_gpu():
    import sys
    # 设置标准输出不缓冲
    sys.stdout.reconfigure(line_buffering=True)  # type: ignore

    # [数据并行] 初始化并行环境
    dist.init_parallel_env()
    
    # 定义模型    
    if args.model_name == "FC":
        model = MNIST_FC_Model()
    elif args.model_name == "CNN":
        model = MNIST_CNN_Model()
    else:
        raise ModelNameError("请选择正确的模型(CNN或FC)!")
    
    # [数据并行] 使用 DataParallel 对模型进行封装
    model = paddle.DataParallel(layers=model)
    
    # 声明模型状态
    model.train()
    
    # 加载数据，获取 MNIST 训练数据集
    train_dataset = MNIST_Dataset(mode="train")
    val_dataset = MNIST_Dataset(mode="valid")
    # 使用paddle.io.DataLoader 定义DataLoader对象用于加载Python生成器产生的数据，
    # DataLoader 返回的是一个批次数据迭代器，并且是异步的；
    train_loader = io.DataLoader(train_dataset, batch_size=args.batch_size, shuffle=True, drop_last=True)
    val_loader = io.DataLoader(val_dataset, batch_size=args.batch_size, shuffle=False, drop_last=True)
    
    # 定义 SGD 优化器
    if args.optimizer == "sgd" or "SGD":
        optimizer = opt.SGD(learning_rate=args.lr, parameters=model.parameters())
    elif args.optimizer == "momentum" or "Momentum":
        optimizer = opt.Momentum(learning_rate=args.lr, parameters=model.parameters())
    elif args.optimizer == "adagrad" or "Adagrad":
        optimizer = opt.Adagrad(learning_rate=args.lr, parameters=model.parameters())
    elif args.optimizer == "adam" or "Adam":
        optimizer = opt.Adam(learning_rate=args.lr, parameters=model.parameters())
    else:
        raise KeyError("Please select correct optimizer in [sgd, momentum, adagrad, adam]!")
    
    # 保存loss
    loss_list = []
    acc_list = []
    
    for epoch in range(1, args.epochs+1):
        epoch_loss = []
        
        for data in train_loader():
            imgs, labels = data
            imgs = paddle.to_tensor(imgs)
            labels = paddle.to_tensor(labels)
            
            # 前向推理
            preds = model(imgs)
            
            # 计算损失
            loss = F.cross_entropy(preds, labels)
            avg_loss = paddle.mean(loss)
            
            # 反向传播
            avg_loss.backward()
            
            # 保存每次迭代的损失
            epoch_loss.append(avg_loss.item()) # type: ignore
        
            """
            Note: 
                对于一个0-D的Tensor而言，直接使用tensor.item()就行，别用tensor.numpy()
                0-D其实就是一个list, shape为 (165, )
            print(f"epoch_loss: {np.shape(epoch_loss)}")  # epoch_loss: (254,)
            print(f"type: {type(epoch_loss)}")  # type: 
            """

            # 优化器
            optimizer.step()

            # 清空梯度
            optimizer.clear_grad()
            
        # 保存模型和优化器参数
        if epoch % 10 == 0:
            paddle.save({
                "model_state_dict": model.state_dict(),
                "optimizer_state_dict": optimizer.state_dict()
            }, path=f"{args.save_path}/model_{args.model_name}_{epoch}_{args.optimizer}.pdparams")
        
        # 保存每个epoch的loss
        current_epoch_loss = np.mean(epoch_loss)
        loss_list.append(current_epoch_loss)
        epoch_loss.clear()
        acc_epoch = evaluation(model, val_loader)
        acc_list.append(acc_epoch)
        
        print(f"Epoch: {epoch}\tLoss: {current_epoch_loss:.4f}\tacc: {acc_epoch*100:.2f}%")
        
    print(f"模型最终loss为: {loss_list[-1]:.4f}")
    print(f"模型最终accuracy为: {acc_list[-1]*100:.2f}%")
    
    # 绘制Loss-Epoch曲线图
    plot_loss_curve(loss_list)
    
    print(model)
    
    
def load_one_img():
    img = Image.open(args.img_path).convert("L")  # 转为灰度图
    img = img.resize((28, 28))
    img = np.array(img).reshape(1, 1, 28, 28).astype(np.float32)
    
    # 归一化
    img = 1.0 - img / 255
    return img


def predict():
    # 读取要预测的图片
    img = load_one_img()
    img = paddle.to_tensor(img)
    
    # 定义模型
    if args.model_name == "FC":
        model = MNIST_FC_Model()
    elif args.model_name == "CNN":
        model = MNIST_CNN_Model()
    else:
        raise ModelNameError("请选择正确的模型(CNN或FC)!")
        
    # 加载模型权重
    param_state_dict = paddle.load(args.weights_path)
    model.load_dict(param_state_dict["model_state_dict"])

    # 声明模型状态
    model.eval()
    
    # 前向推理
    pred = model(img)
    """
    推理结果为: Tensor(shape=[1, 10], dtype=float32, place=Place(gpu:0), stop_gradient=False,
       [[0.00000163, 0.00267692, 0.00088234, 0.04414432, 0.00028779, 0.00000287,
         0.00000097, 0.95190734, 0.00004345, 0.00005248]])
    推理结果.shape为: [1, 10]
    推理结果.type为: 
    """
    
    # 取概率最大的位置
    max_class = paddle.argmax(pred).item()  # type: ignore
    
    # 画出这张图片并给出相关信息
    # 将图片数据转换为 PIL 图像对象
    img_data = img.numpy()[0][0] * 255  # type: ignore
    img_data = img_data.astype(np.uint8)

    # 显示图片
    plt.imshow(img_data, cmap='gray')
    plt.title(f"Predicted Image -> class: {max_class} | prob: {pred[:, max_class].item() * 100:.2f}%")
    plt.axis('off')  # 去除坐标轴
    plt.savefig("predict_res.png")
    
    print(f"预测值的数字为: {max_class}\t预测概率为: {pred[:, max_class].item() * 100:.2f}%")

    
def main(args):
    if args.mode == "train":
        if args.multi_gpu:
            print("使用多GPU训练")
            train_multi_gpu()
        else:
            print("使用单GPU训练")
            train()
    elif args.mode == "predict" or "eval":
        predict()
    else:
        raise KeyError("train or predict or eval")
    

def parse_args():
    parser = argparse.ArgumentParser()
    
    # 超参数
    parser.add_argument("--epochs", type=int, default=10, help="Number of training epochs")
    parser.add_argument("--lr", type=float, default=0.09, help="Learning rate")
    parser.add_argument("--batch_size", type=int, default=100, help="Batch size")
    parser.add_argument("--dataset_path", type=str, default="/data/data_01/lijiandong/Datasets/MNIST/mnist.json.gz", help="Path to the dataset file")
    parser.add_argument("--save_path", type=str, default="results/", help="The path of saving model & params")
    parser.add_argument("--device", type=str, default="gpu", help="cpu or cuda")
    parser.add_argument("--num_classes", type=int, default=10, help="Number of classes")
    parser.add_argument("--model_name", type=str, default="CNN", help="The name of saving model (CNN or FC)")
    parser.add_argument("--img_path", type=str, default="test.png", help="The path of the image predicted")
    parser.add_argument("--weights_path", type=str, default="results/model_CNN_10.pdparams", help="The path of the model's weights")
    parser.add_argument("--mode", type=str, default="train", help="train / predict")
    parser.add_argument("--optimizer", type=str, default="sgd", help="sgd, momentum, adagrad, adam")
    
    # 如果命令行中包含 --multi_gpu 参数，则 args.multi_gpu 将为True。如果没有包含 --multi_gpu 参数，则 args.multi_gpu 将为False。
    parser.add_argument("--multi_gpu", action="store_true", help="multi GPU to speed up training")
    
    # 解析命令行参数  
    args = parser.parse_args()
    
    return args


if __name__ == "__main__":
    # 固定随机种子
    seed = 10010
    paddle.seed(seed)
    np.random.seed(seed)
    random.seed(seed)
    
    args = parse_args()
    
    # 设置使用CPU还是GPU训练
    paddle.set_device(args.device)
    
    if not os.path.exists(args.save_path):
        os.mkdir(args.save_path)
    
    main(args)

3. 训练调试与优化

上一章我们研究了资源部署优化的方法，通过使用单 GPU 和分布式部署，提升模型训练的效率。本章我们依旧横向展开"横纵式"，如下图所示，探讨在手写数字识别任务中，为了保证模型的真实效果，在模型训练部分，对模型进行一些调试和优化的方法。

训练过程优化思路主要有如下五个关键环节：

计算分类准确率，观测模型训练效果

交叉熵损失函数只能作为优化目标，无法直接准确衡量模型的训练效果。准确率可以直接衡量训练效果，但由于其离散性质，不适合做为损失函数优化神经网络。
检查模型训练过程，识别潜在问题

如果模型的损失或者评估指标表现异常，通常需要打印模型每一层的输入和输出来定位问题，分析每一层的内容来获取错误的原因。
加入校验或测试，更好评价模型效果

理想的模型训练结果是在训练集和验证集上均有较高的准确率。
- 如果训练集的准确率低于验证集，说明网络训练程度不够；
- 如果训练集的准确率高于验证集，可能是发生了过拟合现象 ——（通过在优化目标中加入正则化项的办法，解决过拟合的问题）
加入正则化项，避免模型过拟合

飞桨框架支持为整体参数加入正则化项，这是通常的做法。此外，飞桨框架也支持为某一层或某一部分的网络单独加入正则化项，以达到精细调整参数训练的效果。
可视化分析

用户不仅可以通过打印或使用 matplotlib 库作图，飞桨还提供了更专业的可视化分析工具 VisualDL，提供便捷的可视化分析方法。

3.1 计算模型的分类准确率

准确率是一个直观衡量分类模型效果的指标，由于这个指标是离散的，因此不适合作为损失来优化。通常情况下，交叉熵损失越小的模型，分类的准确率也越高。基于分类准确率，我们可以公平地比较两种损失函数的优劣。

使用飞桨提供的计算分类准确率 API，可以直接计算准确率。

class paddle.metric.Accuracy

该 API 的输入参数 input= 为预测的分类结果 predict，输入参数 label= 为数据真实的 label。飞桨还提供了更多衡量模型效果的计算指标，详细可以查看 paddle.meric 包下面的 API。

在下述代码中，我们在模型前向计算过程 forward 函数中计算分类准确率，并在训练时打印每个批次样本的分类准确率。

def train():
    # 定义模型
    if args.model_name == "FC":
        model = MNIST_FC_Model()
    elif args.model_name == "CNN":
        model = MNIST_CNN_Model()
    else:
        raise ModelNameError("请选择正确的模型(CNN或FC)!")
        
    model.train()
    
    # 加载数据，获取 MNIST 训练数据集
    train_dataset = MNIST_Dataset(mode="train")
    val_dataset = MNIST_Dataset(mode="valid")
    # 使用paddle.io.DataLoader 定义DataLoader对象用于加载Python生成器产生的数据，
    # DataLoader 返回的是一个批次数据迭代器，并且是异步的；
    train_loader = io.DataLoader(train_dataset, batch_size=args.batch_size, shuffle=True, drop_last=True)
    val_loader = io.DataLoader(val_dataset, batch_size=args.batch_size, shuffle=False, drop_last=True)
    
    # 定义 SGD 优化器
    if args.optimizer == "sgd" or "SGD":
        optimizer = opt.SGD(learning_rate=args.lr, parameters=model.parameters())
    elif args.optimizer == "momentum" or "Momentum":
        optimizer = opt.Momentum(learning_rate=args.lr, parameters=model.parameters())
    elif args.optimizer == "adagrad" or "Adagrad":
        optimizer = opt.Adagrad(learning_rate=args.lr, parameters=model.parameters())
    elif args.optimizer == "adam" or "Adam":
        optimizer = opt.Adam(learning_rate=args.lr, parameters=model.parameters())
    else:
        raise KeyError("Please select correct optimizer in [sgd, momentum, adagrad, adam]!")
    
    # 保存loss
    loss_list = []
    acc_list = []
    
    for epoch in range(1, args.epochs+1):
        epoch_loss = []
        epoch_acc = []
        
        for data in train_loader():
            imgs, labels = data
            imgs = paddle.to_tensor(imgs)
            labels = paddle.to_tensor(labels)
            
            # 前向推理
            preds, acc = model(imgs, labels)
            
            # 计算损失
            loss = F.cross_entropy(preds, labels)
            avg_loss = paddle.mean(loss)
            
            # 反向传播
            avg_loss.backward()
            
            # 保存每次迭代的损失
            epoch_loss.append(avg_loss.item()) # type: ignore
            epoch_acc.append(paddle.mean(acc).item())  # type: ignore
        
            """
            Note: 
                对于一个0-D的Tensor而言，直接使用tensor.item()就行，别用tensor.numpy()
                0-D其实就是一个list, shape为 (165, )
            print(f"epoch_loss: {np.shape(epoch_loss)}")  # epoch_loss: (254,)
            print(f"type: {type(epoch_loss)}")  # type: 
            """

            # 优化器
            optimizer.step()

            # 清空梯度
            optimizer.clear_grad()
            
        # 保存模型和优化器参数
        if epoch % 10 == 0:
            paddle.save({
                "model_state_dict": model.state_dict(),
                "optimizer_state_dict": optimizer.state_dict()
            }, path=f"{args.save_path}/model_{args.model_name}_{epoch}_{args.optimizer}.pdparams")
        
        # 保存每个epoch的loss
        current_epoch_loss = np.mean(epoch_loss)
        current_epoch_acc = np.mean(epoch_acc)
        loss_list.append(current_epoch_loss)
        acc_list.append(current_epoch_acc)
        epoch_loss.clear()
        epoch_acc.clear()
        # acc_epoch = evaluation(model, val_loader)
        
        print(f"Epoch: {epoch}\tLoss: {current_epoch_loss:.4f}\tacc: {current_epoch_acc*100:.2f}%")
        
    print(f"模型最终loss为: {loss_list[-1]:.4f}")
    print(f"模型最终accuracy为: {acc_list[-1]*100:.2f}%")
    
    # 绘制Loss-Epoch曲线图
    plot_loss_curve(loss_list)
    
    print(model)

其实我们之前的代码中就已经有了准确率计算的代码，而且那种方式其实更加通用，上面代码中求准确率的方式的确少见。

3.2 检查模型训练过程，识别潜在训练问题

使用飞桨动态图编程可以方便的查看和调试训练的执行过程。在网络定义的 forward 函数中，可以打印每一层输入输出的尺寸，以及每层网络的参数。通过查看这些信息，不仅可以更好地理解训练的执行过程，还可以发现潜在问题，或者启发继续优化的思路。

在下述程序中，使用 check_shape 变量控制是否打印“尺寸”，验证网络结构是否正确。使用 check_content 变量控制是否打印“内容值”，验证数据分布是否合理。假如在训练中发现中间层的部分输出持续为 0，说明该部分的网络结构设计存在问题，没有充分利用。

class MNIST_CNN_Model(nn.Layer):
    def __init__(self):
        super(MNIST_CNN_Model, self).__init__()
        
        self.check_shape = args.check_shape
        self.check_content = args.check_content
        
        self.classifier = nn.Sequential(
            nn.Conv2D( in_channels=1, out_channels=20, kernel_size=5, stride=1, padding=2),  # 0
            nn.ReLU(),  # 1
            nn.MaxPool2D(kernel_size=2, stride=2),  # 2
            nn.Conv2D(in_channels=20, out_channels=20, kernel_size=5, stride=1, padding=2),  # 3
            nn.ReLU(),  # 4
            nn.MaxPool2D(kernel_size=2, stride=2))  # 5
        
        self.head = nn.Linear(in_features=980, out_features=args.num_classes)
         

    # 加入对每一层输入和输出的尺寸和数据内容的打印，根据 check 参数决策是否打印每层的参数和输出尺寸
    def forward(self, x):
        # 选择是否打印神经网络每层的参数尺寸和输出尺寸，验证网络结构是否设置正确
        if self.check_shape:
            # 打印每层网络设置的超参数-卷积核尺寸，卷积步长，卷积padding，池化核尺寸
            print(f"\n\t\tPrint Network Layer Hyper-parameters\t\t")
            print(f"[conv1]\tkernel_size: {self.classifier[0].weight.shape}\tpadding: {self.classifier[0]._padding}\tstride: {self.classifier[0]._stride}")
            print(f"[conv2]\t\tkernel_size: {self.classifier[3].weight.shape}\tpadding: {self.classifier[3]._padding}\tstride: {self.classifier[3]._stride}")
            # print(f"[maxpool1]\tkernel_size: {self.classifier[2]._kernel_size}\tpadding: {self.classifier[2]._padding}\tstride: {self.classifier[2]._stride}")
            # print(f"[maxpool2]\tkernel_size: {self.classifier[5]._kernel_size}\tpadding: {self.classifier[5]._padding}\tstride: {self.classifier[5]._stride}")
            print(f"[fc]\tweight_size: {self.head.weight.shape}\t\tbias_size: {self.head.bias.shape}")  # type: ignore

            # 打印每层的输出尺寸
            print(f"\n\t\tPrint shape of features of every layer\t\t")
            print(f"[input]\t{x.shape}")
            
            layer_name = ["conv1", "relu1", "maxpool1", "conv2", "relu2", "maxpool2"]
            for idx, layer in enumerate(self.classifier):  # type: ignore
                x = layer(x)
                print(f"[{layer_name[idx]}]\t{x.shape}")
            
            x = x.flatten(1)  # [batch size, 980]
            print(f"[flatten]\t{x.shape}")
            x = self.head(x)  # [batch size, num_classes]
            print(f"[linear]\t{x.shape}")
            
            # 选择是否打印训练过程中的参数和输出内容，可用于训练过程中的调试
            if self.check_content:
                print(f"\n\t\tprint convolution layer's kernel\t\t")
                print("conv1 params -- kernel weights:", self.classifier[0].weight[0][0])
                print("conv2 params -- kernel weights:", self.classifier[3].weight[0][0])
            return x
        
        else:
            # x.shape: [10, 1, 28, 28]
            x = self.classifier(x)  # [bath size, 20, 7, 7]
            x = x.flatten(1)  # [batch size, 980]
            x = self.head(x)  # [batch size, num_classes]
            
            return x

结果：


                Print Network Layer Hyper-parameters
[conv1] kernel_size: [20, 1, 5, 5]      padding: 2      stride: [1, 1]
[conv2]         kernel_size: [20, 20, 5, 5]     padding: 2      stride: [1, 1]
[fc]    weight_size: [980, 10]          bias_size: [10]

                Print shape of features of every layer
[input] [1, 1, 28, 28]
[conv1] [1, 20, 28, 28]
[relu1] [1, 20, 28, 28]
[maxpool1]      [1, 20, 14, 14]
[conv2] [1, 20, 14, 14]
[relu2] [1, 20, 14, 14]
[maxpool2]      [1, 20, 7, 7]
[flatten]       [1, 980]
[linear]        [1, 10]

                print convolution layer's kernel
conv1 params -- kernel weights: Tensor(shape=[5, 5], dtype=float32, place=Place(cpu), stop_gradient=False,
       [[-0.36611092, -0.07269676,  0.05521000,  0.30789426,  0.12602787],
        [-0.02627250,  0.35711884, -0.23137151, -0.47127703,  0.03564633],
        [-0.20968747, -0.02592727, -0.31650761, -0.08275275,  0.00647940],
        [-0.24060467,  0.18498476, -0.12385617, -0.15215135,  0.28592584],
        [-0.45725125, -0.03480617, -0.00470086,  0.02213454,  0.06672639]])
conv2 params -- kernel weights: Tensor(shape=[5, 5], dtype=float32, place=Place(cpu), stop_gradient=False,
       [[-0.06738405, -0.03293604, -0.04544191, -0.10670338,  0.00311936],
        [ 0.04448142, -0.05615885,  0.05934162, -0.00395017, -0.10877492],
        [ 0.02868257, -0.09811527, -0.02144969, -0.00076835,  0.03616228],
        [-0.00000985,  0.02636371,  0.01030391,  0.05360880,  0.01511308],
        [ 0.12053825, -0.01041320, -0.10291208,  0.00881728, -0.03701136]])
预测值的数字为: 7       预测概率为: 715.55%

3.3 加入校验或测试，更好评价模型效果

在训练过程中，我们会发现模型在训练样本集上的损失在不断减小。但这是否代表模型在未来的应用场景上依然有效？为了验证模型的有效性，通常将样本集合分成三份，训练集、校验集和测试集。

训练集 ：用于训练模型的参数，即训练过程中主要完成的工作。
校验集 ：用于对模型超参数的选择，比如网络结构的调整、正则化项权重的选择等。
测试集 ：用于模拟模型在应用后的真实效果。因为测试集没有参与任何模型优化或参数训练的工作，所以它对模型来说是完全未知的样本。在不以校验数据优化网络结构或模型超参数时，校验数据和测试数据的效果是类似的，均更真实的反映模型效果。

3.4 加入正则化项，避免模型过拟合

3.4.1 过拟合与欠拟合现象

对于样本量有限、但需要使用强大模型的复杂任务，模型很容易出现过拟合的表现，即在训练集上的损失小，在验证集或测试集上的损失较大，如下图所示。反之，如果模型在训练集和测试集上均损失较大，则称为欠拟合。

过拟合表示模型过于敏感，学习到了训练数据中的一些误差，而这些误差并不是真实的泛化规律（可推广到测试集上的规律）。欠拟合表示模型还不够强大，还没有很好的拟合已知的训练样本，更别提测试样本了。因为欠拟合情况容易观察和解决，只要训练 loss 不够好，就不断使用更强大的模型即可，因此实际中我们更需要处理好过拟合的问题。

3.4.2 导致过拟合原因

造成过拟合的原因是模型过于敏感，而训练数据量太少或其中的噪音太多。

如下图所示，理想的回归模型（OPTIMUM）是一条坡度较缓的抛物线，欠拟合的模型（UNDERFITTING）只拟合出一条直线，显然没有捕捉到真实的规律，但过拟合的模型（OVERFITTING）拟合出存在很多拐点的抛物线，显然是过于敏感，也没有正确表达真实规律。

如下图所示，理想的分类模型（normal）是一条半圆形的曲线，欠拟合（underfit）用直线作为分类边界，显然没有捕捉到真实的边界，但过拟合的模型（overfit）拟合出很扭曲的分类边界，虽然对所有的训练数据正确分类，但对一些较为个例的样本所做出的妥协，高概率不是真实的规律。

3.4.3 过拟合的成因与防控

为了更好的理解过拟合的成因，可以参考侦探定位罪犯的案例逻辑，如下图所示。

对于这个案例，假设侦探也会犯错，通过分析发现可能的原因：

情况1：罪犯证据存在错误，依据错误的证据寻找罪犯肯定是缘木求鱼。
情况2：搜索范围太大的同时证据太少，导致符合条件的候选（嫌疑人）太多，无法准确定位罪犯。

那么侦探解决这个问题的方法有两种：或者缩小搜索范围（比如假设该案件只能是熟人作案），或者寻找更多的证据。

归结到深度学习中，假设模型也会犯错，通过分析发现可能的原因：

情况1：训练数据存在噪音（证据中存在一定的错误），导致模型学到了噪音，而不是真实规律。
情况2：使用强大模型（搜索空间大）的同时训练数据太少，导致在训练数据上表现良好的候选假设太多，锁定了一个“虚假正确”的假设。

解决方案：

对于情况1，我们使用数据清洗和修正来解决。
对于情况2，我们或者限制模型表示能力，或者收集更多的训练数据。

然而，清洗训练数据中的错误，或收集更多的训练数据往往是一句“正确的废话”，在任何时候我们都想获得更多更高质量的数据。在实际项目中，更快、更低成本可控制过拟合的方法，只有限制模型的表示能力。

3.4.4 正则化项（Regularization Terms）

为了防止模型过拟合，在没有扩充样本量的可能下，只能降低模型的复杂度，可以通过限制参数的数量或可能取值（参数值尽量小）实现。

注意这里的条件：在训练机器学习模型时，当面临数据量有限且无法扩充的情况下

具体来说，在模型的优化目标（损失）中人为加入对参数规模的惩罚项。当参数越多或取值越大时，该惩罚项就越大。通过调整惩罚项的权重系数，可以使模型在“尽量减少训练损失”和“保持模型的泛化能力”之间取得平衡。泛化能力表示模型在没有见过的样本上依然有效。正则化项的存在，增加了模型在训练集上的损失。

这些参数通常表示为权重（weights）和偏差（biases）等

Q：一般来说，正则化防止过拟合时，正则化作用到的参数有哪些？
A：正则化在防止过拟合时通常会影响模型中的权重（weights）参数，但不会影响偏差（biases）参数。具体来说，有两种常见的正则化方法：L1 正则化和 L2 正则化，它们分别对权重参数进行惩罚。以下是它们的作用方式：

L1 正则化（Lasso 正则化）:
- L1 正则化通过在损失函数中添加权重绝对值的和，惩罚较大的权重值，从而促使一些权重变为零。
- 这对于特征选择很有用，因为它倾向于使一些特征对模型的影响减弱或消除，从而降低模型的复杂度。
- 偏差参数不受 L1 正则化的影响。
L2 正则化（Ridge 正则化）:
- L2 正则化通过在损失函数中添加权重平方的和，惩罚较大的权重值，但不会使权重变为零。
- 它在模型中推动权重值趋于较小的值，从而降低模型的复杂度，并避免过度拟合。
- L2 正则化不会使权重变为零，因此会保留所有的特征。
- 偏差参数不受 L2 正则化的影响。

总之，正则化的作用通常限于模型中的权重参数，而不会影响偏差参数。选择使用哪种正则化方法取决于具体的问题和数据。

飞桨支持为所有参数加上统一的正则化项，也支持为特定的参数添加正则化项。前者的实现如下代码所示，仅在优化器中设置 weight_decay 参数即可实现。使用参数 coeff 调节正则化项的权重，权重越大时，对模型复杂度的惩罚越高。

# 定义 SGD 优化器
if args.optimizer == "sgd" or "SGD":
    optimizer = opt.SGD(learning_rate=args.lr, parameters=model.parameters(), 
                        weight_decay=paddle.regularizer.L2Decay(coeff=1e-5))
elif args.optimizer == "momentum" or "Momentum":
    optimizer = opt.Momentum(learning_rate=args.lr, parameters=model.parameters(),
                             weight_decay=paddle.regularizer.L2Decay(coeff=1e-5))
elif args.optimizer == "adagrad" or "Adagrad":
    optimizer = opt.Adagrad(learning_rate=args.lr, parameters=model.parameters(),
                            weight_decay=paddle.regularizer.L2Decay(coeff=1e-5))
elif args.optimizer == "adam" or "Adam":
    optimizer = opt.Adam(learning_rate=args.lr, parameters=model.parameters(),
                         weight_decay=paddle.regularizer.L2Decay(coeff=1e-5))
else:
    raise KeyError("Please select correct optimizer in [sgd, momentum, adagrad, adam]!")

4. 可视化分析

训练模型时，经常需要观察模型的评价指标，分析模型的优化过程，以确保训练是有效的。可选用这两种工具：Matplotlib 库和 VisualDL。

Matplotlib 库：Matplotlib 库是 Python 中使用的最多的 2D 图形绘图库，它有一套完全仿照 MATLAB 的函数形式的绘图接口，使用轻量级的 PLT 库（Matplotlib）作图是非常简单的。
VisualDL：如果期望使用更加专业的作图工具，可以尝试 VisualDL，飞桨可视化分析工具。VisualDL 能够有效地展示飞桨在运行过程中的计算图、各种指标变化趋势和数据信息。

4.1 使用 Matplotlib 库绘制损失随训练下降的曲线图

def plot_loss_curve(loss_list):
    plt.figure(figsize=(10,5))
    
    freqs = [i for i in range(1, len(loss_list) + 1)]
    # 绘制训练损失变化曲线
    plt.plot(freqs, loss_list, color='#e4007f', label="Train loss")
    
    # 绘制坐标轴和图例
    plt.ylabel("loss", fontsize='large')
    plt.xlabel("epoch", fontsize='large')
    plt.legend(loc='upper right', fontsize='x-large')
    
    plt.savefig(f"train_loss_curve for {args.model_name}_{args.optimizer}.png")

之前我们代码中有，这里不再赘述。

4.2 使用 VisualDL 可视化分析

VisualDL 是飞桨可视化分析工具，以丰富的图表呈现训练参数变化趋势、模型结构、数据样本、高维数据分布等。帮助用户清晰直观地理解深度学习模型训练过程及模型结构，进而实现高效的模型调优，具体代码实现如下。

4.2.1 步骤 1：引入 VisualDL 库

定义作图数据存储位置（供第 3 步使用）。

from visualdl import LogWriter


if args.vdl:
    import datetime
    os.mkdir(args.vdl_path)
    # 获取当前时间
    current_time = datetime.now()
    # 格式化时间为年_月_日_小时_分钟_秒
    formatted_time = current_time.strftime("%Y_%m_%d_%H_%M_%S")
    
    # 创建VisualDL的writer
    args.vdl_path = f"{args.save_path}/log/{formatted_time}/"
    if not os.path.exists(args.vdl_path):
        os.mkdir(args.vdl_path)
    log_writer = LogWriter(args.vdl_path, flush_secs=10)

4.2.2 步骤 2：在训练过程中插入作图语句，过程与 Tensorboard 类似

# 给VisualDL添加数据
log_writer.add_scalar(tag="train_loss", step=epoch, value=current_epoch_loss)
log_writer.add_scalar(tag="val_accuracy", step=epoch, value=acc_epoch)

4.2.3 步骤 3：命令行启动VisualDL

visualdl --logdir xxx/xx [--port 8080]

4.2.4 步骤 4：打开浏览器，查看作图结果

查阅的网址在第三步的启动命令后会打印出来（如 http://127.0.0.1:8080/），将该网址输入浏览器地址栏刷新页面的效果如下图所示。除了右侧对数据点的作图外，左侧还有一个控制板，可以调整诸多作图的细节。

5. 模型加载及恢复训练

在快速入门中，我们已经介绍了将训练好的模型保存到磁盘文件的方法。应用程序可以随时加载模型，完成预测任务。但是在日常训练工作中我们会遇到一些突发情况，导致训练过程主动或被动的中断。如果训练一个模型需要花费几天的训练时间，中断后从初始状态重新训练是不可接受的。

万幸的是，飞桨支持从上一次保存状态开始训练，只要我们随时保存训练过程中的模型状态，就不用从初始状态重新训练。

下面介绍恢复训练的实现方法，依然使用手写数字识别的案例，网络定义的部分保持不变。

5.1 保存模型

def save_model(self, epoch):
    save_state_dict = {"model_state_dict": self.model.state_dict, 
                       "optimizer_state_dict": self.optimizer.state_dict}
    if args.vdl:
        paddle.save(obj=save_state_dict, path=f"{args.vdl_path}/model_{args.model_name}_{epoch}_{args.optimizer}.pdparams")
    else:
        paddle.save(obj=save_state_dict, path=f"{args.save_path}/model_{args.model_name}_{epoch}_{args.optimizer}.pdparams")

5.2 读取模型

if args.resume_path:
    resume_state_dict = paddle.load(args.resume_path)
    self.model.set_state_dict(resume_state_dict["model_state_dict"])
    self.optimizer.set_state_dict(resume_state_dict["optimizer_state_dict"])
    print("-------------Model's Params have been loaded-------------")

6. 可变学习率策略

PolynomialDecay（DeepLab v3+ 提出）的变化曲线下图所示：

# 使用poly学习率更改策略
lr = opt.lr.PolynomialDecay(learning_rate=args.lr, 
                            decay_steps=(int(train_dataset.__len__() // args.batch_size) + 1
                            end_lr=args.lr / 1000)
        
# 定义 SGD 优化器
if args.optimizer == "sgd" or "SGD":
    optimizer = opt.SGD(learning_rate=lr, parameters=model.parameters(), 
                        weight_decay=paddle.regularizer.L2Decay(coeff=1e-5))
elif args.optimizer == "momentum" or "Momentum":
    optimizer = opt.Momentum(learning_rate=lr, parameters=model.parameters(),
                            weight_decay=paddle.regularizer.L2Decay(coeff=1e-5))
elif args.optimizer == "adagrad" or "Adagrad":
    optimizer = opt.Adagrad(learning_rate=lr, parameters=model.parameters(),
                            weight_decay=paddle.regularizer.L2Decay(coeff=1e-5))
elif args.optimizer == "adam" or "Adam":
    optimizer = opt.Adam(learning_rate=lr, parameters=model.parameters(),
                        weight_decay=paddle.regularizer.L2Decay(coeff=1e-5))
else:
    raise KeyError("Please select correct optimizer in [sgd, momentum, adagrad, adam]!")

7. 动静转换（动态图2静态图）

7.1 动/静态图概念

在深度学习框架中，动态图（Dynamic Graph）和静态图（Static Graph）是两种不同的计算图构建和执行方式。这两种图的主要区别在于它们的计算方式和灵活性。

静态图（Static Graph）：
- 静态图是在模型定义阶段就构建好的计算图，然后在执行阶段传递数据进行计算。例如，TensorFlow 的早期版本就是基于静态图的计算模式。
- 在静态图中，你首先定义了计算图的结构，包括网络层、操作和数据流的连接关系。然后，你将数据传递给这个定义好的图，框架会优化图结构并执行计算。
- 静态图的优点在于可以进行高度的优化，因为框架可以在执行前对图进行静态分析，并应用一些优化技术，例如融合操作和自动微分。但构建和调试静态图可能相对复杂，尤其对于初学者而言。
动态图（Dynamic Graph）：
- 动态图是在每一次执行计算时构建的计算图。这意味着你可以在代码中使用控制流（如循环和条件语句），并在运行时构建计算图。
- PyTorch 和 TensorFlow 2.x 中的 Eager Execution 模式都采用了动态图的计算方式。在动态图中，你可以像写普通的 Python 代码一样编写和调试深度学习模型，这使得开发过程更加直观和灵活。
- 动态图的优点在于更容易理解和调试，同时可以处理更加复杂的计算流程。然而，由于没有静态图的优化步骤，可能会影响一些性能。

7.2 动/静态图的选择

选择动态图还是静态图取决于应用的需求和个人偏好。动态图适用于快速的原型开发、灵活的控制流和易于调试，而静态图则适用于需要高度优化的生产环境和对性能有严格要求的应用。不同的框架提供了不同的计算图模式，以满足不同场景的需求。

7.3 动静转换

动态图有诸多优点，比如易用的接口、Python 风格的编程体验、友好的调试交互机制等。在动态图模式下，代码可以按照我们编写的顺序依次执行。这种机制更符合 Python 程序员的使用习惯，可以很方便地将脑海中的想法快速地转化为实际代码，也更容易调试。

但在性能方面，由于 Python 执行开销较大，与 C++ 有一定差距，因此在工业界的许多部署场景中（如大型推荐系统、移动端）都倾向于直接使用 C++ 进行提速。相比动态图，静态图在部署方面更具有性能的优势。静态图程序在编译执行时，先搭建模型的神经网络结构，然后再对神经网络执行计算操作。预先搭建好的神经网络可以脱离 Python 依赖，在 C++ 端被重新解析执行，而且拥有整体网络结构也能进行一些网络结构的优化。

那么，有没有可能，深度学习框架实现一个新的模式，同时具备动态图高易用性与静态图高性能的特点呢？飞桨从 2.0 版本开始，新增新增支持动静转换功能，编程范式的选择更加灵活。用户依然使用动态图编写代码，只需添加一行装饰器 @paddle.jit.to_static，即可实现动态图转静态图模式运行，进行模型训练或者推理部署。在本章节中，将介绍飞桨动态图转静态图的基本用法和相关原理。

7.4 动态图转静态图训练

飞桨的动转静方式是基于源代码级别转换的 ProgramTranslator 实现，其原理是通过分析 Python 代码，将动态图代码转写为静态图代码，并在底层自动使用静态图执行器运行。其基本使用方法十分简便，只需要在要转化的函数（该函数也可以是用户自定义动态图 Layer 的 forward 函数）前添加一个装饰器 @paddle.jit.to_static。这种转换方式使得用户可以灵活使用 Python 语法及其控制流来构建神经网络模型。下面通过一个例子说明如何使用飞桨实现动态图转静态图训练。

import paddle


# 定义手写数字识别模型
class MNIST(paddle.nn.Layer):
    def __init__(self):
        super(MNIST, self).__init__()
        
        # 定义一层全连接层，输出维度是1
        self.fc = paddle.nn.Linear(in_features=784, out_features=10)

    # 定义网络结构的前向计算过程
    @paddle.jit.to_static  # 添加装饰器，使动态图网络结构在静态图模式下运行
    def forward(self, inputs):
        outputs = self.fc(inputs)
        return outputs

上述代码构建了仅有一层全连接层的手写字符识别网络。特别注意，在 forward 函数之前加了装饰器 @paddle.jit.to_static，要求模型在静态图模式下运行。下面是模型的训练代码，由于飞桨实现动转静的功能是在内部完成的，对使用者来说，动态图的训练代码和动转静模型的训练代码是完全一致的。训练代码如下：

import paddle
import paddle.nn.functional as F


# 确保从paddle.vision.datasets.MNIST中加载的图像数据是np.ndarray类型
paddle.vision.set_image_backend('cv2')

# 图像归一化函数，将数据范围为[0, 255]的图像归一化到[-1, 1]
def norm_img(img):
    batch_size = img.shape[0]
    # 归一化图像数据
    img = img/127.5 - 1
    # 将图像形式reshape为[batch_size, 784]
    img = paddle.reshape(img, [batch_size, 784])
    
    return img

def train(model):
    model.train()
    # 加载训练集 batch_size 设为 16
    train_loader = paddle.io.DataLoader(paddle.vision.datasets.MNIST(mode='train'), 
                                        batch_size=16, 
                                        shuffle=True)
    opt = paddle.optimizer.SGD(learning_rate=0.001, parameters=model.parameters())
    EPOCH_NUM = 10
    for epoch in range(EPOCH_NUM):
        for batch_id, data in enumerate(train_loader()):
            images = norm_img(data[0]).astype('float32')
            labels = data[1].astype('int64')
            
            #前向计算的过程
            predicts = model(images)
            
            # 计算损失
            loss = F.cross_entropy(predicts, labels)
            avg_loss = paddle.mean(loss)
            
            #每训练了1000批次的数据，打印下当前Loss的情况
            if batch_id % 1000 == 0:
                print("epoch_id: {}, batch_id: {}, loss is: {}".format(epoch, batch_id, avg_loss.numpy()))
            
            #后向传播，更新参数的过程
            avg_loss.backward()
            opt.step()
            opt.clear_grad()


model = MNIST() 

train(model)

paddle.save(model.state_dict(), './mnist.pdparams')
print("==>Trained model saved in ./mnist.pdparams")

epoch_id: 0, batch_id: 0, loss is: [3.0346446]
epoch_id: 0, batch_id: 1000, loss is: [1.1114309]
epoch_id: 0, batch_id: 2000, loss is: [0.56083727]
epoch_id: 0, batch_id: 3000, loss is: [0.56929463]
epoch_id: 1, batch_id: 0, loss is: [0.64646566]
epoch_id: 1, batch_id: 1000, loss is: [0.4265188]
epoch_id: 1, batch_id: 2000, loss is: [0.2182416]
epoch_id: 1, batch_id: 3000, loss is: [0.5384557]
epoch_id: 2, batch_id: 0, loss is: [0.22628105]

我们可以观察到，动转静的训练方式与动态图训练代码是完全相同的。因此，在动转静训练的时候，开发者只需要在动态图的组网前向计算函数上添加一个装饰器即可实现动转静训练。在模型构建和训练中，飞桨更希望借用动态图的易用性优势，实际上，在加上 @to_static 装饰器运行的时候，飞桨内部是在静态图模式下执行 OP（Operation，运算）的，但是展示给开发者的依然是动态图的使用方式。

动转静更能体现静态图的方面在于模型部署上。下面将介绍动态图转静态图的部署方式。

7.5 动态图转静态图模型保存

在【推理 & 部署】场景中，需要同时保存推理模型的结构和参数，但是动态图是即时执行即时得到结果，并不会记录模型的结构信息。动态图在保存推理模型时，需要先将动态图模型转换为静态图写法，编译得到对应的模型结构再保存，而飞桨框架 2.0 版本推出 paddle.jit.save 和 paddle.jit.load 接口，无需重新实现静态图网络结构，直接实现动态图模型转成静态图模型格式。paddle.jit.save 接口会自动调用飞桨框架 2.0 推出的动态图转静态图功能，使得用户可以做到使用动态图编程调试，自动转成静态图训练部署。

这两个接口的基本关系如下图所示：

当用户使用 paddle.jit.save 保存 Layer 对象（一般是 model）时，飞桨会自动将用户编写的动态图 Layer 模型转换为静态图写法，并编译得到模型结构，同时将模型结构与参数保存。paddle.jit.save 需要适配飞桨沿用已久的推理模型与参数格式，做到前向完全兼容，因此其保存格式与 paddle.save 有所区别，具体包括三种文件：

保存模型结构的 *.pdmodel 文件；
保存推理用参数的 *.pdiparams 文件
保存兼容变量信息的 *.pdiparams.info 文件

这几个文件后缀均为 paddle.jit.save 保存时默认使用的文件后缀。

比如，如果保存上述手写字符识别的 inference 模型用于部署，可以直接用下面代码实现：

# save inference model
from paddle.static import InputSpec


# 加载训练好的模型参数
state_dict = paddle.load("./mnist.pdparams")
# 将训练好的参数读取到网络中
model.set_state_dict(state_dict)
# 设置模型为评估模式
model.eval()

# 保存inference模型
paddle.jit.save(
    layer=model,
    path="inference/mnist",
    input_spec=[InputSpec(shape=[None, 784], dtype='float32')])

print("==>Inference model saved in inference/mnist.")

其中：

paddle.jit.save API 将输入的网络存储为 paddle.jit.TranslatedLayer 格式的模型，载入后可用于预测推理或者 fine-tune 训练。该接口会将输入网络转写后的模型结构 Program 和所有必要的持久参数变量存储至输入路径 path 。
path 是存储目标的前缀，存储的模型结构 Program 文件的后缀为 .pdmodel，存储的持久参数变量文件的后缀为 .pdiparams，同时这里也会将一些变量描述信息存储至文件，文件后缀为 .pdiparams.info。
InputSpec（Input Specification，输入规范）在 PaddlePaddle 框架中用于指定模型的输入数据的形状和数据类型。它的作用是为模型的输入数据提供信息，使得模型在构建、训练和推理时能够更好地管理和处理输入数据。

通过调用对应的 paddle.jit.load 接口，可以把存储的模型载入为 paddle.jit.TranslatedLayer格式，用于预测推理或者 fine-tune 训练。

import numpy as np
import paddle
import paddle.nn.functional as F


# 确保从paddle.vision.datasets.MNIST中加载的图像数据是np.ndarray类型
paddle.vision.set_image_backend('cv2')

# 读取mnist测试数据，获取第一个数据
mnist_test = paddle.vision.datasets.MNIST(mode='test')
test_image, label = mnist_test[0]
# 获取读取到的图像的数字标签
print("The label of readed image is : ", label)

# 将测试图像数据转换为tensor，并reshape为[1, 784]
test_image = paddle.reshape(paddle.to_tensor(test_image), [1, 784])
# 然后执行图像归一化
test_image = norm_img(test_image)
# 加载保存的模型
loaded_model = paddle.jit.load("./inference/mnist")
# 利用加载的模型执行预测
preds = loaded_model(test_image)
pred_label = paddle.argmax(preds)
# 打印预测结果
print("The predicted label is : ", pred_label.numpy())

The label of readed image is :  [7]
The predicted label is :  [7]

paddle.jit.save API 可以把输入的网络结构和参数固化到一个文件中，所以通过加载保存的模型，可以不用重新构建网络结构而直接用于预测，易于模型部署。

8. 问题

8.6 【问题6】使用分布式训练后无法在训练时 print

在开启分布式训练后，可能无法正常 print，而是训练完毕后一次性 print，这样就很烦。

import sys
# 设置标准输出不缓冲
sys.stdout.reconfigure(line_buffering=True)  # type: ignore

这样应该就可以正常 print 了。

知识来源

https://www.paddlepaddle.org.cn/tutorials/projectdetail/4225741
https://www.paddlepaddle.org.cn/tutorials/projectdetail/3445243

你可能感兴趣的:(学习笔记（Learning,Notes）,PaddlePaddle,paddlepaddle,学习,笔记)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
RocketMQ 基础教程-应用篇-死信队列码炫课堂-码哥 rocketmq专题 rocketmq java
作者简介：大家好，我是smart哥，前中兴通讯、美团架构师，现某互联网公司CTO联系qq：184480602，加我进群，大家一起学习，一起进步，一起对抗互联网寒冬学习必须往深处挖，挖的越深，基础越扎实！阶段1、深入多线程阶段2、深入多线程设计模式阶段3、深入juc源码解析阶段4、深入jdk其余源码解析
入门html这篇文章就够了 ξ流ぁ星ぷ132 html 前端
HTML笔记文章目录HTML笔记html介绍什么是htmlhtml的作用HTML标签介绍常用标签标签and标签and标签u标签del删除线br标签用于换行pre标签，预处理标签span标签div标签sub标签andsup标签hr标签h1,h2...h6标签：HTML5中的语义标签：特殊字符img标签a标签第一种用法：超链接第二种用法：锚点video标签表格标签：form标签input标签selec
OKHttp3源码分析——学习笔记 Sincerity_ 源码相关 Okhttp 源码解析读书笔记 httpclient cache
文章目录1.HttpClient与HttpUrlConnection的区别2.OKHttp源码分析使用步骤:dispatcher任务调度器,（后面有详细说明）Request请求RealCallAsyncCall3.OKHttp架构分析1.异步请求线程池,Dispather2.连接池清理线程池-ConnectionPool3.缓存整理线程池DisLruCache4.Http2异步事务线程池,http
JavaScript 基础09：Web APIs——日期对象、DOM节点梦想当全栈 JavaScript javascript 前端开发语言
JavaScript基础09：WebAPIs——日期对象、DOM节点进一步学习DOM相关知识，实现可交互的网页特效能够插入、删除和替换元素节点。能够依据元素节点关系查找节点。一、日期对象掌握Date日期对象的使用，动态获取当前计算机的时间。ECMAScript中内置了获取系统时间的对象Date，使用Date时与之前学习的内置对象console和Math不同，它需要借助new关键字才能使用。1.实例
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（Advanced RAG[1]）基于历史对话重新生成Query？ 985小水博一枚呀 AI大模型学习路线人工智能学习 langchain RAG
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Query？【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Query？文章目录【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Q
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（Advanced RAG[1]）其他Query优化相关策略？ 985小水博一枚呀 AI大模型学习路线人工智能学习 langchain
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？文章目录【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？一
传奇修改map地图教程_传奇技能第三祭：NPC的增加、隐藏和脚本修改垃圾箱博物馆传奇修改map地图教程
技能献祭，Get新技能：传奇技能——NPC功能与实现跟航家学技能，用干货带你飞，现学现用，底部有配套学习资源本篇内容简介：通过对游戏内NPC的控制，可以让NPC出现在地图中的任意位置，还可以控制外观显示、自定义命名，新增与隐藏以及脚本功能的实现。一、NPC总控制文本所在路径：D:MirServerMir200EnvirEnvir目录下，找到NPC总控制文本：Merchant，游戏内的所有NPC都在
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
AI Agent开发学习系列 - langchain之Chains的使用(7)：用四种处理文档的预制链轻松实现文档对话 alex100 AI Agent 学习人工智能 langchain prompt 语言模型 python
在LangChain中，四种文档处理预制链（stuff、refine、mapreduce、mapre-rank）是实现文档问答、摘要等任务的常用高阶工具。它们的核心作用是：将长文档切分为块，分步处理，再整合结果，极大提升大模型处理长文档的能力。stuff直接拼接所有文档内容到prompt，一次性交给大模型处理。适合文档较短、token不超限的场景。refine递进式摘要。先对第一块文档生成初步答案
.NET 一款基于BGInfo的红队内网渗透工具 dot.Net安全矩阵网络 .net 安全 .netcore web安全矩阵
01阅读须知此文所提供的信息只为网络安全人员对自己所负责的网站、服务器等（包括但不限于）进行检测或维护参考，未经授权请勿利用文章中的技术资料对任何计算机系统进行入侵操作。利用此文所提供的信息而造成的直接或间接后果和损失，均由使用者本人负责。本文所提供的工具仅用于学习，禁止用于其他方面02基本介绍在内网渗透过程中，白名单绕过是红队常见的技术需求。Sharp4Bginfo.exe是一款基于微软签名工具
vue3面试题(个人笔记) 武昌库里写JAVA 面试题汇总与解析课程设计 spring boot vue.js java 学习
vue3比vue2有什么优势？性能更好，打包体积更小，更好的ts支持，更好的代码组织，更好的逻辑抽离，更多的新功能。描述Vue3生命周期CompositionAPI的生命周期：onMounted()onUpdated()onUnmounted()onBeforeMount()onBeforeUpdate()onBeforeUnmount()onErrorCaptured()onRenderTrac
Python学习笔记5|条件语句和循环语句 iamecho9 Python从0到1学习笔记 python 学习笔记
一、条件语句条件语句用于根据不同的条件执行不同的代码块。1、if语句基本语法：if布尔型语句1:代码块#语句1为True时执行的代码示例：age=int(input("请输入你的年龄:"))ifage>=18:print("你已成年")2、if-else语句如果if条件不成立，则执行else代码块：if布尔型语句1:代码块#语句1为True时执行的代码else:代码块#语句1为False时执行的代
2025年渗透测试面试题总结-2025年HW(护网面试) 43（题目+回答）独行soc 2025年护网面试职场和发展 linux 科技渗透测试安全护网
安全领域各种资源，学习文档，以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具，欢迎关注。目录2025年HW(护网面试)431.自我介绍与职业规划2.Webshell源码级检测方案3.2025年新型Web漏洞TOP54.渗透中的高价值攻击点5.智能Fuzz平台架构设计6.堆栈溢出攻防演进7.插桩技术实战应用8.二进制安全能力矩阵9.C语言内存管理精要10.Pyth
Javaweb学习之Vue模板语法（三）不要数手指啦 vue.js 学习前端
目录学习资料前情回顾本期介绍（vue模板语法）文本插值Vue的Attribute绑定使用JavaScript表达式综合实例代码：学习资料Vue.js-渐进式JavaScript框架|Vue.js(vuejs.org)前情回顾项目的创建大家可以看这篇文章Vue学习之项目的创建-CSDN博客本期介绍（vue模板语法）首先，找到我们编写代码的地方找到自己项目的src文件夹，打开之后点击component
swagger【个人笔记】撰卢笔记 java
文章目录swagger导入mave坐标在配置类(WebMvcConfiguration)中加入knife4j相关配置设置静态资源映射，主要是让拦截器放行swagger常用注解@Api(tags="\[描述这个类的作用]")@ApiModel(description="\[描述这个类的作用]")@ApiModelProPerty("描述这个类的作用")@ApiOperation("\[描述方法的作用
【个人笔记】负载均衡撰卢笔记负载均衡运维
文章目录nginx反向代理的好处负载均衡负载均很的配置方式均衡负载的方式nginx反向代理的好处提高访问速度进行负载均衡保证后端服务安全负载均衡负载均衡，就是把大量的请求按照我们指定的方式均衡的分配给集群中的每台服务器负载均很的配置方式upstreamwebservers{server192.168.100.128:8080server192.168.100.129:8080}server{lis
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found