Pytorch——model.train 和 model.eval

原文链接: https://blog.csdn.net/u011276025/article/details/78507950

转载:https://blog.csdn.net/weixin_42018112/article/details/91403816

目录连接
(1) 数据处理
(2) 搭建和自定义网络
(3) 使用训练好的模型测试自己图片
(4) 视频数据的处理
(5) PyTorch源码修改之增加ConvLSTM层
(6) 梯度反向传递(BackPropogate)的理解
(7) 模型的训练和测试、保存和加载
(8) pyTorch-To-Caffe
(总) PyTorch遇到令人迷人的BUGPyTorch的学习和使用(七)
模型的训练和测试

两条语句有固定的使用场景。

  • 在训练模型时会在前面加上:
model.train()

 

  • 在测试模型时在前面使用:
model.eval()

 

同时发现,如果不使用这两条语句,程序也可以运行。这两个方法是针对在网络train和eval时采用不同方式的情况,比如Batch Normalization和Dropout。

下面对这Batch Normalization和Dropout做一下详细的解析:

Batch Normalization

BN的作用主要是对网络中间的每层进行归一化处理,并且使用变换重构(Batch Normalization Transform)保证每层所提取的特征分布不会被破坏。
训练时是针对每个mini-batch的,但是在测试中往往是针对单张图片,即不存在mini-batch的概念。由于网络训练完毕后参数都是固定的,因此每个batch的均值和方差都是不变的,因此直接结算所有batch的均值和方差。所有Batch Normalization的训练和测试时的操作不同。

Dropout

Dropout能够克服Overfitting,在每个训练Batch中,通过忽略一半的特征检测器,可以明显的减少过拟合现象。
Pytorch——model.train 和 model.eval_第1张图片
在训练中,每个隐层的神经元先乘以概率P,然后再进行激活。
在测试中,所有的神经元先进行激活,然后每个隐层神经元的输出乘P。

###模型的保存和加载

模型的保存和加载有两种方式:

(1) 仅仅保存和加载模型参数

torch.save(the_model.state_dict(), PATH)

the_model = TheModelClass(*args, **kwargs)
the_model.load_state_dict(torch.load(PATH))



(2) 保存和加载整个模型

torch.save(the_model, PATH)

the_model = torch.load(PATH)



第一种方式需要自己定义网络,并且其中的参数名称与结构要与保存的模型中的一致(可以是部分网络,比如只使用VGG的前几层),相对灵活,便于对网络进行修改。第二种方式则无需自定义网络,保存时已把网络结构保存,比较死板,不能调整网络结构。

你可能感兴趣的:(Pytorch)