Datawhale-街景字符编码识别--Task4 模型训练与验证

零基础入门CV赛事-Task4 模型训练与验证

  • 模型训练要求
  • 验证集划分方式
      • 1.留出法(Hold-Out)
      • 2.交叉验证法(Cross Validation,CV)
      • 3.自助采样法(BootStrap)
    • Pytorch框架下的模型训练与验证
    • Pytorch框架下的模型读取和加载
    • 训练初步优化的步骤
    • 本章小节

模型训练要求

一个成熟合格的深度学习训练流程至少具备以下功能:
1.在训练集上进行训练,并在验证集上进行验证;
2.模型可以保存最优的权重,并读取权重;
3.记录下训练集和验证集的精度,便于调参。

Datawhale-街景字符编码识别--Task4 模型训练与验证_第1张图片

验证集划分方式

1.留出法(Hold-Out)

直接将训练集划分成两部分,新的训练集和验证集。这种划分方式的优点是最为直接简单;缺点是只得到了一份验证集,有可能导致模型在验证集上过拟合。留出法应用场景是数据量比较大的情况。

2.交叉验证法(Cross Validation,CV)

将训练集划分成K份,将其中的K-1份作为训练集,剩余的1份作为验证集,循环K训练。这种划分方式是所有的训练集都是验证集,最终模型验证精度是K份平均得到。这种方式的优点是验证集精度比较可靠,训练K次可以得到K个有多样性差异的模型;CV验证的缺点是需要训练K次,不适合数据量很大的情况。

3.自助采样法(BootStrap)

通过有放回的采样方式得到新的训练集和验证集,每次的训练集和验证集都是有区别的。这种划分方式一般适用于数据量较小的情况。在本次赛题中已经划分为验证集,因此选手可以直接使用训练集进行训练,并使用验证集进行验证精度(当然也可以合并训练集和验证集,自行划分验证集)。

当然这些划分方法是从数据划分方式的角度来讲的,在现有的数据比赛中一般采用的划分方法是留出法和交叉验证法。如果数据量比较大,留出法还是比较合适的。当然任何的验证集的划分得到的验证集都是要保证训练集-验证集-测试集的分布是一致的,所以如果不管划分何种的划分方式都是需要注意的。这里的分布一般指的是与标签相关的统计分布,比如在分类任务中“分布”指的是标签的类别分布,训练集-验证集-测试集的类别分布情况应该大体一致;如果标签是带有时序信息,则验证集和测试集的时间间隔应该保持一致。

Pytorch框架下的模型训练与验证

## validation (task4)
train_loader = torch.utils.data.DataLoader(
    train_dataset,
    batch_size=10, 
    shuffle=True, 
    num_workers=10, 
)
    
val_loader = torch.utils.data.DataLoader(
    val_dataset,
    batch_size=10, 
    shuffle=False, 
    num_workers=10, 
)

model = SVHN_Model1()
criterion = nn.CrossEntropyLoss (size_average=False)
optimizer = torch.optim.Adam(model.parameters(), 0.001)
best_loss = 1000.0
for epoch in range(20):
    print('Epoch: ', epoch)

    train(train_loader, model, criterion, optimizer, epoch)
    val_loss = validate(val_loader, model, criterion)
    
    # 记录下验证集精度
    if val_loss < best_loss:
        best_loss = val_loss
        torch.save(model.state_dict(), './model.pt')

## 其中每个Epoch的训练代码如下:
def train(train_loader, model, criterion, optimizer, epoch):
    # 切换模型为训练模式
    model.train()

    for i, (input, target) in enumerate(train_loader):
        c0, c1, c2, c3, c4, c5 = model(data[0])
        loss = criterion(c0, data[1][:, 0]) + \
                criterion(c1, data[1][:, 1]) + \
                criterion(c2, data[1][:, 2]) + \
                criterion(c3, data[1][:, 3]) + \
                criterion(c4, data[1][:, 4]) + \
                criterion(c5, data[1][:, 5])
        loss /= 6
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

## 其中每个Epoch的验证代码如下:
def validate(val_loader, model, criterion):
    # 切换模型为预测模型
    model.eval()
    val_loss = []

    # 不记录模型梯度信息
    with torch.no_grad():
        for i, (input, target) in enumerate(val_loader):
            c0, c1, c2, c3, c4, c5 = model(data[0])
            loss = criterion(c0, data[1][:, 0]) + \
                    criterion(c1, data[1][:, 1]) + \
                    criterion(c2, data[1][:, 2]) + \
                    criterion(c3, data[1][:, 3]) + \
                    criterion(c4, data[1][:, 4]) + \
                    criterion(c5, data[1][:, 5])
            loss /= 6
            val_loss.append(loss.item())
    return np.mean(val_loss)

Pytorch框架下的模型读取和加载

在Pytorch中模型的保存和加载非常简单,比较常见的做法是保存和加载模型参数:

# 保存模型为'model.pt'
torch.save(model_object.state_dict(), 'model.pt')
# 加载'model.pt'模型
model.load_state_dict(torch.load(' model.pt'))

训练初步优化的步骤

1.初步构建简单的CNN模型,不用特别复杂,首先跑通训练、验证和预测的流程;

2.简单CNN模型的损失会比较大,尝试增加模型复杂度,并观察验证集精度;

3.在增加模型复杂度的同时增加数据扩增方法,直至验证集精度不变。
Datawhale-街景字符编码识别--Task4 模型训练与验证_第2张图片

本章小节

本章以深度学习模型的训练和验证为基础,讲解了验证集划分方法、模型训练与验证、模型保存和加载以及模型调参流程。

需要注意的是模型复杂度是相对的,并不一定模型越复杂越好。在有限设备和有限时间下,需要选择能够快速迭代训练的模型。

你可能感兴趣的:(计算机视觉)