实战PyTorch(二++):宝可梦自定义数据集之迁移学习

  • Load data

  • Build model

  • Train and Test

  • Transfer Learning

思想:如果自己创建resnet18网络,也就是从0开始训练,只能达到85的精度,因为任务的图片数量少,而网络表达能力强,可能出现过拟合的情况,如果用训练好的reset18,有着公有知识,这样训练不是从0开始,而是从公有知识开始,能得到更好的状态。简单来说,也就是在A上训练好分类器后,转移到B上,再根据B的情况做分类器的微调。

实战PyTorch(二++):宝可梦自定义数据集之迁移学习_第1张图片实战PyTorch(二++):宝可梦自定义数据集之迁移学习_第2张图片

 

    trained_model = resnet18(pretrained=True)
    model = nn.Sequential(*list(trained_model.children())[:-1], #[b, 512, 1, 1]
                          Flatten(), # [b, 512, 1, 1] => [b, 512]
                          nn.Linear(512, 5)
                          ).to(device)

最后acc到0.95

总结:

数据集:

数据集有5类对应不同宝可梦,每类有200多张照片,要知道每张图片的存储位置和Label映射的csv文件。得到的dataset对象封装到dataloder,可以批量多线程去读取数据。

网络:

利用reset18解包成公有知识A,以及新知识 B,A是来自训练好的Imagenet网络的参数,利用A+B在新的网络上做训练,精度可达95。

你可能感兴趣的:(#,初始PyTorch,深度学习)