2019-04-30 手把手教你用pytorch实现迁移学习(第一部分-如何构建一个全连接网络)——1.在Pytorch中导入Cifar-10 数据集

一.导入所需要的包:

1 导入和数据处理相关的python包


2019-04-30 手把手教你用pytorch实现迁移学习(第一部分-如何构建一个全连接网络)——1.在Pytorch中导入Cifar-10 数据集_第1张图片
需要用到的标准库(深度学习/图像处理/数据处理相关)

2 导入本地模块和函数


导入我们在本教程中开发的一些类和函数,后面会挨个讲解

二.导入数据集:

使用TorchVision的Dataset模块中提供的CIFAR10函数下载数据的训练和测试集。

通过train=true标志来表示我们想要将其作为训练集。然后通过train=false来说明我们将其作为测试集。

因为是第一次使用这个数据集,所以用download=True来表示我们需要先从指定url下载数据集。

当首次运行此单元并且成功下载数据集后,就要将download参数更改为false,以避免每次重复下载。


2019-04-30 手把手教你用pytorch实现迁移学习(第一部分-如何构建一个全连接网络)——1.在Pytorch中导入Cifar-10 数据集_第2张图片
导入CIFAR-10数据集

以上代码为我们提供了两个数据集对象,他们的类型是:

Pytorch的DataSet类是主要用来进行数据集表示的类,而我们刚刚用到的是DataSet类的一个子类,这个特殊的类表示存储在其内部数据结构中的cifar-10数据。随后,这些对象就会传递给Pytorch的Dataloader对象(稍后马上会有进一步解释),以便进行下一步图像数据处理。

三.查看数据集大小:

下载完成后,可以通过以下语句查看一下数据集的大小:

训练集有50k图片,而测试集有10k

四.查看每张图片的形状:


2019-04-30 手把手教你用pytorch实现迁移学习(第一部分-如何构建一个全连接网络)——1.在Pytorch中导入Cifar-10 数据集_第3张图片
50k张32x32的三通道彩色图片

五.用matplotlib包预览一张图片看看


2019-04-30 手把手教你用pytorch实现迁移学习(第一部分-如何构建一个全连接网络)——1.在Pytorch中导入Cifar-10 数据集_第4张图片
查看第100张图片,Emmm看起来像条船

就像上图我们看到的那样,图像相当模糊,并且分辨率很低(32×32).

经过以上步骤,我们就完成了数据集的下载和导入,并且对这个数据集有了一些简单的了解。

接下来要对数据集进行一些预处理工作。

你可能感兴趣的:(2019-04-30 手把手教你用pytorch实现迁移学习(第一部分-如何构建一个全连接网络)——1.在Pytorch中导入Cifar-10 数据集)