pytorch dataset

pytorch使用dataset和dataloader两类加载数据集,首先利用dataset类读取数据,再使用dataloader按照特定的要求为程序提供数据。

pytorch支持两种类型的dataset

  • map-style datasets
  • iterable-style datasets

Map_style datasets:
这种dataset实现了__getitem__()和__len()__协议,并且其中储存着一个从datasets到实际数据的映射。
对于这种datasets来说,当使用dataset[idx]访问数据的时候,可以从本地磁盘中访问到一张图片和这张图片对应的标签。

iterable-style datasets:
这种dataset是IterableDataset的一个子类,实现了__iter__()协议,其中存储着一个迭代器。
对于这种dataset来说,当使用iter(dataset)的时候,会返回一个从数据库或者是远程服务器读取的数据流。

https://pytorch.org/docs/stable/data.html#map-style-datasets

你可能感兴趣的:(pytorch)