用同一个语句,差一行代码。
以mdb_reviews为例,
本地的话,提前下载解压到
C:\\Users\\Grant\\tensorflow_datasets\\imdb_reviews\\plain_text\\1.0.0,
但是传给load函数的目录是前半部分C:\\Users\\Grant\\tensorflow_datasets\\,
后半部分tfds自动拼接,因为tfds代码库内建数据集操作类代码和特征字典。
####======================load from local =========================
# import os
#windows 10
#text_dir='C:\\Users\\Grant\\tensorflow_datasets\\'
#linux
text_dir='/root/data/'
## 目录自动添加 imdb_reviews\\plain_text\\1.0.0
dataset, info = tfds.load('imdb_reviews', download=False,data_dir=text_dir, with_info=True,as_supervised=True)
#print("data_dir:",text_dir)
####===============================================================
tfds.load
: 一行代码获取数据集,tfds.load
是构建并加载 tf.data.Dataset
最简单的方式。tf.data.Dataset
是构建输入流水线的标准 TensorFlow 接口。