【keras】0.1keras.datasets常用数据集,默认下载地址与修改

一.简介
keras包含7中常见数据,介绍如下

数据集名称 主要用途
CIFAR10 小图像分类数据集(10标签)
CIFAR100 小图像分类数据集(100标签)
IMDB 电影评论情感分类数据集(二分类)
REUTERS 路透社新闻主题分类(多分类)
MNIST 手写字符数据集
Fashion-MNIST 时尚物品数据集(多分类)
Boston 房价回归数据集(回归)

二.使用

from keras.datasets import imdb

(x_train, y_train), (x_test, y_test) = imdb.load_data()

常见参数

参数名 用途
path 数据读取下载路径 ,默认(windows):C:\Users\用户名.keras\datasets\path,可以使用绝对路径的方式修改:D:\project\data\imdb.npz
num_words 整数或 None。保留训练集中前num_words个常见单词
skip_top 整数。要忽略的最常见的单词。
maxlen 整数。最大序列长度,保持数据长度一致
seed 整数。用于可重现数据混洗的种子
start_char 整数。序列的开始将用这个字符标记。设置为 1,因为 0 通常作为填充字符
oov_char 整数。由于 num_words 或 skip_top 限制而被删除的单词将被替换为此字符
index_from 整数。使用此数以上更高的索引值实际词汇索引的开始
test_split 浮点型。用作测试集的数据比例

你可能感兴趣的:(Keras,深度学习,tensorflow)