使用train_test_split划分训练数据集、测试数据集

train_test_split函数是sklearn机器学习库的一个函数,利用这个函数可以自动将数据集按照预定比例划分为测试数据集、训练数据集。

1. 安装sklearn数据库

pip install scikit-learn

2. 声明数据库

from sklearn.model_selection import train_test_split

3. 函数使用

X_tr, X_test, lab_tr, lab_test = train_test_split(X_train, labels_train,test_size=0.3, random_state = 123)
参数 含义
X_train 整体数据
labels_train 整体数据 label
test_size 测试数据所占比例
random_state 随机分配种子,设置一样的种子可以使得两次得到一样的结果
X_tr 训练数据集
X_test 测试数据集
lab_tr 训练 label
lab_test 测试 label

4. 例子train_test_split

import numpy as np
from sklearn.model_selection import train_test_split

X, y = np.arange(10).reshape((5, 2)), range(5)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

你可能感兴趣的:(深度实战,人工智能,python,机器学习)