利用sklearn中的train_test_split从原始数据中随机划分训练集和测试集

from sklearn.model_selection import train_test_split
#从原始数据中划分训练集和测试集
X_tr, X_vld, lab_tr, lab_vld = train_test_split(X_train, labels_train, 
                                                test_size=0.3, random_state = 123)

参数:
输入数据(X_train)和标签(labels_train)

test_size:划分比例

random_state:设定随机数种子,保证下一次划分的时候划分结果不发生变化
设置成一个固定的值(比如这里的"123"),每次产生的随机数是相同的.
随机数种子设置为0或者不设置则每次随机划分,产生的结果不一样

返回结果:
返回训练集(X_tr),测试集(X_vld),训练标签(lab_tr)和测试标签(lab_vld).

你可能感兴趣的:(利用sklearn中的train_test_split从原始数据中随机划分训练集和测试集)