用 Python 实现数据集的分割,将数据集分为训练集和测试集

用 Python 实现数据集的分割,将数据集分为训练集和测试集

在机器学习中,数据集的分割是非常重要的,常见的方法是将数据集分为训练集和测试集。本文将介绍如何使用 Python 中的 Sklearn 实现数据集分割。

首先,我们需要导入 Sklearn 库,并加载数据集,这里我们以鸢尾花数据集为例:

from sklearn import datasets
iris = datasets.load_iris()
X = iris.data
y = iris.target

然后,我们可以使用 Sklearn 中的 train_test_split 函数将数据集分成训练集和测试集。其中,参数 test_size 表示测试集所占比例,random_state 表示随机种子,可以保证每次划分的结果相同。

from sklearn

你可能感兴趣的:(python,机器学习,深度学习)