sklearn.datasets.load_iris函数

函数原型

sklearn.datasets.load_iris(*, return_X_y=False, as_frame=False)

函数说明

Iris数据集是常用的分类实验数据集,由Fisher, 1936收集整理。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含150个数据样本,分为3类,每类50个数据,每个数据包含4个属性(分别是:花萼长度,花萼宽度,花瓣长度,花瓣宽度)。可通过这4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类的鸢尾花中的哪一类。
Iris里有两个属性iris.data,iris.target。data是一个矩阵,每一列代表了萼片或花瓣的长宽,一共4列,每一列代表某个被测量的鸢尾植物,一共有150条记录。

参数return_X_y如果为True,则返回一个(data, target)元组类型的数据;如果为False,则返回一个类似字典的Bunch对象。as_frame如果为True,则表示返回的data、target类型为DataFrame类型;如果为False,则返回的类型为ndarray数组类型。

函数使用

>>> dataset = datasets.load_iris()
# 返回Bunch对象
>>>> type(dataset)

>>> type(dataset["data"])


>>> dataset = datasets.load_iris(return_X_y=True)
# 返回元组(data, target)
>>> type(dataset)

# data是一个ndarray数组
>>> type(dataset[0])


>>> dataset = datasets.load_iris(as_frame=True)
>>> type(dataset)

# data是一个DataFrame对象
>>> type(dataset["data"])

你可能感兴趣的:(#,sklearn,sklearn,机器学习,python)