sklearn--自带数据集(1)

语法:
from sklearn.datasets import XXXX
今天主要学习的是小数据及 和 需要下载的数据集

一、自带的小数据集(packageddataset):sklearn.datasets.load_

  1.    鸢尾花数据集:load_iris():用于分类任务的数据集
    
  2.    手写数字数据集:load_digits():用于分类任务或者降维任务的数据集
    
  3.    乳腺癌数据集load-barest-cancer():简单经典的用于二分类任务的数据集
    
  4.    糖尿病数据集:load-diabetes():经典的用于回归认为的数据集,值得注意的是,这10个特征中的每个特征都已经被处理成0均值,方差归一化的特征值。
    
  5.    波士顿房价数据集:load-boston():经典的用于回归任务的数据集
    
  6.    体能训练数据集:load-linnerud():经典的用于多变量回归任务的数据集。
    

二、可在线下载的数据集:sklearn.datasets.fetch_,一般规模较大(DownloadedDataset)。

fetch_olivetti_faces(data_home=None, shuffle=False, random_state=0,download_if_missing=True):Olivetti 脸部图片数据集。

一般会把data_home自己设置

你可能感兴趣的:(sklearn--自带数据集(1))