sklean中鸢尾花数据集可视化

数据集信息

import matplotlib.pyplot as plt
import sklearn.datasets as dataset
iris_data=dataset.load_iris()
print(type(iris_data))#sklearn自定义的一种数据类型,类似字典
print(iris_data.keys())#打印所有的key

在这里插入图片描述

print('iris data:',type(iris_data.data),'shape:',iris_data.data.shape)#(150,4)的矩阵
print('feature name:',iris_data.feature_names)
print('iris target:',type(iris_data.target),'shape:',iris_data.target.shape)#(150,)的向量
print('target name:',iris_data.target_names)

在这里插入图片描述

iris_data.data#特征

sklean中鸢尾花数据集可视化_第1张图片

iris_data.target#标签

sklean中鸢尾花数据集可视化_第2张图片

对鸢尾花数据集中的前两个标签进行散点图绘制

data=iris_data.data
target=iris_data.target
plt.scatter(data[:,0],data[:,1])#使用前两个特征绘制散点图
plt.show()

sklean中鸢尾花数据集可视化_第3张图片

不同类别使用不用颜色

target==2#通过判断获取对应类别索引

sklean中鸢尾花数据集可视化_第4张图片

data[target==2,0]#类别为2的数据

sklean中鸢尾花数据集可视化_第5张图片

for i in range(3):
    plt.scatter(data[target==i,0],data[target==i,1])#fancy indexing的方式取对应标签的样本
plt.show()

sklean中鸢尾花数据集可视化_第6张图片
此时单从前两个特征不容易区分类别1和类别2,此时可以用后两个类别可视化试试。

可视化后两个类别

plt.scatter(data[target==0,2],data[target==0,3],color='blue',marker='o')
plt.scatter(data[target==1,2],data[target==1,3],color='orange',marker='+')
plt.scatter(data[target==2,2],data[target==2,3],color='green',marker='+')
plt.show()

sklean中鸢尾花数据集可视化_第7张图片

你可能感兴趣的:(机器学习,sklearn,python,机器学习)