tina - 鸢尾花预测

# sklearn 机器学习工具包
# data 数据    sets 集合    load加载/导入  iris鸢尾花
from sklearn import datasets
flower = datasets.load_iris()
print(flower)
# 花萼长度 花萼宽度  花瓣长度   花瓣宽度
# target   0 山鸢尾花     1 变色鸢尾花   2 维吉尼亚鸢尾花
# 表格excel 数据
import pandas as pd
# 熊猫的数据表格功能
df1 = pd.DataFrame(flower.data)
df2 = pd.DataFrame(flower.target)
# 两个表格进行合并  con一起cat猫   axis = 1
df = pd.concat([df1, df2], axis=1)
df.columns = ["花萼长度", "花萼宽度", "花瓣长度", "花瓣宽度", "种类"]
print(df.head())

# 画图6张图
import  matplotlib.pyplot as plt
X = "花萼长度"
Y = "花瓣宽度"
plt.plot(df[X][0:49],df[Y][0:49],"bo")
plt.plot(df[X][50:99],df[Y][50:99],"ro")
plt.plot(df[X][100:149],df[Y][100:149],"go")
plt.show()


# 预测?
from sklearn import linear_model
xun_lian=linear_model.LogisticRegression()
xun_lian.fit(df1,df2)
jie_guo=xun_lian.predict([[4.7,3.2,2.7,0.6]])
print(jie_guo)
score=xun_lian.score(df1,df2)
# print(score)

print("预测概率是%d %%"%(score*100))




你可能感兴趣的:(学生作品,Tina,python,机器学习,数据分析,监督学习)