我的python笔记之鸢尾花种类预测实现

1、什么是鸢尾花数据集

鸢尾花数据集是Python中自带的一种数据集,也是我们平常实验中常用的分类实验数据集,由Fisher, 1936收集整理。

2、步骤分析

在写机器学习的代码的时候,一定要记得先写主要步骤,然后再细分这些步骤,这样编程思路清晰,在以后的学习复习过程中会很方便

        2.1 获取数据集

        2.2 数据基本处理

        2.3 特征工程

        2.4机器学习(模型训练)

        2.5模型评估

3、代码实现

        导包(我们可以根据下面每一步需要的包去一个个导入)

         获取数据集(from sklearn.datasets import load_iris)

iris = load_iris()

         数据基本处理(from sklearn.madel_selection import train_test_split)

# x_train,x_test,y_train,y_test分别为训练集特征值、测试集特征值、训练集目标值、测试集目标值
# test_size 为测试集大小(一般为20%~25%)
x_train,x_test,y_train,y_test = train_test_split(iris.data,iris.target,test_size=0.2,random_state=20)

        特征工程(from sklearn.preprocessing import StandardScaler)

# 什么是特征工程,通俗点讲就是数据标准化
transfer = StandardScaler()
x_train = trainsfer.fit_transform(x_train)
x_test = trainsfer.fit_transform(x_test)

        机器学习(模型训练)(from sklearn.neighbors import KNeighborsClassifier)

estimator = KNeighborsClassifier(n_neighbors=9)
estimator.fit(x_train,y_train)

        模型评估(准确率)

score = estimator.score(x_test,y_test)
print("准确率为:\n", score)

你可能感兴趣的:(python)