Python读取表格中的数据用作机器学习--简单决策树例子--简易代码入门

Python读取表格中的数据用作机器学习--简单决策树例子--简易代码入门

    • 读取CSV
    • 选择输入输出、划分训练集和测试集
    • 用作决策树分类

读取CSV

## 读取数据
import pandas as pd
from sklearn.model_selection import train_test_split
data = pd.read_csv('kms0129_SVM_2.csv')
data

显示data:
Python读取表格中的数据用作机器学习--简单决策树例子--简易代码入门_第1张图片

选择输入输出、划分训练集和测试集

##对data进行划分
X_input = data.iloc[:, 0:8]
Y_output = data.iloc[:,8]
# 使用train_test_split函数划分数据集(训练集占80%,测试集占20%)
Xtrain, Xtest, Ytrain, Ytest = train_test_split(X_input, Y_output, test_size=0.20, random_state=0)

用iloc选择表格中的数据,如X_input选择了表格数据的所有行以及第[0,8)列,Y_output选择了表格数据的所有行及第8列 (从0开始算)。

此时,Xtrain, Xtest, Ytrain, Ytest就可用作机器学习的训练集和测试集,其中X表示输入,Y表示输出(标签),test_size选择0.20(根据自身要求选择)。

用作决策树分类

from sklearn import tree
#构建决策树
clf = tree.DecisionTreeClassifier(criterion="entropy"
                                 ,random_state=30
                                 ,splitter = "random"
                                 )
#训练
clf = clf.fit(Xtrain, Ytrain)
#计算准确率
score = clf.score(Xtest, Ytest)
score

显示结果score:
显示结果score
至此,由表格数据到简易的机器学习决策树完成!

你可能感兴趣的:(决策树,机器学习,python,人工智能,数据分析)