“分而治之,逐一击破”的决策树分类应用实例

 “分而治之,逐一击破”

目录

前言

一、数据集

二、sklearn中的决策树

1.引入库

2.分类结果可视化

3.决策树可视化

总结


前言

随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的决策树分类应用实践案例。

一、数据集

在案例开始前,自然要先有数据集(你可以理解成做实验需要用的小白鼠),在本例中,我采用的是常见的鸢尾花数据集。考虑二维图形更直观,因此,选取了鸢尾花的两个特征来作图。

from sklearn.datasets import load_iris

iris = load_iris()
x = iris.data[:,2:4]
y = iris.target
plt.scatter(x[:,0],x[:,1],c=y)
plt.show()

“分而治之,逐一击破”的决策树分类应用实例_第1张图片

petal length:花瓣长度  petal width:花瓣宽度   选取的两个特征

“分而治之,逐一击破”的决策树分类应用实例_第2张图片

二、sklearn中的决策树

因为是实战案例,公式推导的方法就不演示了,直接用调库大法。

1.引入库

Sklearn.tree 中的DecisionTreeClassifier分类器

from sklearn.tree import DecisionTreeClassifier
clf = DecisionTreeClassifier(max_depth=2,criterion='entropy')      #max_depth:决策树的深度,criterion:"gini"或者"entropy"
clf.fit(x,y)

2.分类结果可视化

“分而治之,逐一击破”的决策树分类应用实例_第3张图片

3.决策树可视化

from sklearn.tree import plot_tree
plot_tree(clf)

“分而治之,逐一击破”的决策树分类应用实例_第4张图片

小结,先声明一下X[1]特征就是花瓣宽度这个特征,弄清楚了这个,图片就好看懂了。根据决策树可知,最后划分成了3类,第一阶段根据花瓣宽度<=0.8划分为第一类,共50个数据,再再根据花瓣宽度>0.8花瓣宽度<=1.75划分为第二类,共49+5个数据,剩下的根据花瓣宽度>1.75划分为为第三类,共1+45个数据


总结

以上就是决策树分类模型的具体应用,虽然分类的任务是解决了,但是这个分类结果好不好或者说这个模型精确度怎样?还请大家留意下一篇文章,会涉及决策树分类模型的评价以及该模型的优缺点,还请大家多多关注。

你可能感兴趣的:(机器学习,决策树,分类)