将sklearn生成的决策树进行图形化展示

1,工具和平台:

python2.7 windows


2,决策树的可视化展示据我所知有两种途径:一是将生成的结果导出为pmml文件,工具包为sklearn2pmml等,具体可见https://github.com/jpmml/jpmml-sklearn 和https://github.com/jpmml/sklearn2pmml 如果遇到安装问题可以留言;而是进行graphviz的图形化展示,首先需要安装graphviz-2.38.msi url:http://www.graphviz.org/pub/graphviz/stable/windows/graphviz-2.38.msi,

这是因为python所用的工具包pydot依赖于dot.exe,配置

path:C:\Program Files (x86)\Graphviz2.38\bin 和 C:\Program Files (x86)\Graphviz2.38 具体按照你自己的安装目录即可

接着安装pydot : pip install pydot

基本原理为:利用sklearn.tree.export_graphviz 可以将随机森林中每一棵树的结构以doc的形式表示出来,结合graphviz可以将结构图转为png或者pdf等。

#coding=utf-8

from sklearn.datasets import load_iris
from sklearn import tree

iris = load_iris()
clf = tree.DecisionTreeClassifier()
clf = clf.fit(iris.data, iris.target)


from sklearn.externals.six import StringIO
import pydot

dot_data = StringIO()
tree.export_graphviz(clf, out_file=dot_data) 
graph = pydot.graph_from_dot_data(dot_data.getvalue())
graph[0].write_dot('iris_simple.dot')
graph[0].write_png('iris_simple.png')


可能会出现错误如:

AttributeError: 'list' object has no attribute 'write_*'

解决方法:
http://www.cnblogs.com/iamxyq/p/5918611.html


你可能感兴趣的:(数据挖掘与分析)