用Jupter进行机器学习的入门练习(自用)——(2)模型的保存、加载和决策树的模型可视化

在用Jupter进行机器学习的入门练习(自用)——(1)建立的模型的基础上进行练习

​​​​​​​https://blog.csdn.net/m0_52974810/article/details/117744358?spm=1001.2014.3001.5501​​​​​​​

本人是跟着b站学习Python的小白,走了许多弯路,怕忘记所以记下来方便查阅。

 学习Python所参考的b站视频https://www.bilibili.com/video/BV14J411U7hj

vscode:​​​​​​​​​​​​​​官网下载软件、安装软件:https://code.visualstudio.com

软件汉化:打开软件ctrl+shift+p调出搜索框,输入“configure language”,在locale.json文件中将

“locale:en-us”更改为“locale:zh-cn”保存;重启VSCode软件,在“扩展视图(左侧最后一个图标)”

中搜索语言包 category:"Language Packs"。选择中文(简体),点击Install,然后重启即可。​​​​


一、模型的保存

将之前训练好的模型进行保存,在下次使用时可以不用再训练,可以直接加载进行预测。

  • 导入joblib对象
from sklearn.externals import joblib

joblib对象有保存和加载模块的方法。

注意:如果运行后出现cannot import name joblib from sklearn.externals的提示:

           解决方法一: 直接使用import joblib(推荐)

           解决方法二: 回退版本

           删除当前版本的scikit-learn pip uninstall scikit-learn

           安装旧版本的scikit-learn pip install scikit-learn==0.20.3

  • 将训练好的模型进行转存
joblib.dump(model, 'music_commender.joblib')

用Jupter进行机器学习的入门练习(自用)——(2)模型的保存、加载和决策树的模型可视化_第1张图片

显示返回值后会在桌面上生成一个相应的文件。

 

二、模型的加载

model = joblib.load('music_commender.joblib')

用Jupter进行机器学习的入门练习(自用)——(2)模型的保存、加载和决策树的模型可视化_第2张图片

 

三、决策树模型的可视化

  • 生成决策树
from sklearn import tree
tree.export_graphviz(model, out_file='music-recommender.dot', 
                    feature_names=['age', 'gender'],
                    class_names=sorted(y.unique()),
                    label='all',
                    rounded=True,
                    filled=True)

运行后桌面会生成一个'music-recommender.dot'文件

参数注释: filled=True ——表示生成的决策树每个节点都有颜色;

                   rounded=True——表示生成的每个盒子外圈有倒角;

                   label='all'——每个节点都是可读标签;

                   class_names=sorted(y.unique())——显示每个分支的类名。

  • 用vscode将决策过程可视化​​​​​​​​​​​​​​

​​​​​​​(1)将dot文件拖入vscode中,安装图中所示的扩展包

用Jupter进行机器学习的入门练习(自用)——(2)模型的保存、加载和决策树的模型可视化_第3张图片

注:截图中的3这一步可以尝试直接安装joao版本的扩展包,如果没出现(2)中的open preview to the side选项,再安装另外一个。

(2)点击open preview to the side生成决策树预览图

用Jupter进行机器学习的入门练习(自用)——(2)模型的保存、加载和决策树的模型可视化_第4张图片

用Jupter进行机器学习的入门练习(自用)——(2)模型的保存、加载和决策树的模型可视化_第5张图片

注:决策树中用gini指数来衡量数据的不纯度或者不确定性,同时用gini指数来决定类别变量的最优二分值的切分问题。

你可能感兴趣的:(机器学习实战,决策树,可视化,机器学习,python)