在用Jupter进行机器学习的入门练习(自用)——(1)建立的模型的基础上进行练习
https://blog.csdn.net/m0_52974810/article/details/117744358?spm=1001.2014.3001.5501
本人是跟着b站学习Python的小白,走了许多弯路,怕忘记所以记下来方便查阅。
学习Python所参考的b站视频https://www.bilibili.com/video/BV14J411U7hj
vscode:官网下载软件、安装软件:https://code.visualstudio.com
软件汉化:打开软件ctrl+shift+p调出搜索框,输入“configure language”,在locale.json文件中将
“locale:en-us”更改为“locale:zh-cn”保存;重启VSCode软件,在“扩展视图(左侧最后一个图标)”
中搜索语言包 category:"Language Packs"。选择中文(简体),点击Install,然后重启即可。
将之前训练好的模型进行保存,在下次使用时可以不用再训练,可以直接加载进行预测。
from sklearn.externals import joblib
joblib对象有保存和加载模块的方法。
注意:如果运行后出现cannot import name joblib from sklearn.externals的提示:
解决方法一: 直接使用import joblib(推荐)
解决方法二: 回退版本
删除当前版本的scikit-learn pip uninstall scikit-learn
安装旧版本的scikit-learn pip install scikit-learn==0.20.3
joblib.dump(model, 'music_commender.joblib')
显示返回值后会在桌面上生成一个相应的文件。
model = joblib.load('music_commender.joblib')
from sklearn import tree
tree.export_graphviz(model, out_file='music-recommender.dot',
feature_names=['age', 'gender'],
class_names=sorted(y.unique()),
label='all',
rounded=True,
filled=True)
运行后桌面会生成一个'music-recommender.dot'文件
参数注释: filled=True ——表示生成的决策树每个节点都有颜色;
rounded=True——表示生成的每个盒子外圈有倒角;
label='all'——每个节点都是可读标签;
class_names=sorted(y.unique())——显示每个分支的类名。
(1)将dot文件拖入vscode中,安装图中所示的扩展包
注:截图中的3这一步可以尝试直接安装joao版本的扩展包,如果没出现(2)中的open preview to the side选项,再安装另外一个。
(2)点击open preview to the side生成决策树预览图
注:决策树中用gini指数来衡量数据的不纯度或者不确定性,同时用gini指数来决定类别变量的最优二分值的切分问题。