决策树预测房价实例

决策树预测房价实例_第1张图片
在2的第一行的代码中的datasets中包含一个内置的数据集,本例就用的内置的数据集,是内置数据集中的房价数据集(有一个地区的房子的价格,还有影响房价的因素)
决策树预测房价实例_第2张图片
2运行的结果,房价数据集的来源网站和简介。
本节课重点是讲库中有哪些参数以及这些参数是干什么的。
决策树预测房价实例_第3张图片
5显示,一共有20640条数据,每条数据有8条属性。
7开始讲怎么用构造决策树模型,导入tree模块,预测分类也行,预测回归也行。
代表树的深度是2
先看一下树模型的参数
决策树预测房价实例_第4张图片
决策树预测房价实例_第5张图片
第一个代表可以用gini系数,也可以用熵值。
2表示在遍历特征的时候选择 best或者random,best是遍历所有特征,random是随机遍历几个特征,一般特征不是很多的时候都是默认best.
3也是一个特征,默认都是所有的,也可以选择后面的,但一般很少改,都是选择默认的。
4是设置树的深度(一般也没有固定值,而是设置一个数组,去遍历,然后对每一个数字进行交叉验证,
最后选择最优的模型)
5是控制叶子节点分裂的情况。
4和5是最常使用的,是非常重要的。
决策树预测房价实例_第6张图片
决策树预测房价实例_第7张图片
决策树预测房价实例_第8张图片
在7的时候模型已经训练出来了,是指颜色,(第8个需要安装的东西没安好。用的时候再安一下)
决策树预测房价实例_第9张图片
决策树预测房价实例_第10张图片
13中,用对数据进行切分(切分成训练集和测试集),把X和Y传进来,测试集是10%,是为了完成一个复现,比如100个数,随机指定了前十个数字为测试集,在每一次改变参数后,保证测试集都是那前10个数字,这样才能更好的对比模型效果。
百度搜sklearn进入官网,官网里面有example和api,例子中有很多的图,可以直接改改用。
决策树预测房价实例_第11张图片
是把训练集平均分成5份,做五次交叉验证,最后一行代码分别是得分值,最好的参数,最好的得分。是分别把某节点的样本数少于3,6,9的时候进行划分(试参数的过程),要建立树的个数。
不知道这里面的参数分别是什么的时候,去查函数。

你可能感兴趣的:(机器学习算法)