Python算法练习(十)// 算法:随机森林(分类),数据集:Wine

一、练习目标
1、通过练习掌握随机森林分类的应用,分析参数调整对结果的影响。
2、区分随机森林分类与决策树分类的差别。建立最优的分类预测模型。
3、通过数据挖掘了解影响红酒标签(三分类)的关键特征。

二、重要结论
1、探索数据发现,在小提琴图中可直观看出①特征proline,当取值大于1000,基本可以判断样本属于标签0; ②特征od280/od315_of_diluted_wines,当取值小于1.5,基本可以判断样本属于标签3。
2、采用决策树算法,模型存在明显的过拟合问题。
3、采用随机森林分类算法,①纠正决策树天生过拟合的倾向,②提高模型预测的准确率。
4、采用决策树算法得到的关键特征,与采用随机森林分类算法得到的关键特征,明显不一样。这大概就是红酒的魅力!

三、练习步骤:
(一)导入数据
Python算法练习(十)// 算法:随机森林(分类),数据集:Wine_第1张图片
在这里插入图片描述
Python算法练习(十)// 算法:随机森林(分类),数据集:Wine_第2张图片
(二)探索数据
Python算法练习(十)// 算法:随机森林(分类),数据集:Wine_第3张图片
Python算法练习(十)// 算法:随机森林(分类),数据集:Wine_第4张图片
Python算法练习(十)// 算法:随机森林(分类),数据集:Wine_第5张图片
Python算法练习(十)// 算法:随机森林(分类),数据集:Wine_第6张图片
Python算法练习(十)// 算法:随机森林(分类),数据集:Wine_第7张图片
Python算法练习(十)// 算法:随机森林(分类),数据集:Wine_第8张图片
Python算法练习(十)// 算法:随机森林(分类),数据集:Wine_第9张图片
Python算法练习(十)// 算法:随机森林(分类),数据集:Wine_第10张图片
(三)模型构建与评估(决策树)
Python算法练习(十)// 算法:随机森林(分类),数据集:Wine_第11张图片
Python算法练习(十)// 算法:随机森林(分类),数据集:Wine_第12张图片
Python算法练习(十)// 算法:随机森林(分类),数据集:Wine_第13张图片
(四)模型构建与评估(随机森林分类)
Python算法练习(十)// 算法:随机森林(分类),数据集:Wine_第14张图片
Python算法练习(十)// 算法:随机森林(分类),数据集:Wine_第15张图片
Python算法练习(十)// 算法:随机森林(分类),数据集:Wine_第16张图片
Python算法练习(十)// 算法:随机森林(分类),数据集:Wine_第17张图片
Python算法练习(十)// 算法:随机森林(分类),数据集:Wine_第18张图片

你可能感兴趣的:(Python)