波士顿房屋租赁数据训练(GBDT\线性回归\决策树CART)

基于波士顿房屋租赁数据进行房屋租赁价格预测模型构建,使用集成学习的算法方式对模型进行构建,比较基于GBDT的模型效果和单模型(单个线性回归、单个决策树)情况下的R2的评估值的比较

解题库:

房屋租赁价格预测属于回归类型,故模型选用回归模型:GBDT (from sklearn.ensemble import GradientBoostingRegressor)、 线性回归(from sklearn.linear_model import LinearRegression)、决策树_cart(from sklearn.tree import DecisionTreeRegressor)

工具库:

加载数据(import pandas as pd)、R2模型评估(from sklearn.metrics import r2_score)、划分样本_训练集vs测试集(from sklearn.model_selection import train_test_split)

step1 数据加载

波士顿房屋租赁数据如下图,数据格式不统一,无法使用同一个分隔符处理

波士顿房屋租赁数据训练(GBDT\线性回归\决策树CART)_第1张图片

数据处理

波士顿房屋租赁数据训练(GBDT\线性回归\决策树CART)_第2张图片
波士顿房屋租赁数据训练(GBDT\线性回归\决策树CART)_第3张图片

step2 数据清洗


波士顿房屋租赁数据训练(GBDT\线性回归\决策树CART)_第4张图片

step3 划分数据集


波士顿房屋租赁数据训练(GBDT\线性回归\决策树CART)_第5张图片

step4 训练模型(GDBT\线性回归\CART决策树)


波士顿房屋租赁数据训练(GBDT\线性回归\决策树CART)_第6张图片

线性回归这边增加了规格化数据处理(from sklearn.preprocessing import StandardScaler)

波士顿房屋租赁数据训练(GBDT\线性回归\决策树CART)_第7张图片
波士顿房屋租赁数据训练(GBDT\线性回归\决策树CART)_第8张图片

step5 用R2评估各模型

波士顿房屋租赁数据训练(GBDT\线性回归\决策树CART)_第9张图片

由此可见集成学习GBDT效果优于单模型效果

你可能感兴趣的:(波士顿房屋租赁数据训练(GBDT\线性回归\决策树CART))