Kaggle(一):房价预测

Kaggle(一) 房价预测 (随机森林、岭回归、集成学习)

 项目介绍:通过79个解释变量描述爱荷华州艾姆斯的住宅的各个方面,然后通过这些变量训练模型,
来预测房价。
  kaggle项目链接:https://www.kaggle.com/c/house-prices-advanced-regression-techniques
数据描述:
train.csv - 训练集
test.csv - 测试集

一.加载数据

#加载必要库
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
#读取数据集
df_train=pd.read_csv('train.csv')
df_test=pd.read_csv('test.csv')

二.数据清洗

把train与test两个数据集合并到一起来处理79个解释变量,等用test来进行预测时就不需再次处理了。

df_train.shape,df_test.shape
y_train=df_train.pop('SalePrice'

你可能感兴趣的:(数据结构与算法,人工智能,python)