Regression-房价预测-(2/4)-读入并查看数据特征

这是Regression-房价预测的第(2)篇笔记。介绍outline里的:

  1. Load data
  2. Data exploration-Statistical, visualization

1. Load data

首先读入数据。这里是csv数据,直接用pandas.read_csv()读入就可以了。

import pandas as pd
data = pd.read_csv('housing.csv')

2. Data exploration-Statistical, visualization

2.1 Statiscial features

首先看看有多少数据点(489,4)。

data.shape

数据类型


查看数据类型

接下来看看它们到底长什么样。这里'MEDV'是y,需要分离出来。


Regression-房价预测-(2/4)-读入并查看数据特征_第1张图片
长这样

查看统计特征


Regression-房价预测-(2/4)-读入并查看数据特征_第2张图片
Statistical summary

2.2 Visualization

单变量特征图
data.hist()
Regression-房价预测-(2/4)-读入并查看数据特征_第3张图片
data.plot(kind='density', subplots=True, layout=(1,4), sharex=False, legend=False, fontsize=1)
Regression-房价预测-(2/4)-读入并查看数据特征_第4张图片
多变量特征图
from matplotlib import pyplot
fig = pyplot.figure()
ax = fig.add_subplot(111)
cax = ax.matshow(data.corr(), vmin=-1, vmax=1, interpolation='none')
fig.colorbar(cax)
pyplot.show()
Regression-房价预测-(2/4)-读入并查看数据特征_第5张图片

END

你可能感兴趣的:(Regression-房价预测-(2/4)-读入并查看数据特征)