深度学习之波士顿房价预测(一)

 

目录

 读入数据

数据形状变换

数据集划分 


深度学习之波士顿房价预测(一)_第1张图片

 读入数据

# 波士顿房价的数据集结构

# 读入数据

# 导入需要用到的package
import numpy as np
import json
datafile = 'housing.data'
data = np.fromfile(datafile, sep=' ')

# 查看数据
x = data[0]
print(x.shape)
print(x)

数据形状变换

由于读入的原始数据是1维的,所有数据都连在一起。因此需要我们将数据的形状进行变换,形成一个2维的矩阵,每行为一个数据样本(14个值),每个数据样本包含13个XXX(影响房价的特征)和一个YYY(该类型房屋的均价)。

 

# 读入之后的数据被转化成1维array,其中array的第0-13项是第一条数据,第14-27项是第二条数据,以此类推.... 
# 这里对原始数据做reshape,变成N x 14的形式
feature_names = [ 'CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE','DIS', 
                 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'MEDV' ]
feature_num = len(feature_names)
data = data.reshape([data.shape[0] // feature_num, feature_num])
#shape是查看数据有多少行多少列
#reshape()是数组array中的方法,作用是将数据重新组织

数据集划分 

#数据集划分
ratio = 0.8
offset = int(data.shape[0]*ratio)
training_data = data[:offset]
training_data.shape

 

你可能感兴趣的:(python,机器学习,人工智能)