Matplotlib基础03:波士顿房价数据集可视化

Matplotlib基础03:利用已学知识绘制boston房价的影响因素表

波士顿房价数据集介绍

Matplotlib基础03:波士顿房价数据集可视化_第1张图片
Matplotlib基础03:波士顿房价数据集可视化_第2张图片
Matplotlib基础03:波士顿房价数据集可视化_第3张图片

散点图描绘这些因素对房价的影响

1.我们先下载数据集

boston = tf.keras.datasets.boston_housing
#加载数据,分训练集与测试集
(train_x,train_y),(test_x,test_y) = boston.load_data(test_split=0) #我们让测试数据为0,这里的test_split是划分数据集中测试集的比例的

print(len(train_x))
print(len(test_x))

会出现下载
在这里插入图片描述
2.访问数据集中的元素
Matplotlib基础03:波士顿房价数据集可视化_第4张图片
3.分割数据x,分别画散点图

import matplotlib 
import matplotlib.pyplot as plt
import numpy as np 
import tensorflow as tf 
boston = tf.keras.datasets.boston_housing
#加载数据,分训练集与测试集
(train_x,train_y),(test_x,test_y) = boston.load_data(test_split=0) #我们让测试数据为0

print(len(train_x))
print(len(test_x))

print(train_x.shape)#(506,13)
print(train_y.shape)#(506,)
factor = ['城市人均犯罪率',"超过25000平方英尺的住在用地所占比例",
"城镇非零售业的商业用地所占比例","是否被Charles河流穿过",
"一氧化碳浓度","每栋住宅的平均房间数",
"早于1940年建成的自住房屋比例 ","到波士顿5个中心区域的加权平均距离",
"到达高速公路的便利指数","每10000美元的全值财产税率","城镇中师生比例 ",
"反映城镇中的黑人比例的指标","低收入人口的比例 ",
"自住房屋房价的平均房价(单位为1000美元) "]
#下面开始绘制图片
#由shape我们知道x里边影响房价的有13个因素,对应着房价
#我们现在要做的就是将这些因素一一与房价分析
#配置中文与负号
plt.rcParams['font.family'] = 'SimHei'
plt.rcParams["axes.unicode_minus"] = False
plt.figure(num='13辅图',figsize=(13,10))

#第一步,逐一取出这些因素
for i in range(13):
    #划分子图
    plt.subplot(4,4,i+1)
    #绘制散点图
    plt.scatter(train_x[:,i],train_y,s=3)
    #设置纵坐标
    plt.ylabel("prices($1000's)")
    #设置子图题目
    plt.title(factor[i],loc="left",backgroundcolor='red')
#设置填充
plt.tight_layout()
#设置全局标题
plt.suptitle("各个因素与房价的关系",backgroundcolor='y',verticalalignment='bottom')
plt.show()

Matplotlib基础03:波士顿房价数据集可视化_第5张图片
从图中,我们就能分析哪些因素最影响房价了,当然,不同的影响因素,用散点图不一定合适。

你可能感兴趣的:(#,tensorflow笔记,数据分析,机器学习,可视化,数据挖掘,python)