二手房数据的分析与挖掘(三)-- 描述性分析2D

实验环境

Windows7
Anaconda3
pyecharts
pandas
numpy

实验内容

在Jupyter notebook中利用numpy、pandas、pyecharts进行数据的可视化,通过数据分析完成一份基于Python的郑州市二手房数据分析报告。

实验步骤

一、数据来源

数据下载:https://download.csdn.net/download/qq_35809147/11176627

二、代码解析
import numpy as np
import pandas as pd
from pyecharts import online
online()

%matplotlib inline

data = pd.read_excel(u'C://Users/liulei/Desktop/正常值数据.xlsx')
data.head()

二手房数据的分析与挖掘(三)-- 描述性分析2D_第1张图片

data.info()

二手房数据的分析与挖掘(三)-- 描述性分析2D_第2张图片

data.loc[:,['UnitPrice', 'TotalPrice']].describe()

二手房数据的分析与挖掘(三)-- 描述性分析2D_第3张图片

from pyecharts import Bar
floor_pivot = data.pivot_table(index='Floor',values='UnitPrice', aggfunc=np.mean)
floor_pivot = floor_pivot.UnitPrice.apply(lambda x : round(x, 2))
attr = floor_pivot.index.tolist()
v1 = floor_pivot.values
bar = Bar("楼层分析","朝向与单价的关系")
bar.add("楼层", attr, v1, is_more_utils=True, is_label_show=True)
bar

二手房数据的分析与挖掘(三)-- 描述性分析2D_第4张图片
分析:楼层对房价的影响
从图中可以看出,不同楼层的单价有差别,即楼层对房价有影响。高层的销售单价最高,为16619.93元/m2,中层的销售单价最低,为15337.97元/m2, 底层和高程比中层楼房的单价要高,原因应该是低层上下楼方便,高层的空气质量较好。所以二者都比中层稍贵一点。

from pyecharts import Bar
direction_pivot = data.pivot_table(index='Direction',values='UnitPrice', aggfunc=np.mean)
direction_pivot = direction_pivot.UnitPrice.apply(lambda x : round(x, 2))
attr = direction_pivot.index.tolist()
v1 = direction_pivot.values
bar = Bar("房屋朝向分析","朝向与单价的关系")
bar.add("房屋朝向", attr, v1, mark_point=['min', 'max'], is_more_utils=True, is_label_show=True)
bar

二手房数据的分析与挖掘(三)-- 描述性分析2D_第5张图片
分析:朝向对房价的影响
从图中可以看出,不同朝向的楼房单价差别很大,即朝向对房价的影响很大。其中西北方向的楼房最贵,为17385元/m2,东西方向的最便宜,为11802元/m2,其他朝向的则差别不大。原因应该是西北方向的楼房接收的阳光最多,其他朝向的次之,东西朝向的接收的阳光最少。

from pyecharts import Bar
decoration_pivot = data.pivot_table(index='Decoration',values='UnitPrice', aggfunc=np.mean)
decoration_pivot =  decoration_pivot.sort_values('UnitPrice', ascending=False)
decoration_pivot = decoration_pivot.UnitPrice.apply(lambda x : round(x, 2))
attr = decoration_pivot.index.tolist()
v1 = decoration_pivot.values.tolist()
bar = Bar("装修程度分析","装修程度与单价的关系")
bar.add("装修程度", attr, v1, mark_point=['min', 'max'], is_more_utils=True, is_label_show=True)
bar

二手房数据的分析与挖掘(三)-- 描述性分析2D_第6张图片
分析:装修程度对单价的影响
从图中可以看出装修程度对房价影响很大,尤其是豪华装修,豪华装修的楼房最贵,平均下来为19728.7元/m2,而精装修、中装修、简装修差别不大,销售单价在15700元/m2左右,其中毛坯最便宜,为15270.27元/m2。

from pyecharts import Bar
housetype_pivot = data.pivot_table(index='HouseType',values='UnitPrice', aggfunc=np.mean)
housetype_pivot = housetype_pivot.UnitPrice.apply(lambda x : round(x, 2))
attr = housetype_pivot.index.tolist()
v1 = housetype_pivot.values.tolist()
bar = Bar("房屋类型", "房屋类型与单价的关系")
bar.add("房屋类型", attr, v1, is_datazoom_show=True, mark_point=['min', 'max'],  is_more_utils=True)
bar

二手房数据的分析与挖掘(三)-- 描述性分析2D_第7张图片
分析:房屋类型对单价的影响
由图可以看出,房屋类型对房价影响较大。其中4室2厅4卫的楼房销售单价最贵,为41250元/m2, 7室3厅4卫次之,为36232元/m2, 其中8室4厅4卫,最便宜,为10000/m2。并且还可以得出,卫生间数量对销售单价影响较大,相同室数和厅数的楼房,随着卫生间数增加,单价也在上升。

from pyecharts import Bar
region_pivot = data.pivot_table(index='XiaoQu',values='UnitPrice', aggfunc=np.median)
region_pivot = region_pivot.sort_values('UnitPrice', ascending=False)
attr = region_pivot.index.values.tolist()
v1 = region_pivot.UnitPrice.values
bar = Bar("小区", "小区与单价的关系")
bar.add("小区", attr, v1, is_datazoom_show=True, mark_point=['min', 'max'],  is_more_utils=True)
bar

二手房数据的分析与挖掘(三)-- 描述性分析2D_第8张图片
分析:各小区房价对比
从图中可以看出不同小区的房价差别还是挺大的,楼房单价最高的五个小区,分别为绿城百合、金领九如意、龙湖上第、建业海马九如府、绿城百合三期。这几个小区的房屋单价都40000元/m2左右,并且相差不是很大。楼房单价最低的的五个小区,分别为啟福中华、中昂朗月、德宝幸福里、优胜龙栖湾、同赢企业总部港,这几个小区的单价在6000元/m2左右。

region_data = data['QuYu'].dropna()
region_A = lambda x : x.strip().split(' ')[0]
data['QuYu_A'] = region_data.apply(region_A)

data.head()

二手房数据的分析与挖掘(三)-- 描述性分析2D_第9张图片

from pyecharts import Pie
quyu_a_counts = data.groupby('QuYu_A')['QuYu_A'].value_counts()
attr = quyu_a_counts.index.tolist()
v1 = quyu_a_counts.values
pie = Pie("各区挂牌数量占比", title_pos='center')
pie.add("", attr, v1, radius=[40, 75], label_text_color=None,
        is_label_show=True, legend_orient='vertical',
        legend_pos='left')
pie

二手房数据的分析与挖掘(三)-- 描述性分析2D_第10张图片
分析:各区域挂牌数量占比
从图中可以看出待销售的二手房主要集中在金水区、郑东区、中原区、管城区和二七区。其中金水区楼房的挂牌数量最多,占比27.27%, 郑东新区次之,占比14.44%,其中新密占比最少,为0.19%。其它地方也有一些挂牌楼房,占比为0.23%。

from pyecharts import Bar
year_pivot = data.pivot_table(index='BuildingYear', values='UnitPrice', aggfunc=np.median)
year_pivot = year_pivot.UnitPrice.apply(lambda x : round(x, 2))
attr = year_pivot.index.tolist()
v1 = year_pivot.values.tolist()
bar = Bar("房屋建造年份", "建造年份与单价的关系")
bar.add("建造年份", attr, v1, is_datazoom_show=True, mark_point=['min', 'max'],  is_more_utils=True)
bar

二手房数据的分析与挖掘(三)-- 描述性分析2D_第11张图片
分析:建造年份对房价的影响
从图中可以看出,建造年份对房价有影响,其中2006年建造的楼房销售单价最高,为16748元/m2,1985年建造的楼房售价最低,为10741元/m2。并且2012年之前,随着楼房建造年份的增加,郑州市二手房的销售单价呈上升趋势,在2012年之后,随着楼房建造年份的增加,销售单价呈现下降趋势。

欢迎加入大数据学习交流群,一起交流学习!

二手房数据的分析与挖掘(三)-- 描述性分析2D_第12张图片

微信扫码,领取毕设资源:

二手房数据的分析与挖掘(三)-- 描述性分析2D_第13张图片

你可能感兴趣的:(郑州市二手房,二手房数据,数据分析,房天下二手房)