2019-08-19 分析lianjia数据(三)——SPSS数据分析

前置内容——lianjia数据清洗

分析lianjia房源数据(一)——Python数据清洗
分析lianjia房源数据(二)——SPSS数据清洗
分析lianjia房源数据(三)——SPSS数据分析
分析lianjia房源数据(四)——PowerBI可视化展示效果
分析lianjia房源数据(五)——生成词云图

正文

前文清洗后的2019-08-12当天的房源数据,一共剩余有效数据共计60054条。

1.上海房价分布

通过箱线图可看出:中位数房价340万元,平均值487万元,同时存在较多的温和异常值与极端异常值。


上海房价箱线图

2.上海各辖区房价分布

黄浦静安还是强啊~


上海各辖区房价

3.价格、单价、面积分区间统计:

3.1价格分段区间分布图

可看出,200~300万范围内的挂牌房源数最多,达到了14806套。500万内的房源占总房源的70%,1000万内的房源占87%,


价格分区间分布图-频数

价格分区间分布图-百分比

3.2单价分段区间分布图

3~7万的区间占总数的56%以上。


单价分区间分布图

3.3面积分段区间分布图

面积分区间分布图

4.各辖区价格、单价、面积箱线图

4.1各辖区总价箱线图

可看出黄浦区的价格数据更加分散,金山、奉贤则相对集中,金山区的极端异常值都没超过黄浦区的中位数房价(-_-||)


各辖区总价箱线图

4.2各辖区单价箱线图

各区身价大PK,黄浦静安遥遥领先啊!


各辖区单价箱线图

4.3各辖区面积箱线图

橙色虚线是70㎡的刻度线,红色是50㎡刻度线。一起看看哪些区域老破小和豪宅比较集中吧(* ̄︶ ̄),至少虹口、杨浦的50㎡以下房源是比较多的。


各辖区面积箱线图

5室厅的量与房屋均价对比关系

数据中排除一些较大室厅(如7室以上,频数极低)。
可看出:按照房源数排列,2室1厅>3室2厅>2室2厅>1室1厅>3室1厅......,随着室厅数的增加,价格也呈现上升的趋势。


室厅的总量与均价对比图

6装修风格与房屋均价关系

精装房价格显著高于其他类型房源。


装修分割分类情况
装修风格与房屋均价关系
装修风格与房屋均价关系

后续文章将使用Python、PowerBI做后续的分析。

你可能感兴趣的:(2019-08-19 分析lianjia数据(三)——SPSS数据分析)