《数据可视化与数据挖掘——基于Tableau和SPSS Modeler图形界面》之房地产业中的应用

《数据可视化与数据挖掘——基于Tableau和SPSS Modeler图形界面》之房地产业中的应用_第1张图片

近些年来,房地产市场不断升温,房价也在节节攀升。对于普通人来说,购买一套合适的住房可能是一生中最大的投资,仓促地做出购房决策可能会影响到人们将来的生活质量与幸福。因此,很多人不得不慎重考虑购房问题。房地产市场也在不断地推出新的楼盘,房屋价格、环境、面积、户型等各有不同。

购房者对住房的价格、环境的优劣、小区物业的服务质量和户型上的合理性等诸如此类的问题会有选择上的困惑,使得做出购房决策难上加难。

15.1  建模思路

根据影响购房决策的因素,如年龄、性别、学历、月薪和家庭人数等数据,应用CHAID决策树算法,建立购房决策树模型。

在收集了购房者的个人信息后,建立购房决策树模型的具体步骤如下。

(1)数据准备及理解

深入理解购房者的个人信息,应用Tableau对其进行可视化分析,挖掘数据中包含的信息,找出购房者的特征,为后续建模做好准备。

(2)模型建立及评估

应用整理好的数据,运用SPSS Modeler软件,建立基于CHAID的购房决策树模型,并对模型进行评价与分析,如模型的准确度等。

(3)应用建立的模型

应用建立的购房决策树模型,对潜在的购房者进行预测,判断其最有可能会购买的房屋类型,从而制定有针对性的营销活动。

使用SPSS Modeler进行建模的流程图如图15-1所示。

《数据可视化与数据挖掘——基于Tableau和SPSS Modeler图形界面》之房地产业中的应用_第2张图片

图15-1  购房决策树模型的流程图

15.4  数据理解

将sex(性别)、education(学历)、employment(职业)、people(家庭人数)和housetype(房屋类型)5个变量放入“维度”区域,其他变量放入“度量”区域中。

将age(年龄)字段拖到“列”功能区,单击“智能显示”下拉菜单中的“直方图”图标,然后将housetype(房屋类型)字段拖到“行”功能区,并将sex(性别)字段拖到“标记”卡中的“颜色”框上,将“记录数”字段拖到“标记”卡中的“标签”框上,效果如图15-2所示。

《数据可视化与数据挖掘——基于Tableau和SPSS Modeler图形界面》之房地产业中的应用_第3张图片

图15-2  不同年龄段购房户型分析

将age字段拖到“列”功能区,单击“智能显示”下拉菜单中的“直方图”图标,然后将salary字段拖到“行”功能区,并将housetype字段拖到“标记”卡中的“颜色”框上,将“记录数”拖到“标记”卡中的“标签”框上,效果如图15-3所示。

将housetype(房屋类型)字段拖到“标记”卡中的“颜色”框上,将“记录数”拖到“标记”卡中的“大小”框上,将education(学历)和housetype(房屋类型)字段分别拖到“标记”卡中的“标签”框上,然后单击“智能显示”下拉菜单中的“填充气泡图”图标,效果如图15-4所示。

《数据可视化与数据挖掘——基于Tableau和SPSS Modeler图形界面》之房地产业中的应用_第4张图片

图15-3  工资水平与购房户型分析

《数据可视化与数据挖掘——基于Tableau和SPSS Modeler图形界面》之房地产业中的应用_第5张图片

图15-4  受教育程度与购房户型分析

你可能感兴趣的:(《数据可视化与数据挖掘——基于Tableau和SPSS Modeler图形界面》之房地产业中的应用)