人人能用的数据小工具系列(三):买房之出价

通过前面两篇文章,我们锁定了某个property,那么随之而来的就是出价环节。这个环节的核心在于,对一个房子的真实价值有一个把握,也就是你对房子真实价值的estimate越接近其真实价值越好。这个环节的难度在于把这个价值用一个数字表达出来,毕竟最后offer的时候你需要给出的只是一个数字。

对于小白如我来说,这个估值主要来源于三个方面:1-talk to people, 听有经验的人的建议,包括sale agent, buy agent, 有投资经验的朋友,自己的估值;2-模型计算,使用过AMP price finder付费服务的朋友可能知道,如果你输入一个property的地址,它会返回对这个property的估值。从我的使用经验来看,对大多数中等区间的房子,AMP给出的估值还是比较decent的。土豪朋友们反应,对豪宅的估值似乎比较不准确。我猜测,它背后的算法可能是两大块加成的。第一部分算法根据周围相似房产的价格给出一个benchmark,第二部分细调,应该是使用了某种machine learning的算法,输入的feature应该是诸如房间数,车库,屋顶等等,使用大量的sample来得到估值。再用房地产从业人员的经验做对比来细调算法的参数。而对于豪宅而言,第一是数量较小,算法的学习sample稀缺,第二是豪宅的feature太多,可能有很多装饰或者进阶的装修,所以估值较难。

虽然AMP的price finder service挺好用的,但是呢,需要支付费用还是有一定成本的,而且它的算法不是公开的,难以从中学习到insight。好消息是,AMP也开放了API,有兴趣的developer朋友们可以去爬一爬他们的数据,应该还是比较丰富的。爬到一定的数据量来建立模型,这个工程量也不是很小。但如果想学习house price modelling的朋友,可以下载kaggle网站的一个数据挖掘比赛提供的数据。这个数据提供的feature极其丰富,很有价值。


房屋定价模型

关于这个kaggle比赛的介绍如下,其数据是波士顿地区的房产数据。

人人能用的数据小工具系列(三):买房之出价_第1张图片
House price modelling competition

在这个比赛的论坛里面,很多team公开了他们的code和analysis,所以在自己动手model之前可以看一下大家的工作。一般回复率比较高的帖子都值得一看。

这个帖子做了一些exploratory analysis,比如作者做了一些feature correlation的分析,寻找和房价correlated比较紧密的feature

人人能用的数据小工具系列(三):买房之出价_第2张图片
Correlation matrix

又比如论坛里这个帖子,已经做了初步的回归分析,用的是regularised regression,作者发布了一些初步的结果。感兴趣的朋友,可以下载这个数据来试试建立自己的定价模型。


总结

在offer阶段,可以结合经验人士给出的估值,以及算法的估值,得出一个适合数字。这个数字作为offer阶段negotiate的一杆秤。在讨价还价的阶段,卖方总有些trick来把价格拉高。可以理解,给对方一些利润的空间。把握大方向,适度让利,毕竟咱们最重要的还是把买卖做成嘛。

你可能感兴趣的:(人人能用的数据小工具系列(三):买房之出价)