- 本站所有数据均由作者定制的爬虫程序采集于互联网(类似于搜索引擎的爬虫),所有数据均为网站公开的非隐私数据,任何人均可看到。
- 本作者没有采用任何非法手段(例如黑客技术)盗取网站的非公开数据。
- 如果您觉得作者侵犯了您的合法权益,请联系作者予以处理
伴随着《明星大侦探》等推理综艺走红,剧本杀游戏也成功出圈,成为年轻消费者偏好的休闲娱乐活动之一。同时随着体验经济的发展,人们对剧本杀这种新消费业态接受度比较高,从而推动其在国内的快速发展。
这节主要是讲解如何爬取数据。
由于大众点评反爬非常非常非常非常非常严格,因此使用了cookie池、ip代理等诸多防ban手段。
某点评反爬策略是字体反爬,需要解析评论、销量等字体才能拿到数据,我们通过在页面信息中解析出字体css文件,对加密字体进行映射从而拿到数据。
采集了全国不同地区剧本杀商家,进行地图分布统计。
可以看到排名前十的商家是北京、上海、武汉、成都、杭州、天津、深圳、沈阳、西安、重庆;
分别拿用户对剧本、对主持人、对环境的打分做了占比分析;
对广州剧本杀评价进行了词云统计,可以看到DM是剧本杀灵魂,带玩家穿越体验不同人生,用户对环境氛围、服务等方面比较注重;
这次的分享到这里就结束了,感谢观看,下期再见!
需要代码请私信