某众点评爬虫采集-剧本杀市场分析-Python

  • 本站所有数据均由作者定制的爬虫程序采集于互联网(类似于搜索引擎的爬虫),所有数据均为网站公开的非隐私数据,任何人均可看到。
  • 本作者没有采用任何非法手段(例如黑客技术)盗取网站的非公开数据。
  • 如果您觉得作者侵犯了您的合法权益,请联系作者予以处理

背景介绍

伴随着《明星大侦探》等推理综艺走红,剧本杀游戏也成功出圈,成为年轻消费者偏好的休闲娱乐活动之一。同时随着体验经济的发展,人们对剧本杀这种新消费业态接受度比较高,从而推动其在国内的快速发展。

数据采集:

这节主要是讲解如何爬取数据。

由于大众点评反爬非常非常非常非常非常严格,因此使用了cookie池、ip代理等诸多防ban手段。
某点评反爬策略是字体反爬,需要解析评论、销量等字体才能拿到数据,我们通过在页面信息中解析出字体css文件,对加密字体进行映射从而拿到数据。

数据展示:

某众点评爬虫采集-剧本杀市场分析-Python_第1张图片

数据分析:

采集了全国不同地区剧本杀商家,进行地图分布统计。
某众点评爬虫采集-剧本杀市场分析-Python_第2张图片
可以看到排名前十的商家是北京、上海、武汉、成都、杭州、天津、深圳、沈阳、西安、重庆;
某众点评爬虫采集-剧本杀市场分析-Python_第3张图片
分别拿用户对剧本、对主持人、对环境的打分做了占比分析;
某众点评爬虫采集-剧本杀市场分析-Python_第4张图片
某众点评爬虫采集-剧本杀市场分析-Python_第5张图片
某众点评爬虫采集-剧本杀市场分析-Python_第6张图片
对广州剧本杀评价进行了词云统计,可以看到DM是剧本杀灵魂,带玩家穿越体验不同人生,用户对环境氛围、服务等方面比较注重;
某众点评爬虫采集-剧本杀市场分析-Python_第7张图片
这次的分享到这里就结束了,感谢观看,下期再见!

联系作者

需要代码请私信

你可能感兴趣的:(爬虫(urllib),市场分析,python,爬虫,开发语言)