重庆火锅哪家强,Python 帮你探探店

重庆火锅哪家强,Python 帮你探探店_第1张图片

作者 | 刘早起

来源 | 早起Python

封图 | 视觉中国

大家好,随着国内疫情逐步好转,一些美食店铺又渐渐开张了,疫情结束你最想吃什么?来一顿痛快的火锅肯定是少不了的活动吧。可是对于选择困难症的我来说,吃饭一小时,挑店一下午,所以今天本文将再次爬取美团网相关数据,以一个消费者的角度去分析如何选择店铺。

数据获取与说明

本文将基于重庆市火锅数据进行分析,为啥是重庆的火锅,除了辣之外还因为其他城市的火锅店数量相比重庆的火锅店数量就是小巫见大巫。

重庆火锅哪家强,Python 帮你探探店_第2张图片

重庆火锅哪家强,Python 帮你探探店_第3张图片

除此之外,相信重庆人民对于火锅的评价会更加地道,所以我们打开重庆市美团网选择火锅进入店铺列表。接下来的操作就和之前类似了:F12—>找到数据包—>requests请求数据—>pandas清洗。

重庆火锅哪家强,Python 帮你探探店_第4张图片

但是本文需要爬取两层数据,首先需要在店铺列表取得店铺id、店铺名和销量等相关数据,第二步还需要根据刚刚的店铺id进入每一个店铺请求评论数据,相关代码如下:

for k in url_list:
    url = k
    r = requests.get(url,headers = headers,proxies=proxies)
    data = r.json()['data']['poiInfos']
    for i in range(len(data)):
        ID = data[i]['poiId']
        biaoti = data[i]['title']
        junfen = data[i]['avgScore']
        pingjia = data[i]['allCommentNum']
        dizhi = data[i]['address'][0:3]
        junjia = data[i]['avgPrice']
        youhui = 1 if len(data[i]['dealList']) > 0 else 0
        df.loc[s] = [ID,biaoti,junfen,pingjia,dizhi,junjia,youhui]
        s = s + 1

来看下最终爬取并清洗完毕的数据,经过提取共有评论数据、店铺基本信息数据、评论标签数据????

重庆火锅哪家强,Python 帮你探探店_第5张图片

重庆火锅哪家强,Python 帮你探探店_第6张图片

去哪吃

首先看下重庆市不同地区的火锅店分布,找火锅店嘛,总要找火锅店多的地区,这样能选择的店铺也更多:

重庆火锅哪家强,Python 帮你探探店_第7张图片

从上图可以看到,重庆市的火锅店基本集中在渝中区、渝北区、沙坪坝区、南岸区,并且经过进一步的计算可以得到这四个区的火锅店总数为388家,在所有进入统计的重庆市27个区县共750家店铺中占到了超过一半,所以优先去这四个区,十步一家火锅店,总有你要的!

什么时候吃

在对地点分析之后,我们来对吃火锅的时间进行分析,以评论数量代替同时吃火锅的人数,并使用Pandas提取含有时间的评论并进行整理得到不同时间的人流量与平均评分:

重庆火锅哪家强,Python 帮你探探店_第8张图片

从上图可以看到,重庆人民吃火锅的时间集中在下午和晚上,并且高峰期集中在晚上7点至11点,所以想安安静静吃火锅可以避开这段时间。不过从整体评价来看下午的评价不太好,反而晚上10点之后的评价比较高,可能是大家对于老板也耐心等候表示认可????

选什么标签

每个店铺下的评价都有顾客评价的标签:

重庆火锅哪家强,Python 帮你探探店_第9张图片

本节我们通过绘制好评用户的矩形数图来看下带有哪些标签的火锅店获得的好评更多:

重庆火锅哪家强,Python 帮你探探店_第10张图片

从上图可以看出除了味道赞,重庆人更喜欢去回头客多、上菜快的店铺,所以当我们寻找一家火锅店的时候,点开店铺评价,按照带有上面标签找准没错。

选什么价格

在挑选一家火锅店的时候,价格也是很重要的一项参考指标,本节对人均价格绘制直方图同时添加对应价格的平均分曲线????

重庆火锅哪家强,Python 帮你探探店_第11张图片

可以看到,虽然重庆火锅店多,但是人均价格超过一百的并不多,大多集中在50—80之间,并且不是越便宜得到的评分越高,反而平均分最高的一个价格区间为100-110,其次是70-80,所以想要火锅吃的爽,至少准备一百块。

要不要优惠

相信大家都会在去吃火锅之前看下商家是否有代金券/团购,所以本节使用箱线图对重庆市火锅店的优惠信息进行分析:

重庆火锅哪家强,Python 帮你探探店_第12张图片

图中箱子越宽说明数量越多,可以看到大部分商家是出售代金券的,是否有代金券对于高分评价没啥影响,但是有代金券的最低分是0分而没有代金券的商家最低分是3+,所以并不是一定要选有优惠的,有时没有优惠可能体验更好哦。

吃什么菜

假设通过上面的分析,我们已经找到了一家火锅店准备开吃,本节继续通过提取评论关键词来看看网友爱点什么菜:

重庆火锅哪家强,Python 帮你探探店_第13张图片

从上图可以看到,最受重庆人民喜爱的肉是牛肉,蔬菜爱选豆芽,喜欢吃油碟的人更多,当然羊肉、毛肚也不能少。

大家都在说什么

在对店铺的影响因素分析完之后,本节对采集到的近万条评论数据进行词云分析,看看大家都在说什么:

重庆火锅哪家强,Python 帮你探探店_第14张图片

可以看到除了味道,大家评论的热点还有服务、服务员、环境,看来重庆火锅的服务相关还是很重要的参考指标。

高分用户怎么说

在我们获取的评论数据中,用户是有等级的,根据查找美团相关资料知道这些等级是根据用户的消费次数、评价质量等多个维度计算得到,相信他们的评价更具有参考价值:

重庆火锅哪家强,Python 帮你探探店_第15张图片

我们看看高分用户怎么说:

重庆火锅哪家强,Python 帮你探探店_第16张图片

可以看到除了味道和服务,份量、新鲜、团购、配菜等都是他们喜欢点评的,所以我们也可以根据这些标签选择,可是等等,怎么老板娘也成了热词。

以上就是一次爬取重庆市火锅数据并分析的过程,当然这些数据可以进行的分析远不止这些,如果近期有打算来一顿重庆火锅的读者可以试着自己去分析一下,记得在看哦,拜拜~

注1:数据采集于美团网公开数据,采集时间为4月16日,数据内容及其解释权归美团网所有。

注2:因本次数据含有商家、用户等信息故不再提供。

【END】

更多精彩推荐

讯飞智能语音先锋者:等到人机交互与人类交流一样自然时,真正的智能时代就来了!

企业打造自己的数据中台,需要的是一套硅谷方法论(文末有福利!)

从Nginx到Pandownload,程序员如何避免面向监狱编程?

☞只会高中数学运算就能发现算法?Google开源的AutoML-Zero有多厉害

Spring Cloud云架构下的微服务架构:部门微服务(Dept)

从Spring Cloud到Service Mesh,微服务架构治理体系如何演进?

你点的每个“在看”,我都认真当成了喜欢

你可能感兴趣的:(重庆火锅哪家强,Python 帮你探探店)