2022全国大学生数据分析大赛B题完整解题思路:餐饮服务评价情感倾向分析

题目 B:餐饮服务评价情感倾向分析 完整思路已更新,代码及教程将持续更新!

餐饮行业被誉为“永不落幕的黄金行业”,一方面是其“民以食 为天”的刚需特性,另一方面是较低的创业门槛,使得行业竞争激烈。 中国餐饮市场经过迅速发展,产业链逐步完善,餐饮外卖市场逐步成 熟,在网络和疫情的影响下,年轻人的线上消费倾向进一步养成,很 大程度上也助推了餐饮行业的线上发展。对餐饮企业来说,结合线上 线下精细化运营,把握好用户评价,才能在竞争中脱颖而出。本题采 集了不同餐饮企业的餐品评论数据,请根据提供的数据进行数据的清 洗、分析与挖掘,并回答下列问题。

2.1 第一问
对数据中的评价内容进行分析,制作词云图,分别给出积极 情绪、消极情绪评价次数最多的 10 个词。
题目分析:首先先根据消极跟积极进行分组,对文本进行分词,可以采用结巴分词器,然后各自统计出消极跟积极评价词语出现次数最多的十个词


2.2. 第二问
分析数据中用户评价的积极情绪、消极情绪与评价时间是否 存在关系,请说明理由。
题目分析:时间数据需要处理一下,可以处理出月,日,小时,三个分组,然后对时间进行分组,统计出这三个时频的消极跟积极情绪的文本个数,然后采用方差分析进行差异性分析


2.3. 第三问
积极情绪最多的是哪个商家,并总结这个商家的优点有哪些。
题目分析:对商家进行分组,统计出积极情绪的文本个数,然后进行降序排序得到积极情绪最多的那个商家,可以对其文本进行lda主题词分析,挖掘其用户反馈的优点


2.4. 第四问
消极情绪最多的是哪个商家,并提出相关改进策略,提高顾 客的积极情绪。
题目分析:对商家进行分组,统计出消极情绪的文本个数,然后进行降序排序得到消极情绪最多的那个商家,可以对其文本进行lda主题词分析,挖掘其用户反馈的缺点,然后对症下药


2.5. 第五问
建立餐饮服务评论的情感倾向模型,并对模型的性能和误差 进行评估。基于模型对附件中的测试数据 test.xlsx 进行评测,将评 测结果补充到第一列中,并将此文件一起上传到竞赛平台。
题目分析:搞个文本分类模型即可,需要训练词向量,建议使用fasttext,针对这种二分类的短文本分类有奇效。

该题属于比较经典的数据分析题目,非常简单,本次大赛为个人赛,参赛选手在规定的时间内完成对相应题目的论文撰写与提交。大赛总计获奖比例为40%,只要提交即可颁发优秀奖。可以作为校内大学生综测加分和奖学金加分的重要依据。预计10点前会更新A跟B的完整解题过程视频及完整代码,有需要的小伙伴可以点个关注。

你可能感兴趣的:(数学建模,大数据)