目录
业务背景
一)明确分析目的
二)数据采集
三)数据清洗
四)数据分析与构建模型
1、相关产品的评论数排名和平均评分反映的问题
2、各评论占比,推荐评论中好评占比
3、kindle相关产品随时间变化其评论数的变化情况
4、kindle相关产品的优点,对评论内容生成词云
五)总结与建议
对于用户:在购买kindle产品时,查看Kindle产品的相关评论,做出决定;
对于企业:可以通过kindle评论,了解用户对kindle的真实体验,针对性改进产品。
1、kindle相关产品的评论数和评分
2、kindle产品的好评和差评占比,推荐评论占比
3、kindle评论数随时间(年份/月份)变化情况
4、kindle产品的优缺点
5、kindle产品受好评的原因
6、结论与业务建议
slsConsumer Reviews of Amazon Products | Kaggle
1、选择子集
1)隐藏与分析问题无关的列
2)选择需要的行
在categries列中进行数据-筛选-包含-"Kindle",进行数据筛选
2、重命名
将英文名重命名为中文名称
3、删除重复值
根据评论时间、评分、评论文本三列的内容判定是否重复,进行去重操作。
4、缺失值处理
筛选产品名、产品类别、评论时间、评分,将空值行删除
评论标题和评论内容可以为空值
5、一致化处理
1)将评论日期拆分为年、月、日三列
用LEFT函数提取年份
用MID和FIND函数提取月份
用MID和FIND函数提取日期
2)对评论分数进行分组(0--3分为差评,4--5分为好评)
IF(D2<=3,"差评",“好评”)
利用数据透视表对产品评论进行分析。
(1)统计评论数,并按高低排名,评论数越多,说明该产品销量越多。通过产品评论数可以大概了解产品的销售情况,如图:(Amazon Kindle Paperwhite - eBook reader - 4 GB - 6 monochrome Paperwhite - touchscreen - Wi-Fi - black)产品的评分数量最多,说明这款产品的销量最好。
前三名产品的评论数量差别不大,从第四名开始评论数量骤减,相比第一名减少5倍多,这说明kindle类产品容易出现积聚效应,大多数人或跟风或有目的性的喜欢特定的两三款产品。
(2)各产品平均评分。如折线图所示,各产品的平均分都在3分以上,说明kindle类产品的总体评价较高,有个别产品的评论数少的,可能是其产品知名度较低或者有明显的缺点。
各评分的占比
好评数量与差评数量的占比
如图所示,好评占比高达95.43,反映了绝大多数用户都对kindle的使用感到满意
(1)总评论数随时间变化的趋势,如图所示,kindle产品的总评论数逐年增长,从2015年开始快速变化,剧增到6000多。
(2)各类产品评论数随时间变化的趋势,有关kindle产品的产品种类在2015年快速上升
(3)对15、16、17年进行逐月分析:
如图所示,评论数量从15年开始逐渐增加,在16年12月达到顶峰
如图所示,kindle销售主要集中在11、12和1月,结合实际,在每年11、12、1月是国内各大电商平台进行活动促销的时段
由上图可知,Oasis(钢化膜)、Cover(封面)、Light(光线)、、运行流畅(worksgreat)这些字样特别明显,这说明消费者喜欢该类产品的原因是它轻便小巧、电池寿命长、运行流畅、价格实惠、封面漂亮,但是缺点是屏幕易碎,需要贴膜。
1、总结
.Kindle产品总体评分比较高,但评论数排名前3和排名第4名起其数目差距比较大,大部产品只有少数评论数,绝大部分用户只喜欢特定的两三种产品。
·Kindle商品深受消费者喜爱,好评度很高。
.Kindle产品在每年10、11月和12月评论数急剧增长,应加大宣传销售手段,刺激增长销售额。
Kindle产品广受好评的主要原因是:其产品特点轻便小巧、电池寿命长、运行流畅、价格实惠、封面漂亮。
2、建议
将最受欢迎的三种产品作为主打商品,分别是
Amazon Kindle Paperwhite-eBook reader-4 GB-6 monochrome Paperwhite -
touchscreen-Wi-Fi-black
Echo(White)
Amazon Fire Tv
建议利用商品使用、性能及价格的优势作为主要宣传手段,在黄金时期(11、12、1月),加大宣传力度,刺激产品销售,提高销售量