3天2100万!周杰伦的说好不哭,20万点评Python来分析

3天2100万!周杰伦的说好不哭,20万点评Python来分析_第1张图片

最近今天,小编被周杰伦的新歌刷屏了,朋友圈纷纷晒出周杰伦的新歌,即便不是周杰伦的歌迷,但是提起他的新歌,想必大家应该都会知道,那就是《说好不哭》。不得不说,周董的号召力还是很强的。看到这首歌如此的受到大家的关注,小编忍不住想要对其分析一下,看一下大家对于这首歌的评价究竟如何。

1

爬取QQ音乐点评

这次小编找的是QQ音乐的评论,看这周董的帅气的封面,音乐才子名不虚传,短短3天已经卖了700万张,看一下评论数有21W的点评数,这人气太旺了!

3天2100万!周杰伦的说好不哭,20万点评Python来分析_第2张图片既然有20万的点评,这个数据量还是很大的。二话不说,用Python迅速爬取。如下图所示,大家可以按照下图箭头所指的位置,找到大家的评论。

3天2100万!周杰伦的说好不哭,20万点评Python来分析_第3张图片

经过检验发现,当请求的时候,需要大家不断改变的是pagenum和lastcommentid这两个参数。评论爬取的部分程序如下图所示。

3天2100万!周杰伦的说好不哭,20万点评Python来分析_第4张图片

这里,通过不断的更新页面数值,并根据爬取的commentid数值来更新lastcommentid的数值,便可以源源不断的爬取到大家的评论,这里,小编爬取了大家的评论和评论时间,昵称以及commentid四个参数,爬取了20万+条评论,如下图所示。

3天2100万!周杰伦的说好不哭,20万点评Python来分析_第5张图片

得到数据之后,接下来是对于数据的处理我们首先来看一下,评论数目前十名的评论有哪一些,如下图所示,很简单的一句程序,便可以得到我们需要的结果。

3天2100万!周杰伦的说好不哭,20万点评Python来分析_第6张图片

在所爬取的数据中,点赞第一名有14100+的点赞数量,他的评论是这样的:

3天2100万!周杰伦的说好不哭,20万点评Python来分析_第7张图片

评价很专业,很走心,一看就是铁粉干的,而且还是很有档次很懂音乐的funs。

2

看一下点评的数据

下面我们看一下,大家的评论数目随着时间的变化情况,如下图所示。

3天2100万!周杰伦的说好不哭,20万点评Python来分析_第8张图片

如上图所示,歌曲是16号23点正式上线与大家见面,立刻引起了大家的评价,可以看见,在歌曲出来的短短一两个小时内,评论数目激增,然后随着入夜大家睡去,评论数目略有下降。而第二天的评论数目虽有小幅度的提升,到那时提升的幅度并不是很大。
这部分的程序如下图所示:

3天2100万!周杰伦的说好不哭,20万点评Python来分析_第9张图片

程序利用的是seaborn库,程序将柱状图与折线图结合起来,更加立体的为大家呈现出评论数目与时间的关系。

3

词云看20W的点评

最后为大家展示的是大家评论的词云制作,看看大家对该首歌的印象。
首先,需要对大家的评论进行预处理,因为爬取到的结果中包含众多的字符,这些字符需要去除。 程序如下图所示。

3天2100万!周杰伦的说好不哭,20万点评Python来分析_第10张图片

上述程序中,我们匹配中文字符和中文标点符号,然后写入指定的文件内,最后利用wordcloud库来制作词云即可:

3天2100万!周杰伦的说好不哭,20万点评Python来分析_第11张图片

看一下大家都说了点啥

3天2100万!周杰伦的说好不哭,20万点评Python来分析_第12张图片

由上图可以看出,大家对于周董的新歌是非常喜欢的,并且都非常的开心,由于信的加入,导致大家在评论的时候会加入五月天的元素。

以上就是本次小编带来的对于周董新歌的分析,小编也准备去买个vip听一下,好好的欣赏周董的新歌曲啦。

数据分析和爬虫:

你可能感兴趣的:(3天2100万!周杰伦的说好不哭,20万点评Python来分析)