开发工具
Python版本:3.5.4
相关模块:
requests模块;
bs4模块;
win_unicode_console模块;
jieba模块;
matplotlib模块;
xlwt模块;
numpy模块;
snownlp模块;
以及一些Python自带的模块。
环境搭建
安装Python并添加到环境变量,pip安装需要的相关模块即可。
主要思路
根据输入的歌手ID(如周杰伦ID为6452)下载该歌手的“热门50单曲”所有歌词:
由于找到了获取歌词的API接口,所以就不需要像之前一样算那两个post参数了。
获取歌手的这些歌词之后我们将对这些歌词进行简单的处理与分析。
具体思路详见相关文件中的源代码。
使用演示
(1)歌词抓取
在cmd窗口运行WYY_Lyrics_Downloader.py文件即可。
PS:
打前面几个字母然后按“Tab”键补全就好了。
使用演示
(1)歌词抓取
在cmd窗口运行WYY_Lyrics_Downloader.py文件即可。
PS:
打前面几个字母然后按“Tab”键补全就好了。
别傻傻地一个个字母打上去了。。。
(2)歌词简单分析(以周董的歌词为例)
词频统计并保存到Excel表中:
随便做个图:
制作歌词词云:
简单的情感分析:
横坐标大于0.5的数量占大多数,看来周董的歌还是蛮积极向上的~~~