网易云音乐系列:抓取网易评论进行分析

网易云音乐评论区几大未解之谜。他和她究竟有没有在一起,考研的究竟考上了没有,努力的人成功了吗,他(她)真的能看到留言吗,那些文艺青年写的究竟是不是抄的。网易评论里还有什么是我们不知道的,本场 Chat 将带大家爬取网易云音乐的评论并生成词云来一探究竟。

主要含以下内容:

  • 对爬虫做一个讲解;
  • 分析网易云音乐的网页结构;
  • 反扒措施分析;
  • 高效编写程序,避免代码中的不规范;
  • 使用 Jieba 进行分词,生成词云。

其中我们会用到的第三方库如下:

  • BeautifulSoup;
  • Selenium;
  • WordCloud;
  • Matplotlib;
  • Jieba;
  • Numpy;
  • PIL。

阅读全文: http://gitbook.cn/gitchat/activity/5c4fef5be156003da327cebf

您还可以下载 CSDN 旗下精品原创内容社区 GitChat App ,阅读更多 GitChat 专享技术内容哦。

FtooAtPSkEJwnW-9xkCLqSTRpBKX

你可能感兴趣的:(网易云音乐系列:抓取网易评论进行分析)