使用Python爬取网站数据分析

阅读更多

玩Chat分享有一段时间了,回过头来看看从数据爬取(如何用 Python 爬取网页制作电子书)、前后端(用 Kotlin 开发 SpringBoot 之 Data JPA、使用 Angular2+ 开发 Markdown 编辑器)、到开发语言(TypeScript 快速入门)都有涉及。但我们在分享一场 Chat 的时候,有没有思考过:

  1. 哪类 Chat 最受欢迎?
  2. 哪类 Chat 作者最多?
  3. 发布 Chat 最多的作者是谁?
  4. 收入最高的作者是谁?
  5. 最受欢迎的主题是什么?
  6. ……

现在深度学习取得了举世瞩目的发展,互联网上的数据就像是一个巨大的金矿,我说不出哪里有黄金,但是我知道哪里有铲子。今天,我们学习使用 Selenium 抓取页面数据,保存到 MongoDB 中,然后使用 PyNum、MatplotLib、Pandas 等工具进行数据的分析、处理、展示,尝试解决我们上面的疑问。

[阅读原文](http://blog.techcave.cn/2018/04/04/it/chat/%E4%BD%BF%E7%94%A8Python%E7%88%AC%E5%8F%96%E7%BD%91%E7%AB%99%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/)

你可能感兴趣的:(python,selenium,numpy,matplotlib,pandas)