python爬虫入门学习(一)合法爬取,拒绝牢饭。

python爬虫入门学习(一)

什么什爬虫

其实爬虫很好理解,互联网好比是一张大网,在这张大网上有无数的站点,站点中有很多的数据信息。这时如果你需要获取某个站点的大量的数据的时候,几千几百的数据量你可以人工,当热这时候下载数据的人已经开始骂娘了。你完全可以利用计算器去做,爬虫就是一个在互联网上的一个蜘蛛,它可以根据你的需求让它帮你,你就可以去花前月下了。。。。额。
注意:爬虫数据获取时必须合法,不然,”爬虫用的溜,牢饭吃的饱“

如何利用python构建爬虫

python的爬虫使用我之后会在几篇文章中给大家分别讲解。
先看下分别pyhon对于爬虫来说,给大家提供了那些工具,也就是因为这些工具,爬虫便利了不少,也有好多进去的人。。

  • 请求库
    • urllib
    • requests
    • selenium
  • 解析库
    • lxml
    • Beautiful Soup
    • pyquery
  • 存储库
    • pymysql
    • pymongo
    • redis / scrapy-redis
  • 图像识别库
    • tesserocer
  • 爬虫框架
    • pyspider
    • scrapy

之后会不定期更新根据上面的分支,内容依次从简答到复杂,也是自己重新温习,也是分享的一次博客。

你可能感兴趣的:(python爬虫入门学习)