【python】爬虫入门书籍推荐

本文目录

  • 网络爬虫学习书籍推荐
  • 书籍
    • python编程从入门到实践-Eric Matthes
    • python网络爬虫开发实战-崔庆才

网络爬虫学习书籍推荐

爬虫英文名spider,python是用来这爬虫最方便的语言了,所以需要点python语法基础,推荐给大家一本 《python编程从入门到实践》,有了语言功底后我们最好买一本专门用来学习爬虫开发的书,这里博主推荐百万博主崔庆才写的 《python网络爬虫开发实战》,推荐它的原因主要是因为他写得好嘿嘿,这本书涵盖面较广,爬虫入门到一些比较高级的比如验证码识别、分布式爬虫、专用框架都写得很详细,所以学完它满足一些基本需求不成问题了,比如批量下载图片、手机app抓包等等,这两本书也是博主正在自学的两本书,其中第一本已经学完了,第二本爬虫也已经学了三分之一。

当然,爬虫最主要的目标是批量下载数据,再加以分析得到的东西才比较具有价值,比如爬取b站数千万的用户信息等等,所以高级爬虫很大一方面追求性能的极致优化,会用到优化算法、多线程、分布式等等,这些都是值得深究的方向。

其实我们日常使用的搜索引擎也是爬虫,比如百度名为BaiDuSpider,百度、谷歌等搜索引擎是非常成熟的爬虫产品了,因此实现的功能也很多样化,而且速度很快,这个涉及就到多线程和算法上面的优化了。

掌握了爬虫技术之后,便可以用它来作为一个工具为机器学习、数据挖掘等等服务,因为机器学习的本质是训练模型,而这个训练量直接关系到学习的成果(例如图像识别的准确度),因此需要一个庞大的数据集,这个数据集就可以利用爬虫技术来爬取得到。

爬虫还是挺好玩的,当自己第一次爬取出大量图片的时候,别提有多兴奋了

书籍

python编程从入门到实践-Eric Matthes

python网络爬虫开发实战-崔庆才

你可能感兴趣的:(爬虫,爬虫,python)