到底用不用Scrapy

到底用不用Scrapy

  • Scrapy是个什么
  • 真的好使吗

Scrapy是个什么

现在Python语言火的不得了,书很多,教程也多,学习班也多,基本上爬虫编写成了必修课。Scrapy的出镜率也随之增高。Scrapy是Python语言开发的比较成熟爬虫框架,是打包方案,底层是异步框架 twisted ,并发是最大优势,他把数据爬取工作进行了结构话的封装,初衷是为了让开发人员更加专注于页面分析。

真的好使吗

由于工作需要,本人要对若网站的数据进行自动化抓取,拿来Scrapy用用吧。整体感觉Python已经提供了很多简单的工具库,本身编写爬虫已经很简单了,用了框架反而增加了很多麻烦。而且网站很多都可以直接调用AJAX的接口获取结构化数据。并发太多会给网站增加很多压力,别人运营网站也不容易,都开几十个并发去爬,无疑就是一种攻击行为。所以后面就还是自己放弃了框架的使用。

你可能感兴趣的:(到底用不用Scrapy)