前言
本文是该专栏的第1篇,本专栏初衷是让你学会使用pyppeteer从小白到精通,后面会持续分享Pyppeteer的干货知识,记得关注。
Pyppeteer是Puppeteer是Python版本,是Google基于Node.js开发的工具,可以通过JavaScript代码来操作chrome。所以在浏览器中绝大多数操作都可以使用Pyppeteer来完成,比如页面功能测试,自动提交表单,请求响应拦截,导出页面PDF,测试浏览器扩展等。对于笔者来说,pyppeteer给予我最大的亮点除了简便易上手之外,还一点就是能轻松规避谷歌Google的人机验证。
其实,相较于selenium的功能,pyppeteer可谓是selenium的进阶版。下面跟着笔者,直接往下看正文。
正文
很多人说,pyppeteer是比selenium更高效的爬虫库,其主要原因在于pyppeteer使用了python的异步协程库Asyncio,而它可结合Scrapy进行分布式爬虫。
GitHub上面的地址,可查看如下:
https:/