任务自动化_Selenium + Headless Chrome 实战

上一篇文章讲了用 request 模拟登录(https://blog.csdn.net/luckycdy/article/details/87981842 )

虽说后来提供了一种新方法,更方便模拟登录,但是想了想后面还要按各种按钮,然后才能下载文档。若是用 request 来撸的话,就要对一个个动作进行抓包然后再post,这好像也有点繁琐。本着只是下载一次文档,不需要太高效率,于是乎决定,用 selenium!

之前用过几次 selenium 来实现自动化,都是用的带界面的浏览器,这次想试试 headless。用到新技术就要去选型,用哪种技术?
任务自动化_Selenium + Headless Chrome 实战_第1张图片
PhantomJS 已经不支持 selenium 了,headless Firefox 和 headless Chrome,因为一直用的 Chrome,所以就选后者了。
下面主要讲这次使用 selenium 的几个注意点:chrome_option 设置,headless Chrome 下载设置,frame & windows,其他

Headless Chrome 配置

你可能感兴趣的:(爬虫)