爬虫篇 | 快速入门selenium(十一)

如果爬虫不会Selenium 就不要说自己会爬虫

Selenium简介

Selenium是一个用于web自动化测试的工具,Selenium测试直接运行在浏览器中,就好像一个真正的用户在操作一样

支持大部分主流的浏览器,包括IE(7,8,9,10,11),Firefox,Safari,Chrome,Opera等。

我们可以利用它来模拟用户点击访问网站,绕过一些复杂的认证场景
通过selnium+驱动浏览器这种组合可以直接渲染解析js,绕过大部分的参数构造和反爬。

安装Selenium

Selenium安装非常简单,直接pip就可以搞定: pip install selenium

使用selenium驱动chrome浏览器需要下载chromedriver,而且chromedriver版本需要与chrome的版本对应,版本错误的话则会运行报错。

Chromedriver下载地址:https://chromedriver.storage.googleapis.com/index.html

Windows: 下载对应版本的chromedriver解压后,将文件移动到一个配置了环境变量的文件夹中,例如Python安装文件夹

爬虫篇 | 快速入门selenium(十一)_第1张图片

Linux/Mac: 解压后,将文件移动至/usr/local/bin目录中

测试
爬虫篇 | 快速入门selenium(十一)_第2张图片

基本使用

元素选取

爬虫篇 | 快速入门selenium(十一)_第3张图片

你可能感兴趣的:(零基础学Python爬虫)