从头学习爬虫(十)进阶篇----selenium

本文讲下selenium。

何为selenium.

用于web自动化测试,好吧给前端用的。爬虫为何要用这玩意呢,绕不过上篇反爬策略。

我们看看应用场景

1页面点击拖动,加载内容

2元素拖动,验证码破解

3执行js,数据获取

4模拟登入

5参数无法获取

那我们要准备什么呢

浏览器(目前谷歌和火狐比较常用)、驱动包、Java对应webdriver 依赖的jar包。

从头学习爬虫(十)进阶篇----selenium_第1张图片

浏览器是65版本

http://chromedriver.storage.googleapis.com/index.html

从头学习爬虫(十)进阶篇----selenium_第2张图片

随便点一个(尽量找新的)

从头学习爬虫(十)进阶篇----selenium_第3张图片

点击notes.txt查找最新对应关系,根据对应关系下载与系统相关的驱动包

从头学习爬虫(十)进阶篇----selenium_第4张图片

我的对应驱动包是v2.38

已谷歌浏览器为例配置版本要对应。

在后面会有实战



你可能感兴趣的:(网络爬虫)