第五章 爬虫进阶(十六) 2020-02-02

十六、 selenium和chromedriver基本使用


Selenium+chromedrive介绍


Selenium相当于是一个机器人。可以模拟人类在浏览器上的一些行为,自动处理浏览器商店一些行为,比如点击,填充数据,删除cookie等。Chromedriver是一个驱动chrome浏览器的驱动程序,使用他才可以驱动浏览器。当然针对不同的浏览器有不同的driver。以下列出了不同浏览器及其对应的driver:

1、Chrome:https://site.google.com/a/chromium.org/chromedriver/downloads

2、Firefox:https://github.com/mozilla/geckodriver/releases

3、Edge:https://developer.microsoft.com/en-us/microsoft-edge/tools/webdriver/

4、Safari:https://webkit.org/blog/6900/webdriver-support-in-safari-10/


Selenium的官方网址:https://selenium-python.readthedocs.io/


安装selenium和webdriver


1、安装selenium:selenium有很多语言的版本,有java、ruby、python等。我们下载python版本就可以了。


cmd指令:pip install selenium


2、安装chromedriver:下载完成后,放到不需要权限的纯英文目录下就可以了。


3、Chromedriver的驱动:


https://site.google.com/a/chromium.org/chromedriver/downloads


Selenium的基本使用


现在以一个简单的获取百度首页的例子来讲下selenium和chromedriver如何快速入门:


示例代码:

 

from selenium import webdriver

 

# chromedriver的绝对路径

driver_path = r'E:\python\chromedriver\chromedriver.exe'

 

# 初始化一个driver,并且指定chromedriver的路径

driver = webdriver.Chrome(executable_path=driver_path)

# 请求网页

driver.get("https://www.baidu.com")

# 通过page_source获取网页源代码

print(driver.page_source)


Selenium的基本使用- 关闭


1、driver.close():关闭当前页面。

2、driver.quit():退出整个浏览器。



上一篇文章 第五章 爬虫进阶(十五) 2020-02-01 地址:

https://www.jianshu.com/p/ca48fa8c11ce

 下一篇文章 第五章 爬虫进阶(十七) 2020-02-03 地址:

 https://www.jianshu.com/p/76c033f8b17c



以上资料内容来源网络,仅供学习交流,侵删请私信我,谢谢。

你可能感兴趣的:(第五章 爬虫进阶(十六) 2020-02-02)