Selenium是一个用于测试网站的自动化测试工具,支持各种浏览器包括Chrome、Firefox、Safari等主流界面浏览器,同时也支持phantomJS无界面浏览器。
Windows、 Mac、 Liunx、 IOS、 Android等
pip install selenium
需要在项目中导入,以完成浏览器驱动文件的配置
谷歌Chrome驱动文件链接: 点击下载
火狐FireFox驱动文件链接: 点击下载
其他浏览器驱动文件参见: selenium3 浏览器驱动
以谷歌为例 在:右上角菜单——》帮助——》关于Google Chrome中查看版本
下载驱动时对比版本号,下载与浏览器版本最接近的驱动文件
设置浏览器的地址非常简单。 我们可以手动创建一个存放浏览器驱动的目录,如: F:\GeckoDriver , 将下载的浏览器驱动文件(例如:chromedriver、geckodriver)丢到该目录下。
我的电脑–>属性–>系统设置–>高级–>环境变量–>系统变量–>Path,将“F:\GeckoDriver”目录添加到Path的值中。比如:Path字段;F:\GeckoDriver
# 导入selenium
from selenium import webdriver
# 实例 (这里使用的是'\\',单个'\'识别不到路径)
browser = webdriver.Chrome(executable_path = "C:\\Users\\dell\\Desktop\\Environment_driven\\chromedriver.exe")
# 定义url
url = 'https://www.baidu.com/'
# 开启网页
browser.get(url=url)
# 关闭网页 (或quit())
browser.close()
用以获取页面元素
# 根据网页元素的id
browser.find_element_by_id('id')
# 根据网页元素的name属性
browser.find_element_by_name('name')
# 根据xpath表达式
browser.find_element_by_xpath('xpath表达式')
# 根据class的值
browser.find_element_by_class_name('class属性')
# 根据css选择器
browser.find_element_by_css_selector('css')
用以节点交互操作
# 点击
click()
# 输入内容
send_keys()
# 清空操作
clear()
# 执行指定的js代码
execute_script(js)
# 示例:browser.find_element_by_id('id').click()
获取html数据
browser.page_source