Python Selenium库的使用

(一)Selenium基础

入门教程:Selenium官网教程

1.Selenium简介

Selenium是一个用于测试网站的自动化测试工具,支持各种浏览器包括Chrome、Firefox、Safari等主流界面浏览器,同时也支持phantomJS无界面浏览器。

2.支持多种操作系统

如Windows、Linux、IOS、Android等。

3.安装Selenium

pip install Selenium

4.安装浏览器驱动

Selenium3.x调用浏览器必须有一个webdriver驱动文件

Chrome驱动文件下载:点击下载chromedrive

Firefox驱动文件下载:点解下载geckodriver

5.配置环境变量

设置浏览器的地址非常简单。 我们可以手动创建一个存放浏览器驱动的目录,如: F:\GeckoDriver , 将下载的浏览器驱动文件(例如:chromedriver、geckodriver)丢到该目录下。

我的电脑–>属性–>系统设置–>高级–>环境变量–>系统变量–>Path,将“F:\GeckoDriver”目录添加到Path的值中。比如:Path字段;F:\GeckoDriver

参考浏览器驱动环境配置

(二)Selenium 快速入门

入门参考文献:Selenium入门

1.Selenium提供了8种定位方式:

id

name

class name

tag name

link text

partial link text

xpath

css selector

2.定位元素的8种方式

参考:selenium元素定位

定位一个元素定位多个元素含义

find_element_by_idfind_elements_by_id通过元素id定位

find_element_by_namefind_elements_by_name通过元素name定位

find_element_by_xpathfind_elements_by_xpath通过xpath表达式定位

find_element_by_link_textfind_elements_by_link_tex通过完整超链接定位

find_element_by_partial_link_textfind_elements_by_partial_link_text通过部分链接定位

find_element_by_tag_namefind_elements_by_tag_name通过标签定位

find_element_by_class_namefind_elements_by_class_name通过类名进行定位

find_elements_by_css_selectorfind_elements_by_css_selector通过css选择器进行定位

3.实例演示

假如我们有一个Web页面,通过前端工具(如,Firebug)查看到一个元素的属性是这样的。

 

 

   

新闻

hao123

通过link text定位:

dr.find_element_by_link_text("新闻")

dr.find_element_by_link_text("hao123")

通过partial link text定位:

dr.find_element_by_partial_link_text("新")

dr.find_element_by_partial_link_text("hao")

dr.find_element_by_partial_link_text("123")

4.Selenium库下webdriver模块常用方法的使用

1.控制浏览器操作的一些方法

方法说明

set_window_size()设置浏览器的大小

back()控制浏览器后退

forward()控制浏览器前进

refresh()刷新当前页面

clear()清除文本

send_keys (value)模拟按键输入

click()单击元素

submit()用于提交表单

get_attribute(name)获取元素属性值

is_displayed()设置该元素是否用户可见

size返回元素的尺寸

text获取元素的文本

实例演示

from selenium import webdriver

from time import sleep

#1.创建Chrome浏览器对象,这会在电脑上在打开一个浏览器窗口

browser = webdriver.Firefox(executable_path ="F:\GeckoDriver\geckodriver")

#2.通过浏览器向服务器发送URL请求

browser.get("https://www.baidu.com/")

sleep(3)

#3.刷新浏览器

browser.refresh()

#4.设置浏览器的大小

browser.set_window_size(1400,800)

#5.设置链接内容

element=browser.find_element_by_link_text("新闻")

element.click()

element=browser.find_element_by_link_text("“下团组”时间")

element.click()

2.鼠标事件

在 WebDriver 中, 将这些关于鼠标操作的方法封装在 ActionChains 类提供。

方法说明

ActionChains(driver)构造ActionChains对象

context_click()执行鼠标悬停操作

move_to_element(above)右击

double_click()双击

drag_and_drop()拖动

move_to_element(above)执行鼠标悬停操作

context_click()用于模拟鼠标右键操作, 在调用时需要指定元素定位

perform()执行所有 ActionChains 中存储的行为,可以理解成是对整个操作的提交动作

实例演示

from selenium import webdriver

#1.引入 ActionChains 类

from selenium.webdriver.common.action_chains import ActionChains

#1.创建Chrome浏览器对象,这会在电脑上在打开一个浏览器窗口

driver = webdriver.Firefox(executable_path ="F:\GeckoDriver\geckodriver")

driver.get("https://www.baidu.com")

#2.定位到要悬停的元素

element= driver.find_element_by_link_text("设置")

#3.对定位到的元素执行鼠标悬停操作

ActionChains(driver).move_to_element(element).perform()

#找到链接

elem1=driver.find_element_by_link_text("搜索设置")

elem1.click()

#通过元素选择器找到id=sh_2,并点击设置

elem2=driver.find_element_by_id("sh_1")

elem2.click()

#保存设置

elem3=driver.find_element_by_class_name("prefpanelgo")

elem3.click()

3.键盘事件

Selenium中的Key模块为我们提供了模拟键盘按键的方法,那就是send_keys()方法。它不仅可以模拟键盘输入,也可以模拟键盘的操作。

常用的键盘操作如下:

模拟键盘按键说明

send_keys(Keys.BACK_SPACE)删除键(BackSpace)

send_keys(Keys.SPACE)空格键(Space)

send_keys(Keys.TAB)制表键(Tab)

send_keys(Keys.ESCAPE)回退键(Esc)

send_keys(Keys.ENTER)回车键(Enter)

组合键的使用

模拟键盘按键说明

send_keys(Keys.CONTROL,‘a’)全选(Ctrl+A)

send_keys(Keys.CONTROL,‘c’)复制(Ctrl+C)

send_keys(Keys.CONTROL,‘x’)剪切(Ctrl+X)

send_keys(Keys.CONTROL,‘v’)粘贴(Ctrl+V)

send_keys(Keys.F1…Fn)键盘 F1…Fn

4.获取断言信息

不管是在做功能测试还是自动化测试,最后一步需要拿实际结果与预期进行比较。这个比较的称之为断言。通过我们获取title 、URL和text等信息进行断言。

属性说明

title用于获得当前页面的标题

current_url用户获得当前页面的URL

text获取搜索条目的文本信息

实例演示

from selenium import webdriver

from time import sleep

driver = webdriver.Firefox(executable_path ="F:\GeckoDriver\geckodriver")

driver.get("https://www.baidu.com")

print('Before search================')

# 打印当前页面title

title = driver.title

print(title)

# 打印当前页面URL

now_url = driver.current_url

print(now_url)

driver.find_element_by_id("kw").send_keys("selenium")

driver.find_element_by_id("su").click()

sleep(1)

print('After search================')

# 再次打印当前页面title

title = driver.title

print(title)

# 打印当前页面URL

now_url = driver.current_url

print(now_url)

# 获取结果数目

user = driver.find_element_by_class_name('nums').text

print(user)

#关闭所有窗口

driver.quit()

打印输出结果

Before search================

百度一下,你就知道

https://www.baidu.com/

After search================

selenium_百度搜索

https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=0&rsv_idx=1&tn=baidu&wd=selenium&rsv_pq=a1d51b980000e36e&rsv_t=a715IZaMpLd1w92I4LNUi7gKuOdlAz5McsHe%2FSLQeBZD44OUIPnjY%2B7pODM&rqlang=cn&rsv_enter=0&rsv_sug3=8&inputT=758&rsv_sug4=759

搜索工具

百度为您找到相关结果约7,170,000个

5.设置元素等待:参考文献

6.定位一组元素

定位一组元素的方法与定位单个元素的方法类似,唯一的区别是在单词element后面多了一个s表示复数。

实例演示

from selenium import webdriver

from time import sleep

driver =webdriver.Firefox(executable_path ="F:\GeckoDriver\geckodriver")

driver.get("https://www.baidu.com")

driver.find_element_by_id("kw").send_keys("selenium")

driver.find_element_by_id("su").click()

sleep(1)

#1.定位一组元素

elements = driver.find_elements_by_xpath('//div/h3/a')

print(type(elements))

#2.循环遍历出每一条搜索结果的标题

for t in elements:

    print(t.text)

    element=driver.find_element_by_link_text(t.text)

    element.click()

    sleep(3)

driver.quit()

7.多表单切换

在Web应用中经常会遇到frame/iframe表单嵌套页面的应用,WebDriver只能在一个页面上对元素识别与定位,对于frame/iframe表单内嵌页面上的元素无法直接定位。这时就需要通过switch_to.frame()方法将当前定位的主体切换为frame/iframe表单的内嵌页面中。

方法说明

switch_to.frame()将当前定位的主体切换为frame/iframe表单的内嵌页面中

switch_to.default_content()跳回最外层的页面

 

    ...