4.6 获得验证信息
通常我们用得最多的几种验证信息分别是title、url和text,text方法它用于获取标签对应的文本信息。
下面用126邮箱例子,来获取这些信息:Login126.py
#coding=utf-8
From selenium import webdriver
Driver=webdriver.Chrome()
Driver.get(“http://www.126.com”)
Print “Before login=================”
#打印当前页面title
Title=Driver.title
Print “The current title %r” %title
#打印当前页面URL
Now_url=driver.current_url
Print “The current url %r” %Now_url
#执行邮箱登录
Driver.find_element_by_id(“idInput”).clear()
Driver.find_element_by_id(“idInput”).send_keys(“username”)
Driver.find_element_by_id(“pwdInput”).clear()
Driver.find_element_by_id(“pwdInput”).send_keys(“password”)
Driver.find_element_by_id(“loginBtn”).click()
Print “Afterlogin===================”
#再次打印当前页面title
Title=driver.title
Print “After login thecurrent title %r” %title
#打印当前页面URL
Now_url=driver.current_url
Print “After login thecurrent url %r” %Now_url
#获取登录的用户名
User=driver.find_element_by_id(“spnUid”).text
Print “The login user name%r” %User
Driver.closed()
4.7 设置元素等待
当浏览器在加载页面时,页面内的元素可能并不是同时被加载完成的,这些元素的定位添加困难。如果加载某个元素时延迟而造成ElementNotVisibleException的情况出现,那么就降低了自动化脚本的稳定性。
WebDriver提供两种类型的等待:显式等待和隐式等待
显示等待使webdriver等待某个条件成立时继续执行,否则在达到最大时长抛出超时异常(TimeoutException)
WebDriverWait.py
#coding=utf-8
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
driver = webdriver.Chrome()
driver.get("http://www.baidu.com")
element = WebDriverWait(driver,5,0.5).until(
EC.presence_of_element_located((By.ID,"kw"))
)
element.send_keys('selenium')
driver.close()
WebDriverWait()在设置时间内,默认每隔一段时间检测一次当前页面元素是否存在,如果超出设置时间检测不到抛出异常。具体格式如下:
WebDriverWait(driver,timeout,poll_frequency=0.5,ignored_exceptions=None)
Driver---WebDriver的驱动程序
Timeout—最常超是时间,默认以秒为单位
Poll_frequency—休眠时间的间隔时间,默认为0.5秒
Ignored_exception—超时后的异常信息,默认情况下抛NoSuchElementException异常。
WebDriverWait()一般由until()或until_not()方法配合使用,下面是until()和until_not()方法的说明
Until(method,message=’’):调用该方法提供的驱动程序作为一个参数,直到返回值为True。
Until_not(method,message=‘’):调用该方法提供的驱动程序作为一个参数,直到返回值为false。
通过as关键词对expected_conditons重名为EC,并调用presence_of_element_located()判断元素是否存在。
Expected_conditions类提供一些预期条件的实现。
Title_is 用于判断标题是否为xx。
Title_contains 用于判断标题收包含xx信息。
Presence_of_element_located 元素是否存在
Visibility_of 元素是否可见
Presence_of_all_elements_located 判断一组元素是否存在
Text_to_be_present_in_element 判断元素是否有xx文本信息
Text_to_be_present_in_element_value 判断元素值是否有xx文本信息
Frame_to_be_available_and_switch_to_it 表单是否可用,并切换到该表单
Invisibility_of_element_located 判断元素是否隐藏
Element_to_be_clickable 判断元素是否点击,它处于可见和启动状态
Staleness_of 等到一个元素不再是依附于DOM
Element_to_be_selected 被选中的元素
Element_located_to_be_selected 一个期望的元素位于被选中
Element_selection_state_to_be 一个期望检查如果给定的元素被选中
Element_located_selection_state_to_be 期望找到一个元素并检查是否选在状态
Alert_is_present 预期一个警告信息
Is_displayed()方法也能判断元素是否可见。
Baidu.py
#coding=utf-8
from selenium import webdriver
driver=webdriver.Chrome()
driver.get("http://www.baidu.com")
size=driver.find_element_by_id("kw").size
print "The kw element size is %r" %size
text=driver.find_element_by_id("cp").text
print "The cp element text is %r" %text
attribute=driver.find_element_by_id("kw").get_attribute("type")
print "The type attribute of kw element is %r" %attribute
result=driver.find_element_by_id("kw").is_displayed()
print "the is_display of kw result is %r" %result
driver.close()
implicitly_wait()默认参数的单位为秒,本例中设置等待时长为10 秒,首先这10 秒并非一个固定的等待时间,它并不影响脚本的执行速度。其次,它并不真对页面上的某一元素进行等待,当脚本执行到某个元素定位时,如果元素可定位那么继续执行,如果元素定位不到,那么它将以轮询的方式不断的判断元素是否被定位到,假设在第6 秒钟定位到元素则继续执行。直接超出设置时长(10 秒)还没定位到元素则抛出异常。
在上面的例子中,显然百度输入框的定位id=kw22是有误的,那么在超出10 秒后将抛出异常。
当执行到sleep()方法时会固定的休眠所设置的时长,然后再继续执行。sleep()方法默认参数以秒为单位,如果设置时长小于1 秒,可以用小数点表示,如:sleep(0.5)
4.8 定位一组元素
WebDriver提供了8中定位一组元素的方法:---
Find_elements_by_id()
Find_elements_by_name()
Find_elements_by_class_name()
Find_elements_by_tag_name()
Find_elements_by_link_text()
Find_elements_by_partial_link_text()
Find_element_by_xpath()
Find_element_by_css_selector()
定位一组对象一般用于以下场景:
l 批量操作对象,比如将页面上所有的复选框都被勾选
l 先获取一组对象,再在这组对象中过滤出需要具体定位的一些对象。比如定位出页面上所有的checkbox,让后选择最后一个。
Checkbox.htm:checkbox.htm
为了使页面更美观,在代码中添加了bootstrap在线样式的引用。下面就通过例子来操作页面上的这一组复选框:
checkbox.py
#coding=utf-8
from selenium import webdriver
import os
driver=webdriver.Chrome()
file_path='file:///'+os.path.abspath('checkbox.htm')
driver.get(file_path)
#choose the tag_name with input of thepage
inputs=driver.find_elements_by_tag_name("input")
for i in inputs:
if i.get_attribute("type")=="checkbox":
i.click()
driver.close()
前面在提到通过tag name 的定位方式很难定位到单个元素,因为元素标签名重复的概率很高。那么在定位一组元素时,这种方式就派上了用场。上面的例子中先通过find_elements_by_tag_name()找到一组标签名为input 的元素。然后通过for 循环进行遍历。在遍历的过程中通过get_attribute()方法获取元素的type属性,判断是否为“chcckbox”,如果为“chcckbox”那么这个元素就是一个复选框。对其进行click()勾选操作。
在本例中,因为通过浏览器打开的是一个本地的html文件,所以需要用到Python 的os 模块,path.abspath()方法用于获取当前路径下的文件。
除此之外,我们也可以使用XPath 或CSS 来判断属性值,从而进行点击操作。
CheckBox.py
#coding=utf-8
from selenium import webdriver
import os
import time
driver=webdriver.Chrome()
file_path="file:///"+os.path.abspath("checkbox.htm")
driver.get(file_path)
#by xpath find type=checkbox element
#checkboxes =driver.find_elements_by_xpath("//input[@type='checkbox']")
#by css find type=checkbox element
checkboxes =driver.find_elements_by_css_selector('input[type=checkbox]')
for checkbox in checkboxes:
checkbox.click()
#print the current page with checkboxnumbers
print len(checkboxes)
#unselect the last checkbox of the currentpage
driver.find_elements_by_css_selector('input[type=checkbox]').pop().click()
time.sleep(5)
driver.close()
通过XPath 或CSS 来查找一组元素,少去判断步骤,因为它本身已经做了判断,只需要循环对每一个元素进行click()勾选即可。
len()可获取元素的个数,通过print 打印会得到一个3 的结果。pop() 函数用于获取列表中的一个元素(默认为最后一个元素),并且返回该元素的值。因为前的循环已经所有复选框都勾选上了,再对这一组元素执行pop().lick() 其实是对后一个元素取消勾选.
pop()或pop(-1) 默认获取一组元素中的最后一个。
pop(0) 默认获取一组元素中的第一个。
pop(1) 默认获取一组元素中的第二个。