强制等待:sleep()
import time
sleep(5) #等待5秒
设置固定休眠时间,单位为秒。 由python的time包提供, 导入 time 包后就可以使用。
缺点:不智能,使用太多的sleep会影响脚本运行速度
driver.implicitly_wait(10) #隐式等待10秒
隐式等待:
由webdriver提供的方法,一旦设置,这个隐式等待会在WebDriver对象实例的整个生命周期起作用,它不针对某一个元素,是全局元素等待,即在定位元素时,需要等待页面全部元素加载完成,才会执行下一个语句。如果超出了设置时间的则抛出异常。
缺点:当页面某些js无法加载,但是想找的元素已经出来了,它还是会继续等待,直到页面加载完成(浏览器标签左上角圈圈不再转),才会执行下一句。某些情况下会影响脚本执行速度。
显式等待
from selenium.webdriver.support.wait import WebDriverWait
WebDriverWait(driver,timeout,poll_frequency=0.5,ignored_exceptions=None)
#driver:浏览器驱动
#timeout:最长超时时间,默认以秒为单位
#poll_frequency:检测的间隔步长,默认为0.5s
#ignored_exceptions:超时后的抛出的异常信息,默认抛出NoSuchElementExeception异常。
与until()或者until_not()方法结合使用
WebDriverWait(driver,10).until(method,message="")
WebDriverWait(driver,10).until_not(method,message="")
在设置时间(10s)内,等待后面的条件发生。如果超过设置时间未发生,则抛出异常。在等待期间,每隔一定时间(默认0.5秒),调用until或until_not里的方法并返回值
WebDriverWait与expected_conditions结合使用
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
wait = WebDriverWait(driver,10,0.5)
element =waite.until(EC.presence_of_element_located((By.ID,"kw"),message="") #此处注意,如果省略message="",则By.ID外面是两层()
方法 | 说明 |
---|---|
title_is | 判断当前页面的 title 是否完全等于(==)预期字符串,返回布尔值 |
title_contains | 判断当前页面的 title 是否包含预期字符串,返回布尔值 |
presence_of_element_located | 判断某个元素是否被加到了 dom 树里,并不代表该元素一定可见 |
visibility_of_element_located | 判断元素是否可见(可见代表元素非隐藏,并且元素宽和高都不等于 0) |
visibility_of | 同上一方法,只是上一方法参数为locator,这个方法参数是 定位后的元素 |
presence_of_all_elements_located | 判断是否至少有 1 个元素存在于 dom 树中。举例:如果页面上有 n 个元素的 class 都是’wp’,那么只要有 1 个元素存在,这个方法就返回 True |
text_to_be_present_in_element | 判断某个元素中的 text 是否 包含 了预期的字符串 |
text_to_be_present_in_element_value | 判断某个元素中的 value 属性是否包含 了预期的字符串 |
frame_to_be_available_and_switch_to_it | 判断该 frame 是否可以 switch进去,如果可以的话,返回 True 并且 switch 进去,否则返回 False |
invisibility_of_element_located | 判断某个元素中是否不存在于dom树或不可见 |
element_to_be_clickable | 判断某个元素中是否可见并且可点击 |
staleness_of | 等某个元素从 dom 树中移除,注意,这个方法也是返回 True或 False |
element_to_be_selected | 判断某个元素是否被选中了,一般用在下拉列表 |
element_selection_state_to_be | 判断某个元素的选中状态是否符合预期 |
element_located_selection_state_to_be | 跟上面的方法作用一样,只是上面的方法传入定位到的 element,而这个方法传入 locator |
alert_is_present | 判断页面上是否存在 alert |
自己构造一个callable的类或者函数就行,我们可以把多个条件打包进行这个类的__call__函数中或者callable的函数中,以until为例,在函数内部调用了method,也就是我们传进去的方法,而until返回值就是我们方法的返回值,这样便可以每次检测多个元素
def until(self, method, message=''):
"""Calls the method provided with the driver as an argument until the \
return value is not False."""
screen = None
stacktrace = None
end_time = time.time() + self._timeout
while True:
try:
value = method(self._driver)
if value:
return value
except self._ignored_exceptions as exc:
screen = getattr(exc, 'screen', None)
stacktrace = getattr(exc, 'stacktrace', None)
time.sleep(self._poll)
if time.time() > end_time:
break
raise TimeoutException(message, screen, stacktrace)
class accoutn_validation(object):
def __call__(self,driver):
element_exist=EC.visibility_of_element_located((By.ID, 'password'))(driver)
print('element_exist is {}'.format(element_exist))
if element_exist:
p = driver.find_element_by_id('password')# 这里的element_exist和p其实是同一个类型
print('type of p is {}'.format(type(element_exist)))
return True
else:
response_msg=EC.visibility_of_element_located((By.ID, 'responseMessage'))(driver)
if response_msg:
print('response_msg is {}'.format(response_msg.text))
raise InVaildAccount()
webelement对象是selenium中所有元素的父类,也就是webelement对象拥有的方法,其它元素对象都会有;
只是不同的对象在调用特定方法时,效果是不一样的,即:
某些方法只是针对特定元素类型有效,而对其它类型无效。
(1)clear:清空文本框中的文本,仅仅对有文本输入特性的元素有效;例如:文本框、多行文本框等;
(2)click:单击元素,可以通过该方法,让元素获取焦点;
(3)find_element系列:查找子元素的方法,同浏览器的find_element系列方法相同;
(4)get_attribute:获取当前元素的特定属性值,如 name、style等;
(5)id:表示当前元素在selenium中的唯一标识;
(6)is_displayed:当前元素是否可见;
(7)is_enabled:当前元素是否可用;
(8)is_selected:当前元素是否被选中,通常在checkbox、radiobox、select option等元素上;
(9)location:返回当前元素的左上角坐标X、Y的位置,即在当前页面中的绝对位置坐标;
(10)location_once_scrolled_into_view:返回当前元素第一次滚动到可视区域时的左上角坐标X、Y的位置,使用此方法可以把不在可视区域的元素滚动到可视区域;
(11)parent:返回WebDriver对象;
(12)rect:返回当前元素左上角坐标X、Y值,以及该元素的宽和高,即该元素的显示区域;
(13)send_keys:向当前元素发送字符串内容,仅仅对可输入web元素有效,如文本框、文本区域等;
(14)size:获取当前元素的宽和高;
(15)submit:提交当前元素所在的form表单,相当于单击所在form表单内的submit;
(16)tag_name:获取当前元素的tag name内容,如文本框的值为input;
(17)text:获取当前元素的inneerText值,即元素开始标签和结束标签之间的文本内容;
(18)value_of_css_property:获取当前元素的css属性,如获取color的属性值;
绝对路径定位(从根节点出发,以/开头,太麻烦不推荐使用)
a = browser.find_element_by_xpath('/html/body/div/div[x]/div[x]/div/div/from/span')
标签+属性定位——xpath = “//标签名[@属性=‘属性值’]”
browser.find_element_by_xpath("//*[@id='kw' and @name='wd']") #其中*表示所有的标签
contains()方法定位,也叫模糊定位
browser.find_element_by_xpath("//a[contains(@name,'news')]")
starts-with ,ends-with方法定位
browser.find_element_by_xpath("//a[ends-with(@name,'_trnews')]")
text()方法定位
browser.find_element_by_xpath("//*[text()='新闻']")
如果一个元素无法通过自身的属性定位到,那么可以先定位到他的上一级或者上N级,然后再一级一级地找到他
browser.find_element_by_xpath("//form[@id='form']/span[contains(@class,'xxx')]/input/xxx")
1.目标元素如果在iframe上需要切换iframe
2.input中的value不能通过text取出来,可以xxxx.get_attribute('value'),也可以执行js进行返回