这里来说一说selenium中的等待方式,其实在webdriver只有两种类型等待方式,显式等待和隐式等待,之前是在程序运行过程中使用time模块中的sleep进行代码的休眠进行强制等待,是显式等待中的一种极端情况。
Time.sleep
通过time模块中sleep进行代码的暂停,但是实际使用过程中,如果都以sleep进行控制严重影响了程序的运行。
# coding=utf-8 # 强制等待——代码休眠 import time from selenium import webdriver driver = webdriver.Chrome() driver.get("https://www.baidu.com") time.sleep(3) driver.quit()
显式等待
显式等待是你在代码中定义等待一定条件发生后再进一步执行你的代码。
示例:
# coding=utf-8 from time import ctime from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC dr = webdriver.Chrome() dr.get('https://www.baidu.com') try: print(ctime()) element = WebDriverWait(dr, 10).until( EC.presence_of_element_located((By.ID, "kw")) ) # WebDriverWait(driver=self.driver, timeout=300, poll_frequency=0.5, ignored_exceptions=None) # driver:浏览器驱动 # timeout:最长超时等待时间 # poll_frequency:检测的时间间隔,默认为500ms # ignore_exception:超时后抛出的异常信息,默认情况下抛 NoSuchElementException 异常 print("我已找到") finally: print(ctime()) dr.quit()
执行结果:
以上代码执行后就发现,整段代码执行速度非常快,即使我在WebDriverWait中设置10秒,也不会等待10秒的情况,因为在不到一秒内,已经完成了加载并定位id为“kw”的元素。
通过WebDriverWait 和 ExpectedCondition 组合使用,让我们的代码执行只需要等待需要的时长,而不是固定的时长,这样最大限度的节省时间。
此外ExpectedCondition类中提供了很多预期条件判断方法,省去了再创建包的功夫:
1 """ 2 title_is:判断当前页面的title是否等于预期 3 title_contains:判断当前页面的title是否包含预期字符串 4 presence_of_element_located:判断某个元素是否被加到了dom树里,并不代表该元素一定可见 5 visibility_of_element_located:判断某个元素是否可见. 可见代表元素非隐藏,并且元素的宽和高都不等于0 6 visibility_of:跟上面的方法做一样的事情,只是上面的方法要传入locator,这个方法直接传定位到的element就好了 7 presence_of_all_elements_located:判断是否至少有1个元素存在于dom树中。举个例子,如果页面上有n个元素的class都是'column-md-3',那么只要有1个元素存在,这个方法就返回True 8 text_to_be_present_in_element:判断某个元素中的text是否 包含 了预期的字符串 9 text_to_be_present_in_element_value:判断某个元素中的value属性是否包含了预期的字符串 10 frame_to_be_available_and_switch_to_it:判断该frame是否可以switch进去,如果可以的话,返回True并且switch进去,否则返回False 11 invisibility_of_element_located:判断某个元素中是否不存在于dom树或不可见 12 element_to_be_clickable - it is Displayed and Enabled:判断某个元素中是否可见并且是enable的,这样的话才叫clickable 13 staleness_of:等某个元素从dom树中移除,注意,这个方法也是返回True或False 14 element_to_be_selected:判断某个元素是否被选中了,一般用在下拉列表 15 element_located_to_be_selected 16 element_selection_state_to_be:判断某个元素的选中状态是否符合预期 17 element_located_selection_state_to_be:跟上面的方法作用一样,只是上面的方法传入定位到的element,而这个方法传入locator 18 alert_is_present:判断页面上是否存在alert 19 """
另外这里使用了until()函数也可以使用until_not()
隐式等待
如果某些元素不是立即可用的,隐式等待是告诉WebDriver去等待一定的时间后去查找元素。
# coding=utf-8 from selenium import webdriver from selenium.common.exceptions import NoSuchElementException from time import ctime driver = webdriver.Firefox() # 设置隐式等待为10秒 driver.implicitly_wait(10) driver.get("http://www.baidu.com") try: print(ctime()) driver.find_element_by_id("kw22").send_keys('selenium') except NoSuchElementException as e: print(e) finally: print(ctime()) driver.quit()
这里可以看到在10秒内没有找到想要找到的元素,但是依旧执行了10秒,然后报错,如果修改代码为可以找到,代码执行非常迅速。
implicitly_wait()默认参数的单位为秒,本例中设置等待时长为10秒。首先这10秒并非一个固定的等待时间,它并不影响脚本的执行速度。其次,它并不针对页面上的某一元素进行等待。当脚本执行到某个元素定位时,如果元素可以定位,则继续执行;如果元素定位不到,则它将以轮询的方式不断地判断元素是否被定位到。假设在第6秒定位到了元素则继续执行,若直到超出设置时长(10秒)还没有定位到元素,则抛出异常。
好像也没有很复杂……