python+selenium记录

python+selenium记录

  • selenium基本操作
    • selenium等待
    • expected_conditions类提供的预期条件判断的方法
    • 多元素检测
    • WebElement对象操作
    • Xpath定位元素的几种方式
    • 定位元素踩的坑

selenium基本操作

selenium等待

强制等待:sleep()

import time
sleep(5)  #等待5秒

设置固定休眠时间,单位为秒。 由python的time包提供, 导入 time 包后就可以使用。
缺点:不智能,使用太多的sleep会影响脚本运行速度


driver.implicitly_wait(10) #隐式等待10秒

隐式等待:
由webdriver提供的方法,一旦设置,这个隐式等待会在WebDriver对象实例的整个生命周期起作用,它不针对某一个元素,是全局元素等待,即在定位元素时,需要等待页面全部元素加载完成,才会执行下一个语句。如果超出了设置时间的则抛出异常。

缺点:当页面某些js无法加载,但是想找的元素已经出来了,它还是会继续等待,直到页面加载完成(浏览器标签左上角圈圈不再转),才会执行下一句。某些情况下会影响脚本执行速度。


显式等待

from selenium.webdriver.support.wait import WebDriverWait
WebDriverWait(driver,timeout,poll_frequency=0.5,ignored_exceptions=None)

#driver:浏览器驱动
#timeout:最长超时时间,默认以秒为单位
#poll_frequency:检测的间隔步长,默认为0.5s
#ignored_exceptions:超时后的抛出的异常信息,默认抛出NoSuchElementExeception异常。
与until()或者until_not()方法结合使用

WebDriverWait(driver,10).until(method,message="")
WebDriverWait(driver,10).until_not(method,message="") 

在设置时间(10s)内,等待后面的条件发生。如果超过设置时间未发生,则抛出异常。在等待期间,每隔一定时间(默认0.5),调用until或until_not里的方法并返回值

WebDriverWait与expected_conditions结合使用
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
wait = WebDriverWait(driver,10,0.5)
element =waite.until(EC.presence_of_element_located((By.ID,"kw"),message="") #此处注意,如果省略message="",则By.ID外面是两层()

expected_conditions类提供的预期条件判断的方法

方法 说明
title_is 判断当前页面的 title 是否完全等于(==)预期字符串,返回布尔值
title_contains 判断当前页面的 title 是否包含预期字符串,返回布尔值
presence_of_element_located 判断某个元素是否被加到了 dom 树里,并不代表该元素一定可见
visibility_of_element_located 判断元素是否可见(可见代表元素非隐藏,并且元素宽和高都不等于 0)
visibility_of 同上一方法,只是上一方法参数为locator,这个方法参数是 定位后的元素
presence_of_all_elements_located 判断是否至少有 1 个元素存在于 dom 树中。举例:如果页面上有 n 个元素的 class 都是’wp’,那么只要有 1 个元素存在,这个方法就返回 True
text_to_be_present_in_element 判断某个元素中的 text 是否 包含 了预期的字符串
text_to_be_present_in_element_value 判断某个元素中的 value 属性是否包含 了预期的字符串
frame_to_be_available_and_switch_to_it 判断该 frame 是否可以 switch进去,如果可以的话,返回 True 并且 switch 进去,否则返回 False
invisibility_of_element_located 判断某个元素中是否不存在于dom树或不可见
element_to_be_clickable 判断某个元素中是否可见并且可点击
staleness_of 等某个元素从 dom 树中移除,注意,这个方法也是返回 True或 False
element_to_be_selected 判断某个元素是否被选中了,一般用在下拉列表
element_selection_state_to_be 判断某个元素的选中状态是否符合预期
element_located_selection_state_to_be 跟上面的方法作用一样,只是上面的方法传入定位到的 element,而这个方法传入 locator
alert_is_present 判断页面上是否存在 alert

多元素检测

自己构造一个callable的类或者函数就行,我们可以把多个条件打包进行这个类的__call__函数中或者callable的函数中,以until为例,在函数内部调用了method,也就是我们传进去的方法,而until返回值就是我们方法的返回值,这样便可以每次检测多个元素

def until(self, method, message=''):
        """Calls the method provided with the driver as an argument until the \
        return value is not False."""
        screen = None
        stacktrace = None

        end_time = time.time() + self._timeout
        while True:
            try:
                value = method(self._driver)
                if value:
                    return value
            except self._ignored_exceptions as exc:
                screen = getattr(exc, 'screen', None)
                stacktrace = getattr(exc, 'stacktrace', None)
            time.sleep(self._poll)
            if time.time() > end_time:
                break
        raise TimeoutException(message, screen, stacktrace)
class accoutn_validation(object):
    def __call__(self,driver):

        element_exist=EC.visibility_of_element_located((By.ID, 'password'))(driver)
        print('element_exist is {}'.format(element_exist))
        if element_exist:
            p = driver.find_element_by_id('password')# 这里的element_exist和p其实是同一个类型
            print('type of p is {}'.format(type(element_exist)))
            return True
        else:
            response_msg=EC.visibility_of_element_located((By.ID, 'responseMessage'))(driver)
            if response_msg:
                print('response_msg is {}'.format(response_msg.text))
                raise InVaildAccount()

由于前面返回True,这里已经飘起了红线
由于前面返回True,这里已经飘起了红线

WebElement对象操作

webelement对象是selenium中所有元素的父类,也就是webelement对象拥有的方法,其它元素对象都会有;

只是不同的对象在调用特定方法时,效果是不一样的,即:

某些方法只是针对特定元素类型有效,而对其它类型无效。

(1)clear:清空文本框中的文本,仅仅对有文本输入特性的元素有效;例如:文本框、多行文本框等;

(2)click:单击元素,可以通过该方法,让元素获取焦点;

(3)find_element系列:查找子元素的方法,同浏览器的find_element系列方法相同;

(4)get_attribute:获取当前元素的特定属性值,如 name、style等;

(5)id:表示当前元素在selenium中的唯一标识;

(6)is_displayed:当前元素是否可见;

(7)is_enabled:当前元素是否可用;

(8)is_selected:当前元素是否被选中,通常在checkbox、radiobox、select option等元素上;

(9)location:返回当前元素的左上角坐标X、Y的位置,即在当前页面中的绝对位置坐标;

(10)location_once_scrolled_into_view:返回当前元素第一次滚动到可视区域时的左上角坐标X、Y的位置,使用此方法可以把不在可视区域的元素滚动到可视区域;

(11)parent:返回WebDriver对象;

(12)rect:返回当前元素左上角坐标X、Y值,以及该元素的宽和高,即该元素的显示区域;

(13)send_keys:向当前元素发送字符串内容,仅仅对可输入web元素有效,如文本框、文本区域等;

(14)size:获取当前元素的宽和高;

(15)submit:提交当前元素所在的form表单,相当于单击所在form表单内的submit;

(16)tag_name:获取当前元素的tag name内容,如文本框的值为input;

(17)text:获取当前元素的inneerText值,即元素开始标签和结束标签之间的文本内容;

(18)value_of_css_property:获取当前元素的css属性,如获取color的属性值;

Xpath定位元素的几种方式

  1. 绝对路径定位(从根节点出发,以/开头,太麻烦不推荐使用)

    a = browser.find_element_by_xpath('/html/body/div/div[x]/div[x]/div/div/from/span')
    
  2. 标签+属性定位——xpath = “//标签名[@属性=‘属性值’]”

    browser.find_element_by_xpath("//*[@id='kw' and @name='wd']") #其中*表示所有的标签
    
  3. contains()方法定位,也叫模糊定位

    browser.find_element_by_xpath("//a[contains(@name,'news')]")
    
  4. starts-with ,ends-with方法定位

    browser.find_element_by_xpath("//a[ends-with(@name,'_trnews')]")
    
  5. text()方法定位

    browser.find_element_by_xpath("//*[text()='新闻']")
    
  6. 如果一个元素无法通过自身的属性定位到,那么可以先定位到他的上一级或者上N级,然后再一级一级地找到他

    browser.find_element_by_xpath("//form[@id='form']/span[contains(@class,'xxx')]/input/xxx")
    

定位元素踩的坑

1.目标元素如果在iframe上需要切换iframe
2.input中的value不能通过text取出来,可以xxxx.get_attribute('value'),也可以执行js进行返回

你可能感兴趣的:(Python)