selenium相关知识点

一、官方参考文档:http://selenium-python.readthedocs.io/index.html

二、安装方式:

    1.PyPI 网站下载 Selenium库https://pypi.python.org/simple/selenium 

    2. pip install selenium  

Selenium 库里有 WebDriver 的 API。WebDriver 类似可以加载网站的浏览器,同时可以像 BeautifulSoup、xpath 或者其他 Selector 对象一样用来查找页面元素,与页面上的元素进行交互 (发送文本、点击等),以及执行其他动作来运行网络爬虫,提取网页动态数据以及应对反爬。

三、操作步骤:

    1.导包

        from selenium import webdriver

    2.调用环境变量指定的Chrome浏览器创建浏览器对象

        driver = webdriver.Chrome()

    3.定位元素

      

定位元素常用方法

           driver.find_element_by_id

4.获取标签属性值

        get_attribute('属性名')

5.获取文本

        text

6.填入表单数据

        send_keys()

7.鼠标点击

        click()

8.获取cookies值

    get_cookies()

9.selenium中的页面等待

现在的网页越来越多采用了 Ajax 技术,这样程序便不能确定何时某个元素完全加载出来了。如果实际页面等待时间过长导致某个dom元素还没出来,但是你的代码直接使用了这个WebElement,那么就会抛出NullPointer的异常。

为了避免这种元素定位困难而且会提高产生 ElementNotVisibleException 的概率。所以 Selenium 提供了两种等待方式,一种是隐式等待,一种是显式等待。

隐式等待是等待特定的时间,显式等待是指定某一条件直到这个条件成立时继续执行。

    1.显性等待


显性等待模版


selenium内置等待条件

    2.隐性等待

        driver.implicitly_wait(10)

        time.sleep(2)

你可能感兴趣的:(selenium相关知识点)