ALittleHigh

Selenium学习笔记——selenium操作详记

Selenium操作学习笔记

学习目的： 使用selenium自动化测试工具，模拟人为操作浏览器，达到可以注册/登录网页，滑动下拉框，选择，鼠标点击等操作，为以后编写突破反爬虫机制的个人小爬虫建立基础。
学习背景： windows系统，python语言，PyCharm
学习资源： https://www.selenium.dev/documentation/en/

主要内容

1. 定位元素

是最重要的学习内容之一，学习如何定位到网页中的元素

1.1 定位单一元素

driver.find_element(By.ID, "cheese")

tips：driver是WebDriver的实例对象

一旦“定位到了”以上的网页元素，可以在上一步结果的基础上进一步缩小范围

cheese = driver.find_element(By.ID, "cheese")
cheddar = cheese.find_elements_by_id("cheddar")

同时，也可以使用另一种方法实现

cheddar = driver.find_element_by_css_selector("#cheese #cheddar")

1.2 定位多个元素

如果网页结构如下


 …
 
…
 
…
 …

想要定位cheese下的所有元素，如下

mucho_cheese = driver.find_elements_by_css_selector("#cheese li")

1.3 元素选择策略

WebDriver有八个内置的元素选择方法

定位法	使用描述
class name	寻找包含查找值的class name元素（不包括复合class name）
css selector	用css法定位元素
id	依据id属性值定位元素
name	依据name属性值定位元素
link text	定位其可视文本与搜索值匹配的锚元素
partial link text	定位其可视文本包含搜索值的第一个锚元素
tag name	定位tag name与搜索值匹配的元素
xpath	查找与xpaht表达式匹配的元素

1.4 其他定位法

在定位到想要的元素后，可以使用以下方法定位到相邻的元素

above()	定位到现元素上面的元素
below()	定位到现元素下面的元素
toLeftOf()	定位到现元素左面的元素
tpRightOf()	定位到现元素右面的元素
near()	定位到最多距现元素50个像素远的元素

2. 动作操作

2.1 定位并输入文本

name = "Charles"
driver.find_element(By.NAME, "name").send_keys(name)

2.2 拖放功能

source = driver.find_element(By.ID, "source")
target = driver.find_element(By.ID, "target")
ActionChains(driver).drag_and_drop(source, target).perform()

2.3 点击元素

driver.find_element(By.CSS_SELECTOR, "input[type='submit']").click()

3. 实例化WebDriver

from selenium.webdriver import Chrome

driver = Chrome()

或

from selenium.webdriver import Chrome

with Chrome() as driver:
    #your code inside this indent

4. 浏览器操作

4.1 打开网页

driver.get("https://selenium.dev")

4.2 获取当前网址

从浏览器的地址栏读取当前的URL

driver.current_url

4.3 按下浏览器的后退按钮

driver.back()

4.4 按下浏览器的前进按钮

driver.forward()

4.5 刷新当前网页

driver.refresh()

4.6 从浏览器中读取当前页面标题

driver.title

4.7 当打开一个新窗口时，获取该窗口的处理权

driver.current_window_handle

4.8 当点击一个链接跳转到新窗口时，需要switch到新窗口

from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

# Start the driver
with webdriver.Chrome() as driver:
    # Open URL
    driver.get("https://seleniumhq.github.io")

    # Setup wait for later
    wait = WebDriverWait(driver, 10)

    # Store the ID of the original window
    original_window = driver.current_window_handle

    # Check we don't have other windows open already
    assert len(driver.window_handles) == 1

    # Click the link which opens in a new window
    driver.find_element(By.LINK_TEXT, "new window").click()

    # Wait for the new window or tab
    wait.until(EC.number_of_windows_to_be(2))

    # Loop through until we find a new window handle
    for window_handle in driver.window_handles:
        if window_handle != original_window:
            driver.switch_to.window(window_handle)
            break

    # Wait for the new tab to finish loading content
    wait.until(EC.title_is("SeleniumHQ Browser Automation"))

4.9 创建新窗口并switch

# Opens a new tab and switches to new tab
driver.switch_to.new_window('tab')

# Opens a new window and switches to new window
driver.switch_to.new_window('window')

4.10 关闭一个窗口或tab

#Close the tab or window
driver.close()

#Switch back to the old tab or window
driver.switch_to.window(original_window)

4.11 退出浏览器

driver.quit()

4.12 Frames和Iframes，点击iframes中的按钮


  
   <button>Click here</button>

代码如下
方法一

# Store iframe web element
iframe = driver.find_element(By.CSS_SELECTOR, "#modal > iframe")

# switch to selected iframe
driver.switch_to.frame(iframe)

# Now click on button
driver.find_element(By.TAG_NAME, 'button').click()

方法二

# Switch frame by id
driver.switch_to.frame('buttonframe')

# Now, Click on the button
driver.find_element(By.TAG_NAME, 'button').click()

方法三

# Switch to the second frame
driver.switch_to.frame(1)

4.13 退出一个frame或frameset

driver.switch_to.default_content()

5. 窗口管理

5.1 获取窗口大小

# Access each dimension individually
width = driver.get_window_size().get("width")
height = driver.get_window_size().get("height")

# Or store the dimensions and query them later
size = driver.get_window_size()
width1 = size.get("width")
height1 = size.get("height")

5.2 设置窗口大小

driver.set_window_size(1024, 768)

5.3 获得窗口位置

# Access each dimension individually
x = driver.get_window_position().get('x')
y = driver.get_window_position().get('y')

# Or store the dimensions and query them later
position = driver.get_window_position()
x1 = position.get('x')
y1 = position.get('y')

5.4 设置窗口位置

# Move the window to the top left of the primary monitor
driver.set_window_position(0, 0)

5.5 最大化窗口

driver.maximize_window()

5.6 最小化窗口

driver.minimize_window()

5.7 窗口全屏

driver.fullscreen_window()

6. 等待响应

例子：将下列代码保存为一个文件，路径为：file://race_condition.html



Race Condition Example

6.1 显式等待网页加载完成

方法一

from selenium.webdriver.support.ui import WebDriverWait
def document_initialised(driver):
    return driver.execute_script("return initialised")

driver.navigate("file:///race_condition.html")
WebDriverWait(driver).until(document_initialised)
el = driver.find_element(By.TAG_NAME, "p")
assert el.text == "Hello from JavaScript!"