python自动化库selenium的基础操作

selenium的基础操作

1.无头模式的开启

from selenium.webdriver import Chrome   # 导入模块
from selenium.webdriver.chrome.options import Options  

# 以下两行代码无需记忆,需要时粘贴即可
option = Options()   # 实例化一个对象
option.add_argument('headless')  # 设置无头参数

web = Chrome(options=option)
web.get('https://www.xxxx.com')  # GET方法访问网址

2.八大定位语法

web.find_element('id', 'id标识内容') 
web.find_element('css selector', 'css标识内容').send_keys()

web.find_element('link text', '文本标识内容')
web.find_element('partial link text', '部分文本标识内容')

web.find_element('name', 'name标识内容')
web.find_element('class name', 'class标识内容')
web.find_element('tag name', 'tag name标识内容')
web.find_element('xpath', 'xpath标识内容')

3.网页基本操作

  • 基础操作
web.implicitly_wait('秒数')  # 设置最大等待时间
web.implicitly_wait(60)  # 设置最大等待时间为60秒

web.refresh()  # 刷新当前窗口
web.forward()  # 网页前进
web.back()  # 网页后退

web.maximize_window()  # 最大化当前驱动窗口
web.minimize_window()  # 最小化当前驱动窗口
web.fullscreen_window()  # 网页全屏,调用窗口管理器特定的“全屏”操作
  • 自动截屏
web.get_screenshot_as_file('filename.png')   # 文件名后缀png不能少
web.get_screenshot_as_png()  # 当前页面截屏保存为png格式,数据形式为binary data

你可能感兴趣的:(python爬虫,python,爬虫)