Debug_轩

Python_Selenium使用

文章目录

- 前言
- - selenium (from selenium import webdriver)
  - - 1、安装
    - 2、基本使用
    - 3、声明浏览器对象
    - 4、访问页面
    - 5、查找节点
    - - 5.1 查找单个节点
      - 5.2 查找多个节点
    - 6、节点交互（操作节点事件）
    - 7、动作链
    - - 7.1 鼠标点击
      - 7.2 鼠标移动
      - 7.3 鼠标拖拽
      - 7.4 按键监听
    - 8、执行JavaScript脚本
    - 9、获取节点信息
    - 10、切换iFrame
    - 11、延迟等待（显示等待和隐式等待）
    - 12、前进与后退
    - 13、Cookies使用
    - 14、选项卡管理（切换句柄）
    - 15、异常处理
    - 16、浏览器退出
    - 17、截图操作
    - 18、Selenium项目模板
  - 总结

前言

网络上有着很多这种类型的使用说明以及教程，但终归不是自己的。
遇到不会的时候还得不断的重复去百度，这样导致效率低下。
最终还是想着结合网上的教程，给自己归纳总结一部分库的使用，方便自己回顾。

selenium (from selenium import webdriver)

更详细操作见：Selenium_Python英文版、Selenium中文翻译操作文档
Selenium手册
Selenium使用
Selenium教程
这边推荐一个元素测试网站（动作链部分针对于该网站）：元素测试网站

1、安装

安装步骤1：通过pip install selenium安装
安装步骤2：安装与计算机使用浏览器版本相对应的WebDriver
- Chrome（ChromeDriver与浏览器对应的版本）
- Firefox（默认下载最新的geckodriver即可）
安装步骤3：下载完成解压后，将文件移动到一个配置了环境变量的文件夹中，例如Python环境的文件夹下。

2、基本使用

Selenium是一个用于Web应用程序测试的工具。
Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。支持的浏览器包括IE（7, 8, 9, 10, 11），Firefox，Safari，Chrome，Opera等。
Selenium 可以根据我们的指令，让浏览器自动加载页面，获取需要的数据，甚至页面截屏，或者判断网站上某些动作是否发生。同时也可以获取页面的源代码，可以获取页面渲染后的元素，做到可见即可爬

'''
    功能如下：
    	自动弹出一个Chrome浏览器，浏览器首先会跳转至百度，然后输入Python，回车，等待3秒，自动关闭浏览器。
'''
import time

from selenium import webdriver
from selenium.webdriver.common.by import By  # 显示等待中使用By进行定位元素
from selenium.webdriver.common.keys import Keys  # 可以实现键盘回车的功能
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.wait import WebDriverWait


browser = webdriver.Chrome()  # 声明Chrome浏览器对象
try:
    browser.get('https://www.baidu.com')  # get()方法请求网页
    input_item = browser.find_element(By.ID, 'kw')  # 定位到百度输入框，find_element()方法获取单个元素节点
    input_item.send_keys('Python')  # send_keys()方法向input框中填入字符串
    input_item.send_keys(Keys.ENTER)  # 模拟键盘回车
    wait = WebDriverWait(browser, 10)  # 显示等待，指定加载的最长时间
    wait.until(EC.presence_of_element_located((By.ID, "content_left")))  # 等待内容节点，直到出现进行下一步
    print(browser.current_url)  # 获取当前浏览器中url
    print(browser.page_source)  # 获取当前url的网页源代码
finally:
    time.sleep(3)  # 等待3s
    browser.quit()  # 退出浏览器

3、声明浏览器对象

在使用Selenium之前肯定要先声明浏览器对象，以下代码完成了浏览器对象的初始化并赋值给browser对象，接下来就是调用browser对象，让其执行一系列的人为操作。

'''
    功能如下：
        声明浏览器对象
'''

from selenium import webdriver
browser = webdriver.Chrome()
browser = webdriver.Firefox()
browser = webdriver.Edge()
browser = webdriver.Safari()

4、访问页面

get()：请求网页，参数：url网址

'''
    功能如下：
        输入一个网址，通过selenium进行访问页面
'''

from selenium import webdriver
browser = webdriver.Chrome()  # 创建浏览器对象
browser.get("https://www.baidu.com")  # get() 方法访问页面
print(browser.page_source)  # 获取网页源代码
browser.quit()  # 退出浏览器

5、查找节点

更多请查看：英文文档、中文文档

5.1 查找单个节点

find_element()：返回的是WebElement类型，这个方法需要导入这个包from selenium.webdriver.common.by import By
find_element_by_XXX：这个方法不需要额外添加依赖包

方法1	方法2
find_element_by_id	find_element(By.ID, “”)
find_element_by_name	find_element(By.NAME, “”)
find_element_by_xpath	find_element(By.XPATH, “”)
find_element_by_link_text	find_element(By.LINK_TEXT, “”)
find_element_by_partial_link_text	find_element(By.PARTIAL_LINK_TEXT, “”)
find_element_by_tag_name	find_element(By.TAG_NAME, “”)
find_element_by_class_name	find_element(By.CLASS_NAME, “”)
find_element_by_css_selector	find_element(By.CSS_SELECTOR, “”)

单独拿一个id做案例，代码使用参考如下：

'''
    功能如下：
        实现查找节点中id方法的案例
    案例网站：【豆瓣电影排行榜】https://movie.douban.com/chart

'''
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

def fun_one():
    '''
    使用 find_element_by_xxx类型
    :return:
    '''
    icp1 = browser.find_element_by_id('icp')
    icp2 = browser.find_element_by_xpath('//span[@id="icp"]')
    icp3 = browser.find_element_by_css_selector('#icp')
    print("方法一：")
    print(icp1)
    print(icp2)
    print(icp3)


def fun_two():
    '''
    使用 find_element()类型
    :return:
    '''
    icp1 = browser.find_element(By.ID, 'icp')
    icp2 = browser.find_element(By.XPATH, '//span[@id="icp"]')
    icp3 = browser.find_element(By.CSS_SELECTOR, '#icp')
    print("方法二：")
    print(icp1)
    print(icp2)
    print(icp3)

if __name__ == '__main__':
    browser = webdriver.Chrome()
    browser.get('https://movie.douban.com/chart')
    wait = WebDriverWait(browser, 15)
    wait.until(EC.presence_of_element_located((By.ID, "content")))
    fun_one()  # 方法一：find_element_by_xxx类型
    fun_two()  # 方法二：find_element()类型
    browser.quit()

# 最后运行的结果如下
#方法一：
#
#
#
#方法二：
#
#
#

5.2 查找多个节点

find_elements()：返回的是列表类型，列表里面每一个都是WebElement类型。
find_elements_by_XXX：这个方法不需要额外添加依赖包

方法1	方法2
find_elements_by_id	find_elements(By.ID, “”)
find_elements_by_name	find_elements(By.NAME, “”)
find_elements_by_xpath	find_elements(By.XPATH, “”)
find_elements_by_link_text	find_elements(By.LINK_TEXT, “”)
find_elements_by_partial_link_text	find_elements(By.PARTIAL_LINK_TEXT, “”)
find_elements_by_tag_name	find_elements(By.TAG_NAME, “”)
find_elements_by_class_name	find_elements(By.CLASS_NAME, “”)
find_elements_by_css_selector	find_elements(By.CSS_SELECTOR, “”)

'''
    功能如下：
        实现查找节点中id方法的案例
    案例网站：【豆瓣电影排行榜】https://movie.douban.com/chart

'''
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

def fun_one():
    '''
    使用 find_elements_by_xxx类型
    :return:
    '''
    items1 = browser.find_elements_by_css_selector('div.indent .item')
    items2 = browser.find_elements_by_xpath('//div[@class="indent"]//tr[@class="item"]')
    print("方法一：")
    print(items1)
    print(items2)


def fun_two():
    '''
    使用 find_elements()类型
    :return:
    '''
    items1 = browser.find_elements(By.CSS_SELECTOR, 'div.indent .item')
    items2 = browser.find_elements(By.XPATH, '//div[@class="indent"]//tr[@class="item"]')
    print("方法二：")
    print(items1)
    print(items2)


if __name__ == '__main__':
    browser = webdriver.Chrome()
    browser.get('https://movie.douban.com/chart')
    wait = WebDriverWait(browser, 15)
    wait.until(EC.presence_of_element_located((By.ID, "content")))
    fun_one()  # 方法一：find_elements_by_xxx类型
    fun_two()  # 方法二：find_elements()类型
    browser.quit()

6、节点交互（操作节点事件）

Selenium驱动浏览器执行一些动作，比较常见的方法有：
send_keys()：输入文字方法
clear()：清空文字
click()：点击按钮
submit()：回车
更多操作见：文档

'''
    功能如下：
        实现input框的输入
        实现input框的清空
        实现元素的点击操作
'''

import time

from selenium import webdriver
from selenium.webdriver.common.by import By  # 显示等待中使用By进行定位元素
from selenium.webdriver.common.keys import Keys  # 可以实现键盘回车的功能
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.wait import WebDriverWait


browser = webdriver.Chrome()  # 声明Chrome浏览器对象
try:
    browser.get('https://cn.bing.com/')  # get()方法请求网页
    input_item = browser.find_element(By.ID, 'sb_form_q')  # 定位到百度输入框，find_element()方法获取单个元素节点
    input_item.send_keys('Python')  # send_keys()方法：向input框中填入字符串
    input_item.submit()  # 模拟键盘回车
    # input_item.send_keys(Keys.ENTER)  # 模拟键盘回车
    wait = WebDriverWait(browser, 10)  # 显示等待，指定加载的最长时间
    wait.until(EC.presence_of_element_located((By.ID, "b_results")))  # 等待内容节点，直到出现进行下一步

    time.sleep(1)
    input_item2 = browser.find_element(By.ID, 'sb_form_q')
    input_item2.clear()  # clear()方法：清空input框内容
    time.sleep(0.2)
    input_item2.send_keys("阿尔法")  # send_keys()方法：输入字符串
    browser.find_element(By.ID, "sb_form_go").click()  # click()方法：进行点击操作
finally:
    time.sleep(3)  # 等待3s
    browser.quit()  # 退出浏览器

7、动作链

用selenium做自动化，有时候会遇到需要模拟鼠标操作才能进行的情况，比如单击、双击、点击鼠标右键、拖拽等等。而selenium给我们提供了一个类来处理这类事件——ActionChains
更多操作见：文档

使用动作链常用的几个场景，如下：

鼠标点击（单击、双击、右键）
鼠标移动（解决hover的某些问题）
鼠标拖拽（实现节点拖拽操作，将某个节点从一处拖拽到另一处。）
按键监听（监听按键的状态）

ActionChains方法列表

click(on_element=None) 										# 单击鼠标左键
click_and_hold(on_element=None)     						# 点击鼠标左键，不松开
context_click(on_element=None)      						# 单击鼠标右键
double_click(on_element=None)       						# 双击鼠标左键
drag_and_drop(source, target)       						# 按住鼠标左键拖拽到某个元素然后松开
drag_and_drop_by_offset(source, xoffset, yoffset)  			# 拖拽到某个坐标(偏移量)然后松开
key_down(value, element=None) 								# 按下某个键盘上的键，不释放
key_up(value, element=None) 								# 松开某个键
move_by_offset(xoffset, yoffset) 							# 鼠标从当前位置移动到某个坐标
move_to_element(to_element) 								# 鼠标移动到某个元素的中间
move_to_element_with_offset(to_element, xoffset, yoffset) 	# 移动到距某个元素（左上角坐标）多少距离的位置
perform() 													# 执行链中的所有动作
release(on_element=None) 									# 在某个元素位置松开鼠标左键
reset_actions()												# 清除链中的所有操作
send_keys(*keys_to_send) 									# 发送某个键到当前焦点的元素
send_keys_to_element(element, *keys_to_send) 				# 发送某个键到指定元素

7.1 鼠标点击

示例网址：https://sahitest.com/demo/clicks.htm

'''
    功能如下：
        1. 实现左键单击操作
        2. 实现左键双击操作
        3. 实现右键单击操作
'''

from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
from selenium.webdriver.common.by import By
import time

browser = webdriver.Chrome()  # 初始化浏览器对象

try:
    browser.maximize_window()  # 窗口最大化
    browser.get('http://sahitest.com/demo/clicks.htm')
    time.sleep(0.5)
    click_btn = browser.find_element(By.XPATH, '//input[@value="click me"]')  # 单击按钮
    doubleclick_btn = browser.find_element(By.XPATH, '//input[@value="dbl click me"]')  # 双击按钮
    rightclick_btn = browser.find_element(By.XPATH, '//input[@value="right click me"]')  # 右键单击按钮
    ActionChains(browser).click(click_btn).double_click(doubleclick_btn).context_click(rightclick_btn).perform()  # 链式用法,执行动作链
    time.sleep(0.5)
    textarea = browser.find_element(By.XPATH, '//textarea[@name="t2"]').get_attribute('value')  # 获取textarea文本域中的值
    print(textarea)
finally:
    time.sleep(3)
    browser.quit()

7.2 鼠标移动

示例网址：https://sahitest.com/demo/mouseover.htm

'''
    功能如下：
        解决某些hover的问题
'''

from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
from selenium.webdriver.common.by import By
import time

browser = webdriver.Chrome()  # 初始化浏览器对象

try:
    browser.maximize_window()  # 窗口最大化
    browser.get('https://sahitest.com/demo/mouseover.htm')
    time.sleep(0.5)
    write = browser.find_element(By.XPATH, '//input[@value="Write on hover"]')  # Writer on hover
    black = browser.find_element(By.XPATH, '//input[@value="Blank on hover"]')  # Blank on hover
    action = ActionChains(browser)
    action.move_to_element(write).perform()  # 将鼠标移动到Writer on hover
    time.sleep(2)
    action.move_to_element(black).perform()  # 将鼠标移动到Blank on hover
finally:
    time.sleep(3)
    browser.quit()

7.3 鼠标拖拽

示例网址：https://sahitest.com/demo/dragDropMooTools.htm

'''
    功能如下：
        实现鼠标将某一个元素拖拽到另一个元素中
'''

from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
from selenium.webdriver.common.by import By
import time

browser = webdriver.Chrome()  # 初始化浏览器对象

try:
    browser.maximize_window()  # 窗口最大化
    browser.get('https://sahitest.com/demo/dragDropMooTools.htm')
    time.sleep(0.5)
    dragger = browser.find_element(By.ID, 'dragger')  # dragger
    items = browser.find_elements(By.XPATH, '//div[@class="item"]')  # items

    action = ActionChains(browser)
    action.drag_and_drop(dragger, items[0]).perform()  # 将drop拖拽到第一个item中
    time.sleep(2)
    action.drag_and_drop(dragger, items[2]).perform()  # 将drop拖拽到第三个item中
    time.sleep(2)
    action.drag_and_drop(dragger, items[-1]).perform()  # 将drop拖拽到第四个item中
finally:
    time.sleep(3)
    browser.quit()

7.4 按键监听

示例网址：http://sahitest.com/demo/keypress.htm

'''
    功能如下：
        在selenium中实现键盘的简易操作
'''

import time

from selenium import webdriver
from selenium.webdriver import Keys
from selenium.webdriver.common.action_chains import ActionChains

from selenium.webdriver.common.by import By

browser = webdriver.Chrome()
browser.maximize_window()
browser.get('http://sahitest.com/demo/keypress.htm')

key_up_radio = browser.find_element(By.ID, 'r1')  # 监测按键升起
key_down_radio = browser.find_element(By.ID, 'r2')  # 监测按键按下
key_press_radio = browser.find_element(By.ID, 'r3')  # 监测按键按下升起

enter = browser.find_elements(By.XPATH, '//form[@name="f1"]/input')[1]  # 输入框
result = browser.find_elements(By.XPATH, '//form[@name="f1"]/input')[0]  # 监测结果

# 监测key_down
key_down_radio.click()
ActionChains(browser).key_down(Keys.CONTROL, enter).key_up(Keys.CONTROL).perform()  # 在输入框中按下ctrl建
print(result.get_attribute('value'))
time.sleep(5)

# 监测key_up
key_up_radio.click()
enter.click()
ActionChains(browser).key_down(Keys.SHIFT).key_up(Keys.SHIFT).perform()  # 在输入框中按下shift建，松开
print(result.get_attribute('value'))
time.sleep(5)

# 监测key_press
key_press_radio.click()
enter.click()
ActionChains(browser).send_keys('a').perform()
print(result.get_attribute('value'))
time.sleep(5)
browser.quit()

8、执行JavaScript脚本

execute_script()：可以直接模拟运行JavaScript，常见的几种执行场景如下：
- 将滚动条拉至顶部
- 将滚动条拉至底部
- 直接使用js操作页面，能解决很多click()不生效的问题
- 处理富文本，时间控件的输入

代码如下：

'''
    功能如下：
        - 将滚动条拉至顶部
	    - 将滚动条拉至底部
	    - JS执行元素操作（点击、输入文本、等）
'''
from selenium import webdriver
import time

from selenium.webdriver.common.by import By

browser = webdriver.Chrome()
browser.maximize_window()
browser.get('https://movie.douban.com/chart')
time.sleep(2)

# driver.execute_script("arguments[0].click();", element)，点击操作
# driver.execute_script("arguments[0].scrollIntoView();", element)，移动到目标元素，类似于滑动查找


# 滚动条拉到底部
js = 'window.scrollTo(0, document.body.scrollHeight)'
browser.execute_script(js)
print(f'''滚动条滑动到底部''')
time.sleep(2)

# 滚动条拉到顶部
js = 'window.scrollTo(0, 0)'
browser.execute_script(js)
print(f'''滚动条滑动到顶部''')
time.sleep(2)

# 输入文本操作
msg = '悬疑'
send_js = f"text_input = document.getElementById('inp-query'); " \
          f"text_input.value = '{msg}'"
browser.execute_script(send_js)
print(f'''{msg}文本输入成功。。。''')
time.sleep(2)

# 点击操作
input_btn = browser.find_element(By.CSS_SELECTOR, ".inp-btn input")
click_js = 'arguments[0].click();'
browser.execute_script(click_js, input_btn)
print(f'''搜索按钮点击成功''')

# 创建一个新的选项卡
browser.execute_script('window.open()')
handles = browser.window_handles  # 获取当前浏览器对象中有多少选项卡
print(handles)
browser.switch_to.window(handles[-1])  # 跳转到最后一个选项卡中
browser.get('https://www.taobao.com')  # 跳转至淘宝中

time.sleep(3)
browser.quit()

9、获取节点信息

page_source属性可以获取网页的源代码，也可以使用解析库(如正则表达式、BeautifulSoup、pyquery、parsel等)来提取信息

Selenium已经提供了选择节点的方法，返回的是WebElement类型，那么它也有相关的方法和属性来直接提取节点信息，如属性、文本等。这样的话，我们就可以不用通过解析源代码来提取信息了，非常方便。

get_attribute()：获取节点的属性，但是其前提是先选中这个节点，示例如下：

from selenium import webdriver
import time

from selenium.webdriver.common.by import By

browser = webdriver.Chrome()
browser.maximize_window()
browser.get('https://movie.douban.com/chart')
time.sleep(2)

items = browser.find_elements(By.XPATH, '//div[@class="pl2"]/a[1]')
for item in items:
    print(item.get_attribute('href'))  # 获取节点属性href

time.sleep(2)
browser.quit()

# 运行效果
# https://movie.douban.com/subject/30314848/
# https://movie.douban.com/subject/27199850/
# https://movie.douban.com/subject/35874097/
# https://movie.douban.com/subject/35008440/
# https://movie.douban.com/subject/34861178/
# https://movie.douban.com/subject/30165311/
# https://movie.douban.com/subject/35769174/
# https://movie.douban.com/subject/35307624/
# https://movie.douban.com/subject/35303842/
# https://movie.douban.com/subject/35441573/

text：获取文本值，每个WebElement节点都有text属性，直接调用这个属性就可以得到节点内部的信息，示例如下：

from selenium import webdriver
import time

from selenium.webdriver.common.by import By

browser = webdriver.Chrome()
browser.maximize_window()
browser.get('https://movie.douban.com/chart')
time.sleep(2)

items = browser.find_elements(By.XPATH, '//div[@class="pl2"]/a[1]')
for item in items:
    print(item.text)  # 获取文本数据

time.sleep(2)
browser.quit()

# 运行结果
# 瞬息全宇宙 / 妈的多重宇宙(台) / 奇异女侠玩救宇宙(港)
# 暗夜博士：莫比亚斯 / 莫比亚斯 / 魔比煞(港)
# 网络炼狱：揭发N号房 / 网路炼狱：揭发N号房(台) / 网络地狱：N号房现形记
# 唐顿庄园2 / 唐顿庄园电影版2 / 唐顿庄园：全新世代(港/台)
# 北欧人 / 北方人(台)
# 坏蛋联盟 / 大坏蛋 / 坏家伙
# 万湖会议 / The Conference
# 渔港的肉子酱 / 渔港的肉子 / Fortune Favors Lady Nikuko
# 迷失之城 / 迷失D城 / Lost City of D
# 首尔怪谈 / Urban Myths / Urban Myths: Tooth Worms

id属性：selenium 使用的内部 ID。
location属性：获取节点在页面中的相对位置
tag_name属性：可以获取标签名称
size属性：可以获取节点元素大小

'''
    功能如下：
        id属性：selenium 使用的内部 ID。
        location属性：获取节点在页面中的相对位置
        tag_name属性：可以获取标签名称
        size属性：可以获取节点元素大小
'''

from selenium import webdriver
import time

from selenium.webdriver.common.by import By

browser = webdriver.Chrome()
browser.maximize_window()
browser.get('https://movie.douban.com/chart')
time.sleep(2)

item = browser.find_elements(By.XPATH, '//div[@class="pl2"]/a[1]')[0]
print(item.id)  # 获取节点在selenium中的id
print(item.location)  # 获取节点在页面中的位置
print(item.size)  # 获取节点的大小
print(item.tag_name)  # 获取节点的标签名称

time.sleep(2)
browser.quit()

# 执行效果
# 8c32db1c-1321-4674-9aee-92abad562603
# {'x': 534, 'y': 281}
# {'height': 16, 'width': 318}
# a

10、切换iFrame

示例网址：https://sahitest.com/demo/iframesTest.htm
selenium中处理iFrame有三种方式

1、如果iframe有id或name，则可根据iframe的id或name切换。

<iframe name="aa"id="x-URS-iframe1610006384373.8518"></iframe>
browser.switch_to.frame('x-URS-iframe1610006384373.8518')  # id定位
browser.switch_to.frame('aa')  # name定位

2、把iframe当作页面元素，通过元素定位表达式进行切换。

<iframe name="aa"id="x-URS-iframe1610006384373.8518"></iframe>
frame = browser.find_element_by_xpath('//iframe[@id="x-URS-iframe"]')  # 先定位元素
browser.switch_to.frame(frame)  # 在切换iframe

3、将iframe存储到list中，然后根据ifrane的索引定位（适合页面有多个iframe，且前两种方法无法使用）。
```
browser.switch_to.frame(0)
```

返回上一级

browser.switch_to.parent_frame()  # 返回上一级

跳出iframe窗口并返回到Top Window 上

browser.switch_to_default_conten()  # 跳出iframe窗口并返回Window主窗体

这里案例只用将元素作为参数传递，进入iframe中。

from selenium import webdriver
import time

from selenium.webdriver.common.by import By

browser = webdriver.Chrome()
browser.maximize_window()
browser.get('https://sahitest.com/demo/iframesTest.htm')
time.sleep(2)

item = browser.find_element(By.ID, 'checkRecord').get_attribute('value')
h2_out = browser.find_element(By.TAG_NAME, 'h2').text
print(f'''外层的主体输出：{item}, {h2_out}''')

time.sleep(2)
# 第一层iframe
iframe = browser.find_element(By.TAG_NAME, 'iframe')
browser.switch_to.frame(iframe)
h2_in = browser.find_element(By.TAG_NAME, 'h2').text
print(f'''内层iframe的输出：{h2_in}''')

time.sleep(2)
browser.quit()

11、延迟等待（显示等待和隐式等待）

在selenium中，get()方法会在网页框架加载完之后结束，但是在这时候获取网页源代码page_source，可能并不是浏览器加载完之后的数据，如果某些页面有额外的Ajax请求，我们在网页源代码中也不一定能成功获取到。所以，这里需要延时等待一定时间，确保节点已经加载出来。
等待的方式有两种：一种是显示等待，一种是隐式等待

隐式等待implicily_wait()：当使用隐式执行测试时，如果selenium没有在DOM中找到节点，将继续等待，超出设定时间后则抛出找不到节点的异常。【换句话说，当前查找节点的节点没有立即出现，则进行等待隐式等待设定的时候，再查找DOM节点，默认的隐式等待时间为0】

from selenium import webdriver
from selenium.webdriver.common.by import By

browser = webdriver.Chrome()
browser.implicitly_wait(10)  # 隐式等待10s
browser.maximize_window()
browser.get('https://movie.douban.com/chart')

items = browser.find_elements(By.XPATH, '//div[@class="pl2"]/a[1]')
for item in items:
    print(item.get_attribute('href'))  # 获取节点属性href
browser.quit()

显式等待wait = WebDriverWait(browser,10)：隐式等待的效果其实没有这么好，隐式等待只是设置固定等待一段时间，而页面会收到网络的影响。有一中更适合的显示等待方法，去处理上述问题，【简单的说，显示等待就是在查找节点时，设置一个最长等待时间，在这个规定的时间内，不断的间隔查找节点是否加载出来，如果加载出来，则返回查找的节点；如果到了规定时间依然没有加载出该节点，则抛出找不到节点的异常】

import time

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

browser = webdriver.Chrome()
browser.implicitly_wait(10)  # 隐式等待10s
browser.maximize_window()
browser.get('https://movie.douban.com/chart')

item = WebDriverWait(browser, 10).\
    until(EC.presence_of_element_located((By.XPATH, '//div[@class="pl2"]')))
print(item)
time.sleep(2)
browser.quit()
# 运行结果
<selenium.webdriver.remote.webelement.\
WebElement (session="21cb0b79ea3b60b9711ae9bb7aab33a5", element="0d6c5acb-9eba-40eb-8075-3655d02b336a")>

详细操作：文档

等待条件	含义
title_is	标题是某内容
title_contains	标题包含某内容
presence_of_element_located	节点加载出来，传入定位元组，如（By.ID，‘p’）
visibility_of_element_located	节点可见，传入定位元组
visibility_of	可见，传入节点对象
presence_of_all_elements_located	所有节点加载出来
text_to_be_present_in_element	某个节点文本包含某文字
text_to_be_present_in_element_value	某个节点值包含某文字
frame_to_be_available_and_switch_to_it	加载并切换
invisibility_of_element_located	节点不可见
element_to_be_clickable	节点可点击
staleness_of	判断一个节点是否仍在DOM，可判断页面是否已经刷新
element_to_be_selected	节点可选择，传节点对象
element_located_to_be_selected	节点可选择，传入定位元组
element_selection_state_to_be	传入节点对象以及状态，相等返回true，否则返回False
element_located_selection_state_to_be	传入定位元组以及状态，相等返回True，否则返回False
alert_is_present	是否出现警告

12、前进与后退

back()：后退
forward()：前进

import time
from selenium import webdriver
browser = webdriver.Chrome()
browser.get('https://www.baidu.com/')
browser.get('https://www.taobao.com/')
browser.get('https://www.zhihu.com/')
browser.back()
time.sleep(1)
browser.forward()
browser.close()

13、Cookies使用

get_cookies()：获取cookies 【列表格式】
add_cookie(dict)：添加cookie【字典格式】
delete_cookie(name=“”)：删除某一个cookie
delete_all_cookies()：删除所有的cookies

import time
from selenium import webdriver
browser = webdriver.Chrome()
browser.get('https://www.baidu.com/')
cookies = browser.get_cookies()  # 获取页面的cookie【列表格式】
print(cookies)
time.sleep(1)
browser.add_cookie({'name': 'name', 'domain': '.baidu.com', 'value': 'xuan'})  # 添加cookie
time.sleep(0.5)
print(browser.get_cookies())
time.sleep(0.5)
browser.delete_all_cookies()  # 删除所有的cookies
time.sleep(0.5)
print(browser.get_cookies())
browser.close()

# 运行结果
# [{'domain': '.baidu.com', 'expiry': 1685068239, 'httpOnly': False, 'name': 'ZFY', 'path': '/', 'sameSite': 'None', 'secure': True, 'value': '6L4XyME:AUQ:AgwiMtufstx4tSWgLYItHOAIkkYt6HSMo:C'}, {'domain': '.baidu.com', 'expiry': 1653618639, 'httpOnly': False, 'name': 'BA_HECTOR', 'path': '/', 'secure': False, 'value': '8cak8121ah252lela01h8tpif15'}, {'domain': '.baidu.com', 'httpOnly': False, 'name': 'H_PS_PSSID', 'path': '/', 'secure': False, 'value': '36454_31253_36452_36421_36165_36488_36055_26350_36301_36469_36311_36447'}, {'domain': '.baidu.com', 'expiry': 1685068238, 'httpOnly': False, 'name': 'BAIDUID', 'path': '/', 'secure': False, 'value': 'C0B5A9B5DBE343265E238C99CE101CAC:FG=1'}, {'domain': '.baidu.com', 'expiry': 3801015885, 'httpOnly': False, 'name': 'BIDUPSID', 'path': '/', 'secure': False, 'value': 'C0B5A9B5DBE3432620590E72CBC92B05'}, {'domain': '.baidu.com', 'expiry': 3801015885, 'httpOnly': False, 'name': 'PSTM', 'path': '/', 'secure': False, 'value': '1653532239'}, {'domain': 'www.baidu.com', 'expiry': 1654396239, 'httpOnly': False, 'name': 'BD_UPN', 'path': '/', 'secure': False, 'value': '12314753'}, {'domain': 'www.baidu.com', 'httpOnly': False, 'name': 'BD_HOME', 'path': '/', 'secure': False, 'value': '1'}]
# [{'domain': '.baidu.com', 'expiry': 1685068239, 'httpOnly': False, 'name': 'ZFY', 'path': '/', 'sameSite': 'None', 'secure': True, 'value': '6L4XyME:AUQ:AgwiMtufstx4tSWgLYItHOAIkkYt6HSMo:C'}, {'domain': '.baidu.com', 'expiry': 1653618639, 'httpOnly': False, 'name': 'BA_HECTOR', 'path': '/', 'secure': False, 'value': '8cak8121ah252lela01h8tpif15'}, {'domain': '.baidu.com', 'httpOnly': False, 'name': 'H_PS_PSSID', 'path': '/', 'secure': False, 'value': '36454_31253_36452_36421_36165_36488_36055_26350_36301_36469_36311_36447'}, {'domain': '.baidu.com', 'expiry': 1685068238, 'httpOnly': False, 'name': 'BAIDUID', 'path': '/', 'secure': False, 'value': 'C0B5A9B5DBE343265E238C99CE101CAC:FG=1'}, {'domain': '.baidu.com', 'httpOnly': False, 'name': 'name', 'path': '/', 'secure': True, 'value': 'xuan'}, {'domain': '.baidu.com', 'expiry': 3801015885, 'httpOnly': False, 'name': 'BIDUPSID', 'path': '/', 'secure': False, 'value': 'C0B5A9B5DBE3432620590E72CBC92B05'}, {'domain': '.baidu.com', 'expiry': 3801015885, 'httpOnly': False, 'name': 'PSTM', 'path': '/', 'secure': False, 'value': '1653532239'}, {'domain': 'www.baidu.com', 'expiry': 1654396239, 'httpOnly': False, 'name': 'BD_UPN', 'path': '/', 'secure': False, 'value': '12314753'}, {'domain': 'www.baidu.com', 'httpOnly': False, 'name': 'BD_HOME', 'path': '/', 'secure': False, 'value': '1'}]
# []

这里增加一个扩展功能，比如selenium的Cookies转换成字符串Cookie可以给requests使用，又或者requests的Cookie字符串转换成selenium可使用的list格式Cookies。

# 网页中的cookie转换成selenium使用的cookie
def cookie_seleinium(cookieStr, domain):
    '''
    将requests拿到的cookie转换成selenium使用的cookie
    :param cookieStr: cookie
    :param domain: 填入统一的domin域名
    :return:
    '''
    cookie_list = cookieStr.split(';')
    selenium_cookie_list = []
    for cookie in cookie_list:
        # print(cookie)
        # print(cookie.split('=', 1))
        cookie = cookie.strip()
        name = cookie.split('=', 1)[0]
        value = cookie.split('=', 1)[-1]
        cookie_dict = {
            "domain": domain,
            "name": name,
            "value": value,
            "path": "/"
        }
        selenium_cookie_list.append(cookie_dict)
    return selenium_cookie_list


# selenium获取cookie可转成requests使用的cookie
def selenium_requests_cookie(selenium_list):
    #获取cookies
    cookie_list = [item["name"] + "=" + item["value"] for item in selenium_list]
    cookieStr = ';'.join(item for item in cookie_list)
    return cookieStr

14、选项卡管理（切换句柄）

获取当前句柄：browser.current_window_handle
获取所有句柄：hanles = browser.window_handles
切换指定句柄：handle = handles[-1] # 取最新窗口的id browser.switch_to.window(handle) # 切换窗口
访问网页的时候，很多时候我们点击一个链接时，会新建一个选项卡，那么如何跳转至新打开的选项卡呢？就需要用到switch_to.window(handle)方法去跳转，以下代码会做一个小案例。

import time
from selenium import webdriver
browser = webdriver.Chrome()
browser.get('https://www.baidu.com')
# 调用execute_script()方法，传入window.open()这个javascript语句新开启一个选项卡
browser.execute_script('window.open()')
# 获取当前开启的所有选项卡，返回的是选项卡的代号列表
print(browser.window_handles)
# 调用switch_to.window()方法切换选项卡，参数是选项卡代号，跳转到最后一个，选项卡中序号默认从0开始
browser.switch_to.window(browser.window_handles[-1])
browser.get('https://www.taobao.com')#打开淘宝页面
time.sleep(1)
browser.switch_to.window(browser.window_handles[0])#跳转到第一个选项卡
browser.get('https://douban.com')

time.sleep(1)
browser.quit()
# 运行结果：
# ['CDwindow-AD42B99E578AAAFBD39CE0B27261CEFB', 'CDwindow-A06ACF8B3CABE2F92782552A95C36071']

15、异常处理

在使用selenium时，会经常遇到一些报错哦异常。例如：超时异常、节点未找到等报错异常，一旦出现这种异常，程序就会停止执行，这时我们可以使用try···except语句来实现捕获异常进行处理。
更多异常类：文档

from selenium import webdriver
from selenium.common.exceptions import TimeoutException,NoSuchElementException
browser = webdriver.Chrome()
try:
	browser.get('https://www.baidu.com')
except TimeoutException:
	print('Time Out')
try:
	browser.find_element_by_id('hello')
except NoSuchElementException:
	print('No Element')
finally:
	browser.close()
# 运行结果
# No Element

16、浏览器退出

browser.close()：关闭浏览器的一个标签页
browser.quit()：关闭浏览器

17、截图操作

在linux中，使用selenium进行截图，需要安装中文库，否则中文会变成方框。
Selenium截图有大的两个方式，一个是针对于浏览器而言，另一种是针对与元素而言

针对于浏览器对象browser而言，有四种截图方式

driver.get_screenshot_as_base64()：以 base64 编码字符串形式获取当前窗口的屏幕截图，在HTML界面输出截图时使用。
driver.get_screenshot_as_png()：以二进制数据形式获取当前窗口的屏幕截图。
driver.save_screenshot(filename/full_path)：获取截屏png图片，参数是文件名称，截屏必须是.png图片，如果只给文件名，截图会保存在项目的根目录下面。
driver.get_screenshot_as_file(filename/full_path)：获取截屏png图片，参数是文件的绝对路径，截屏必须是.png图片。如果只给文件名，截屏会存在项目的根目录下。

import time
from selenium import webdriver
from selenium.webdriver.common.by import By

def save_screenshot_demo():
    '''
    获取截屏png图片，参数是文件名称，截屏必须是.png图片， 如果只给文件名，截图会保存在项目的根目录下面。
    :return:
    '''
    try:
        browser.get('https://www.baidu.com')
        browser.find_element(By.LINK_TEXT, '新闻').click()
        time.sleep(3)
        browser.switch_to.window(browser.window_handles[-1])
        browser.save_screenshot('save_screenshot_demo.png')  # save_screenshot的图片数据必须以png结尾
    finally:
        time.sleep(3)
        browser.quit()

def get_screenshot_as_file_demo():
    '''
    获取截屏png图片，参数是文件的绝对路径，截屏必须是.png图片。如果只给文件名，截屏会存在项目的根目录下。
    :return:
    '''
    try:
        browser.get('https://www.baidu.com')
        browser.find_element(By.LINK_TEXT, '新闻').click()
        time.sleep(3)
        browser.switch_to.window(browser.window_handles[-1])
        browser.get_screenshot_as_file('get_screenshot_as_file_demo.png')  # get_screenshot_as_file的图片数据必须以png结尾
    finally:
        time.sleep(3)
        browser.quit()

def get_screenshot_as_base64_demo():
    '''
    以 base64 编码字符串形式获取当前窗口的屏幕截图，在HTML界面输出截图时使用。
    :return:
    '''
    try:
        browser.get('https://www.baidu.com')
        browser.find_element(By.LINK_TEXT, '新闻').click()
        time.sleep(3)
        browser.switch_to.window(browser.window_handles[-1])
        b64 = browser.get_screenshot_as_base64()
        print(b64)
    finally:
        time.sleep(3)
        browser.quit()

def get_screenshot_as_png_demo():
    '''
    以二进制数据形式获取当前窗口的屏幕截图。
    :return:
    '''
    try:
        browser.get('https://www.baidu.com')
        browser.find_element(By.LINK_TEXT, '新闻').click()
        time.sleep(3)
        browser.switch_to.window(browser.window_handles[-1])
        b_data = browser.get_screenshot_as_png()
        print(b_data)
    finally:
        time.sleep(3)
        browser.quit()

针对于元素而言

element.screenshot(save_file_path)：针对某一个元素进行截图，并报错到相对的路径文件

from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as ec
from selenium.webdriver.support.wait import WebDriverWait
import random


def selenium_screenshot(url, css_element: str, width=None, height=None, file_name=None):
    """
    快照截图(截图某个元素)
    :param url: url
    :param width:  窗口宽度
    :param height:
    :param css_element: css定位
    :return:
    """
    ua = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.107 Safari/537.36"
    driver = ""
    ip = ''
    # ip = "xxx.xxx.xxx.xxx"
    try:
        chrome_options = Options()
        chrome_options.add_argument('--headless')  # 无头模式
        chrome_options.add_argument('--disable-gpu')  # 禁用gpu
        chrome_options.add_argument('--no-sandbox')
        chrome_options.add_argument(f'user-agent={ua}')  # 添加UA
        if ip:
            chrome_options.add_argument(f'--proxy-server=http://{ip}:port"')
        driver = webdriver.Chrome(options=chrome_options)
        driver.maximize_window()
        if width:
            driver.set_window_size(width, height)
        driver.get(url)
        wait = WebDriverWait(driver, 10)
        wait.until(ec.presence_of_element_located((By.CSS_SELECTOR, css_element)))
        ele = driver.find_element(By.CSS_SELECTOR, css_element)
    except Exception as err:
        print(f"{url} selenium_screenshot false: {err} ")
        return
    else:
        if not file_name:
            file_name = random.random()
        save_file_path = f"{file_name}.png"
        ele.screenshot(save_file_path)
        print(f"selenium_screenshot success {url}")
        return save_file_path
    finally:
        if driver:
            driver.quit()

18、Selenium项目模板

这里给大家分享一个我自己常用的Selenium脚本执行的模板。

import time

from selenium.webdriver import Chrome, ChromeOptions
from selenium.webdriver.support.wait import WebDriverWait
from tenacity import retry, stop_after_attempt

TIME_OUT = 15  # wait最长等待时间

class Selenium_Chrome(object):
    def __init__(self):
        # 参数初始化
        self.chrome_path = r''  # 指定chrome版本浏览器存放的路径
        self.user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.107 Safari/537.36'

    @retry(
        stop=stop_after_attempt(3)  # 重启三次
    )
    def start_chrome(self):
        '''

        Chrome初始化配置对象
        :return:
        '''
        chrome_options = ChromeOptions()
        if self.chrome_path:  # 如果指定Chrome的版本，就设置这个
            chrome_options.binary_location = self.chrome_path
        # chrome_options.add_argument("--headless")  # 无界面运行
        chrome_options.add_argument('accept-language="zh-CN,en-US;q=0.8"')
        chrome_options.add_argument(f'''user-agent={self.user_agent}''')
        chrome_options.add_experimental_option('useAutomationExtension', False)
        chrome_options.add_experimental_option('excludeSwitches', ['enable-automation'])
        chrome_options.add_argument("--disable-blink-features=AutomationControlled")
        chrome_options.add_argument('--disable-gpu')  # 爬虫的时候，我们一般会选择禁用GPU，如果不禁用，访客GPU都相同，太容易判断了
        chrome_options.add_argument('--no-sandbox')
        chrome_options.add_argument("-incognito")  # 设置无痕模式

        # 创建Chrome对象
        self.browser = Chrome(options=chrome_options)

        # 进行简单的规避操作
        self.browser.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
            "source": """
            Object.defineProperty(navigator, 'webdriver', {
              get: () => undefined
            })
          """
        })
        self.browser.maximize_window()  # 将窗口最大化
        self.wait = WebDriverWait(self.browser, TIME_OUT)

    def end_chrome(self):
        """
        清除缓存并关闭chrome
        """
        time.sleep(3)
        self.browser.delete_all_cookies()
        self.browser.quit()

    def start(self):
        try:
            self.start_chrome()
            '''
                这里存放主程序的各种执行函数
            '''
            self.browser.get('https://www.baidu.com')
        finally:
            self.end_chrome()

if __name__ == '__main__':
    test = Selenium_Chrome()
    test.start()

总结

以上便是目前我在selenium中常用的方法以及知识汇总，其中可能还会有欠缺，如果实际操作中，有用到其他的案例，也会继续在这里进行添加。当然如果文章中有不对的地方，欢迎评论区留言进行指导，我会及时更改。在这里非常感谢开头的几篇优质文章作为参考。

你可能感兴趣的:(SpiderCrawl,python,selenium,chrome)

深度讨论Python for循环观智能 python 开发语言
作者的其他文章推荐：强化学习再受关注！for循环使用于遍历可迭代对象的Python语句，工作原理如下：#for循环foriteminiterable:print(item)#等价于iterator=iter(iterable)#获取迭代器whileTrue:try:item=next(iterator)#获取下一个元素print(item)exceptStopIteration:break#迭代结
Python第六章08：元组操作练习题苹果.Python.八宝粥 python 开发语言
#元组定义操作练习题"""定义一个元组，内容是：('周杰伦',11,['football','music'])，记录一个学生的信息（姓名、年龄、爱好）请通元组（tuple）的功能，对其进行如下操作：1.查询其年龄所在的下标位置2.查询学生的姓名3.删除学生爱好中的football4.增加爱好：coding"""my_tuple=('周杰伦',11,['football','music'])#1.查
Python第六章07：元组的定义和操作苹果.Python.八宝粥 python 前端开发语言
#tuple元组的定义和操作#tuple元组定义用小括号：(1,2,3,4,5),可以是不同类型元素#给变量定义元组时，写括号不写tuple：a=(1,2,3,4,5)#变量=（）变量=tuple（）空元组变量#tuple元组定义完成后，不可以修改，但是，如果元组中嵌套了一个列表时，元组中列表的内容可以修改#封装数据后，不希望被篡改数据，就使用元组tuple#1.定义一个元组t1=("halibo
利用Python爬虫获取Shopee（虾皮）商品详情：实战指南小爬虫程序猿 python 爬虫开发语言
在跨境电商领域，Shopee（虾皮）作为东南亚及台湾地区领先的电商平台，拥有海量的商品信息。无论是进行市场调研、数据分析，还是寻找热门商品，获取Shopee商品详情都是一项极具价值的任务。然而，手动浏览和整理这些信息显然是低效且容易出错的。幸运的是，通过编写Python爬虫程序，我们可以高效地完成这一任务。本文将详细介绍如何利用Python爬虫获取Shopee商品详情，并提供完整的代码示例。一、为
在Mac M1/M2芯片上完美安装DeepCTR库：避坑指南与实战验证 ku_code_ku 机器学习 macos 推荐算法推荐系统
让推荐算法在AppleSilicon上全速运行概述作为推荐系统领域的最经常用的明星库，DeepCTR集成了CTR预估、多任务学习等前沿模型实现。但在AppleSilicon架构的Mac设备上，安装过程常因ARM架构适配、依赖库版本冲突等问题受阻。本文通过20+次环境搭建实测，总结出最稳定的安装方案。关键版本说明（2024年验证）组件推荐版本注意事项Python3.10.x向下兼容至3.7，但3.1
数据库数值函数详解 web安全工具库数据库 oracle jvm
各类资料学习下载合集https://pan.quark.cn/s/8c91ccb5a474数值函数是数据库中用于处理数值数据的函数，可以用于执行各种数学运算、统计计算等。数值函数在数据分析及处理时非常重要，能够帮助我们进行数据的聚合、计算和转换。在本篇博客中，我们将详细介绍常用的数据库数值函数，并通过Python和SQLite进行示例，帮助您理解和应用这些函数。1.数值函数的基本概念数值函数是用于
Python中Requests的Cookies的简单使用北条苒茗殇 python 开发语言 Requests
概述Python的Requests库中有一个cookies，是用于管理HTTPCookie的工具，可以像字典一样操作Cookie，支持自动处理作用域（域名、路径）和持久化，cookies是一个RequestsCookieJar的类型。一、概念1.作用自动存储服务器返回的Cookie根据请求域名和路径进行自动发送匹配的Cookie支持手动添加、修改、删除Cookie2.RequestsCookieJ
Pytest基础使用北条苒茗殇 pytest
概述Pytest是Python里的一个强大的测试框架，灵活易用，可以进行功能，自动化测试使用，可以与Requests，Selenium等进行结合使用，同时可以生成Html的报告。一、Pytest的基本使用在未指定Pytest的配置文件时，会对以下文件进行执行：test_*.py，如：test_1.py*_test.py，如：1_test.py会对以下的类和函数进行执行：类：以Test_开头的类，如
Visual Studio Code官网下载地址及使用技巧（含常用的拓展插件推荐） ITCTCSDN vscode ide 编辑器
VisualStudioCode（简称“VSCode”）是Microsoft于2015年4月发布的可运行于MacOS、Windows和Linux之上的跨平台源代码编辑器，它具有对JavaScript，TypeScript和Node.js的内置支持，并具有丰富的其他语言（例如C++，C＃，Java，Python，PHP，Go）和运行时（例如.NET和Unity）扩展的生态系统。VisualStudi
python中rmdir和rmtree的用法 Gin387 python
shutil.rmtree()是Python中shutil模块提供的一个函数，用于递归删除整个目录树（包括子目录和所有文件）。os.rmdir()（只能删除空目录）不同，shutil.rmtree()可以强制删除非空目录importshutil#删除指定目录及其所有内容shutil.rmtree('path/to/directory')
构建 Python 插件架构：打造灵活可扩展的模块化应用全栈探索者chen python python 架构开发语言学习机器学习程序人生插件
构建Python插件架构：打造灵活可扩展的模块化应用前言在现代软件开发中，单一的代码库往往难以满足不断变化的业务需求和多样化的扩展场景。如何设计一个应用，使其既能保持核心功能的稳定，又能轻松集成第三方功能、模块或定制化扩展？答案就是——插件架构。通过插件架构，你可以让应用具备极高的灵活性，支持动态加载、无缝扩展以及解耦维护。本文将深入探讨如何在Python中设计和构建一个插件架构。从核心概念、模块
31天Python入门——第11天:挑战一口气把闭包·装饰器讲明白安然无虞 Python手把手教程 python 开发语言后端 pyqt
你好，我是安然无虞。文章目录1.闭包扩展知识:闭包的自由变量是如何存储的2.装饰器装饰器的应用场景3.补充练习1.闭包闭包是指在一个函数内部定义的函数，并且这个内部函数可以访问外部函数的变量、参数.换句话说，闭包是一个包含了函数及其相关引用环境的组合体.在Python中，当一个函数返回了内部函数的引用时，这个内部函数可以访问并操作外部函数的局部变量，它就创建了一个闭包,即使外部函数已经执行完毕，它
opencv python rgb转yuv_OpenCV之色彩空间与色彩空间转换 xiao fei opencv python rgb转yuv
python代码：importcv2ascvsrc=cv.imread("test.jpg")cv.namedWindow("rgb",cv.WINDOW_AUTOSIZE)cv.imshow("rgb",src)#RGBtoHSVhsv=cv.cvtColor(src,cv.COLOR_BGR2HSV)cv.imshow("hsv",hsv)#RGBtoYUVyuv=cv.cvtColor(sr
【AI大模型】搭建本地大模型GPT-NeoX：详细步骤及常见问题处理 qzw1210 gpt 人工智能深度学习
搭建本地大模型GPT-NeoX：详细步骤及常见问题处理GPT-NeoX是一个开源的大型语言模型框架，由EleutherAI开发，可用于训练和部署类似GPT-3的大型语言模型。本指南将详细介绍如何在本地环境中搭建GPT-NeoX，并解决过程中可能遇到的常见问题。1.系统要求1.1硬件要求1.2软件要求操作系统:Linux(推荐Ubuntu20.04或更高版本)CUDA:11.2或更高版本Python
python 列表倒序输出小琳爱分享 python python
python列表倒序输出#使用reverseli1=[1,6,4,3,7,9]li2=['a','m','s','g']li1.reverse()li2.reverse()print(li1,li2)#利用list切片li1=[1,6,4,3,7,9]li2=['a','m','s','g']print(li1[::-1])print(li2[::-1])#利用算法进行转换，这里需要用到深层cop
python怎么输出倒序 hakesashou python基础知识 python java 服务器
python怎么输出倒序？下面给大家介绍四种方法：创建测试列表>>> lst = [1,2,3,4,5,6]方法1：>>> lst.reverse() #reverse()反转>>> lst[6, 5, 4, 3, 2, 1]方法2：>>> lst1 = [i for i in reversed(lst)] #reversed只适用于与序列(列表、元组、字符串)>>> lst1[6, 5, 4,
chatgpt赋能python：Python怎么倒序列表 aijinglingchat ChatGpt python chatgpt 人工智能计算机
Python怎么倒序列表列表是Python中最常用的数据结构之一，但在实际使用时，有时需要将列表进行倒序排列。Python提供了多种方法来实现这个需求，本文将简要介绍这些方法以及它们的使用场景。方法1：使用reverse()函数使用列表的reverse()方法是Python中最简单直接的方法来倒序列表。该方法会将原列表倒置。lst=[1,2,3,4,5]lst.reverse()print(lst
“统计视角看世界”专栏阅读引导赛卡统计视角看世界信息可视化数据分析
根据文章主题和逻辑关系，我为您设计以下阅读引导方案：1.六西格玛基础2.帕累托图3.直方图4.散点图基础5.散点图高阶6.多变量可视化7.密度图进阶8.回归分析配套文字说明：入门基石（必读）《1.六西格玛遇上Python》→方法论总纲，建议优先精读基础三剑客（可并行）├─《2.帕累托图》→重点数据排序与决策├─《3.直方图》→数据分布核心工具└─《4.散点图》→数据探索第一视角高阶应用链（递进学习
自定义mavlink 生成wireshark wlua插件错误（已解决） JasonComing 问题收集 wireshark wlua mavlink
进入正题python3-mpymavlink.tools.mavgen--lang=WLua--wire-protocol=2.0--output=output/developmessage_definitions/v1.0/development.xml编译WLUA的时候遇到一些问题1.ERROR:SCHEMASV:SCHEMAV_CVC_ENUMERATION_VALID3765:0:ERRO
吐血整理 python最全习题100道（含答案）持续更新题目，建议收藏！ Bejpse 面试学习路线阿里巴巴 python 开发语言 pycharm redis java-ee
最近为了提升python水平，在网上找到了python习题，然后根据自己对于python的掌握，整理出来了答案，如果小伙伴们有更好的实现方式，可以下面留言大家一起讨论哦~已知一个字符串为“hello_world_yoyo”,如何得到一个队列[“hello”,”world”,”yoyo”]test=‘hello_world_yoyo’使用split函数，分割字符串，并且将数据转换成列表类型print
2024年第五届MathorCup数学应用挑战赛--大数据竞赛思路、代码更新中..... 宇哥预测优化代码学习 1024程序员节
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️研赛及概况一、竞赛背景与目的二、组织机构与参赛对象三、竞赛时间与流程四、竞赛要求与规则五、奖项设置与奖励六、研究文档撰写建议七、参考资料与资源1找程序网站推荐2公式编辑器、流程图、论文排版324年研赛资源下载4思路、Python、Matlab代码分享......⛳
2024MathorCup数学建模之——MathorCup奖杯”获得者经验思路分享美赛数学建模数学建模
一、经验分享1.工具选择：顺手即可。Matlab和Python都是比较主流的选择，二者的应用场合各有不同。Python在数据分析、深度学习方面的优势愈发明显，而Matlab更适合进行物理仿真和数值计算。不过随着Python社区不断发展，其功能也愈发全面与强大，因此我们比较推荐学有余力的情况下可以更早接触Python。2.模型算法：多多益善。不一定要精通所有的算法，但是手上至少要准备一些常用的算法（
Python 用户账户(创建用户账户) 钢铁男儿 Python 从入门到精通 python sqlite 数据库
Web应用程序的核心是让任何用户都能够注册账户并能够使用它，不管用户身处何方。在本章中，你将创建一些表单，让用户能够添加主题和条目，以及编辑既有的条目。你还将学习Django如何防范对基于表单的网页发起的常见攻击，这让你无需花太多时间考虑确保应用程序安全的问题。然后，我们将实现一个用户身份验证系统。你将创建一个注册页面，供用户创建账户，并让有些页面只能供已登录的用户访问。接下来，我们将修改一些视图
使用欧拉法数值求解微分方程的 Python 实现神经网络15044 python 深度学习算法 python 开发语言
编写函数y=Eular(x,h)，使用欧拉法数值求解微分方程初值为函数Eular(x,h)中Cx为计算结束时微分方程x的值，h为计算步长再编写脚本，通过调用函数分别以不同步长(例如h=1.0，h=0.5，h=0.25)计算y(3)，并分析步长和误差之间的关系。以下是使用欧拉法数值求解微分方程的Python实现。假设我们要求解的微分方程是dydx=f(x,y)\frac{dy}{dx}=f(x,y)
使用AirtableLoader轻松加载数据到Python bavDHAUO python 开发语言
在现代软件开发中，数据的管理与使用非常关键。Airtable作为一种灵活的数据库应用，提供了简便且强大的数据处理方式。而通过使用AirtableLoader这种工具，可以轻松地将Airtable中的数据加载到Python项目中进行处理。技术背景介绍Airtable是一款集电子表格和数据库功能于一体的工具，它以其简单易用、强大的扩展性而受到众多开发者的喜爱。AirtableLoader是一个文档加载
【Python工具】Jupyter Notebook常用快捷键清平乐的技术博客 Python高级应用由浅入深学Python jupyter ide python
1.JupyterNotebook的启动与停止环境为Windows10系统首先win+R进入命令提示符cmd，用cd命令切换到工作目录，键入命令jupyternotebook2.JupyterNotebook常用快捷键2.1模式切换当前cell侧边为蓝色时，表示此时为命令模式，按Enter切换为编辑模式当前cell侧边为绿色时，表示此时为编辑模式，按Esc切换为命令模式2.2命令模式快捷键H：显示
Pytorch深度学习教程_9_nn模块构建神经网络 tRNA做科研深度学习保姆教程深度学习 pytorch 神经网络
欢迎来到《深度学习保姆教程》系列的第九篇！在前面的几篇中，我们已经介绍了Python、numpy及pytorch的基本使用，进行了梯度及神经网络的实践并学习了激活函数和激活函数，在上一个教程中我们学习了优化算法。今天，我们将开始使用pytorch构建我们自己的神经网络。欢迎订阅专栏进行系统学习：深度学习保姆教程_tRNA做科研的博客-CSDN博客目录1.理解nn模块：(1)使用nn.Sequent
Python 单例模式的 5 种实现方式：深入解析与最佳实践做测试的小薄测试高阶 python 单例模式自动化测试测试框架
单例模式（SingletonPattern）是一种经典的设计模式，其核心思想是确保一个类在整个程序运行期间只有一个实例，并提供一个全局访问点。这种模式在许多场景中非常有用，例如全局配置管理、日志记录器、数据库连接池等。然而，Python的灵活性使得实现单例模式有多种方式，每种方法都有其特点和适用场景。本文将详细介绍Python中实现单例模式的5种常见方法，并深入分析它们的优缺点以及适用场景，帮助您
Python 爬虫实战：舞台剧与演出信息获取西攻城狮北 python 爬虫开发语言
作为一名对文化艺术活动和数据获取感兴趣的内容创作者，我决定利用Python爬虫技术抓取舞台剧与演出信息。这对于文艺爱好者、文化活动组织者以及相关研究人员来说，是一个极具价值的探索。一、项目背景舞台剧和各类演出活动丰富了人们的精神文化生活。许多城市都有专业的演出场馆，如国家大剧院、上海大剧院等，它们会定期发布演出信息。通过爬虫技术，我们可以自动化地获取这些演出信息，方便用户查询和分析。二、技术选型在
LeetCode剑指offer题目记录4 t.y.Tang LeetCode记录 leetcode python 矩阵
leetcode刷题开始啦,每天记录几道题.目录剑指offer07.重建二叉树题目描述示例思路python改进剑指offer09.用两个栈实现队列题目描述示例思路python剑指offer10-1.斐波那契数列题目描述思路pythonC++剑指offer10-2.青蛙跳台阶问题问题描述思路C++剑指offer07.重建二叉树题目描述输入某二叉树的前序遍历和中序遍历的结果，请构建该二叉树并返回其根节
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。