Long_poem

【第四天】零基础入门刷题Python-Selenium-自动化测试-打开百度的首页搜索B站然后打开B站-切换B站窗口在B站搜索框中搜索Selenium-复习XPATH详细语法

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

文章目录

前言
一、先复习昨天的XPATH语法，然后学习怎么切换窗口
二、详细代码
- 1.对本节代码XPath表达式的解释
- 2.在百度的首页上搜索B站后打开B站-在B站搜索框中搜索Selenium
- 3.对切换窗口的详细介绍
- 4.对上方的两个模块的详细介绍
总结

前言

提示：这里可以添加本文要记录的大概内容：

第零天练习补充零基础入门刷题Python-Selenium-自动化测试-搭建WebDriver驱动-以及下载驱动的地址
第一天练习打开Firefox浏览器实例和打开Chrome浏览器实例-进入百度的首页
第二天练习用Chrome浏览器实例-在百度的首页上搜索B站
第三天练习用Chrome浏览器实例-在百度的首页上搜索B站-利用XPATH打开B站-注意：（~~从现在开始以后零基础入门刷题Python-Selenium-自动化测试都会用XPATH的方法来使用~~ ）
第四天练习用Chrome浏览器实例-在百度的首页上搜索B站后打开B站-在B站搜索框中搜索Selenium

提示：以下是本篇文章正文内容，下面案例可供参考

一、先复习昨天的XPATH语法，然后学习怎么切换窗口

	XPATH详细语法：
	一、基本路径表达式：
/	表示从根节点开始选择元素，是绝对路径的起始。例如，/html/body/div 表示从 HTML 文档的根节点（html）开始，选择 body下的div元素。
//	表示在整个文档中查找元素，不考虑其位置，是相对路径。
	二、节点选择：
*	匹配任何元素节点。例如，//* 会匹配文档中的所有元素节点。
element	根据元素名称选择节点。例如，//p 会查找所有的 p元素。
	三、根据属性选择节点：
[@attribute=‘value’]	根据元素的属性及其值选择节点。例如，//input[@type=‘text’] 会查找所有 type 属性值为 text 的 input元素。
[@attribute]	选择具有指定属性的节点，不考虑属性值。例如，//div[@class] 会查找所有具有 class 属性的 div元素。
	四、根据位置选择节点：
[position()]	根据元素的位置选择节点。例如，//li[position()=2] 会选择文档中的第二个 li 元素。
[last()]	选择最后一个元素。例如，//li[last()] 会选择最后一个 li 元素。
[position()< 3]	选择最后一个元素。例如，//li[last()] 会选择最后一个 li 元素。
	五、轴（Axes）：
child::	选择当前节点的子节点。例如，child::div 会选择当前节点的所有 div 子节点。
descendant::	选择当前节点的后代节点（包括子节点、孙节点等）。例如，descendant::p 会选择当前节点的所有 p 后代节点。
ancestor::	选择当前节点的祖先节点。例如，ancestor::div 会选择当前节点的所有 div 祖先节点。
following-sibling::	选择当前节点之后的兄弟节点。例如，following-sibling::p 会选择当前节点后面的所有 p 兄弟节点。
preceding-sibling::	选择当前节点之前的兄弟节点。例如，preceding-sibling::p 会选择当前节点前面的所有 p 兄弟节点。
	六、文本选择：
text()	选择元素的文本内容。例如，//p/text() 会选择所有 p 元素的文本内容。
	七、组合选择：
I（竖线）	可用于组合多个路径表达式。例如，//div[@class=‘header’] I（竖线） //div[@class=‘footer’] 会选择 class 属性为 header 的 div 元素和 class 属性为 footer 的 div 元素。
	八、函数使用：
contains()	用于检查元素的属性是否包含指定的字符串。例如，//div[contains(@class,‘container’)] 会查找 class 属性中包含 container 的 div 元素。
starts-with()	检查元素的属性是否以指定字符串开始。例如，//div[starts-with(@id,‘section’)] 会查找 id 属性以 section 开始的 div 元素。

from selenium.webdriver.support import expected_conditions as EC：

selenium.webdriver.support 是 Selenium 库中的一个模块，提供了各种支持自动化测试的工具和类。

expected_conditions是该模块中的一个子模块，包含了一系列预定义的条件，这
些条件用于在自动化测试中检查元素或页面是否达到了预期的状态。

as EC 是Python 的别名语法，将 expected_conditions 简称为 EC，方便在代码中使用，使代码更加简洁。

from selenium.webdriver.support.wait import WebDriverWait：

selenium.webdriver.support.wait 是 Selenium 库中的一个模块，包含 WebDriverWait
类，用于实现智能等待功能。

~~！！！上面两个模块在本节代码的使用介绍在本文的代码末尾处详细解释！！！~~

二、详细代码

1.对本节代码XPath表达式的解释

通过XPATH定位属性id的方法在百度的首页上搜索B站（示例）：

对XPath表达式 '//div[@id="content_left"]//a[contains(text(), "哔哩哔哩")]' 的详细解释：
1.//：
	这对双斜杠表示选择文档中的节点时，不考虑它们位于当前节点（在XPath的上下文中，这通常是从根节点或某个指定的起始节点开始）的什么层级。换句话说，它会搜索整个文档树，查找匹配的节点，而不仅仅是直接子节点。
2.div[@id="content_left"]：
	这部分指定了要查找的div元素，它必须有一个id属性，且该属性的值为"content_left"。@id="content_left"是一个条件（谓语），它指定了div元素必须满足的属性值。
3.//a：
	在找到了满足条件的div元素之后，这部分表示从该div元素开始，搜索其内部（包括所有子元素，无论层级多深）的所有a（锚点/链接）元素。
4.[contains(text(), "哔哩哔哩")]：
	这是另一个条件（谓语），它应用于前面找到的a元素。contains(text(), "哔哩哔哩")是个函数，它检查a元素的文本内容是否包含字符串"哔哩哔哩"。text()是一个函数，它返回元素的文本内容（不包括任何子元素的文本）。因此，这个条件会筛选出所有文本内容包含“哔哩哔哩”的a元素。综上所述，这个XPath表达式会查找整个文档中，位于ID为content_left的div元素内部（无论层级多深）的所有a元素，这些a元素的文本内容必须包含“哔哩哔哩”。

在实际应用中，这个表达式通常用于Selenium WebDriver等自动化测试工具中，以定位并操作网页上的特定元素。

2.在百度的首页上搜索B站后打开B站-在B站搜索框中搜索Selenium

代码如下（示例）：

# 导入 Selenium WebDriver 的 Chrome 浏览器驱动模块
# 导入 Selenium 的 expected_conditions 模块，并将其重命名为 EC，用于定义等待元素时的预期条件
from selenium.webdriver.support import expected_conditions as EC
# 导入 WebDriverWait 类，用于实现智能等待，等待元素满足预期条件
from selenium.webdriver.support.wait import WebDriverWait
from selenium import webdriver
# 导入用于元素定位的 By 类
from selenium.webdriver.common.by import By
# 导入 time 模块用于暂停执行
import time

# 创建一个 Chrome 浏览器的实例
# 这里假设 chromedriver 已正确配置在系统 PATH 中，或者提供了 chromedriver 的路径
driver = webdriver.Chrome()
# 创建一个 Chrome 浏览器的 WebDriver 对象，以便后续操作浏览器，如打开网页、查找元素、执行操作等


# 使用 driver 对象打开百度首页的 URL
driver.get('https://www.baidu.com')
# 让浏览器打开百度的首页，使用 get 方法加载百度的网址


# 使用 find_element 方法通过 XPATH 定位百度搜索框
# XPATH 表达式 '//input[@id="kw"]' 用于选择 ID 为 "kw" 的 input 元素，即搜索框
search_box = driver.find_element(By.XPATH, '//input[@id="kw"]')
# 通过 XPATH 表达式查找百度搜索框元素，使用 find_element 方法结合 By.XPATH 定位方式，根据提供的 XPATH 表达式找到对应的元素，并将其存储在 search_box 变量中


# 在搜索框中输入搜索关键词“B站”
search_box.send_keys('B站')
# 在找到的搜索框元素（search_box）中输入搜索关键词 "B站"，使用 send_keys 方法模拟键盘输入操作


# 提交搜索，这通常是通过点击搜索框旁边的搜索按钮或通过按下回车键来实现的
# 但由于我们已经通过 send_keys 输入了关键词，并且搜索框通常具有搜索功能，
# 因此调用 submit() 方法将触发搜索
search_box.submit()
# 调用搜索框元素的 submit 方法提交搜索，相当于点击搜索按钮或按下回车键进行搜索操作


# 等待搜索结果页面加载
# 这里使用简单的 time.sleep() 方法暂停执行 3 秒
# 在实际项目中，为了提高效率和可靠性，推荐使用 WebDriverWait 等更精确的等待方式
time.sleep(3)
# 调用 time 模块的 sleep 方法，暂停程序执行 3 秒，目的是等待百度搜索结果页面加载完成，但这种等待方式不够灵活，可能会导致等待时间过长或过短


# 查找搜索结果中第一个包含 "哔哩哔哩" 文本的元素
# 使用 find_elements 方法返回所有匹配的元素列表
# XPATH 表达式 '//div[@id="content_left"]//a[contains(text(), "哔哩哔哩")]' 用于在 ID 为 "content_left" 的 div 内
# 查找所有 a 元素，这些元素的文本内容包含 "哔哩哔哩"
results = driver.find_elements(By.XPATH, '//div[@id="content_left"]//a[contains(text(), "哔哩哔哩")]')
# 使用 find_elements 方法结合 By.XPATH 定位方式，根据提供的 XPATH 表达式查找搜索结果中所有包含 "哔哩哔哩" 文本的元素，并将结果存储在 results 列表中


# 如果找到了至少一个匹配项，则点击第一个元素
if results:
    results[0].click()
# 检查 results 列表是否不为空，如果不为空，点击列表中的第一个元素，通常用于跳转到第一个匹配的搜索结果页面


# 在实际自动化测试中，通常不需要这样的延迟，除非有特定的需求
time.sleep(5)
# 再次调用 time 模块的 sleep 方法，暂停程序执行 5 秒，可能是为了等待某些元素加载完成或进行一些其他操作，根据具体需求而定


# 获取所有打开的窗口句柄
window_handles = driver.window_handles
# 使用 window_handles 属性获取当前打开的所有窗口的句柄列表，句柄可以用来唯一标识不同的窗口


# 假设我们要切换到新打开的窗口，这里假设是最后一个打开的窗口
handle = window_handles[-1]
# 从窗口句柄列表中选取最后一个元素作为要切换的窗口句柄，存储在 handle 变量中，假设新打开的窗口是最后一个


# 切换到新打开的窗口
driver.switch_to.window(handle)
# 使用 switch_to.window 方法，将浏览器的焦点切换到 handle 所代表的窗口，即切换到新打开的窗口


# 查找搜索框元素，使用智能等待
# 使用 By.CLASS_NAME 定位元素
search_bilibili = WebDriverWait(driver, 30).until(
    EC.presence_of_element_located((By.XPATH, '//input[@class="nav-search-input"]'))
)
# 使用 WebDriverWait 类结合 expected_conditions 模块的 presence_of_element_located 条件，等待 30 秒，直到找到具有 class 为 nav-search-input 的元素出现，找到后存储在 search_bilibili 变量中


# 在搜索框中输入搜索关键词 “Selenium”
search_bilibili.send_keys('Selenium')
# 在找到的搜索框元素（search_bilibili）中输入 "Selenium" 作为新的搜索关键词，使用 send_keys 方法模拟键盘输入操作


# 提交搜索框中的内容
search_bilibili.submit()
# 调用搜索框元素（search_bilibili）的 submit 方法提交搜索，开始新的搜索操作


time.sleep(5)
# 调用 time 模块的 sleep 方法，暂停程序执行 5 秒，可能是为了等待搜索结果页面加载或进行一些其他操作


# 打印当前浏览器窗口的标题
print(driver.title)
# 使用 print 函数输出当前浏览器窗口的标题，可用于验证操作是否成功或检查当前页面是否符合预期


# 关闭浏览器
driver.quit()
# 调用 driver 的 quit 方法关闭浏览器，释放资源，结束程序运行

3.对切换窗口的详细介绍

window_handles = driver.window_handles：

driver.window_handles：这是 Selenium 的 WebDriver 对象（这里是
driver）的一个属性，它返回一个列表，其中包含了当前浏览器会话中所有打开窗口的句柄。窗口句柄是一个唯一的标识符，用于区分不同的浏览器窗口或标签页。

window_handles：将这个句柄列表存储在 window_handles 变量中，以便后续操作。

handle = window_handles[-1]：

window_handles[-1]：通过列表的索引操作，这里使用 [-1]
表示选择列表中的最后一个元素。在多窗口操作的情况下，这通常是最新打开的窗口或标签页的句柄。

handle：将最后一个窗口句柄存储在 handle 变量中，方便后续使用。

driver.switch_to.window(handle)：

driver.switch_to.window(handle)：这是 WebDriver
对象的一个方法，它允许你将浏览器的焦点切换到指定的窗口或标签页。这里的 handle
是之前获取的窗口句柄，调用该方法后，后续的操作将在该窗口中执行，而不是在原始窗口。

4.对上方的两个模块的详细介绍

# 查找搜索框元素，使用智能等待
# 使用 By.CLASS_NAME 定位元素
search_bilibili = WebDriverWait(driver, 30).until(
    EC.presence_of_element_located((By.XPATH, '//input[@class="nav-search-input"]'))
)
# 使用 WebDriverWait 类结合 expected_conditions 模块的 presence_of_element_located 条件，等待 30 秒，直到找到具有 class 为 nav-search-input 的元素出现，找到后存储在 search_bilibili 变量中
)

WebDriverWait(driver, 30)：

WebDriverWait 是 Selenium 提供的一个等待类，用于实现智能等待功能。

driver：是一个已经初始化的 WebDriver 实例，例如
webdriver.Chrome()，代表了一个浏览器会话，用于控制浏览器的操作，如打开页面、查找元素等。

30：表示等待的最长时间，单位为秒。这意味着程序将等待最多 30 秒，以满足后续指定的条件。

EC.presence_of_element_located((By.XPATH, ‘//input[@class=“nav-search-input”]’))：

EC 是 expected_conditions 的别名，是 selenium.webdriver.support
模块中的一个子模块，提供了一系列预定义的等待条件，用于判断元素或页面是否达到某种期望状态。

presence_of_element_located：是 EC 中的一个等待条件方法，用于检查元素是否存在于 DOM
中，但不要求元素可见或可交互。

(By.XPATH, ‘//input[@class=“nav-search-input”]’)：是一个定位器元组，其中： By.XPATH：表示使用 XPATH 来定位元素。 ‘//input[@class=“nav-search-input”]’：是一个
XPATH 表达式，用于定位元素。在这个例子中，它的作用是查找具有 class 属性值为 nav-search-input 的 input
元素。这个 XPATH 表达式会在整个 HTML 文档中搜索满足条件的元素。

until 方法：

until 是 WebDriverWait 类的一个方法，它接收一个条件作为参数（这里是
EC.presence_of_element_located((By.XPATH,
‘//input[@class=“nav-search-input”]’)）。

该方法会在指定的等待时间内（这里是 30 秒）不断地检查条件是否满足。

一旦条件满足（即找到 class 为 nav-search-input 的 input 元素），until 方法将返回该元素，存储在 search_bilibili 变量中。

如果在 30 秒内条件未满足，将抛出 TimeoutException，表示等待超时。

常见使用场景：页面元素加载等待：

在自动化测试或网页自动化任务中，页面加载速度可能会因网络状况、服务器响应时间等因素而有所不同。使用这种智能等待方式可以确保在操作元素之前，元素已经加载到页面的 DOM 中，避免因元素尚未加载而导致的 NoSuchElementException 错误。

例如，当你打开一个网页并需要操作一个搜索框时，你可以使用这个等待条件确保搜索框元素已经存在于页面的 DOM 中，然后再进行输入或点击操作。

总结

提示：这里对文章进行总结：
例如：以上就是今天要讲的内容，本文复习了XPATH语法是什么，介绍了对切换窗口的详细介绍和from selenium.webdriver.support import expected_conditions as EC：和from selenium.webdriver.support.wait import WebDriverWait两个模块的使用。

Python绘制汽车（完整代码） Want595 Python趣味编程 python 开发语言
系列专栏《Python趣味编程》《C/C++趣味编程》《HTML趣味编程》《Java趣味编程》写在前面Python绘制一辆小汽车的完整代码。技术需求Turtle库基本操作：画笔控制：通过
Python绘制房子（完整代码） Want595 Python趣味编程 python 开发语言
系列专栏《Python趣味编程》《C/C++趣味编程》《HTML趣味编程》《Java趣味编程》写在前面Python绘制一间小房子的完整代码。技术需求1.turtle模块的使用画笔创建和控制：通过turtle.Turtle()创建画笔对象，使用penup()和
Python绘制气球（完整代码） Want595 Python趣味编程 python
系列专栏《Python趣味编程》《C/C++趣味编程》《HTML趣味编程》《Java趣味编程》写在前面Python绘制一个红色气球的完整代码。技术需求编程语言：Python3.x依赖库：Turtle库（标准库，无
Python五环图（完整代码） Want595 Python趣味编程 python turtle
系列专栏《Python趣味编程》《C/C++趣味编程》《HTML趣味编程》《Java趣味编程》写在前面Python绘制蓝、黑、红、黄、绿五环图的完整代码。技术需求1.Turtle模块基础功能窗口设置：<
Python教师信息管理系统（完整代码） Want595 Python趣味编程算法 python
目录写在前面技术需求完整代码下载代码代码分析一、类的设计与功能1.__init__方法2.add方法3.delete方法4.update方法5.search方法二、程序的主要流程1.输入与输出2.异常处理3.用户操作的逻辑三、代码的优化1.输入数据的验证2.数据存储3.提示信息的增强4.功能扩展四、总结系列文章写在后面写在前面Python语言实现教师信息管理系统的完整代码。技术需求面向对象编程(O
Python学生信息管理系统（完整代码） Want595 Python趣味编程 python 开发语言
目录写在前面技术需求完整代码下载代码代码分析1.类与对象的设计2.学生信息管理功能2.1添加学生信息2.2删除学生信息2.3修改学生信息2.4查询学生信息2.5按学号排序3.用户交互部分3.1菜单系统3.2用户输入处理3.3根据用户选择执行操作4.异常处理与程序健壮性5.总结系列文章写在后面写在前面Python语言实现学生信息管理系统的完整代码。技术需求类和对象：使用了StudentManager
python函数一：函数的概念、函数定义与调用、函数的参数、函数的返回值、说明文档以及函数的嵌套调用 @听风吟 Python python 开发语言数据库大数据
文章目录1.函数介绍1.1函数的概念1.2函数定义与调用1.2函数的参数1.3函数的返回值1.4说明文档2.函数的嵌套调用2.1嵌套调用及执行流程2.2嵌套调用的应用1.函数介绍1.1函数的概念什么是函数？函数:是一个被命名的、独立的、完成特定功能的代码段，其可能给调用它的程序一个返回值。通俗的说函数就是把一段可以实现某种功能的代码封装起来,想要使用这个功能就可以直接调用函数。被命名的：在Pyth
如何用Python训练一个AI模型（超详细教程）非常详细收藏我这一篇就够了！程序员二飞人工智能架构算法制造自然语言处理
引言人工智能（AI）——一个熟悉又神秘的词汇。我们常听说它可以生成诗歌、编写代码、创作艺术，甚至回答各种问题。然而，当你想亲手实现一个“AI模型”时，却可能感到无从下手。这篇教程正是为你准备的，将带你从零开始，逐步掌握从“AI新手”到“能够搭建AI模型”的核心技能。前排提示，文末有大模型AGI-CSDN独家资料包哦！一、AI的基本概念1.什么是AI模型？AI模型是通过训练得到的一种程序，能够利用海
在Python中实现多线程与多进程的任务并发：实用指南清水白石008 python Python题库 python java jvm
在Python中实现多线程与多进程的任务并发：实用指南在现代计算中，任务并发是提高程序性能和响应速度的重要手段。Python提供了多线程和多进程两种方式来实现并发处理。本文将详细介绍如何在Python中实现多线程和多进程的任务并发，包括基本概念、使用场景、示例代码以及最佳实践。一、基本概念1.线程与进程线程：线程是进程中的一个执行单元，多个线程共享同一进程的内存空间。线程的创建和销毁开销较小，适合
Python生态系统中拥有丰富的第三方库 ___Y1 python python
Python生态系统中拥有丰富的第三方库，这些库覆盖了几乎所有领域，包括科学计算、数据分析、机器学习、人工智能、Web开发等。这些库的存在极大地丰富了Python的功能，使其成为一门强大而灵活的编程语言。以下是一些常用的Python第三方库：1.**科学计算与数据处理：**-**NumPy：**提供高性能的多维数组对象，以及相关工具，用于处理这些数组。-**Pandas：**提供数据结构和数据分析
【ChatBI】text2sql-不需要访问数据表-超轻量Python库Vanna快速上手，对接oneapi 机器玄学实践者 oneapi vanna chatbi dbgpt nl2sql
oneapi准备首先确保你有oneapi，然后申请kimi的api需要去MoonshotAI-开放平台然后添加一个apikey然后打开oneapi的渠道界面，添加kimi。然后点击测试，如果能生成响应时间，就是配置正确。然后创建令牌http://xxx:3000/token,模型名是moonshot-v1-8k然后复制token，token是sk开头的一串密码。其他平台接入也是类似操作，不懂的读者
人工智能 Python ZSup{A} 人工智能 java 前端服务器
人工智能Python（一）一．基本语法1.在python中严格区分大小写2.Python中的每一行就是一条语句，每条语句以换行结束3.Python每一行语句不要过长（规范中建议每行不要超过80个字符）“rulers”:[80]4.一条语句可以分多行编写，语句后面以\结尾5.Python是缩进严格的语言，所以在Python中不要随便写缩进6.在Python使用#表示注释，#后面的内容都属于注释，注释
DTD 验证 kekexi1i 前端 ui javascript
使用InternetExplorer可根据某个DTD来验证您的XML。通过XML解析器进行验证当您试图打开某个XML文档时，XML解析器有可能会产生错误。通过访问parseError对象，就可以取回引起错误的确切代码、文本甚至所在的行。注意：load()方法用于文件，而loadXML()方法用于字符串。实例varxmlDoc=newActiveXObject("Microsoft.XMLDOM")
【人工智能】Python常用库-PyTorch常用方法教程 IT古董人工智能机器学习 Python 人工智能 python pytorch 机器学习
PyTorch是一个强大的开源深度学习框架，以其灵活性和动态计算图而广受欢迎。以下是PyTorch的详细教程，涵盖从基础到实际应用的使用方法。1.安装与导入1.1安装PyTorch访问PyTorch官方网站，根据系统、Python版本和CUDA支持选择安装命令。常用安装命令：pipinstalltorchtorchvisiontorchaudio1.2导入库importtorchimporttor
【人工智能】Python常用库-TensorFlow常用方法教程 IT古董人工智能机器学习 Python 人工智能 python tensorflow 机器学习
TensorFlow是一个广泛应用的开源深度学习框架，支持多种机器学习任务，如深度学习、神经网络、强化学习等。以下是TensorFlow的详细教程，涵盖基础使用方法和示例代码。1.安装与导入安装TensorFlow：pipinstalltensorflow导入TensorFlow：importtensorflowastfimportnumpyasnp验证安装：print(tf.__version_
【人工智能】Python常用库-Matplotlib常用方法教程 IT古董人工智能机器学习 Python 人工智能 python matplotlib
Matplotlib是一个强大的Python数据可视化库，用于绘制各种图形。以下是Matplotlib常用方法的详细说明及示例，帮助你快速上手。1.安装和导入Matplotlib安装Matplotlib：pipinstallmatplotlib导入Matplotlib：importmatplotlib.pyplotasplt2.基本绘图绘制简单折线图importmatplotlib.pyplota
gradle和maven的区别以及怎么选择使用它们爱掉发的小龙 maven android java 开发语言 windows 学习
目录区别1.配置方式2.依赖管理3.构建性能4.灵活性和扩展性5.多项目构建如何选择使用选择Maven的场景选择Gradle的场景区别1.配置方式Maven：使用基于XML的pom.xml文件进行配置。所有的项目信息、依赖管理、构建插件等都在这个文件中定义。这种方式结构固定，配置相对简单，但对于复杂的构建需求，XML文件可能会变得冗长且难以维护。示例：4.0.0com.examplemy-proj
python 命名实体识别_Python NLTK学习11（命名实体识别和关系抽取） weixin_39630762 python 命名实体识别
PythonNLTK学习11(命名实体识别和关系抽取)发表于:2017年7月27日阅读:18262除特别注明外，本站所有文章均为小杰Code原创本系列博客为学习《用Python进行自然语言处理》一书的学习笔记。命名实体识别命名实体识别(NER)系统的目标是识别所有文字提及的命名实体。可以分解成两个子任务：确定NE的边界和确定其类型。命名实体识别非常适用于基于分类器类型的方法来处理的任务。NLTK有
python断点调试出现问题_python的断点调试 weixin_39689870 python断点调试出现问题
在Python中也可以像gcc/gdb那样调试程序，只要在运行Python程序时引入pdb模块（假设要调试的程序名为d.py）：1$vid.py12345678#!/usr/bin/pythondefmain():i,sum=1,0foriinxrange(100):sum=sum+iprintsumif__name__=='__main__':main()1$python-mpdbd.py运行上
python命名实体识别工具,斯坦福大学使用NLTK命名实体识别器（NER）功能宇宙探索未解之迷 python命名实体识别工具
Isthispossible:toget(similarto)StanfordNamedEntityRecognizerfunctionalityusingjustNLTK?Isthereanyexample?Inparticular,IaminterestedinextractionLOCATIONpartoftext.Forexample,fromtextThemeetingwillbehel
python做个游戏辅助_8个用于辅助项目的出色Python库 cumj63710 数据库 python java 大数据编程语言
python做个游戏辅助在Python/Django世界中我们有一句俗语：我们是为语言而来的，而是为社区而留下的。对我们大多数人来说都是如此，但是让我们留在Python世界中的另一件事是，有了一个想法并在午餐或晚上几个小时内快速地解决它是多么容易。本月，我们将深入研究我们喜欢用来快速擦除那些附带项目或午餐时间痒的Python库。即时将数据保存在数据库中：数据集当我们快速想要收集数据并将其保存到数据
用Python做一个绝地求生压枪版程序媛了了 python 开发语言
一、概述1.1效果总的来说，这种方式是通过图像识别来完成的，不侵入游戏，不读取内存，安全不被检测。1.2前置知识游戏中有各种不同的枪械，不同的枪械后坐力不一样，射速也不同。相同的枪械，装上不同的配件后，后坐力也会发生变化。枪械的y轴上移是固定的，x轴是随机的，因此我们程序只移动鼠标y轴。x轴游戏中手动操作。1.3实现原理简述通过python中的pynput模块监听键盘鼠标。监听鼠标左键按下，这个时
Python开发FastAPI从入门到精通赵梓宇 Python权威教程合集 fastapi python 前端
想用Python写API快到飞起？FastAPI就是你的“代码瑞士军刀”！这本书不讲玄学，只教真功夫——从零搭建高性能API，到微服务、分布式事务、熔断限流，连异步编程都能玩成魔法！小白也能变大神：路由、依赖注入、数据库集成手把手教学；老鸟直呼内行：服务网格、Saga模式、K8s部署实战全覆盖。附赠三个硬核项目：任务管理、在线商城、实时聊天系统，代码跑起来比老裁缝织毛衣还丝滑！别说我没提醒你：翻开
NLTK命名实体识别（NER） Mr数据杨 Python 自然语言技术 NLTK 自然语言处理 1024程序员节
命名实体识别（NamedEntityRecognition,NER）是自然语言处理（NLP）中的一项核心技术，旨在从文本中识别出具有特定意义的实体，如人名、地名、组织名等。通过对文本的自动化处理，NER能够帮助计算机理解和组织大量的非结构化数据，为信息抽取、搜索引擎优化、数据分析等领域提供强有力的技术支持。NLTK（NaturalLanguageToolkit）是一个广泛使用的Python库，提供
【算法】经典博弈论问题——威佐夫博弈 python 查理零世算法 python 开发语言
目录威佐夫博弈(WythoffGame)【模板】威佐夫博弈(WythoffGame)有两堆石子，数量任意，可以不同，游戏开始由两个人轮流取石子游戏规定，每次有两种不同的取法1)在任意的一堆中取走任意多的石子2)可以在两堆中同时取走相同数量的石子最后把石子全部取完者为胜者现在给出初始的两堆石子的数目，返回先手能不能获胜结论：小！=（大-小）*黄金分割比例，先手赢小=（大-小）*黄金分割比例，后手赢证
python 的sm2 生成密钥的方法，gmssl里没有提供密钥生成 CissSimkey python 算法机器学习
"""Author:tangleiDateTime:2024-11#importrandom#random不安全所以替换为secrets中的算法#选择素域，设置椭圆曲线参数"""importsecretsclassSM2_Key():default_ecc_table={'n':'FFFFFFFEFFFFFFFFFFFFFFFFFFFFFFFF7203DF6B21C6052B53BBF40939D
基于Python第三方模块fuzzywuzzy实现字符串匹配和相似度比较袁袁袁袁满 Python实用技巧大全 python 开发语言 fuzzywuzzy 符串匹配和相似度比较
文章目录一、引言二、安装三、核心模块与功能1.fuzz模块的主要函数2.process模块的主要函数四、应用场景五、性能与优化一、引言fuzzywuzzy是一个强大的Python库，专门用于执行模糊字符串匹配和相似度比较。由SeatGeek开发并开源，它基于Levenshtein距离（编辑距离）算法，能够处理字符串之间的拼写错误、格式差异以及部分匹配等问题。fuzzywuzzy在数据清洗、文本匹配
常见的反爬机制及应对策略极客点儿 #网络爬虫 Python 爬虫反爬
1.Headers:从用户的headers进行反爬是最常见的反爬策略,Headers是一种最常见的反爬机制Headers是一种区分浏览器行为和机器行为中最简单的方法，还有一些网站会对Referer（上级链接）进行检测从而实现爬虫。相应的解决措施：通过审查元素或者开发者工具获取相应的headers然后把相应的headers传输给python的requests，这样就能很好地绕过。2.IP限制一些网站
Python3 【函数】：见证算法的优雅与力量李智 - 重庆 Python 精讲精练 -从入门到实战算法 python 经验分享案例学习编程技巧学习方法
Python3【函数】：见证算法的优雅与力量一、问题描述使用3种不同的算法编写函数，实现如下功能：找出3个数中的最大数。二、算法实现使用if-elif-else语句实现defmax_of_three(a,b,c):ifa>=banda>=c:returnaelifb>=aandb>=c:returnbelse:returnc#示例调用print(max_of_three(10,20,15))#输出
应对FingerprintJS反爬：Selenium的破解策略与技术详解傻啦嘿哟 selenium 测试工具
目录引言FingerprintJS技术概述技术原理应用场景应对策略高级解决方案代码实现与案例分析去除webdriver特征使用Undetected_chromedriver案例分析：爬取目标网站数据结论引言在现代互联网环境中，网站反爬技术日益成熟，FingerprintJS作为一种高效的浏览器指纹识别技术，被广泛应用于防止自动化脚本（如Selenium）的访问。FingerprintJS通过收集用
jQuery 跨域访问的三种方式 No 'Access-Control-Allow-Origin' header is present on the reque qiaolevip 每天进步一点点学习永无止境跨域众观千象
XMLHttpRequest cannot load http://v.xxx.com. No 'Access-Control-Allow-Origin' header is present on the requested resource. Origin 'http://localhost:63342' is therefore not allowed access. test.html:1
mysql 分区查询优化 annan211 java 分区优化 mysql
分区查询优化引入分区可以给查询带来一定的优势，但同时也会引入一些bug. 分区最大的优点就是优化器可以根据分区函数来过滤掉一些分区，通过分区过滤可以让查询扫描更少的数据。所以，对于访问分区表来说，很重要的一点是要在where 条件中带入分区，让优化器过滤掉无需访问的分区。可以通过查看explain执行计划，是否携带 partitions
MYSQL存储过程中使用游标 chicony Mysql存储过程
DELIMITER $$ DROP PROCEDURE IF EXISTS getUserInfo $$ CREATE PROCEDURE getUserInfo(in date_day datetime)-- -- 实例-- 存储过程名为：getUserInfo-- 参数为：date_day日期格式:2008-03-08-- BEGINdecla
mysql 和 sqlite 区别 Array_06 sqlite
转载： http://www.cnblogs.com/ygm900/p/3460663.html mysql 和 sqlite 区别 SQLITE是单机数据库。功能简约，小型化，追求最大磁盘效率 MYSQL是完善的服务器数据库。功能全面，综合化，追求最大并发效率 MYSQL、Sybase、Oracle等这些都是试用于服务器数据量大功能多需要安装，例如网站访问量比较大的。而sq
pinyin4j使用 oloz pinyin4j
首先需要pinyin4j的jar包支持；jar包已上传至附件内方法一:把汉字转换为拼音；例如：编程转换后则为biancheng /** * 将汉字转换为全拼 * @param src 你的需要转换的汉字 * @param isUPPERCASE 是否转换为大写的拼音； true:转换为大写；fal
微博发送私信随意而生微博
在前面文章中说了如和获取登陆时候所需要的cookie，现在只要拿到最后登陆所需要的cookie，然后抓包分析一下微博私信发送界面 http://weibo.com/message/history?uid=****&name=**** 可以发现其发送提交的Post请求和其中的数据，让后用程序模拟发送POST请求中的数据，带着cookie发送到私信的接入口，就可以实现发私信的功能了。
jsp 香水浓 jsp
JSP初始化容器载入JSP文件后，它会在为请求提供任何服务前调用jspInit()方法。如果您需要执行自定义的JSP初始化任务，复写jspInit()方法就行了 JSP执行这一阶段描述了JSP生命周期中一切与请求相关的交互行为，直到被销毁。当JSP网页完成初始化后
在 Windows 上安装 SVN Subversion 服务端 AdyZhang SVN
在 Windows 上安装 SVN Subversion 服务端2009-09-16高宏伟哈尔滨市道里区通达街291号最佳阅读效果请访问原地址：http://blog.donews.com/dukejoe/archive/2009/09/16/1560917.aspx 现在的Subversion已经足够稳定，而且已经进入了它的黄金时段。我们看到大量的项目都在使
android开发中如何使用 alertDialog从listView中删除数据？ aijuans android
我现在使用listView展示了很多的配置信息，我现在想在点击其中一条的时候填出 alertDialog,点击确认后就删除该条数据，（ ArrayAdapter ，ArrayList，listView 全部删除），我知道在下面的onItemLongClick 方法中参数 arg2 是选中的序号，但是我不知道如何继续处理下去 1 2 3
jdk-6u26-linux-x64.bin 安装 baalwolf linux
1.上传安装文件(jdk-6u26-linux-x64.bin) 2.修改权限 [root@localhost ~]# ls -l /usr/local/jdk-6u26-linux-x64.bin 3.执行安装文件 [root@localhost ~]# cd /usr/local [root@localhost local]# ./jdk-6u26-linux-x64.bin&nbs
MongoDB经典面试题集锦 BigBird2012 mongodb
1.什么是NoSQL数据库？NoSQL和RDBMS有什么区别？在哪些情况下使用和不使用NoSQL数据库？ NoSQL是非关系型数据库，NoSQL = Not Only SQL。关系型数据库采用的结构化的数据，NoSQL采用的是键值对的方式存储数据。在处理非结构化/半结构化的大数据时；在水平方向上进行扩展时；随时应对动态增加的数据项时可以优先考虑使用NoSQL数据库。在考虑数据库的成熟
JavaScript异步编程Promise模式的6个特性 bijian1013 JavaScript Promise
Promise是一个非常有价值的构造器，能够帮助你避免使用镶套匿名方法，而使用更具有可读性的方式组装异步代码。这里我们将介绍6个最简单的特性。在我们开始正式介绍之前，我们想看看Javascript Promise的样子： var p = new Promise(function(r
[Zookeeper学习笔记之八]Zookeeper源代码分析之Zookeeper.ZKWatchManager bit1129 zookeeper
ClientWatchManager接口 //接口的唯一方法materialize用于确定那些Watcher需要被通知 //确定Watcher需要三方面的因素1.事件状态 2.事件类型 3.znode的path public interface ClientWatchManager { /** * Return a set of watchers that should
【Scala十五】Scala核心九：隐式转换之二 bit1129 scala
隐式转换存在的必要性，在Java Swing中，按钮点击事件的处理，转换为Scala的的写法如下： val button = new JButton button.addActionListener( new ActionListener { def actionPerformed(event: ActionEvent) {
Android JSON数据的解析与封装小Demo ronin47
转自：http://www.open-open.com/lib/view/open1420529336406.html package com.example.jsondemo; import org.json.JSONArray; import org.json.JSONException; import org.json.JSONObject; impor
[设计]字体创意设计方法谈 brotherlamp UI ui自学 ui视频 ui教程 ui资料
从古至今，文字在我们的生活中是必不可少的事物，我们不能想象没有文字的世界将会是怎样。在平面设计中，UI设计师在文字上所花的心思和功夫最多，因为文字能直观地表达UI设计师所的意念。在文字上的创造设计，直接反映出平面作品的主题。如设计一幅戴尔笔记本电脑的广告海报，假设海报上没有出现“戴尔”两个文字，即使放上所有戴尔笔记本电脑的图片都不能让人们得知这些电脑是什么品牌。只要写上“戴尔笔
单调队列-用一个长度为k的窗在整数数列上移动，求窗里面所包含的数的最大值 bylijinnan java 算法面试题
import java.util.LinkedList; /* 单调队列滑动窗口单调队列是这样的一个队列：队列里面的元素是有序的，是递增或者递减题目：给定一个长度为N的整数数列a(i),i=0,1,...,N-1和窗长度k. 要求：f(i) = max{a(i-k+1),a(i-k+2),..., a(i)},i = 0,1,...,N-1 问题的另一种描述就
struts2处理一个form多个submit chiangfai struts2
web应用中，为完成不同工作，一个jsp的form标签可能有多个submit。如下代码： <s:form action="submit" method="post" namespace="/my"> <s:textfield name="msg" label="叙述：">
shell查找上个月，陷阱及野路子 chenchao051 shell
date -d "-1 month" +%F 以上这段代码，假如在2012/10/31执行，结果并不会出现你预计的9月份，而是会出现八月份，原因是10月份有31天，9月份30天，所以-1 month在10月份看来要减去31天，所以直接到了8月31日这天，这不靠谱。野路子解决：假设当天日期大于15号
mysql导出数据中文乱码问题 daizj mysql 中文乱码导数据
解决mysql导入导出数据乱码问题方法：１、进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+----------------------------------------+ | Variable_name&nbs
SAE部署Smarty出现：Uncaught exception 'SmartyException' with message 'unable to write dcj3sjt126com PHP smarty sae
对于SAE出现的问题：Uncaught exception 'SmartyException' with message 'unable to write file...。官方给出了详细的FAQ：http://sae.sina.com.cn/?m=faqs&catId=11#show_213 解决方案为： 01 $path
《教父》系列台词 dcj3sjt126com
Your love is also your weak point. 你的所爱同时也是你的弱点。 If anything in this life is certain, if history has taught us anything, it is that you can kill anyone. 不顾家的人永远不可能成为一个真正的男人。 &
mongodb安装与使用 dyy_gusi mongo
一.MongoDB安装和启动,widndows和linux基本相同 1.下载数据库, linux:mongodb-linux-x86_64-ubuntu1404-3.0.3.tgz 2.解压文件,并且放置到合适的位置 tar -vxf mongodb-linux-x86_64-ubun
Git排除目录 geeksun git
在Git的版本控制中，可能有些文件是不需要加入控制的，那我们在提交代码时就需要忽略这些文件，下面讲讲应该怎么给Git配置一些忽略规则。有三种方法可以忽略掉这些文件，这三种方法都能达到目的，只不过适用情景不一样。 1. 针对单一工程排除文件这种方式会让这个工程的所有修改者在克隆代码的同时，也能克隆到过滤规则，而不用自己再写一份，这就能保证所有修改者应用的都是同一
Ubuntu 创建开机自启动脚本的方法 hongtoushizi ubuntu
转载自： http://rongjih.blog.163.com/blog/static/33574461201111504843245/ Ubuntu 创建开机自启动脚本的步骤如下： 1) 将你的启动脚本复制到 /etc/init.d目录下以下假设你的脚本文件名为 test。 2) 设置脚本文件的权限 $ sudo chmod 755
第八章流量复制/AB测试/协程 jinnianshilongnian nginx lua coroutine
流量复制在实际开发中经常涉及到项目的升级，而该升级不能简单的上线就完事了，需要验证该升级是否兼容老的上线，因此可能需要并行运行两个项目一段时间进行数据比对和校验，待没问题后再进行上线。这其实就需要进行流量复制，把流量复制到其他服务器上，一种方式是使用如tcpcopy引流；另外我们还可以使用nginx的HttpLuaModule模块中的ngx.location.capture_multi进行并发
电商系统商品表设计 lkl
DROP TABLE IF EXISTS `category`; -- 类目表 /*!40101 SET @saved_cs_client = @@character_set_client */; /*!40101 SET character_set_client = utf8 */; CREATE TABLE `category` ( `id` int(11) NOT NUL
修改phpMyAdmin导入SQL文件的大小限制 pda158 sql mysql
　用phpMyAdmin导入mysql数据库时，我的10M的数据库不能导入，提示mysql数据库最大只能导入2M。　　 phpMyAdmin数据库导入出错：　　You probably tried to upload too large file. Please refer to documentation for ways to workaround this limit.
Tomcat性能调优方案 Sobfist apache jvm tomcat 应用服务器
一、操作系统调优对于操作系统优化来说，是尽可能的增大可使用的内存容量、提高CPU的频率，保证文件系统的读写速率等。经过压力测试验证，在并发连接很多的情况下，CPU的处理能力越强，系统运行速度越快。。【适用场景】任何项目。二、Java虚拟机调优应该选择SUN的JVM，在满足项目需要的前提下，尽量选用版本较高的JVM，一般来说高版本产品在速度和效率上比低版本会有改进。 J
SQLServer学习笔记 vipbooks 数据结构 xml
1、create database school 创建数据库school 2、drop database school 删除数据库school 3、use school 连接到school数据库，使其成为当前数据库 4、create table class(classID int primary key identity not null) 创建一个名为class的表，其有一