天天不吃饭阿

作为爬虫工程师，自动化和抓包你说不了解的selenium采集内容篇！

前言

作为爬虫工程师，掌握Selenium采集是非常有用的，因为有些网站采用了动态加载、javascript渲染或AJAX技术，这些技术使得使用传统的静态HTML解析库难以获取到完整的数据。Selenium是一个自动化测试工具，它可以模拟用户在浏览器中的交互行为，包括点击、滚动、输入等操作。因此，通过使用Selenium，你可以实现以下几个方面的功能：

动态网页采集：Selenium可以模拟用户的浏览器行为，包括加载动态内容和执行JavaScript脚本。对于需要与服务器进行交互获取数据的网站，Selenium可以执行完整的页面加载过程，并获取到动态生成的数据。
解决JavaScript渲染问题：有些网页使用JavaScript来渲染内容，这些内容可能无法通过传统的爬虫工具直接获取。Selenium可以模拟浏览器的行为，使得网页中的JavaScript得以执行，从而获取到完整的渲染后的页面内容。
验证码处理：一些网站为了抵御爬虫，会在页面上添加验证码来识别用户是否为人类操作。Selenium可以帮助模拟用户的验证码处理过程，包括输入验证码、点击验证按钮等操作。
用户登录和会话维持：当需要对需要登录才能访问的网站进行数据采集时，Selenium可以模拟用户的登录行为，包括输入用户名密码、点击登录按钮等操作。同时，Selenium还可以维持用户会话，使得能够在登录状态下继续进行数据采集。

需要注意的是，虽然Selenium功能强大，能够处理复杂的动态网页，但它的性能相对较低，因为它模拟了完整的浏览器环境。因此，在采集大规模数据或对性能要求较高的场景下，可以考虑结合其他爬虫技术，如异步请求库或代理池等，以提高效率。

总的来说，掌握Selenium采集技术能够帮助爬虫工程师应对更复杂的网页结构和动态加载，增加数据采集的灵活性和准确性。

接下来就以八个方面对selenium展开介绍

关注公众号：python技术训练营，接单兼职赚钱，学习进阶一步到位

将会获得，适用于零基础学习和进阶人群的python资源：

① 腾讯认证python完整项目实战教程笔记PDF
② 十几个大厂python面试专题PDF
③ python全套视频教程（零基础-高级进阶JS逆向）
④ 百个项目实战+源码+笔记
⑤ 编程语法-机器学习-全栈开发-数据分析-爬虫-APP逆向等全套项目+文档
⑥ 交流学习
⑦ 想要兼职接单

1.selenium自动化环境安装以及各版本差异

Selenium是一个流行的用于Web应用程序测试和网页抓取的自动化工具。它可以模拟用户在Web浏览器中的行为，比如点击、填写表单、提交等。在爬虫工程师的工作中，Selenium也常常被用来开发Web爬虫，自动化完成一些操作，以及抓取动态生成的内容。

安装Selenium自动化环境需要以下步骤：

1.安装Python

Selenium是一个Python库，因此首先需要在电脑上安装Python。可以从官方网站（https://www.python.org）下载Python的最新版本。

2.安装Selenium库

在安装完成Python后，使用pip命令安装Selenium库。运行以下命令：

pip install selenium

3.安装浏览器驱动

Selenium需要与特定的浏览器一起使用，因此需要下载并安装相应的浏览器驱动程序。目前，Selenium支持各种主流浏览器，如Chrome、Firefox、Safari和Edge等。需要根据你的需要选择相应的驱动。

Chrome驱动：下载地址：https://sites.google.com/a/chromium.org/chromedriver/downloads
Firefox驱动（geckodriver）：下载地址：https://github.com/mozilla/geckodriver/releases
Safari驱动：Safari浏览器内置支持Selenium，因此不需要单独安装驱动。
Edge驱动：下载地址：https://developer.microsoft.com/en-us/microsoft-edge/tools/webdriver/

下载适合操作系统和浏览器的对应版本的驱动，并将其添加到系统的PATH环境变量中。

4.配置Selenium

创建一个Python脚本，导入Selenium库，并配置浏览器驱动的路径。以下是使用Chrome驱动的示例代码：

from selenium import webdriver

# 设置Chrome驱动的路径
driver_path = '/path/to/chromedriver'

# 创建Chrome浏览器实例
driver = webdriver.Chrome(executable_path=driver_path)

# 使用driver进行自动化操作
# ...

请注意将/path/to/chromedriver替换为实际的Chrome驱动程序路径。

在Selenium中，还有一些版本差异需要注意：

Selenium版本：Selenium的Python库有多个版本可用，包括Selenium WebDriver和Selenium Grid。Selenium WebDriver主要用于测试Web应用程序，而Selenium Grid用于在多台机器上并行运行测试。根据需求选择适合的版本。
浏览器驱动版本：Selenium库的版本和浏览器驱动的版本需要兼容。确保你使用的Selenium库版本与下载的浏览器驱动版本匹配。如果版本不兼容可能导致运行时出现错误或无法正常工作。

建议在使用Selenium之前详细查阅官方文档和相关教程，以获取更多关于环境配置和版本差异的信息。这样可以确保你的爬虫工程师自动化和抓包工作顺利进行。

2.Selenium选择元素/id选择器/class选择器/CSS选择器/xpath选择器

当使用Selenium进行Web自动化和抓包时，需要选择页面上的元素以进行操作或提取信息。Selenium提供了多种方式来选择元素，包括ID选择器、Class选择器、CSS选择器和XPath选择器。下面是对这些选择器的详细介绍：

1.ID选择器：

使用方式：通过元素的ID属性选择元素。
示例代码：driver.find_element_by_id(“element_id”)
注意事项：
- ID应该是唯一的，每个元素只能有一个ID。
- ID选择器速度较快，是一种高效的选择元素的方法。

2.Class选择器：

使用方式：通过元素的class属性选择元素。
示例代码：driver.find_element_by_class_name(“element_class”)
注意事项：
- Class可以在多个元素中重复使用，所以选择器会返回匹配的第一个元素。
- 如果要选择包含多个class的元素，可以使用CSS选择器。

3.CSS选择器：

使用方式：通过CSS选择器语法选择元素。
示例代码：driver.find_element_by_css_selector(“css_selector”)
注意事项：
- CSS选择器语法灵活且强大，可以选择元素的各个属性、层级关系和伪类等。
- 可以使用开发者工具（如Chrome开发者工具）来检查元素并获取相应的CSS选择器。

4.XPath选择器：

使用方式：通过XPath表达式选择元素。
示例代码：driver.find_element_by_xpath(“xpath_expression”)
注意事项：
- XPath是一种强大的选择元素的语言，可以根据元素的层级关系、属性、文本内容等进行选择。
- 在使用XPath选择器时，要注意编写准确的XPath表达式，以确保选择到目标元素。
  这些选择器可以根据需要灵活组合使用，以准确定位页面上的元素。例如，使用CSS选择器和XPath选择器结合使用可以实现更复杂的选择逻辑。

当选择到元素后，你可以使用Selenium提供的方法进行操作，例如点击元素、填写表单、获取元素文本等。同时，Selenium还提供了一些等待机制，以确保元素在页面中可见或可操作。

需要注意的是，页面上的元素可能会有动态变化，所以在编写自动化脚本时，最好添加适当的等待操作，以避免操作过早或操作失败。

3.Selenium被监测的特征/绕过浏览器监测

在进行Web自动化和抓包时，Selenium工具有一些被网站监测的特征，因为它模拟用户在浏览器中的行为，与真实用户的行为存在一些差异。一些网站通过检测这些特征来判断是否被爬虫或自动化工具访问，并采取相应的反爬虫措施。下面是一些常见的Selenium被监测的特征：

用户代理（User-Agent）: 网站可以检测到Selenium使用的默认浏览器的用户代理字符串，并将其识别为自动化工具。可以通过修改User-Agent来绕过监测。例如，可以设置一个常见的浏览器User-Agent，使其看起来像是由真实浏览器发出的请求。
JavaScript检测: Selenium与浏览器交互时，会自动执行网页中的JavaScript。某些网站可能会通过在页面加载完成后执行一段特定的JavaScript代码来检测Selenium。这可以通过禁用JavaScript或使用Selenium提供的无头浏览器（如Headless Chrome或Headless Firefox）来规避。
页面加载速度: Selenium加载页面的速度可能比真实浏览器快很多，因为Selenium会直接与页面进行交互，而无需等待CSS和JavaScript的渲染。一些网站可能会检测页面加载速度异常快的情况，并将其识别为自动化工具。可以通过模拟人为操作时的等待时间来缓解这个问题。
元素交互: Selenium可以模拟鼠标点击、键盘输入等用户行为，但与真实用户的行为可能有一些差异。一些网站可能会检测到通过Selenium进行的组合按键或快速的鼠标操作，并将其识别为自动化工具。可以通过模拟更自然的行为，如添加鼠标移动、延迟等方式来绕过这些检测。

除了这些特征之外，还有其他的一些高级监测技术，如Canvas指纹识别、WebRTC指纹识别等，可以追踪浏览器和操作系统的特征。如果网站针对Selenium进行了高级监测，可能需要更复杂的技术手段来绕过监测，如使用Selenium Grid结合多个代理、切换IP地址等。

4.Selenium切换ifname/切换窗口/滚动页面/前进/后退

当进行Web自动化和抓包时，Selenium提供了一些功能来处理窗口切换、页面滚动以及前进和后退操作。这些功能可以用于模拟用户在浏览器中的行为，以便更好地完成爬虫任务。下面是关于这些主题的详细介绍：

1.切换iframes：

在网页中存在一种叫做iframe的HTML标签，用于嵌入其他网页或内容。在爬虫任务中，可能需要与iframe中的内容进行交互或提取信息。Selenium提供了switch_to.frame()方法来切换到特定的iframe。你可以通过定位iframe元素并使用该方法来切换到相应的iframe。

from selenium import webdriver

driver = webdriver.Chrome()

# 切换到指定的iframe
iframe = driver.find_element_by_tag_name("iframe")
driver.switch_to.frame(iframe)

# 在iframe中进行操作

# 切换回主页面
driver.switch_to.default_content()

2.切换窗口：

在一些情况下，需要在多个浏览器窗口之间切换，例如点击某个链接后在新窗口中进行操作。Selenium提供了window_handles属性和switch_to.window()方法来处理窗口切换。

from selenium import webdriver

driver = webdriver.Chrome()

# 记录当前窗口句柄
main_window = driver.current_window_handle

# 打开新窗口
driver.execute_script("window.open('https://www.example.com');")

# 切换到新窗口
for window_handle in driver.window_handles:
    if window_handle != main_window:
        driver.switch_to.window(window_handle)
        break

# 在新窗口中进行操作

# 关闭新窗口并切换回主窗口
driver.close()
driver.switch_to.window(main_window)

3.滚动页面：

当需要模拟用户在页面上滚动的行为时，可以使用Selenium的execute_script()方法结合JavaScript代码来实现。通过执行JavaScript代码，可以控制页面的滚动行为，例如滚动到特定元素、滚动到页面底部等。

from selenium import webdriver

driver = webdriver.Chrome()

# 滚动到页面底部
driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")

# 滚动到特定元素
element = driver.find_element_by_id("element_id")
driver.execute_script("arguments[0].scrollIntoView();", element)

4.前进和后退：

在模拟用户浏览网页过程中，有时需要执行前进和后退操作。Selenium提供了back()和forward()方法来实现这两个操作。

from selenium import webdriver

driver = webdriver.Chrome()

# 执行后退操作
driver.back()

# 执行前进操作
driver.forward()

这些功能可以帮助爬虫工程师实现更精确和复杂的自动化操作和抓包任务。通过掌握这些功能，可以更好地模拟用户行为，提高爬虫的效率和稳定性。

5.页面冻结/弹窗处理/单选/多选/下拉选择框

在PC端爬虫工程师的自动化和抓包任务中，可能会遇到页面冻结、弹窗处理、单选、多选和下拉选择框等情况。下面对这些专题进行详细介绍：

页面冻结：
有些网页可能会在加载或执行某些操作时导致页面冻结。在自动化爬虫任务中，页面冻结可能会阻碍操作的进行。为了应对这种情况，可以使用Selenium中的等待机制来等待页面解冻。

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

driver = webdriver.Chrome()

# 执行某个操作导致页面冻结

# 使用显式等待等待页面解冻
wait = WebDriverWait(driver, 10)
element = wait.until(EC.element_to_be_clickable((By.ID, 'element_id')))

# 在解冻后执行操作
element.click()

弹窗处理：
在爬虫任务中，可能会遇到各种弹窗，例如警告框、确认框和提示框。为了处理这些弹窗，可以使用Selenium提供的switch_to.alert方法。

from selenium import webdriver

driver = webdriver.Chrome()

# 切换到警告框
alert = driver.switch_to.alert

# 获取警告框的文本
alert_text = alert.text

# 确认警告框
alert.accept()

# 或者取消警告框
alert.dismiss()

单选和多选：
在处理网页中的单选和多选框时，Selenium提供了WebElement对象的click()方法来模拟用户的点击选择行为。

from selenium import webdriver

driver = webdriver.Chrome()

# 单选框选择
radio_button = driver.find_element_by_xpath("//input[@type='radio' and @value='option_value']")
radio_button.click()

# 多选框选择
checkbox = driver.find_element_by_xpath("//input[@type='checkbox' and @value='option_value']")
checkbox.click()

下拉选择框：
在处理下拉选择框时，可以使用Select类来选择选项。

from selenium import webdriver
from selenium.webdriver.support.ui import Select

driver = webdriver.Chrome()

# 实例化Select对象
dropdown = Select(driver.find_element_by_id("dropdown_id"))

# 选择下拉选项
dropdown.select_by_value("option_value")  # 根据value属性选择
dropdown.select_by_visible_text("option_text")  # 根据可见文本选择
dropdown.select_by_index(0)  # 根据索引选择第一个选项

# 获取当前选择的选项
selected_option = dropdown.first_selected_option

这些方法可以帮助爬虫工程师处理页面冻结、弹窗、单选、多选和下拉选择框等情况。通过使用Selenium提供的功能，可以模拟用户进行操作，从而更好地完成自动化爬虫任务。

6.Selenium隐形等待/显式等待

当进行PC端爬虫工程师的自动化和抓包任务时，使用Selenium进行网页操作是常见的做法。在这些任务中，隐形等待和显式等待是两个重要的概念，用于处理页面加载和元素查找的等待时间。下面我将详细介绍这两个专题。

1.隐形等待（Implicit Wait）：

隐形等待是通过设置一个全局性的等待时间，让Selenium在查找元素时等待一段时间，等待时间内如果元素没有立即找到，Selenium会继续等待，直到超过设定的等待时间。这样可以避免因为页面加载速度不同而导致的元素查找失败。

在使用隐形等待时，需要设置等待时间，单位为秒。以下是使用隐形等待的示例代码：

from selenium import webdriver

driver = webdriver.Chrome()
driver.implicitly_wait(10)  # 设置隐形等待时间为10秒

# 在该等待时间内，如果元素没有立即找到，Selenium会等待一段时间后继续查找
element = driver.find_element_by_xpath("//div[@id='element_id']")

在上述示例中，当使用driver.find_element_by_xpath查找元素时，如果元素未立即找到，Selenium会等待10秒，直到找到或超过设定的等待时间为止。

2.显式等待（Explicit Wait）：

显式等待是通过设置等待条件，让Selenium等待直到满足特定条件后再进行下一步操作。这种等待方式更为灵活，可以根据具体的等待条件来控制等待时间。

为了使用显式等待，需要使用WebDriverWait类并指定等待时间和等待条件。以下是使用显式等待的示例代码：

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

driver = webdriver.Chrome()

# 设置显式等待时间为10秒
wait = WebDriverWait(driver, 10)

# 等待直到元素可见
element = wait.until(EC.visibility_of_element_located((By.XPATH, "//div[@id='element_id']")))

# 在元素可见后执行后续操作
element.click()

在上述示例中，WebDriverWait接受两个参数：driver和等待时间（以秒为单位）。然后，使用until方法和expected_conditions模块中的条件（例如EC.visibility_of_element_located）指定等待条件。

在这个示例中，Selenium会等待10秒，直到元素可见或超过设定的等待时间为止。一旦元素可见，Selenium会执行后续的操作。

通过使用隐形等待和显式等待，可以更好地控制和处理页面加载和元素查找的等待时间，从而提高自动化爬虫任务的稳定性和准确性。

7.Selenium模拟登录/cookie处理/结合requests

当PC端爬虫工程师进行自动化和抓包任务时，使用Selenium进行模拟登录、处理Cookie，并结合requests库进行请求发送和数据处理是常见的做法。下面我将详细介绍这些专题。

1.Selenium模拟登录：

模拟登录是进行网站数据抓取的重要一步，通过Selenium可以实现自动填写登录表单、点击登录按钮等操作。以下是一个使用Selenium模拟登录的示例代码：

from selenium import webdriver

driver = webdriver.Chrome()
driver.get("https://example.com/login")

# 找到登录表单元素并填写用户名和密码
username_input = driver.find_element_by_id("username")
password_input = driver.find_element_by_id("password")
username_input.send_keys("your_username")
password_input.send_keys("your_password")

# 找到登录按钮并点击
login_button = driver.find_element_by_id("login_button")
login_button.click()

在上述示例中，首先创建一个Chrome WebDriver实例，并通过get方法打开登录页面。然后，使用find_element_by_id方法获取用户名和密码输入框，并使用send_keys方法填写相关信息。最后，找到登录按钮并使用click方法进行点击操作。

2.Cookie处理：

登录后，网站会将认证信息存储在Cookie中。在进行后续请求时，可以使用Selenium提供的get_cookies方法获取登录后的Cookie，并将其传递给requests库进行请求发送。以下是一个使用Selenium获取Cookie并使用requests发送请求的示例代码：

import requests
from selenium import webdriver

driver = webdriver.Chrome()
driver.get("https://example.com/login")

# 模拟登录操作

# 获取登录后的Cookie
cookies = driver.get_cookies()

# 创建一个session对象
session = requests.Session()

# 将Cookie添加到session中
for cookie in cookies:
    session.cookies.set(cookie['name'], cookie['value'])

# 使用session发送请求
response = session.get("https://example.com/data")

# 处理响应数据
data = response.json()

在上述示例中，通过Selenium获取登录后的Cookie，并使用session.cookies.set方法将Cookie添加到requests的Session对象中。然后，使用Session对象发送请求，可以保持登录状态进行抓取，并通过处理响应数据来获取所需的信息。

3.结合requests：

在进行抓包任务时，Selenium通常用于模拟登录和处理动态渲染的页面，而requests库则用于发送请求和处理响应。结合两者可以实现更灵活的数据获取和处理。以下是一个结合Selenium和requests的示例代码：

import requests
from selenium import webdriver

driver = webdriver.Chrome()
driver.get("https://example.com/login")

# 模拟登录操作

# 获取登录后的Cookie
cookies = driver.get_cookies()

# 创建一个session对象
session = requests.Session()

# 将Cookie添加到session中
for cookie in cookies:
    session.cookies.set(cookie['name'], cookie['value'])

# 使用session发送请求
response = session.get("https://example.com/data")

# 处理响应数据
data = response.json()

在上述示例中，通过Selenium进行模拟登录和获取Cookie后，使用requests的Session对象发送请求。通过将Cookie添加到Session对象中，可以保持登录状态进行后续请求，并通过处理响应数据获得所需的信息。

通过使用Selenium进行模拟登录、处理Cookie，并结合requests库发送请求和处理响应，可以实现灵活、高效的PC端爬虫工程师自动化和抓包任务。这种组合可以处理动态渲染的页面和保持用户状态，从而获取更全面和准确的数据

8.selenium采集小实战

当PC端爬虫工程师进行自动化和抓包任务时，Selenium是一个强大的工具。下面我将介绍一个实战项目，该项目使用Selenium来采集目标网站的数据。

1.案例背景：

假设你需要采集一个电商网站上的商品信息，包括商品名称、价格和评论数。由于该网站是动态加载的，只有在用户滚动页面时才会加载更多的商品信息。这种情况下，使用传统的requests库无法直接获取到全部的数据，这时就可以使用Selenium来模拟用户的行为，自动滚动页面并获取数据。

2.步骤如下：

安装Selenium和Chrome WebDriver：
使用pip命令安装Selenium库：pip install selenium
下载对应浏览器版本的Chrome WebDriver，然后将其添加到系统路径中。
导入所需的库和模块：

from selenium import webdriver
from selenium.webdriver.chrome.options import Options
import time

创建WebDriver实例：

chrome_options = Options()
chrome_options.add_argument("--headless")  # 无需打开浏览器窗口运行
driver = webdriver.Chrome(chrome_options=chrome_options)

打开目标网页：

driver.get("https://example.com/products")

模拟滚动页面：

scroll_pause_time = 2  # 每次滚动暂停的时间
scroll_height = 0  # 已滚动的高度
while True:
    # 滚动到页面底部
    driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
    time.sleep(scroll_pause_time)
    
    # 计算滚动高度的变化，判断是否已经到达底部
    new_scroll_height = driver.execute_script("return document.body.scrollHeight;")
    if new_scroll_height == scroll_height:
        break
    scroll_height = new_scroll_height

提取数据：

products = driver.find_elements_by_xpath("//div[@class='product']")
for product in products:
    name = product.find_element_by_xpath(".//h2").text
    price = product.find_element_by_xpath(".//span[@class='price']").text
    comments = product.find_element_by_xpath(".//span[@class='comments']").text
    
    # 进行数据处理或保存操作
    # ...

在上述示例中，我们首先创建了一个无头浏览器的WebDriver实例，使用chrome_options.add_argument("--headless")可以让浏览器在后台运行而不弹出窗口。然后，我们使用driver.get方法访问目标网页。

为了获取全部商品信息，我们使用execute_script方法模拟滚动页面的操作，通过调用window.scrollTo(0, document.body.scrollHeight)将页面滚动到底部。利用循环和计算滚动高度的变化，我们可以实现不断滚动直到到达底部。

最后，我们使用find_elements_by_xpath方法查找商品元素，然后逐个提取商品名称、价格和评论数等信息，并进行数据处理或保存操作。

这个实战项目展示了如何使用Selenium进行自动化采集，模拟用户操作，获取动态加载的数据。你可以根据具体需求进行进一步修改和优化，例如添加代理、处理验证码等。

关注公众号：python技术训练营，接单兼职赚钱，学习进阶一步到位

将会获得，适用于零基础学习和进阶人群的python资源：

① 腾讯认证python完整项目实战教程笔记PDF
② 十几个大厂python面试专题PDF
③ python全套视频教程（零基础-高级进阶JS逆向）
④ 百个项目实战+源码+笔记
⑤ 编程语法-机器学习-全栈开发-数据分析-爬虫-APP逆向等全套项目+文档
⑥ 交流学习
⑦ 想要兼职接单

你可能感兴趣的:(python爬虫,python开发,selenium,爬虫,自动化,selenium,python,数据库)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
前端项目架构设计要领
1.架构设计的核心目标在设计前端项目架构时，核心目标是模块化、可维护、可扩展、可测试，以及开发效率的最大化。这些目标可以通过以下几个方面来实现：组件化：将UI功能封装为可复用的组件。模块化：将业务逻辑分解为独立的模块或服务。自动化构建与部署：实现自动化构建、测试和部署流程，减少人为操作的错误。代码规范化与检查：确保团队协作时，代码风格和质量一致。2.项目目录结构设计一个清晰合理的目录结构对大型项目
Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
ARM嵌入式可编程控制器技术开发拉勾科研工作室 arm开发
PLC自动化设计|毕业设计指导|工业自动化解决方案✨专业领域：PLC程序设计与调试工业自动化控制系统HMI人机界面开发工业传感器应用电气控制系统设计工业网络通信擅长工具：西门子S7系列PLC编程三菱/欧姆龙PLC应用触摸屏界面设计电气CAD制图工业现场总线技术自动化设备调试主要内容：PLC控制系统设计工业自动化方案规划电气原理图绘制控制程序编写与调试毕业论文指导毕业设计题目与程序设计✅具体问题可以
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
CentOS7环境卸载MySQL5.7 Hadoop_Liang mysql 数据库 mysql
备份重要数据切记，卸载之前先备份mysql重要的数据。备份一个数据库例如：备份名为mydatabase的数据库到backup.sql的文件中mysqldump-uroot-ppassword123mydatabase>backup.sql备份所有数据库mysqldump-uroot-ppassword123--all-databases>all_databases_backup.sql注意：-p后
php SPOF 贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.什么是单点故障（SPOF）？单点故障指的是系统中某个组件一旦失效，整个系统或服务就会不可用。常见的单点有：数据库、缓存、Web服务器、负载均衡、网络设备等。2.常见单点故障场景只有一台数据库服务器，宕机后所有业务不可用只有一台Redis缓存，挂掉后缓存全部失效只有一台Web服务器，挂掉后网站无法访问只有一个负载均衡节点，挂掉后流量无法分发只有一条网络链路，断开后所有服务失联3.消除单点故障的主
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
centos7安装 mysql5.7(安装包) heiPony linux mysql mariadb centos mysql
一.卸载centos7自带数据库查看系统自带的Mariadbrpm-qa|grepmariadbmariadb-libs-5.5.44-2.el7.centos.x86_64卸载rpm-e--nodepsmariadb-libs-5.5.44-2.el7.centos.x86_64删除etc目录下的my.cnfrm/etc/my.cnf二.检查mysql是否存在(有就卸载,删除相关文件)rpm-q
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
无面试无offer? 你需要AI 求职co-pilot的帮助!
大家好啊，我写的开源免费求职AIco-pilot工具发布了v3.0.0，欢迎大家参与、使用!https://github.com/weicanie/prisma-ai一、项目介绍开源免费的求职co-pilot，自动化简历准备至offer到手的整个流程。优化您的项目、定制您的简历、为您匹配工作，并帮助您做好面试准备。二、核心价值prisma-ai旨在解决求职者在准备简历和寻找工作时最头疼的3个问题:
等保测评中的物联网设备安全评估亿林数据物联网安全网络安全等保测评
随着物联网（IoT）技术的飞速发展，物联网设备已经广泛应用于智能家居、智慧城市、工业自动化等多个领域，极大地提升了社会生产力和生活便利性。然而，随着IoT设备数量的激增，其安全性问题也日益凸显，成为我们必须面对的重要课题。在这一背景下，等级保护（等保）测评中的物联网设备安全评估显得尤为重要，它为我们提供了一个有效的安全评估和管理机制。一、物联网设备安全评估的重要性物联网设备的核心理念是实现物物相连
seaborn又一个扩展heatmapz qq_21478261 #Python可视化 matplotlib
推荐阅读：Pythonmatplotlib保姆级教程嫌Matplotlib繁琐？试试Seaborn！
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS