无水先生

【Python程序设计】工厂模式【07/8】

一、说明

我们探索数据工程中使用的设计模式 - 软件设计中常见问题的可重用解决方案。以下文章是有关 Python 数据工程系列文章的一部分，旨在帮助数据工程师、数据科学家、数据分析师、机器学习工程师或其他刚接触 Python 的人掌握基础知识。

迄今为止，本初学者指南包括：

第 1 部分：Python 包探讨了 Python 模块、Python 包的基础知识以及如何将模块导入您自己的项目。【Python 程序设计】包和数据人员入门【01/8】
第 2 部分：介绍了依赖项管理和虚拟环境。【Python 程序设计】数据人员入门【02/8】
第 3 部分：项目的最佳实践，涵盖了构建项目的 9 个最佳实践和示例。【Python程序设计】项目的最佳实践【03/8】
第 4 部分： Dagster 管道，我们探讨了设置 Dagster 项目以及数据资产的关键概念。【Python程序设计】从 Python 项目到 Dagster Pipelines【04/8】
第 5 部分：我们将介绍环境变量的重要性以及如何使用它们。【Python程序设计】Python 中的环境变量【05/8】
第 6 部分：类型提示，或类型提示如何减少错误。
第7 部分：模式，或学习设计模式，它们是软件设计中常见问题的可重用解决方案。【Python程序设计】工厂模式【07/8】

二、Python 编程中的工厂模式

在本系列中，你了解了数据工程中的 Python 最佳实践，以及如何构建更健壮和可扩展的软件。今天，我们将采用一种称为设计模式的更高级编程概念，它是软件设计中常见问题的可重用解决方案。您可能会在数据工程项目中遇到这些问题。

我们将看看什么是设计模式，为什么要使用它们，并特别深入探讨一种模式：工厂模式。我们还将讨论为什么数据工程师会从使用工厂模式中受益。

工厂模式优雅地简化了数据连接器的创建，并使现有数据基础结构更具可扩展性。这对于处理具有不同处理需求的各种数据源的数据工程师特别有用。

工厂模式定义：在软件设计中，“工厂模式”允许您创建一个类，其子类决定要实例化哪个类。工厂模式允许在不指定将要创建的确切对象类的情况下创建对象，从而促进代码中的松散耦合和可伸缩性。此模式通常使用工厂方法或工厂类来实现，以基于输入条件或条件生成对象的实例。

工厂模式称为“创建设计模式”（本文稍后将对此进行说明）。

在本课程的这一部分中，我们将了解工厂模式如何在数据工程中实现可重用性、可伸缩性和可维护性。

三、设计模式 101

Python 中的设计模式作为模板工作，可以应用于重复性任务或问题，因此在数据工程中非常有用。对于 Python 数据工程师来说，设计模式为数据处理和集成任务中反复出现的挑战提供了结构化且高效的解决方案。它们还提供共享词汇表，促进团队成员之间更清晰的沟通，从而实现更一致和协作的软件设计。

3.1 设计模式的类型

Python 中的设计模式以及一般编程中的设计模式通常被认为是中级到高级概念，因为它们通常需要了解编程原理、面向对象设计以及识别和抽象更大、更复杂的系统（即代码架构）中反复出现的问题的能力。Python的设计模式通常分为三种类型：

创建模式：这些模式包括工厂模式，可用于实例化和管理数据库连接，确保无论是连接到 SQL 数据库还是 NoSQL 存储，该过程都得到简化且一致
结构模式：提供有关组织和链接不同组件的指导，在集成不同的数据源时可能非常宝贵。例如，您可以使用适配器模式将来自旧系统的数据与现代分析平台协调，从而确保无缝数据流
行为模式：提供对象之间有效沟通和交互的策略。例如，可以使用观察者模式来监视数据集中的更改：想象一下，每当新数据到达时，数据引入过程都会通知多个下游处理任务。

3.2 为什么要在数据工程中使用设计模式？

设计模式为数据工程任务提供了明显的优势，这些任务与软件设计的核心原则相呼应：

声明：通过设计模式，数据工程师可以定义最终目标或他们想要实现的目标，而不会陷入程序应该如何执行的细节中。通过定义你想要什么，底层逻辑会处理“如何”。这种抽象简化了过程。
可重用： 将设计模式视为蓝图。正如建筑计划可用于建造各种建筑物一样，这些模式可以应用于不同的管道或项目，确保您的工作不仅限于一个解决方案，而是可以多次利用。
一致： 数据世界是广阔而多样的。通过采用设计模式，数据工程师可确保数据资产（无论其来源或应用程序如何）都遵循一致的结构和行为。这使得数据操作可预测并减少异常，从而产生更强大的数据系统。

通过将资产工厂等设计模式集成到数据工程工作流（从数据提取、分析数据、数据转换等）中，我们为更顺畅的操作、更少的错误和更高效的系统铺平了道路，确保管理和优化数据以获得最佳结果。

每个设计模式都用于防止在项目缩放时出现特定问题。今天，我们将重点介绍工厂模式，该模式用于构建多个类似的东西，以促进集中配置、标准化测试，并在遵守一致性的同时允许灵活性。

四、工厂模式如何工作？

工厂模式被归类为创建模式，因为它们在 Python 编程中创建对象。它们根据某些条件语句或参数返回不同的对象。

4.1 将对象创建与主应用程序分离

将工厂模式视为公司中的一个专业部门，只专注于生产某些产品。该部门负责制造的所有细节，公司的其他部门只需在需要时要求产品，而不必担心其制造方式。

同样，工厂模式负责创建特定对象的所有细节。应用程序的其余部分不需要知道这些对象的创建方式或它们需要哪些参数。它只是要求“工厂”生产对象，并信任它来处理其余的。这种分离使代码更清晰、更易于理解。

4.2 Python 中的工厂模式

在 Python 中，实现工厂模式特别精简，这要归功于它的动态类型和一流的函数。您可以从工厂函数返回不同的类甚至函数，而无需太多样板。

此外，许多 Python 库和框架利用工厂模式或类似工厂的模式，即使它不是显式的或完全相同的。例如，像SQLAlchemy这样的ORM（对象关系映射库）使用工厂来创建数据库会话对象。SQLAlchemy 可以比作工厂模式，因为它生成新的会话实例，充当数据库通信的主要接口。sessionmaker()

4.3 使用 Python 在数据工程中使用工厂模式：示例

Python 的内置功能（如装饰器）可用于增强工厂模式。例如，装饰器可用于向工厂注册类，从而扩展工厂的功能，而无需显式修改它。

想象一下数据工程中的一个常见场景：用于操作来自不同文件格式的数据的数据管道：CSV、JSON 和 XML 文件。根据文件类型，应应用不同的分析步骤。

我们将使用一个简单的字典作为这些文件解析器的“注册表”，并将函数作为我们的工厂。

首先，我们将定义解析函数：

import csv
import json
import xml.etree.ElementTree as ET

def parse_csv(file_path):
    with open(file_path, mode='r') as file:
        reader = csv.reader(file)
        return list(reader)

def parse_json(file_path):
    with open(file_path, mode='r') as file:
        return json.load(file)

def parse_xml(file_path):
    tree = ET.parse(file_path)
    root = tree.getroot()
    return root  # you'd typically add more logic to process the XML tree

然后，我们将定义一个装饰器来注册这些解析器：

PARSERS = {}

def register_parser(file_type):
    def decorator(fn):
        PARSERS[file_type] = fn
        return fn
    return decorator

我们将注册我们的解析器：

@register_parser('csv')
def csv_parser(file_path):
    return parse_csv(file_path)

@register_parser('json')
def json_parser(file_path):
    return parse_json(file_path)

@register_parser('xml')
def xml_parser(file_path):
    return parse_xml(file_path)

最后，我们将编写一个函数来获取正确的解析器，并使用工厂来解析文件：

def get_parser(file_type):
    return PARSERS.get(file_type)

data_csv = get_parser('csv')('data.csv')
data_json = get_parser('json')('data.json')
data_xml = get_parser('xml')('data.xml')

对于数据工程师来说，处理多种文件格式是很常见的，并且能够使用新的解析器（如XML，Parquet等）轻松扩展系统至关重要。通过此设置，数据工程师只需定义一个新的解析函数并将其注册到装饰器，即可轻松扩展系统以支持新的文件类型。

无需接触现有的工厂逻辑，使其易于维护和扩展。通过将工厂模式与装饰器一起使用，我们可以简化此过程并维护更干净、更模块化的代码。

五、使用工厂模式进行数据工程

数据工程师或数据科学家经常将工厂模式用于日常任务，例如批处理、构建实时数据流和 ETL 管道。

例如，假设工作流中有各种类型的数据连接，例如数据库、文件或 API。您可以使用工厂模式根据当时的需求为您创建正确的连接，而不是手动创建与每个连接的连接。可以把它想象成一条装配线，在需要时准确地生产你需要的东西，而不会用不必要的细节弄乱其余的代码。

5.1 在数据管道中

让我们考虑一个需要连接到不同类型的数据库的场景，如MySQL和PostgreSQL。工厂模式可用于根据给定输入创建适当的数据库连接。下面是一个说明此模式的简单示例：

让我们首先定义每个数据库的连接：

import mysql.connector
import psycopg2

def connect_mysql(host, user, password, database):
    connection = mysql.connector.connect(
        host=host,
        user=user,
        password=password,
        database=database
    )
    return connection

def connect_postgresql(host, user, password, database):
    connection = psycopg2.connect(
        host=host,
        user=user,
        password=password,
        dbname=database
    )
    return connection

接下来，我们将定义一个装饰器来注册数据库连接：

DB_CONNECTIONS = {}

def register_db_connector(db_type):
    def decorator(fn):
        DB_CONNECTIONS[db_type] = fn
        return fn
    return decorator

然后，我们将注册连接：

@register_db_connector('mysql')
def mysql_connector(host, user, password, database):
    return connect_mysql(host, user, password, database)

@register_db_connector('postgresql')
def postgresql_connector(host, user, password, database):
    return connect_postgresql(host, user, password, database)

最后，我们将编写一个函数来获取正确的连接器，并使用工厂来获取适当的数据库连接：

def get_db_connector(db_type):
    if db_type not in DB_CONNECTIONS:
        raise ValueError(f"Unsupported database type: {db_type}")
    return DB_CONNECTIONS[db_type]

# Example usage:
mysql_conn = get_db_connector('mysql')('localhost', 'user', 'password', 'mydb')
postgres_conn = get_db_connector('postgresql')('localhost', 'user', 'password', 'mydb')

通过此设置，将来添加对新型数据库连接的支持非常简单。我们首先定义连接函数，然后使用装饰器注册它。无需更改其他部件，展示了工厂模式的可维护性和可扩展性优势。

六、实际方案中的工厂模式

工厂在以下情况下特别有用：

处理可能随时间变化的外部库或系统，让您隔离这些更改
实现系统的插件或扩展
需要出于对象池、延迟初始化或日志记录等目的控制对象实例化

我们将看两个示例，说明工厂资产在现实世界中的工作方式。

6.1 示例 1：抓取维基百科

当您需要抓取不同类型的页面但希望为所有页面保持一致的界面时，工厂模式在网页抓取中特别有用。让我们看看工厂模式如何用于按人口抓取维基百科的国家和依赖关系表：

首先，请确保安装以下内容：

pip install requests
pip install beautifulsoup4

然后，定义函数以从维基百科中抓取不同的表。假设维基百科可能有多个表以不同的格式表示这些数据。一个表可能是标准表，而另一个表可能是针对移动设备优化的。

from bs4 import BeautifulSoup
import requests

def scrape_standard_table(url):
    page = requests.get(url)
    soup = BeautifulSoup(page.content, 'html.parser')

    # Assuming the first table on the page is the one of interest
    table = soup.find_all("table")[0]

    rows = table.find_all("tr")
    data = []
    for row in rows[1:]:  # skipping the header row
        columns = row.find_all("td")
        country = columns[0].get_text(strip=True)
        population = columns[1].get_text(strip=True)
        data.append((country, population))
    return data

def scrape_mobile_table(url):
    page = requests.get(url)
    soup = BeautifulSoup(page.content, 'html.parser')

    # Mobile tables might be different, for the sake of example let's assume they're div-based
    table_div = soup.find("div", {"class": "mobile-table"})
    rows = table_div.find_all("div", {"class": "row"})
    data = []
    for row in rows:
        country = row.find("div", {"class": "country"}).get_text(strip=True)
        population = row.find("div", {"class": "population"}).get_text(strip=True)
        data.append((country, population))
    return data

然后，我们将定义一个装饰器来注册抓取函数：

SCRAPERS = {}

def register_scraper(scraper_type):
    def decorator(fn):
        SCRAPERS[scraper_type] = fn
        return fn
    return decorator

现在我们将注册我们的抓取函数：

@register_scraper('standard')
def standard_scraper(url):
    return scrape_standard_table(url)

@register_scraper('mobile')
def mobile_scraper(url):
    return scrape_mobile_table(url)

最后，我们将编写我们的函数来获取正确的抓取工具，并使用工厂从维基百科获取数据：

def get_scraper(scraper_type):
    if scraper_type not in SCRAPERS:
        raise ValueError(f"Unsupported scraper type: {scraper_type}")
    return SCRAPERS[scraper_type]

# Example usage:
url = "https://en.wikipedia.org/wiki/List_of_countries_and_dependencies_by_population"
data_standard = get_scraper('standard')(url)
# data_mobile = get_scraper('mobile')(url)  # if you had a mobile URL

在此示例中，添加对将来抓取不同格式的支持（如维基百科中的不同表结构）很简单：定义抓取函数，然后使用装饰器注册它。这可确保抓取代码保持模块化且易于扩展，而无需修改现有逻辑。

6.2 示例 2：数据编排

Dagster 是一个数据编排器，可为数据处理的不同阶段（从引入到机器学习）提供单一管理平台。Dagster帮助安排和观察广泛的数据工程工具，Python作为其编程语言。它被数据工程师和数据科学家广泛用于数据科学、数据分析、大数据、机器学习等一系列应用。

Dagster 的功能之一是能够管理资产，这些资产是数据计算的输出。资产表示一段数据或具有价值且值得跟踪的计算结果。这可以是数据库中的表、磁盘上的文件、模型工件等。资产通常是管道的输出。

资源工厂是 Dagster 中的一项功能，允许用户以声明方式定义资产的生成方式。它们可以被视为通过定义生成资产所需的输入、输出和计算来创建资产的模板。

让我们演练一个简单的示例，在该示例中，我们将通过在 Dagster 中应用 Factory 模式来重构现有代码块以生成一组资产。

在开始之前，请确保安装Dagster：

pip install dagster dagster-webserver

假设我们是非营利组织数据工程团队的一员。我们有一些现有的代码来查询捐赠者平台的 API 并将结果写入文件（CSV 或 JSON）。它目前看起来像这样：

from dagster import asset
import requests
import csv

@asset
def volunteers():
    result = requests.get('www.donorplatform.org/api/v1/volunteers')
    with open('volunteers.csv', 'w') as f:
        writer = csv.writer(f)
        writer.writerows(result)

@asset
def donations():
    result = requests.get('www.donorplatform.org/api/v2/donations')
    with open('donations.csv', 'w') as f:
        writer = csv.writer(f)
        writer.writerows(result)

@asset
def donors():
    result = requests.get('www.donorplatform.org/api/v1/donors')
    with open('donors.json', 'w') as f:
        f.write(result)

我们的运营团队最近扩大了对捐赠者平台的使用，并要求我们从 50 个新的 API 端点运行数据提取。这变得不守规矩且难以管理，因为您知道这将需要很长时间，数据工程师将偏离他们检索数据的方式，并且很难测试。

使用我们新的 python 技能，让我们为此应用工厂模式来解决这些问题。

首先，让我们定义可以配置的内容。需要为每个资产自定义三个部分：

资产的名称
它查询的终结点
结果保存为的文件类型

因此，我们将定义一个 JSON 对象来集中资产的可能配置。

specs = [
    {
        'name': 'volunteers',
        'endpoint': 'v1/volunteers',
        'file_type': 'csv'
    },
    {
        'name': 'donations',
        'endpoint': 'v2/donations',
        'file_type': 'csv'
    },
    {
        'name': 'donors',
        'endpoint': 'v1/donors',
        'file_type': 'json'
    }
]

然后，我们将定义和泛化我们的资产函数，以采用规范并生成资产

spec = specs[0] # take a single spec as reference while building

@asset(name=spec['name'])
def generic_asset():
    result = requests.get(f'www.donorplatform.org/api/{spec["endpoint"]}')
    with open(f'{spec["name"]}.f{spec["file_type"]}', 'w') as f:
        if spec["file_type"] == 'csv':
            writer = csv.writer(f)
            writer.writerows(result)
        elif spec["file_type"] == 'json':
            f.write(result)

最后，让我们将通用资产包装在一个函数中，该函数将用作生成所有资产的工厂。该函数将采用规范并将其应用于我们的资产。

def generate_donor_platform_asset(spec):
    @asset(name=spec['name'])
    def _asset():
        result = requests.get(f'www.donorplatform.org/api/{spec["endpoint"]}')
        with open(f'{spec["name"]}.f{spec["file_type"]}', 'w') as f:
            if spec["file_type"] == 'csv':
                writer = csv.writer(f)
                writer.writerows(result)
            elif spec["file_type"] == 'json':
                f.write(result)

    return _asset

在您的工厂中，您只需定义其他规格即可生产更多资产。以下是它在生产中的使用方式：

from dagster import Definitions, asset
import requests
import csv

specs = [
    {'name': 'volunteers', 'endpoint': 'v1/volunteers', 'file_type': 'csv'},
    {'name': 'donations', 'endpoint': 'v2/donations', 'file_type': 'csv'},
    {'name': 'donors', 'endpoint': 'v1/donors', 'file_type': 'json'},
    {'name': 'projects', 'endpoint': 'v1/projects', 'file_type': 'json'},
    {'name': 'fundraisers', 'endpoint': 'v1/fundraisers', 'file_type': 'csv'},
]

def generate_donor_platform_asset(spec):
    @asset(name=spec['name'])
    def _asset():
        result = requests.get(f'www.donorplatform.org/api/{spec["endpoint"]}')
        with open(f'{spec["name"]}.f{spec["file_type"]}', 'w') as f:
            if spec["file_type"] == 'csv':
                writer = csv.writer(f)
                writer.writerows(result)
            elif spec["file_type"] == 'json':
                f.write(result)

    return _asset


defs = Definitions(assets=[generate_donor_platform_asset(spec) for spec in specs])

如果您运行，您将可以访问 dagster 的 UI 和 localhost：3000 上的资产图。当您向列表中添加更多规范并重新加载定义时，您将看到生成的更多资产。dagster dev

这是 Dagster 中资产工厂入门的基本数据工程示例。随着您深入研究 Dagster，您可以探索更高级的功能。Dagster还提供与许多数据库和数据系统的集成。这使得使用资源工厂以各种格式和位置生成资产变得容易。可以使用资产工厂在云存储系统上生成文件、执行 SQL 或训练机器学习模型。

因此，python项目中的资产工厂提供了相同的三个好处：

声明：资源工厂允许您指定要生产的内容，而无需编写如何生成它的详细逻辑
可重用：由于资源工厂是模板，因此可以在不同的管道或项目中重复使用它们
一致：使用资源工厂可确保以一致的方式生成资产，无论它们在何处或如何使用

七、结论

工厂模式是数据工程师的宝贵工具，尤其是在处理不同类型的数据源或复杂对象创建时。它简化了您的代码，使其更具可重用性、可扩展性和可维护性。

作为最流行的编程语言之一，在使用 Python 进行数据工程时，工厂模式非常有用。虽然这些也适用于其他语言，但您最有可能遇到 Python 作为通用编程语言，落后于大多数流行的数据工程任务工具。

你可能感兴趣的:(python技能小结,算法,python,开发语言)

Python 虚拟环境管理工具 UV：从安装到高级用法的详细教程 Dush32 python uv 开发语言人工智能机器学习分类
前言在Python开发中，管理不同项目的依赖包和Python版本是开发者常常遇到的问题。不同项目可能依赖不同版本的库，甚至同一个库在不同版本下的行为可能不同。为了避免这些问题，使用虚拟环境成为了解决方案。虚拟环境通过隔离每个项目的依赖，避免了版本冲突问题。在Python中，常用的虚拟环境管理工具有virtualenv、venv和一些第三方工具，如UV。本文将详细介绍如何使用UV虚拟环境管理工具，从
前端面试专栏-工程化：27.工程化实践（CI/CD、代码规范）爱分享的程序员前端面试通关指南前端面试 ci/cd
欢迎来到前端面试通关指南专栏！从js精讲到框架到实战，渐进系统化学习，坚持解锁新技能，祝你轻松拿下心仪offer。前端面试通关指南专栏主页前端面试专栏规划详情项目实战与工程化模块-工程化实践（CI/CD、代码规范）在团队协作的项目实战中，工程化实践是保障开发效率与代码质量的核心支柱。当项目规模从几人协作扩展到数十人团队时，单纯依赖人工沟通和经验规范会导致效率低下、bug频发。本文聚焦工程化的两大核
前端面试专栏-工程化：28.团队协作与版本控制（Git）爱分享的程序员前端面试通关指南 node.js 前端 javascript
欢迎来到前端面试通关指南专栏！从js精讲到框架到实战，渐进系统化学习，坚持解锁新技能，祝你轻松拿下心仪offer。前端面试通关指南专栏主页前端面试专栏规划详情项目实战与工程化模块-团队协作与版本控制（Git）在多人协作的项目中，代码的版本管理是保障开发效率与代码质量的核心环节。Git作为目前最流行的分布式版本控制系统，不仅能追踪代码变更历史，更能通过分支策略、协作流程规范团队工作方式。本文从实战角
python并发执行_Python的并发并行[0] -> 基本概念 weixin_39940253 python并发执行
基本概念/BasicConcept快速跳转0简介与动机/WhyMulti-Thread/Multi-Process/Coroutine在多线程(multithreaded,MT)编程出现之前，计算机程序的执行是由单个步骤序列组成的，该序列在主机的CPU中按照同步顺序执行。即无论任务多少，是否包含子任务，都要按照顺序方式进行。然而，假定子任务之间相互独立，没有因果关系，若能使这些独立的任务同时运行，
python线程嵌套线程_Python中的嵌套并行性 weixin_39923262 python线程嵌套线程
1)WhatamImissinghere;whyshouldn’taPoolbesharedbetweenprocesses?并不是所有的对象/实例都是可挑选的/可序列化的,在这种情况下,池使用的是不可挑剔的thread.lock：>>>importthreading,pickle>>>pickle.dumps(threading.Lock())Traceback(mostrecentcallla
移除 GIL，可显著提升 Python 多线程性能么？ AIGC开发者 python 1024程序员节 python 开发语言
近日，一位名叫SamGross的开发者提出了一个对全局解释器锁（GIL）进行重大修改的设想。其目标在于移除CPython中的GIL，以使得多线程能够并行执行Python代码。目前，该项目已经引起了Python核心开发团队的关注。我一直在对CPython进行修改，使其能够在没有全局解释器锁的情况下运行。我想与大家分享一个可以在没有GIL的情况下运行的概念验证。这个概念验证涉及到对CPython内部的
python 利用多进程实现文件的拷贝 AI算法网奇 python宝典 python 开发语言
python利用多进程实现文件的拷贝版权声明：本文为博主原创文章，未经博主允许不得转载。https://blog.csdn.net/m0_37338590/article/details/78472103整个程序的流程可分为四步：第一步是提示用户输入要拷贝的文件夹;第二步是创建新文件夹;第三步是获取文件夹中所有文件的名字;最后一步是就是利用进程池创建进程完成复制。具体的分析在程序中都有了，不再做过
python 多线程拍照 NO1212 python 开发语言
相机为basler，logicbalser相机识别条码，进行拍照args[0]为logging的参数保证log实时传输到GUI界面调用方法:main_process(args[0]).camera_run()importsysimporterrnoimportcv2importnumpyasnpimportjsonimportloggingimportthreadingimportlogging.
python实现精确的四舍五入 mocobk
由于计算精度的问题，python无法实现真正的四舍五入round四舍五入时是遵循靠近0原则，所以-0.5和0.5进行0位四舍五入，返回的都是0round(2.135,2)-->2.13round(number[,ndigits])Returnthefloatingpointvaluenumberroundedtondigitsdigitsafterthedecimalpoint.Ifndigits
iOS 抓包工具选择与配置指南从零基础到高效调试的完整流程 HTTPwise ios 小程序 uni-app iphone android webview https
iOS抓包：复杂网络调试的必要技能随着移动端应用越来越依赖网络交互，iOS抓包作为核心调试工具之一，变得尤为重要。无论是调试App与后端的接口通信、排查HTTPS请求加密问题，还是定位网络连接超时、请求异常，抓包都能在关键时刻提供有效支持。然而，iOS系统的封闭性与安全机制，往往让开发者在调试过程中碰壁：证书无法安装：系统严格的证书信任机制使得常规抓包工具很难直接抓取HTTPS请求。无法配置代理：
【Python】线程—GIL—asyncio 2401_84139049 程序员 python 开发语言
它们的特点和适用场景：工具特点适用场景Lock最基本的互斥锁，一次只允许一个线程访问共享资源不可重入，即同一线程再次获取会导致死锁简单的线程同步需求需要确保一段代码同一时间只能被一个线程执行RLock可重入锁，同一线程可以多次获取锁并释放允许同一线程多次调用acquire()复杂的递归线程同步需求某些情况下需要允许同一线程多次获取和释放锁Semaphore允许一定数量的线程同时访问共享资源控制并发
基于 Python/PHP/Node.js 的淘宝 API 商品数据抓取开发教程
在电商数据分析、竞品监控等场景中，抓取淘宝商品数据是常见需求。淘宝开放平台（OpenPlatform）提供了标准化的API接口，通过合法途径调用可高效获取商品信息。本文将分别基于Python、PHP、Node.js三种语言，详解淘宝API商品数据抓取的开发流程，并提供完整代码示例。一、淘宝API准备工作在开发前，需完成以下准备步骤：注册开发者账号访问注册账号并完成实名认证，创建应用（应用类型选择“
python的多线程无法并行只能并发，why？
标题python的多线程无法并行只能并发，why？python的多线程无法并行只能并发，why？在Python中，特别是使用CPython解释器时，由于存在全局解释器锁（GIL），即使在多核处理器上，只有一个线程在同一时刻可以执行Python字节码。GIL会导致CPU密集型任务的线程不能真正并行执行，即使在多核机器上。这种情况下，即使你创建多个线程，CPU也会轮流为每个线程分配执行时间。只有涉及到
图灵python从入门到实践浮点数_Python编程从入门到实践-图灵出品-pdf 巴黎巨星岬太郎
封面简介本书是一本针对所有层次的Python读者而作的Python入门书。全书分两部分：首部分介绍用Python编程所必须了解的基本概念，包括matplotlib、NumPy和Pygal等强大的Python库和工具介绍，以及列表、字典、if语句、类、文件与异常、代码测试等内容；第二部分将理论付诸实践，讲解如何开发三个项目，包括简单的Python2D游戏开发，如何利用数据生成交互式的信息图，以及创建
python从菜鸟到高手电子书下载_PYTHON从菜鸟到高手清华大学出版社逐码追风
推荐序...1前言...3本书配套资源...5第一篇Python基础知识第1章初识Python.31.1Python简介...31.2搭建Python开发环境...81.3第一个Python程序...261.4调试Python程序...261.5小结...291.6实战与练习...29第2章Python语言基础...302.1Python程序中的基本要素...302.2数字...342.3获取用户
Python从入门到高手9.1节-Python中的字典类型大神薯条老师 Python从入门到高手 python 数据分析机器学习爬虫网络爬虫深度学习
目录9.1.1理解字典类型9.1.2字典的类型名9.1.3字典的定义9.1.4字典的主要性质9.1.5好好学习，天天向上9.1.1理解字典类型在日常生活中，我们常常会接触到“字典”这种数据类型，例如一本书籍的目录结构，在目录结构中，通过查找页码，就可以快速翻到指定的页面。如果没有这样的页码，那么我们必须从书籍的第一页开始，一页一页地查找。有了页码以后，直接翻到指定的页面。在Python中，可以通过
Github 2024-06-07开源项目日报 Top10
根据GithubTrendings的统计，今日(2024-06-07统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Python项目3C++项目3JavaScript项目2JupyterNotebook项目1TypeScript项目1Vue项目1比特币核心：开源比特币软件创建周期：4919天开发语言：C++协议类型：MITLicenseStar数量：76760个F
LangGraph 教程：初学者综合指南（1）背太阳的牧羊人 langgraph langchain langgraph
关键概念图结构LangGraph设计的核心是基于图形的应用程序工作流程表示。该图包含两个主要元素：节点-工作的构建块：LangGraph中的每个节点代表应用程序中的一个不同的工作或操作单元。这些节点本质上是封装特定任务的Python函数。此任务可能涉及多种操作，例如：与LLM直接沟通，进行文本生成、摘要或其他基于语言的任务。与外部工具和API交互以获取数据或在现实世界中执行操作。通过格式化、过滤或
我们大多在食用二次知识――论知识的阶级性 Yo有灵L0
不论是《美丽新世界》，还是《未来简史》，对人类未来的预计都没有很美好。这其中包含了太多集权的观点。即：人类的绝大多数资源被极少数人所掌控，而绝大多数人沦为平庸。在《美丽新世界》里，阶级的划分直接由人为控制出生来决定；在《未来简史》里，当人们把越来越多的事情交给算法去处理之后，人类自身则降至被动的地位。这些看起来和知识不搭边？不，知识这条路，竟然也存在着阶级划分。这种阶级划分，有自身的因素，也有环境
Python 应用程序分发全指南：从基础到高级工具与实践面朝大海，春不暖，花不开 Python基础 python 开发语言
文章大纲引言在现代软件开发中，Python因其简洁的语法和强大的生态系统而广受欢迎。然而，将Python应用程序从开发者手中传递给最终用户并非总是简单的过程。分发Python应用程序涉及到诸多挑战，例如依赖管理、跨平台兼容性以及用户环境的多样性。如果分发不当，用户可能面临安装失败或运行错误等问题，从而影响软件的使用体验。本文将深入探讨Python应用程序分发的各种方法，从最基础的源代码分享到现代标
第31次一周小结（2023.02.19-02.25） 2023.02.26 龚宇佳
上周总结：1.阅读21h。第一，精读《社会性动物》，有些内容和《态度改变与社会影响》、《思考，快与慢》想通，读起来很顺畅。第二，翻看《夏商周：从神话到史实》以及《汉字就是这么来的》。2.写作3.5h。保持日更。3.语言学习5h。I.粤语学习方面。上周模仿了电视剧《新四十二章经》，在工作中和同事用粤语交流，II.英语学习方面。每天至少听写或翻译一篇，跟读电影扎导版《正义联盟》。4.PPT学习3.5h
轻松拿捏Anaconda安装，Python开发快人一步奔跑吧邓邓子必备核心技能 python 开发语言 Anaconda 科学计算
目录一、Anaconda是什么1.1包管理与环境管理1.2预装丰富的科学计算库二、为什么选择Anaconda2.1简化依赖管理2.2避免版本冲突2.3丰富的库资源2.4适合的应用场景三、安装前准备3.1确认系统要求3.2下载安装包四、Windows系统安装步骤4.1运行安装程序4.2许可协议4.3选择安装类型4.4选择安装路径4.5高级选项4.6安装完成五、MacOS系统安装步骤5.1下载安装包5
早起一小时，你就赢了金塔488潘顺英
有位前辈跟我算过一笔账：如果每天早起一小时，一个月就比别人多了30个小时。这30个小时，你可以看完几本书，可以在一门新技能上初入门槛……人与人的差距就是这样逐渐拉开的。这笔账算得我热血沸腾，二话不说，当即着手去实施。可是这激情来得快褪去得也快，每天早上被闹钟吵醒的电光石火之间，就为自己找了无数的理由和借口开脱：睡眠不足影响一天的效率；学习不差这一会儿，先再补个觉；明天一定把今天欠下的补回来……等心
mavlink python 彩云的笔记 linux 无人驾驶 mavlink
frompymavlinkimportmavutil#Createtheconnectionm=mavutil.mavlink_connection('udpin:0.0.0.0:14550')dir(m.mav)['_MAVLink__callbacks','_MAVLink__parse_char_legacy','_MAVLink__parse_char_native','__class__
《用上位机控制无人机：Python+MAVLink协议飞行实验》欧振芳 python
1.实验目标-通过Python编写的上位机程序，基于MAVLink协议控制无人机（如PX4/ArduPilot固件的无人机）。-实现基础飞行指令：解锁、起飞、悬停、降落。-探索MAVLink消息的构造与解析机制。2.实验环境准备硬件-无人机硬件：支持MAVLink协议的飞控（如Pixhawk系列）。-通信链路：USB直连、数传电台（3DRRadio）或WiFi（如通过UDP）。-安全环境：空旷无干
一次Python与STK12.2联合仿真
（一）软件准备：STK12.2是在某宝上花钱买的。我个人在安装软件上，更偏向于能用钱解决的就用钱解决，无论是商家远程安装还是自己按照商家的步骤安装，效率都更高，而自己从网上找免费的渠道安装软件费时费力还不一定能成功。Python是自己按照版本对应关系下载的，我使用的Python版本是3.10.9。我是在PycharmCommunityEdition2023.1.1上进行编程。（二）STK12与Py
《Python 项目 CI/CD 实战指南：从零构建自动化部署流水线》清水白石008 课程教程学习笔记开发语言 python ci/cd 自动化
《Python项目CI/CD实战指南：从零构建自动化部署流水线》一、引言：为什么Python项目需要CI/CD？在现代软件开发中，CI/CD（持续集成/持续部署）已成为不可或缺的工程实践。它不仅提升了开发效率，还显著降低了部署风险。对于Python项目而言，CI/CD的价值尤为突出：✅自动化测试确保代码质量✅快速部署加速产品迭代✅与云平台、容器技术无缝集成✅支持多版本、多环境的灵活发布Python
使用python调用STK12.2并实现霍曼转移 AndyVictory python 开发语言
使用STK的PythonAPI和Astrogator模块来创建一个简单的霍曼转移轨道场景（从近地轨道转移到地球同步轨道）:1、创建一个新的场景并添加一个卫星。2、定义卫星的初始状态（近地轨道的参数）。3、传播近地轨道。4、使用目标序列和DV1机动将卫星转移到转移椭圆轨道。5、传播转移椭圆轨道到远地点。6、使用目标序列和DV2机动将卫星转移到外部轨道（地球同步轨道）。7、传播外部轨道。8、运行任务控
《复制技能：我靠系统成为篮球天才》方阳刘诗婷（独家小说）精彩TXT阅读九月文楼
《复制技能：我靠系统成为篮球天才》方阳刘诗婷（独家小说）精彩TXT阅读主角：方阳刘诗婷简介：开局惨遭深爱女友劈腿，还目睹女友与校篮球队的其他人勾搭。一股无名火直冲心头，同时也有一个奇怪的声音在我的脑海中出现:【恭喜宿主，激活最强篮球系统，宿主只要和他人打球，就能够一定程度复制对方的篮球技术，能够复制的上限和完成度需要根据宿主在篮球界的名声，影响力等等因素来决定。】可关注微信公众号【冰晶文楼】去回个
python坦克大战名难取aaa python pygame 开发语言贴图
文章目录前言资源获取一、项目介绍1.pygame是什么？2.操作指南3.项目演示二、项目实现1.安装库2.引入库3.项目代码3.1主逻辑类3.2背景类3.3基类3.4坦克类3.5MyTank类3.6EnemyTank类3.7子弹类3.8爆炸类3.9墙壁类3.10水晶类3.11音乐类4.项目打包参考文档总结前言《坦克大战》，1985年由日本开发商南梦宫（Namco）开发，是第一款可以双打的红白机游戏
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS

【Python程序设计】 工厂模式【07/8】