銀河鐵道的企鵝

Apache Airflow 2.1.2：开源工作流管理系统的全面指南

本文还有配套的精品资源，点击获取

简介：Apache Airflow 2.1.2是一个开源的工作流管理系统，用于编排、调度和监控复杂的业务逻辑。它基于DAG（有向无环图）概念，通过Python代码定义任务的Operator，定义任务的执行顺序和条件。该版本提供了任务调度、监控、错误处理、插件扩展和多环境管理等核心功能。解压后包含许可证文件、文档和源代码目录等，且介绍了安装和运行步骤。Airflow适用于数据工程领域，并能优化和自动化业务流程。

1. Apache Airflow 概述

1.1 Apache Airflow简介

Apache Airflow是一个开源的工作流管理平台，用于编排复杂的任务调度和工作流程。由Airbnb开发并捐献给Apache软件基金会，Airflow以其强大的可编程性和灵活性在大数据领域迅速流行起来。

1.2 Airflow的核心功能

Airflow的核心功能包括任务调度、监控和管理。它允许用户通过定义DAG（有向无环图）来表达工作流程，并提供了丰富的Operator用于执行各种任务。Airflow内置了Web界面，方便用户监控和管理任务的执行情况。

1.3 Airflow的应用场景

Airflow适用于各种数据处理场景，包括ETL（提取、转换、加载）、数据管道构建、任务调度和监控等。它支持复杂的依赖管理，使得编排大型和复杂的工作流成为可能。

2. DAG和Operator的概念

2.1 DAG的基本原理

2.1.1 DAG的定义和重要性

在Apache Airflow中，DAG（Directed Acyclic Graph）是一个有向无环图，用于表示任务之间的依赖关系。DAG是Airflow的核心概念之一，它允许用户以图形化的方式定义工作流，其中节点代表任务，边代表任务之间的依赖关系。

DAG的重要性在于它提供了一种直观的方式来管理和调度复杂的任务依赖关系。在数据工程和ETL（Extract, Transform, Load）流程中，任务往往需要按照特定的顺序执行，DAG使得这一过程变得可控和易于理解。例如，你可能需要先从数据库中提取数据，然后对其进行转换，最后将结果加载到数据仓库中。这些任务之间的依赖关系可以用DAG来清晰地表示出来。

2.1.2 DAG的创建和配置

创建DAG的第一步是定义一个Python文件，通常以 .py 为扩展名。在这个文件中，你需要导入Airflow的核心模块，并定义一个继承自 DAG 类的实例。这个实例将包含所有必要的配置，如DAG的ID、默认参数、调度间隔、运行时参数等。

from airflow import DAG
from airflow.operators.bash_operator import BashOperator
from datetime import datetime

default_args = {
    'start_date': datetime(2021, 1, 1),
    'owner': 'airflow',
    'depends_on_past': False,
    'retries': 1,
    'retry_delay': timedelta(minutes=5),
}

dag = DAG(
    'example_dag',
    default_args=default_args,
    schedule_interval='@daily',
)

task1 = BashOperator(
    task_id='print_date',
    bash_command='date',
    dag=dag,
)

task2 = BashOperator(
    task_id='sleep',
    bash_command='sleep 5',
    retries=3,
    dag=dag,
)

在这个例子中，我们定义了一个名为 example_dag 的DAG，它包含两个任务： print_date 和 sleep 。 print_date 任务简单地打印当前日期，而 sleep 任务则在执行时休眠5秒。我们还设置了DAG的一些基本参数，如 start_date 、 owner 、 schedule_interval 等。

通过本章节的介绍，我们了解了DAG的基本概念和创建方法。在本章节中，我们将深入探讨DAG的高级配置，包括任务依赖关系的管理、动态DAG的生成等。

2.2 Operator的类型和作用

2.2.1 常见Operator类型介绍

在Airflow中，Operator是定义和执行任务的基本单元。每个Operator代表一个特定的操作，如执行一个bash命令、发送一个HTTP请求、处理一个数据库查询等。Airflow提供了一系列内置的Operator，覆盖了最常见的任务类型。

以下是几种常见的Operator类型及其作用：

BashOperator : 执行bash命令。
PythonOperator : 执行Python函数。
HttpOperator : 发送HTTP请求。
SqlOperator : 执行SQL命令。
Sensor : 等待条件满足后再继续执行。
EmailOperator : 发送电子邮件。

每个Operator都有其特定的参数和属性，用于定义任务的行为。例如， BashOperator 可以指定要执行的命令， SqlOperator 可以指定要执行的SQL语句。

2.2.2 Operator的参数和属性

为了使用Operator，你需要了解它们的参数和属性。这些参数和属性定义了任务的行为和执行方式。例如，大多数Operator都有一个 task_id 参数，用于标识任务的名称。

以 BashOperator 为例，以下是它的几个关键参数：

bash_command : 要执行的bash命令。
env : 环境变量的字典。
execution_timeout : 任务执行的超时时间。

task = BashOperator(
    task_id='print_date',
    bash_command='date',
    env={'MY_VAR': 'value'},
    execution_timeout=timedelta(minutes=1),
    dag=dag,
)

在这个例子中， BashOperator 执行了 date 命令，并设置了环境变量 MY_VAR 。 execution_timeout 参数用于指定任务的最大执行时间。

2.2.3 自定义Operator的开发

当内置的Operator无法满足特定需求时，你可以开发自定义的Operator。自定义Operator需要继承自 BaseOperator 类，并实现 execute 方法。 execute 方法是任务执行时调用的核心方法，你需要在此方法中编写具体的任务逻辑。

以下是一个简单的自定义Operator的例子，它执行一个打印消息的任务：

from airflow.models import BaseOperator
import logging

class PrintMessageOperator(BaseOperator):
    def __init__(self, message, *args, **kwargs):
        super(PrintMessageOperator, self).__init__(*args, **kwargs)
        self.message = message

    def execute(self, context):
        ***(self.message)

# 使用自定义Operator
task = PrintMessageOperator(
    task_id='print_message',
    message='Hello Airflow!',
    dag=dag,
)

在这个例子中， PrintMessageOperator 继承自 BaseOperator ，并接受一个 message 参数。 execute 方法打印了这条消息。

通过本章节的介绍，我们了解了Operator的基本概念和常见类型。在本章节中，我们将深入探讨如何使用这些Operator来构建复杂的任务依赖关系，以及如何开发自定义的Operator来满足特定的需求。

在下一节中，我们将介绍DAG中的任务调度策略和调度器。我们将讨论如何设置和优化时间调度，以及如何管理任务之间的依赖关系。

3. 任务调度功能

3.1 调度策略和调度器

3.1.1 调度策略的基本概念

在Airflow中，调度策略是指决定何时启动DAG中的任务的规则。这些规则可以基于时间的设定，也可以是外部事件触发。Airflow的调度策略主要依赖于 start_date 、 end_date 、 depends_on_past 、 wait_for_downstream 等参数来定义。

start_date ：DAG开始调度的时间。
end_date ：DAG停止调度的时间，如果不设置，则默认为无限期执行。
depends_on_past ：决定任务是否依赖于前一次调度的结果。
wait_for_downstream ：决定如果前一个任务失败，当前任务是否等待或立即调度。

3.1.2 内置调度器的介绍和配置

Airflow提供了两种内置调度器： SequentialScheduler 和 CeleryScheduler 。默认情况下，Airflow使用 SequentialScheduler ，它适用于单节点环境和测试场景。 CeleryScheduler 则适用于生产环境，支持分布式执行和任务的动态分配。

要配置调度器，需要修改Airflow配置文件 airflow.cfg 中的 scheduler 参数。例如：

[scheduler]
调度器类型 = CeleryScheduler

3.1.3 调度策略的优化

调度策略的优化主要关注于减少不必要的任务调度和提升调度器的性能。例如，可以设置合理的 start_date 和 end_date ，避免调度过去或未来的任务。另外，可以通过调整 depends_on_past 和 wait_for_downstream 参数来优化依赖关系，减少不必要的等待时间。

3.2 时间调度和依赖管理

3.2.1 时间调度的设置和优化

时间调度是通过DAG中的 schedule_interval 参数来设置的，它定义了任务调度的频率。例如， @daily 表示每天调度一次， @hourly 表示每小时调度一次。此外，还可以使用Cron表达式来自定义调度频率。

from datetime import datetime, timedelta

default_args = {
    'owner': 'airflow',
    'start_date': datetime(2023, 1, 1),
    'email': ['***'],
    'email_on_failure': False,
    'email_on_retry': False,
    'retries': 1,
    'retry_delay': timedelta(minutes=5),
}

dag = DAG(
    'example_dag',
    default_args=default_args,
    schedule_interval="@daily",
)

3.2.2 任务依赖关系的管理

在Airflow中，任务之间的依赖关系是通过 PythonOperator 或其他Operator的 depends_on_past 参数来管理的。这个参数决定了一个任务是否需要等待前一个任务成功完成才能启动。

from airflow.operators.python_operator import PythonOperator

def print_context(**context):
    print("The time is: {}".format(datetime.now().strftime("%Y-%m-%d %H:%M:%S")))

task1 = PythonOperator(
    task_id='print_current_time',
    python_callable=print_context,
    provide_context=True,
    dag=dag,
)

task2 = PythonOperator(
    task_id='print_later',
    python_callable=print_context,
    provide_context=True,
    depends_on_past=True,
    dag=dag,
)

task1 >> task2

3.2.3 依赖关系的可视化展示

为了更好地理解和管理任务之间的依赖关系，Airflow提供了Web界面来可视化展示这些关系。在Web界面中，每个任务都有一个节点，节点之间的连线表示依赖关系。

graph LR
A[任务1] -->|依赖| B[任务2]

3.2.4 依赖关系的动态调整

有时候，我们可能需要在任务执行过程中动态调整依赖关系。例如，根据前一个任务的输出结果来决定是否启动下一个任务。在Airflow中，这可以通过编写自定义的 BranchPythonOperator 来实现。

from airflow.operators.python_operator import BranchPythonOperator
from airflow.models import BaseOperator

def decide_to_run_task(**context):
    if context['dag_run'].conf.get('use_task2', False):
        return 'task2'
    return 'task3'

branch_task = BranchPythonOperator(
    task_id='decide_to_run',
    python_callable=decide_to_run_task,
    provide_context=True,
    dag=dag,
)

task2 = PythonOperator(
    task_id='task2',
    python_callable=print_context,
    provide_context=True,
    dag=dag,
)

task3 = PythonOperator(
    task_id='task3',
    python_callable=print_context,
    provide_context=True,
    dag=dag,
)

branch_task >> task2
branch_task >> task3

3.2.5 依赖关系的代码逻辑解读

在上述代码中， decide_to_run_task 函数根据 dag_run 对象的配置决定下一个要执行的任务。这个函数返回的任务ID将决定执行流程的方向。

context['dag_run'].conf.get('use_task2', False) ：获取 dag_run 配置中的 use_task2 键的值，如果没有设置则默认为 False 。
if context['dag_run'].conf.get('use_task2', False) ：如果 use_task2 为 True ，则返回 'task2' ，否则返回 'task3' 。

3.2.6 依赖关系管理的注意事项

在管理任务依赖关系时，需要考虑以下几点： - 避免循环依赖，这将导致任务无法执行。 - 合理使用 depends_on_past 参数来控制任务的执行顺序。 - 注意任务执行的资源消耗和时间成本，避免不必要的依赖导致资源浪费。

3.2.7 任务调度和依赖管理的实践案例

假设我们有一个数据处理的工作流，其中包含两个任务： task1 负责数据提取， task2 负责数据转换。 task1 在成功完成后会触发 task2 。

from airflow.operators.python_operator import PythonOperator
from airflow.operators.bash_operator import BashOperator
from airflow.utils.dates import days_ago
from airflow.models import DAG

def extract_data():
    # 提取数据的逻辑
    print("Data extracted.")

def transform_data():
    # 转换数据的逻辑
    print("Data transformed.")

default_args = {
    'owner': 'airflow',
    'start_date': days_ago(1),
}

dag = DAG(
    'example_dag',
    default_args=default_args,
    schedule_interval="@daily",
    catchup=False,
)

extract_task = PythonOperator(
    task_id='extract_data',
    python_callable=extract_data,
    dag=dag,
)

transform_task = BashOperator(
    task_id='transform_data',
    bash_command='transform_data.sh',
    dag=dag,
)

extract_task >> transform_task

在本章节中，我们介绍了Airflow的任务调度功能，包括调度策略和调度器的基本概念、时间调度的设置和优化、任务依赖关系的管理、依赖关系的可视化展示、动态调整以及管理注意事项。通过具体的代码示例和实践案例，我们深入理解了如何在Airflow中设计和实现高效的任务调度和依赖管理。

4. 任务监控功能

在本章节中，我们将深入探讨Apache Airflow的任务监控功能，这是确保数据管道稳定运行的关键组成部分。监控功能不仅可以帮助我们及时发现并解决问题，还能提供运维决策的依据。

4.1 监控组件和指标

4.1.1 Airflow提供的监控组件

Apache Airflow提供了一系列内置的监控组件，用于跟踪任务的状态和性能。这些组件包括但不限于：

Web服务器仪表板 ：Airflow的Web服务器提供了一个直观的仪表板，用于监控DAGs和任务的状态。它显示任务实例的实时状态，以及历史执行情况。
Graph View ：提供了一个图形化的方式来查看任务之间的依赖关系和执行进度。
Tree View ：以树状结构展示任务的层级关系和状态。
Gantt Chart ：展示任务的时间线和持续时间，帮助我们了解任务执行的时间分布。

4.1.2 常用监控指标的解释和应用

Airflow还提供了一些关键的监控指标，这些指标对于理解和优化数据管道至关重要。常用的指标包括：

DAGs状态 ：显示所有DAGs的运行状态，例如是否正在运行、暂停或失败。
任务实例状态 ：显示特定任务实例的状态，如成功、失败、运行中或重试中。
执行时间 ：记录任务的开始和结束时间，以及总的执行时间。
资源使用情况 ：监控任务执行期间的CPU、内存使用情况。

这些指标可以通过Airflow的API进行查询，并且可以集成到第三方监控工具中，如Prometheus和Grafana，以实现更复杂的监控和告警功能。

4.2 日志管理和报警机制

4.2.1 日志的收集和分析

Airflow的日志记录功能是任务监控不可或缺的一部分。默认情况下，Airflow会将日志记录到本地文件系统中。然而，对于大规模部署，将日志集中存储到如ELK（Elasticsearch, Logstash, Kibana）这样的日志分析平台是一个更好的选择。

日志分析可以帮助我们：

跟踪任务执行的细节 ：了解任务执行过程中的具体步骤和可能的错误信息。
分析性能瓶颈 ：通过分析日志中的时间戳，定位任务执行的瓶颈环节。
审计和合规 ：保留执行记录，用于审计和满足合规性要求。

4.2.2 报警设置和通知方式

Airflow支持多种报警通知方式，确保当任务失败或出现异常时，相关人员能够及时得到通知。这些通知方式包括：

邮件：通过配置SMTP服务器，Airflow可以发送邮件通知。
Webhooks ：当任务状态发生变化时，可以触发一个HTTP回调，用于集成到自定义的通知系统中。
Slack或其他聊天工具 ：通过集成第三方聊天工具，可以在聊天室中发送实时通知。

在本章节中，我们介绍了Airflow的任务监控功能，包括监控组件、指标、日志管理和报警机制。这些功能对于维护数据管道的稳定性至关重要。接下来，我们将探讨错误处理和重试策略，这将帮助我们更好地应对运行中的问题。

graph TD
    A[开始] --> B[监控组件和指标]
    B --> C[日志管理和报警机制]
    C --> D[错误处理和重试策略]
    D --> E[插件扩展能力]
    E --> F[多环境管理支持]
    F --> G[安装和运行Airflow的步骤]
    G --> H[数据工程领域的应用]
    H --> I[结束]

以上流程图展示了从任务监控功能到其他章节内容的逻辑关系，每一部分都是Airflow整体功能的重要组成部分。在实际应用中，监控功能与错误处理、插件扩展能力等其他功能紧密相连，共同确保数据管道的稳定运行。

5. 错误处理和重试策略

在数据管道的管理和运维过程中，错误处理和重试策略是确保系统稳定性和数据完整性的重要环节。Apache Airflow作为一个强大的工作流管理系统，提供了一系列的机制来处理任务执行中可能出现的错误，并支持灵活的重试策略来应对各种复杂情况。

5.1 错误处理机制

5.1.1 Airflow错误处理流程

Airflow的错误处理流程主要依赖于任务的状态管理和回调机制。当一个任务失败时，Airflow会根据预设的错误处理策略来进行下一步操作。这通常包括以下几个步骤：

检测错误 ：Airflow在任务执行过程中会定期检查任务的状态，一旦发现任务执行失败（如返回非零退出码），则会触发错误处理流程。
执行失败回调 ：如果任务配置了失败回调函数，Airflow会在任务失败时调用这些函数，这些函数可以用来发送告警邮件或者进行一些清理工作。
记录错误信息 ：失败的任务状态会被记录在数据库中，包括错误信息和堆栈跟踪，便于后续的分析和调试。
触发重试或失败处理 ：根据任务的重试策略，Airflow可能会重新调度任务，或者将任务标记为永久失败。

5.1.2 常见错误类型和处理方法

在实际使用中，任务失败可能有多种原因，下面是一些常见的错误类型及其处理方法：

资源限制 ：如果任务因资源不足（如内存溢出）而失败，可以通过调整任务的资源请求来解决。
依赖问题 ：任务可能因为依赖的服务或数据不可用而失败。在这种情况下，可以设置一个等待依赖的超时时间，并在超时后尝试重试。
编程错误 ：代码中的bug可能导致任务失败。这种情况下，需要开发者介入进行调试和修复。

# 示例：自定义失败回调函数
from airflow import DAG
from airflow.operators.dummy_operator import DummyOperator
from airflow.utils.trigger_rule import TriggerRule

def on_failure_callback(**context):
    print(f"Task failed with execution context {context}")

default_args = {
    'on_failure_callback': on_failure_callback,
}

dag = DAG('example_dag', default_args=default_args, schedule_interval=None)

task1 = DummyOperator(task_id='task1', dag=dag)
task2 = DummyOperator(task_id='task2', dag=dag, trigger_rule=TriggerRule.NONE_FAILED)

task1 >> task2

5.2 重试策略和恢复流程

5.2.1 任务重试的条件和策略

Airflow允许为每个任务单独配置重试策略，包括重试次数、重试延迟等。这些策略可以通过任务的 retries 和 retry_delay 参数进行设置。

retries ：指定任务失败后需要重试的次数，默认为0，即不重试。
retry_delay ：指定每次重试之间的延迟时间，默认为300秒（5分钟）。

# 示例：设置任务重试策略
from airflow import DAG
from airflow.operators.bash_operator import BashOperator
from datetime import datetime

default_args = {
    'start_date': datetime(2023, 1, 1),
    'retries': 3,
    'retry_delay': timedelta(minutes=5),
}

dag = DAG('retry_dag', default_args=default_args, schedule_interval=None)

task = BashOperator(
    task_id='failed_task',
    bash_command="exit 1",
    dag=dag
)

5.2.2 任务失败后的恢复步骤

当任务永久失败后，可以采取以下步骤进行恢复：

分析失败原因 ：查看任务的日志和堆栈跟踪信息，确定失败的原因。
修复问题 ：根据分析结果，修复代码中的bug或调整资源配置。
手动重置任务 ：使用Airflow的Web界面或者CLI工具手动重置任务到一个合适的状态，如 FAILED 或 UP FOR RETRY 。
重新调度任务 ：在修复问题后，可以手动重新调度任务，或者等待Airflow自动进行重试。

Airflow提供了强大的错误处理和重试策略，使得数据管道的管理更加灵活和可靠。通过合理配置这些策略，可以最大限度地减少任务失败对数据处理流程的影响，并提高整体的运维效率。

本文还有配套的精品资源，点击获取

你可能感兴趣的:(Apache Airflow 2.1.2：开源工作流管理系统的全面指南)

优化版三国主题MySQL建表与查询练习（细节增强）韩公子的Linux大集市五 MySQL运维DBA mysql 数据库
文章目录优化版三国主题MySQL建表与查询练习（细节增强）题目一：三国人物信息表（全面优化）建表语句（增强约束与注释）插入数据（含完整信息）查询练习（增强实用性）题目二：三国战役表（增强关系设计）建表语句（完整关系模型）插入数据（完整战役信息）查询练习（多表关联）综合实战演练1.人物能力值分析2.战役地图查询3.胜负因素分析设计亮点总结优化版三国主题MySQL建表与查询练习（细节增强）题目一：三国
php加密的是什么,看看下面这个php代码是使用什么加密的? xiao龟 php加密的是什么
加密的代码如下：!/usr/bin/php-qeNrtWWlTG1cW/SvY5Yqg4krevoSQuIUEiE0LYAwuijKbEGA2YbMk+TUOjEnyc976b+Y2pKZqpNcgz3gm46r5BpL69Ln3nnvved3PrrFyRhOJEAoySvT66ceoMFbS02BNEFE8XRsLRAmkHI7eKMxMHC7tnKOz+Ytuezt7SUrPS6TcOa0c6
php rad加密公钥过长,看看下面这个php代码是使用什么加密的? 范特嘻嘻 php rad加密公钥过长
加密的代码如下：!/usr/bin/php-qeNrtWWlTG1cW/SvY5Yqg4krevoSQuIUEiE0LYAwuijKbEGA2YbMk+TUOjEnyc976b+Y2pKZqpNcgz3gm46r5BpL69Ln3nnvved3PrrFyRhOJEAoySvT66ceoMFbS02BNEFE8XRsLRAmkHI7eKMxMHC7tnKOz+Ytuezt7SUrPS6TcOa0c6
TCP和UDP协议区别+应用场景+优缺点+常用协议马拉萨的春天一天一读基础知识点 tcp/ip udp 网络
文章目录1.TCP协议特点应用场景优点缺点运行于TCP协议之上的协议2.UDP协议特点应用场景优点缺点运行于UDP协议之上的协议TCP（TransmissionControlProtocol）和UDP（UserDatagramProtocol）是两种常用的传输层协议，它们在网络通信中扮演不同的角色，各有优缺点。1.TCP协议特点提供面向连接的、可靠的数据传输服务。使用三次握手建立连接，四次挥手断开
什么是站群8C？应该能获得多少个IP？
简述站群服务器有1C、2C、4C、8C或更多的种类,IP数量都不同,究竟不同C段数目的分别是什么？不同C段应获得多少IP数量才算合理吗？是如何换算出来？内文会为大家解答什么是C段C段是指IP段的第三个节点,例如142.250.66.110,当中的第三个节点的66便是C段内容。C段的数目越多,不同C段的产品IP便越多,但相对可用IP越少IP组合:aaa.bbb.ccc.dddIP范围:0-255.0
使用内联汇编实现CAS操作（含详细讲解）（Charon）汇编
在多线程环境下，如何安全地更新共享变量，一直是一个重要的话题。今天，我们通过一段使用内联汇编实现的CAS（CompareAndSwap）代码，深入学习它的原理和用法。完整示例代码如下：#include//标准输入输出头文件#include//pthread多线程编程相关头文件#include//usleep函数需要的头文件#defineTHREAD_COUNT10//定义线程数量为10volati
C语言手写一个简易 DNS 客户端（Charon）服务器 linux 网络
本文聚焦讲解如何通过C语言构造并发送一个最小化的DNS请求，特别以dns_client_commit()函数为主线，带你一步步理解DNS请求的构造过程。为什么要学习DNS报文构造？我们平时在浏览器里输入一个网址（比如www.baidu.com），浏览器其实背后会通过操作系统的DNS模块发送一个查询请求，将域名解析为IP地址。而如果我们手动用C语言自己构造DNS请求，我们可以更深刻地理解底层网络通信
C语言手写简易 DNS 客户端（接收部分）（Charon） c语言开发语言
本文通过纯C语言手动构造DNS请求报文，使用UDP协议发送到公共DNS服务器，并接收响应，完整演示DNS请求流程。主流程：dns_client_commit()这是整个流程的核心函数，下面我们按顺序拆解每一步的逻辑，尤其突出发送sendto与接收recvfrom的设计思路和实现。第一步：创建UDP套接字intsockfd=socket(AF_INET,SOCK_DGRAM,0);if(sockfd
服务器或网络卡的原因和状况 qq2453939845 服务器网络网络服务器
卡的情况下，请先检查您服务器的使用情况。1、CPU使用率是否大于50%。2、内存使用率是否过高。3、网络使用率是否过高。如您购买的是10mbps，那么您服务器的网卡如果为100mbps的连接速率，当网络使用率为10%左右的情况下，则表示您的服务器带宽跑满了，以此类推，如果是千兆网卡（连接速率1000mbps）的，则显示1%即为10mbps。如果出现上述情况，则表明您的服务器或网络无法承载您目前的服
解决Linux绑定失败地址已使用(端口被占用)的问题誰能久伴不乏 linux 服务器网络
文章目录解决`bindfailed:Addressalreadyinuse`问题一、问题原因1.**端口已经被其他程序占用**2.**端口处于`TIME_WAIT`状态**3.**未正确关闭套接字**二、如何排查和解决问题1.**确认端口是否被占用**2.**查找并杀掉占用端口的进程**3.**等待端口释放（`TIME_WAIT`状态）**4.**强制重用端口**（仅限开发环境）5.**使用其他端
基于STM32金属探测器设计
摘要随着便携式金属探测器在安防，考古及工业检测等领域需求的增加，现有探测器的体积大，能耗高，操作复杂的缺点亟需解决。本文针对便携式金属探测器的设计进行探索，在硬件上使用了STM32F103C8T6单片机模块，WL02涡流传感器模块，ADS1115模数转换模块，蜂鸣器模块等设计出本系统的电路，在软件上设计出主程序，信号采集及报警子程序等，对系统进行基础功能，灵敏度，抗干扰和耐久性测试，测试结果表明探
8个Java TCP/UDP框架：优缺点及应用场景全解析！技术男老张 #编程语言 -JAVA 编程语言 java tcp/ip udp ssl 网络协议 websocket http
JavaTCP框架在现代网络编程中扮演着至关重要的角色，尤其是在需要高效、稳定且可扩展的网络通信解决方案时。本文将深入探讨一些主流的JavaTCP/UDP框架，分析它们的优缺点以及适用场景，旨在为开发者提供一份详尽的指南。一、NettyNetty是一个异步事件驱动的网络应用框架，用于快速开发高性能、高可靠性的网络IO程序。Netty的设计目标是简化网络编程的复杂性，同时提高网络应用的性能和可扩展性
基于TCP/UDP的应用层协议 huangxy10 面试专题——网络知识
1，基于TCP的有：Telnet(TeletypeovertheNetwork,网络电传)，通过一个终端(terminal)登陆到网络
大模型MoE模型技术详解大雷神 AI 人工智能机器学习 AI 大模型
场景：大型超市的收银区域想象一下周末的超市，人山人海（就像大模型要处理海量的Token）。众多收银台（专家）：超市有20个收银台，每个收银台都是一个“专家”。有的收银台是人工柜台（擅长处理现金、复杂商品、老人购物）；有的是自助扫码机（适合年轻人、商品少、动作快）；有的是快速通道（只允许买5件商品以下的顾客）；有的是大宗商品通道（专门处理整箱饮料、大件物品）。智能引导系统（门控网络）：顾客（每个To
K8s 1.24在node节点上手动部署etcd 喝醉酒的小白 K8s kubernetes etcd 容器
目录标题第一次操作一、生成证书并拷贝到新增节点~~~~方案1~~缺少了SAN（SubjectAlternativeNames）~~方案2关键改进：使用说明：二、在已有节点（181）上添加etcd集群成员三、在180上部署静态Pod四、更新旧节点（181）的静态Pod配置-可选五、验证集群状态第一次操作下面给出在节点 172.30.30.180（下简称“180”）上新增etcd成员的完整操作步骤。假
信创海光x86服务器，定义、特点及应用详解
信创海光x86服务器是中国近年来在信息技术领域努力实现自主可控的成果之一，旨在打破国外技术封锁和限制，这类服务器的核心特点基于x86架构，这是一种广泛应用于全球的微处理器架构，由英特尔公司最初设计，海光作为国产处理器的代表之一，其技术基础来源于AMDZen的授权，主要面向服务器市场。服务器核心：海光C863350处理器海光C863350处理器是一款基于x86架构的高性能CPU，具体参数包括8核心1
为什么你的服务器总被攻击？运维老兵的深度分析
作为运维人员，最头疼的莫过于服务器在毫无征兆的情况下变得异常缓慢、服务中断，甚至数据泄露。事后查看日志，常常发现一些“莫名其妙”的攻击痕迹。为什么服务器会成为攻击者的目标？这些攻击又是如何悄无声息发生的？今天，我们就从实战角度分析几种常见且容易被忽视的攻击模式，并教你如何通过日志分析初步定位问题。一、服务器被攻击的常见“莫名其妙”原因“扫楼式”探测与弱口令爆破：现象：服务器CPU、内存无明显异常，
三网BGP服务器——CDN加速的底层基石群联云防护小杜安全问题汇总服务器 python 运维游戏安全自动化网络
为什么跨网访问会成为业务性能杀手？场景痛点当电信用户访问联通机房的资源时，平均延迟高达120ms以上，而跨网丢包率可达15%。传统单线机房导致30%的用户体验直接下降。BGP协议的核心价值#三网路由优化模拟器（Python3）importrandomdefbgp_route_selection(user_isp,cdn_nodes):#用户ISP：1=电信2=移动3=联通#节点示例：{'node1
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
linux/ubuntu启动引导过程详细分析奇妙之二进制 #linux ubuntu postgresql
文章目录**一、固件初始化阶段（BIOS/UEFI）****1.BIOS（基本输入输出系统）模式****2.UEFI（统一可扩展固件接口）模式****二、引导加载程序阶段（GRUB2）****1.GRUB2的加载过程****2.GRUB配置解析****3.内核参数传递****三、内核加载与初始化****1.内核解压缩与启动****2.initramfs（初始内存文件系统）加载****3.根文件系统
udev 规则文件命名规范奇妙之二进制 #嵌入式/Linux linux 网络运维
文章目录udev规则文件名的含义、规范及数字开头的原因一、udev规则文件的基本概念二、udev规则文件名的规范与含义1.文件名格式规范2.名称各部分的含义3.文件扫描路径三、为何规则文件名通常以数字开头？1.执行顺序的精确控制2.便于分类和管理3.兼容性与标准化四、示例与实践建议1.常见规则文件示例2.自定义规则命名建议五、总结udev规则文件名的含义、规范及数字开头的原因一、udev规则文件的
初学者如何选购性价比国产电钢琴？指尖跃动的 C 大调电钢琴
内容概要本文专为初学者设计，系统解析选购性价比国产电钢琴的关键要点。我们将从选购指南入手，深入探讨手感还原度（如逐级重锤技术和实木琴键设计）、音质稳定性（高复音数确保不跑音）、实用功能（如耳机插孔避免扰民）及性价比策略（低价位结合零调音成本）。随后，推荐高性价比型号，例如贝琪电钢琴，并全面分析其优缺点，帮助读者明智决策。此外，常见问题部分将解答入门常见困惑。为清晰展示核心内容，下表概述文章结构：文
UDP并发服务器之多进程并发
一、常见的服务器类型在网络程序里面，通常都是一个服务器处理多个客户端。为了处理多个客户端的请求,服务器端程序有不同的处理方式。1.迭代服务器大多数UDP都是迭代运行，服务器等待客户端的数据，收到数据后处理该数据，送回其应答，在等待下一个客户端请求。2.并发服务器并发服务器是指在同一个时刻可以响应多个客户端的请求本质是创建多进程/多线程，对多数用户的信息进行处理UDP协议一般默认是不支持多线程并发的
Docker高级管理 --Dockerfile镜像制作牛爷爷敲代码 docker 容器 LNMP dockerfile 镜像制作
Docker高级管理--Dockerfile镜像制作一、Dockerfile基础概念1.定义与作用定义：Dockerfile是一个包含创建Docker镜像所需指令的文本文件。作用：自动化镜像构建流程，避免手动配置的繁琐和不一致性。版本控制：Dockerfile可纳入代码仓库，便于团队协作和追踪变更。可重复性：相同的Dockerfile构建出的镜像内容完全一致。2.核心组件指令（Instructio
Java中hashmap的原理好好沉淀笔记学习 java 经验分享
是什么hashmap底层是由哈希表组成，用于存储键值对的，其核心就是将哈希值映射到数组索引位置上，通过数组+链条的方式来解决哈希冲突，java8之后优化成数组+链条+红黑树。存放hashmap的哈希值由hashcode方法来进行计算，确定存储在数组上的位置，哈希值进过计算之后可能会重复，此时直接加在链表上即可，防止冲突分布不均。扩容hashmap的数组默认长度是16，负载因子是0.75，当大于16
如何在Windows系统下使用Dockerfile构建Docker镜像：完整指南 996蹲坑 windows docker 容器
前言Docker作为当前最流行的容器化技术，已经成为开发、测试和运维的必备工具。本文将详细介绍在Windows系统下使用Dockerfile构建Docker镜像的完整流程，包括两种镜像构建方式的对比、Dockerfile核心指令详解、实战案例演示以及Windows系统下的特殊注意事项。一、Docker镜像构建的两种方式1.容器转为镜像（不推荐）这种方式适合临时保存容器状态，但不适合生产环境使用：#
Python入门--day04--Python 推导式、常见语句和内置函数总结 the time zips by #Python基础 python 开发语言
文章目录前言一、推导式1.列表推导式2.集合推导式3.字典推导式4.生成器推导式二、常见语句1赋值语句2.控制语句2.1条件语句2.1.1if-elif-else2.1.2match-case2.2循环语句2.2.1for循环2.2.2while循环2.3循环控制语句2.3.1break2.3.2continue2.3.3pass3.range语句3.函数定义语句4.异常处理语句4.1try-ex
flask模型model--多表操作 lpy817 flask python 后端数据库 mysql
外键的设置表之间的关系为一对多时，需要创建两张表，在多的一端表中设置外键。表之间的关系为多对多时，需要创建三张表，两边的表中一般都不设置外键，构建一张中间表对这两个表设置外键。如何知道backref定义的反向属性名，最终可以访问什么？#在A模型中（比如Grade）students=db.relationship('Student',backref='grade')#那么在B模型（Student）中
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
深入理解 Linux 中的 stat 函数与文件属性操作
在Linux系统编程中，获取和操作文件属性是一项基础且重要的任务。stat函数作为获取文件状态信息的核心接口，为我们提供了丰富的文件元数据。本文将详细解析stat函数的用法、结构体成员含义，以及与文件时间戳、权限相关的实用操作。一、stat函数：文件信息的"万能查询器"stat函数的原型非常简洁：intstat(constchar*pathname,structstat*statbuf)功能：通过
ios内付费 374016526 ios 内付费
近年来写了很多IOS的程序，内付费也用到不少，使用IOS的内付费实现起来比较麻烦，这里我写了一个简单的内付费包，希望对大家有帮助。具体使用如下: 这里的sender其实就是调用者，这里主要是为了回调使用。 [KuroStoreApi kuroStoreProductId:@"产品ID" storeSender:self storeFinishCallBa
20 款优秀的 Linux 终端仿真器 brotherlamp linux linux视频 linux资料 linux自学 linux教程
终端仿真器是一款用其它显示架构重现可视终端的计算机程序。换句话说就是终端仿真器能使哑终端看似像一台连接上了服务器的客户机。终端仿真器允许最终用户用文本用户界面和命令行来访问控制台和应用程序。（LCTT 译注：终端仿真器原意指对大型机-哑终端方式的模拟，不过在当今的 Linux 环境中，常指通过远程或本地方式连接的伪终端，俗称“终端”。）你能从开源世界中找到大量的终端仿真器，它们
Solr Deep Paging(solr 深分页) eksliang solr深分页 solr分页性能问题
转载请出自出处：http://eksliang.iteye.com/blog/2148370 作者：eksliang(ickes) blg:http://eksliang.iteye.com/ 概述长期以来，我们一直有一个深分页问题。如果直接跳到很靠后的页数，查询速度会比较慢。这是因为Solr的需要为查询从开始遍历所有数据。直到Solr的4.7这个问题一直没有一个很好的解决方案。直到solr
数据库面试题 18289753290 面试题数据库
1.union ,union all 网络搜索出的最佳答案： union和union all的区别是,union会自动压缩多个结果集合中的重复结果，而union all则将所有的结果全部显示出来，不管是不是重复。 Union：对两个结果集进行并集操作，不包括重复行，同时进行默认规则的排序； Union All：对两个结果集进行并集操作，包括重复行，不进行排序； 2.索引有哪些分类？作用是
Android TV屏幕适配酷的飞上天空 android
先说下现在市面上TV分辨率的大概情况两种分辨率为主 1.720标清，分辨率为1280x720. 屏幕尺寸以32寸为主，部分电视为42寸 2.1080p全高清，分辨率为1920x1080 屏幕尺寸以42寸为主，此分辨率电视屏幕从32寸到50寸都有适配遇到问题，已1080p尺寸为例：分辨率固定不变，屏幕尺寸变化较大。如：效果图尺寸为1920x1080，如果使用d
Timer定时器与ActionListener联合应用永夜-极光 java
功能:在控制台每秒输出一次代码: package Main; import javax.swing.Timer; import java.awt.event.*; public class T { private static int count = 0; public static void main(String[] args){
Ubuntu14.04系统Tab键不能自动补全问题解决随便小屋 Ubuntu 14.04
Unbuntu 14.4安装之后就在终端中使用Tab键不能自动补全，解决办法如下： 1、利用vi编辑器打开/etc/bash.bashrc文件（需要root权限） sudo vi /etc/bash.bashrc 接下来会提示输入密码 2、找到文件中的下列代码 #enable bash completion in interactive shells #if
学会人际关系三招轻松走职场 aijuans 职场
要想成功，仅有专业能力是不够的，处理好与老板、同事及下属的人际关系也是门大学问。如何才能在职场如鱼得水、游刃有余呢？在此，教您简单实用的三个窍门。　　第一，多汇报最近，管理学又提出了一个新名词“追随力”。它告诉我们，做下属最关键的就是要多请示汇报，让上司随时了解你的工作进度，有了新想法也要及时建议。不知不觉，你就有了“追随力”，上司会越来越了解和信任你。　　第二，勤沟通团队的力
《O2O：移动互联网时代的商业革命》读书笔记 aoyouzi 读书笔记
移动互联网的未来：碎片化内容+碎片化渠道=各式精准、互动的新型社会化营销。 O2O：Online to OffLine 线上线下活动 O2O就是在移动互联网时代，生活消费领域通过线上和线下互动的一种新型商业模式。手机二维码本质：O2O商务行为从线下现实世界到线上虚拟世界的入口。线上虚拟世界创造的本意是打破信息鸿沟，让不同地域、不同需求的人
js实现图片随鼠标滚动的效果百合不是茶 JavaScript 滚动属性的获取图片滚动属性获取页面加载
1,获取样式属性值 top 与顶部的距离 left 与左边的距离 right 与右边的距离 bottom 与下边的距离 zIndex 层叠层次例子:获取左边的宽度,当css写在body标签中时 <div id="adver" style="position:absolute;top:50px;left:1000p
ajax同步异步参数async bijian1013 jquery Ajax async
开发项目开发过程中，需要将ajax的返回值赋到全局变量中，然后在该页面其他地方引用，因为ajax异步的原因一直无法成功，需将async:false，使其变成同步的。格式： $.ajax({ type: 'POST', ur
Webx3框架（1） Bill_chen eclipse spring maven 框架 ibatis
Webx是淘宝开发的一套Web开发框架，Webx3是其第三个升级版本；采用Eclipse的开发环境，现在支持java开发；采用turbine原型的MVC框架，扩展了Spring容器，利用Maven进行项目的构建管理，灵活的ibatis持久层支持，总的来说，还是一套很不错的Web框架。 Webx3遵循turbine风格，velocity的模板被分为layout/screen/control三部
【MongoDB学习笔记五】MongoDB概述 bit1129 mongodb
MongoDB是面向文档的NoSQL数据库，尽量业界还对MongoDB存在一些质疑的声音，比如性能尤其是查询性能、数据一致性的支持没有想象的那么好，但是MongoDB用户群确实已经够多。MongoDB的亮点不在于它的性能，而是它处理非结构化数据的能力以及内置对分布式的支持(复制、分片达到的高可用、高可伸缩)，同时它提供的近似于SQL的查询能力，也是在做NoSQL技术选型时，考虑的一个重要因素。Mo
spring/hibernate/struts2常见异常总结白糖_ Hibernate
Spring ①ClassNotFoundException: org.aspectj.weaver.reflect.ReflectionWorld$ReflectionWorldException 缺少aspectjweaver.jar，该jar包常用于spring aop中 ②java.lang.ClassNotFoundException: org.sprin
jquery easyui表单重置(reset)扩展思路 bozch form jquery easyui reset
在jquery easyui表单中尚未提供表单重置的功能，这就需要自己对其进行扩展。扩展的时候要考虑的控件有： combo,combobox,combogrid,combotree,datebox,datetimebox 需要对其添加reset方法，reset方法就是把初始化的值赋值给当前的组件，这就需要在组件的初始化时将值保存下来。在所有的reset方法添加完毕之后，就需要对fo
编程之美-烙饼排序 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; /* *《编程之美》的思路是：搜索+剪枝。有点像是写下棋程序：当前情况下，把所有可能的下一步都做一遍；在这每一遍操作里面，计算出如果按这一步走的话，能不能赢（得出最优结果）。 *《编程之美》上代码有很多错误，且每个变量的含义令人费解。因此我按我的理解写了以下代码： */
Struts1.X 源码分析之ActionForm赋值原理 chenbowen00 struts
struts1在处理请求参数之前，首先会根据配置文件action节点的name属性创建对应的ActionForm。如果配置了name属性，却找不到对应的ActionForm类也不会报错，只是不会处理本次请求的请求参数。如果找到了对应的ActionForm类，则先判断是否已经存在ActionForm的实例，如果不存在则创建实例，并将其存放在对应的作用域中。作用域由配置文件action节点的s
[空天防御与经济]在获得充足的外部资源之前,太空投资需有限度 comsci 资源
这里有一个常识性的问题: 地球的资源,人类的资金是有限的,而太空是无限的..... 就算全人类联合起来,要在太空中修建大型空间站,也不一定能够成功,因为资源和资金,技术有客观的限制.... &
ORACLE临时表—ON COMMIT PRESERVE ROWS daizj oracle 临时表
ORACLE临时表转临时表：像普通表一样，有结构，但是对数据的管理上不一样，临时表存储事务或会话的中间结果集，临时表中保存的数据只对当前会话可见，所有会话都看不到其他会话的数据，即使其他会话提交了，也看不到。临时表不存在并发行为，因为他们对于当前会话都是独立的。创建临时表时，ORACLE只创建了表的结构（在数据字典中定义），并没有初始化内存空间，当某一会话使用临时表时，ORALCE会
基于Nginx XSendfile+SpringMVC进行文件下载 denger 应用服务器 Web nginx 网络应用 lighttpd
在平常我们实现文件下载通常是通过普通 read-write方式，如下代码所示。 @RequestMapping("/courseware/{id}") public void download(@PathVariable("id") String courseID, HttpServletResp
scanf接受char类型的字符 dcj3sjt126com c
/* 2013年3月11日22:35:54 目的：学习char只接受一个字符 */ # include <stdio.h> int main(void) { int i; char ch; scanf("%d", &i); printf("i = %d\n", i); scanf("%
学编程的价值 dcj3sjt126com 编程
发一个人会编程, 想想以后可以教儿女, 是多么美好的事啊, 不管儿女将来从事什么样的职业, 教一教, 对他思维的开拓大有帮助像这位朋友学习: http://blog.sina.com.cn/s/articlelist_2584320772_0_1.html VirtualGS教程 (By @林泰前): 几十年的老程序员，资深的
二维数组（矩阵）对角线输出飞天奔月二维数组
今天在BBS里面看到这样的面试题目, 1，二维数组（N*N），沿对角线方向，从右上角打印到左下角如N=4： 4*4二维数组 { 1 2 3 4 } { 5 6 7 8 } { 9 10 11 12 } {13 14 15 16 } 打印顺序 4 3 8 2 7 12 1 6 11 16 5 10 15 9 14 13 要
Ehcache（08）——可阻塞的Cache——BlockingCache 234390216 并发 ehcache BlockingCache 阻塞
可阻塞的Cache—BlockingCache 在上一节我们提到了显示使用Ehcache锁的问题，其实我们还可以隐式的来使用Ehcache的锁，那就是通过BlockingCache。BlockingCache是Ehcache的一个封装类，可以让我们对Ehcache进行并发操作。其内部的锁机制是使用的net.
mysqldiff对数据库间进行差异比较 jackyrong mysqld
mysqldiff该工具是官方mysql-utilities工具集的一个脚本，可以用来对比不同数据库之间的表结构，或者同个数据库间的表结构如果在windows下，直接下载mysql-utilities安装就可以了，然后运行后，会跑到命令行下： 1）基本用法 mysqldiff --server1=admin:12345
spring data jpa 方法中可用的关键字 lawrence.li java spring
spring data jpa 支持以方法名进行查询/删除/统计。查询的关键字为find 删除的关键字为delete/remove (>=1.7.x) 统计的关键字为count (>=1.7.x) 修改需要使用@Modifying注解 @Modifying @Query("update User u set u.firstna
Spring的ModelAndView类 nicegege spring
项目中controller的方法跳转的到ModelAndView类，一直很好奇spring怎么实现的？ /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version 2.0 (the "License"); * yo
搭建 CentOS 6 服务器(13) - rsync、Amanda rensanning centos
（一）rsync Server端 # yum install rsync # vi /etc/xinetd.d/rsync service rsync { disable = no flags = IPv6 socket_type = stream wait
Learn Nodejs 02 toknowme nodejs
（1）npm是什么 npm is the package manager for node 官方网站：https://www.npmjs.com/ npm上有很多优秀的nodejs包，来解决常见的一些问题，比如用node-mysql，就可以方便通过nodejs链接到mysql，进行数据库的操作在开发过程往往会需要用到其他的包，使用npm就可以下载这些包来供程序调用 &nb
Spring MVC 拦截器 xp9802 spring mvc
Controller层的拦截器继承于HandlerInterceptorAdapter HandlerInterceptorAdapter.java 1 public abstract class HandlerInterceptorAdapter implements HandlerIntercep