wumingxiaoyao

Big Data 流处理框架 Flink

什么是 Flink
- Flink 的主要特性
- 典型应用场景
Amazon Elastic MapReduce (EMR) VS Flink
- 架构和运行时环境
- 实时处理能力
- 开发和编程模型
- 操作和管理
- 应用场景
- 总结
Flink 支持的数据源
Flink 如何消费 AWS SQS 数据源
- 自定义 Source Function
- Flink Connector for AWS SQS (社区贡献或第三方库)
- 借助 AWS Lambda 和 Kinesis
- 选择方案的考虑因素

什么是 Flink

Apache Flink 是一款用于大数据流处理和批处理的开源流式计算框架。它以高吞吐量、低延迟、可扩展性和精确一次语义（exactly-once semantics）为特点，适用于实时数据分析、复杂事件处理、数据管道、机器学习和图计算等场景。

Flink 的主要特性

流处理与批处理：Flink 最初是为流处理而设计的，可以处理无界（unbounded）和有界（bounded）数据流。同时，它也支持批处理，并将批处理视为特殊的有界流处理。
精确一次语义：Flink 提供了强大的状态管理和故障恢复机制，确保数据处理的精确一次语义，即使在系统发生故障时也能保证数据不丢失、不重复。
高吞吐量、低延迟：Flink 具有出色的性能，能够在高吞吐量下保持低延迟的数据处理。这使其非常适合实时分析和事件驱动的应用。
丰富的 API：Flink 提供了高级的 API，包括 DataStream API（用于流处理）、DataSet API（用于批处理）和 Table API/SQL（用于声明式查询），方便开发者编写数据处理逻辑。
可扩展性：Flink 可以在不同规模的集群上运行，从本地环境到大型分布式集群，具有很好的扩展性。
灵活的部署选项：Flink 支持多种部署模式，包括独立集群、YARN、Kubernetes、Mesos 等，也可以嵌入在其他应用中运行。

典型应用场景

实时数据分析（如点击流分析、实时监控）
复杂事件处理（如欺诈检测、报警系统）
数据管道和 ETL（数据抽取、转换、加载）
机器学习和图计算

Flink 作为一个强大的流处理框架，已经在许多企业级应用中得到了广泛的使用。

Amazon Elastic MapReduce (EMR) VS Flink

Amazon EMR 和 Apache Flink 都可以用于实时处理 Kinesis 数据流中的大数据，但它们在架构、功能、应用场景和操作复杂性方面有所不同。以下是两者的主要区别：

架构和运行时环境

Amazon EMR:

Hadoop 生态系统: EMR 是一个托管的大数据处理服务，支持 Hadoop 生态系统中的各种框架，如 Apache Spark、Apache Hive、HBase 和 Presto。可以用于批处理、交互式分析和流处理。
集群管理: EMR 提供对集群的完全控制，用户可以配置集群规模、实例类型、网络设置等。适合需要自定义运行时环境的场景。
弹性伸缩: EMR 支持自动扩展，可以根据负载动态增加或减少集群实例，以处理不同规模的数据。

Apache Flink:

专注于流处理: Flink 是一个专为实时流处理设计的分布式计算框架，提供了高吞吐量和低延迟的数据处理能力。它支持事件驱动和状态化处理。
Flink 应用: Flink 通过独立的应用程序进行运行，不依赖于整个 Hadoop 生态系统。它更轻量级，专注于提供实时流处理功能。
托管服务: 使用 Amazon Kinesis Data Analytics for Apache Flink，用户无需管理底层基础设施，AWS 会自动扩展和管理 Flink 应用。

实时处理能力

Amazon EMR (使用 Spark Streaming):

批处理与流处理: 使用 Spark Streaming 时，EMR 将流数据划分为微批（micro-batch）进行处理。这种模式在一些场景下可能引入较高的延迟。
延迟: 微批处理模式意味着处理延迟通常在秒级，适合批处理和一些需要实时处理的场景，但不是严格的实时处理。

Apache Flink:

原生流处理: Flink 支持原生的事件流处理，提供精细的时间控制（事件时间和处理时间）。它可以在亚秒级延迟下处理流数据，非常适合需要低延迟的实时处理任务。
复杂事件处理: 支持事件时间窗口、状态管理和复杂事件处理，使其适用于更复杂的流分析和实时处理任务。

开发和编程模型

Amazon EMR (使用 Spark Streaming):

编程模型: Spark Streaming 使用类似于批处理的编程模型，用户可以使用 RDD 或 DataFrame API 来处理微批数据。对于已经熟悉 Spark API 的用户，学习曲线较平缓。
灵活性: 由于 Spark 生态系统的丰富性，EMR 上的 Spark 可以与其他大数据工具无缝集成，如 Hive、HBase 和 MLlib，适用于更广泛的数据处理需求。

Apache Flink:

编程模型: Flink 提供了一个更直接的流处理 API，支持事件驱动的操作，如窗口、状态和时间处理。它具有较高的灵活性和丰富的操作集，适用于需要精细流控制的应用。
更复杂的分析: Flink 的编程模型更适合于构建复杂的流处理应用，包括复杂事件处理（CEP）、实时机器学习和异常检测等。

操作和管理

Amazon EMR:

运维复杂性: 需要管理集群的生命周期，包括启动、监控和终止集群。对于弹性伸缩和优化性能，用户需要进行更多的配置和调整。
成本: 由于是集群模式，运行成本可能较高，尤其是对于持续运行的流处理任务。
Apache Flink:
托管服务: 使用 Kinesis Data Analytics for Apache Flink，无需管理底层基础设施，AWS 会处理扩展、监控和故障恢复。用户只需关注应用逻辑。
简化运维: Flink 的托管服务减少了运维复杂性，提供自动扩展和高可用性，适合希望简化管理流程的用户。

应用场景

Amazon EMR:
适合需要结合批处理和流处理的场景。

数据湖分析：结合 S3、Glue、Athena 等服务进行大数据分析和 ETL。
大规模批处理：例如使用 Spark 进行机器学习模型训练或大规模数据转换。

Apache Flink:
适合需要低延迟和复杂事件处理的实时流处理任务。

实时监控和报警：处理 IoT 数据、金融交易、点击流数据等。
实时分析：例如在线机器学习、实时推荐系统。

总结

如果你的任务主要集中在严格的实时处理，要求低延迟和复杂事件处理，Apache Flink 是更好的选择。而如果你需要一个更通用的平台，支持批处理、交互式分析以及流处理，且希望利用整个 Hadoop 生态系统，那么 Amazon EMR 是一个更灵活的解决方案。

Flink 支持的数据源

Apache Flink 可以处理多种数据源，包括实时和批量数据源。以下是一些常见的数据源类型：

消息队列和流处理平台

Apache Kafka：Flink 与 Kafka 集成良好，可以作为数据输入和输出的数据源，用于高吞吐量、低延迟的消息传递和流处理
连接器：FlinkKafkaConsumer。
RabbitMQ：Flink 可以从 RabbitMQ 中消费消息并进行流处理，用于消息队列和异步通信。
连接器：RMQSource
Amazon Kinesis：Flink 支持与 Kinesis 集成，可以从 Kinesis 流中消费数据，用于实时数据流的收集和处理。
连接器：FlinkKinesisConsumer
Google Pub/Sub：用于全球分布的消息传递和流处理。
连接器：PubSubSource

文件系统

HDFS（Hadoop Distributed File System）：Flink 可以从 HDFS 中读取文件作为批处理数据源，也可以将处理结果写入 HDFS，用于分布式文件存储和处理。
连接器：HadoopFileSource
本地文件系统：支持从本地文件系统读取数据，适用于开发和测试环境。
连接器：FileSource
Amazon S3：可以从S3 中读取数据或将处理结果存储到 S3，用于云存储和数据湖。
连接器：S3FileSource
Azure Blob Storage：用于云存储和数据湖。
连接器：AzureBlobStorageSource

数据库

关系型数据库（如MySQL、PostgreSQL）：通过 JDBC （JDBCInputFormat）连接器，Flink 可以从各种关系型数据库中读取和写入数据。
NoSQL数据库（如 Cassandra 连接器：CassandraSource、HBase 连接器：HBaseSource）：Flink 支持与 NoSQL 数据库集成，用于处理非结构化或半结构化数据。
MongoDB：用于文档型 NoSQL 数据存储。
连接器：MongoDBSource

分布式存储
Apache Cassandra：可以从 Cassandra 读取或写入数据，适用于需要高可用性和分布式存储的场景。
Elasticsearch：Flink 可以将处理结果写入 Elasticsearch，以支持实时搜索和分析。
数据流服务

Apache Pulsar：Flink 可以与 Pulsa r集成，用于处理实时数据流。
Google Pub/Sub：可以从 Google Cloud Pub/Sub 中消费数据，适用于云环境。

数据仓库
Amazon Redshift：用于大规模数据分析和查询。
Google BigQuery：用于大规模数据分析和查询。
Snowflake：用于云数据仓库和分析。
其他数据源
HTTP/REST API：可以通过自定义源连接器从HTTP或REST API中获取数据。
自定义数据源：Flink允许开发者实现自定义的 SourceFunction，从任意数据源读取数据。
Flink 的模块化设计使其能够轻松集成不同类型的数据源，为实时和批处理提供了极大的灵活性。

Flink 如何消费 AWS SQS 数据源

Flink 消费 AWS SQS 数据源可以通过几种不同的方案实现，主要取决于项目的复杂性、性能需求和可维护性。以下是几种常见的方案：

自定义 Source Function

方案描述：自己编写一个自定义的 SourceFunction，使用 AWS SDK 直接与 SQS 交互。可以完全控制从 SQS 拉取消息的逻辑。
实现步骤：
使用 AWS SDK 在 SourceFunction 中连接到 SQS。
实现消息的接收、处理和删除。
在 Flink 作业中使用自定义的 SourceFunction。
优点：
灵活性高，可以根据需求定制化逻辑。
可以实现精确的消费和错误处理策略。
缺点：
需要编写和维护额外的代码。
需要处理并发和容错等复杂性。
示例代码：

import com.amazonaws.auth.DefaultAWSCredentialsProviderChain;
import com.amazonaws.services.sqs.AmazonSQS;
import com.amazonaws.services.sqs.AmazonSQSClientBuilder;
import com.amazonaws.services.sqs.model.Message;
import com.amazonaws.services.sqs.model.ReceiveMessageRequest;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.streaming.api.functions.source.SourceFunction;

import java.util.List;

public class SqsFlinkExample {
    public static void main(String[] args) throws Exception {
        // 创建 Flink 执行环境
        final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

        // 创建 SQS 消费者
        env.addSource(new SqsSourceFunction("your-sqs-queue-url"))
            .map(String::toUpperCase)
            .print();

        // 启动 Flink 作业
        env.execute("SQS Flink Example");
    }

    public static class SqsSourceFunction implements SourceFunction<String> {
        private final String queueUrl;
        private volatile boolean isRunning = true;

        public SqsSourceFunction(String queueUrl) {
            this.queueUrl = queueUrl;
        }

        @Override
        public void run(SourceContext<String> ctx) throws Exception {
            AmazonSQS sqs = AmazonSQSClientBuilder.standard()
                    .withCredentials(new DefaultAWSCredentialsProviderChain())
                    .withRegion("us-east-1")
                    .build();

            while (isRunning) {
                ReceiveMessageRequest receiveMessageRequest = new ReceiveMessageRequest(queueUrl)
                        .withMaxNumberOfMessages(10)
                        .withWaitTimeSeconds(20);

                List<Message> messages = sqs.receiveMessage(receiveMessageRequest).getMessages();

                for (Message message : messages) {
                    synchronized (ctx.getCheckpointLock()) {
                        ctx.collect(message.getBody());
                    }
                    sqs.deleteMessage(queueUrl, message.getReceiptHandle());
                }
            }
        }

        @Override
        public void cancel() {
            isRunning = false;
        }
    }
}

Flink Connector for AWS SQS (社区贡献或第三方库)

方案描述：使用社区贡献的 Flink SQS 连接器或第三方库，封装了与 SQS 的交互逻辑，提供更简单的接口。
实现步骤：
查找并集成现有的 Flink SQS 连接器库（如果有）。
使用连接器提供的 API 在 Flink 作业中消费 SQS 消息。
优点：
简化了开发过程，不需要自己实现消息拉取逻辑。
通常会提供更多的高级功能，如自动重试、并行消费等。
缺点：
社区贡献的连接器质量和维护情况可能不一。
功能可能不完全满足特定需求。

借助 AWS Lambda 和 Kinesis

方案描述：使用 AWS Lambda 作为中间层，将 SQS 中的消息推送到 Kinesis 数据流，然后在 Flink 中使用 Kinesis 连接器消费数据。
实现步骤：
创建 Kinesis 数据流：在 AWS 管理控制台中创建一个 Kinesis 数据流。
编写 Lambda 函数：编写一个 Lambda 函数，将 SQS 消息转发到 Kinesis 数据流。
配置 Lambda 触发器：配置 Lambda 函数触发器，使其在 SQS 队列中有新消息时自动触发。
编写 Flink 应用程序：编写 Flink 应用程序，从 Kinesis 数据流中读取数据并进行处理。
优点：
可以利用 AWS 服务的扩展性和管理能力，Kinesis 是 AWS 原生服务，与其他 AWS 服务（如 SQS、Lambda、DynamoDB）集成良好，Kinesis 是托管服务，减少了运维负担。
使用成熟的 Flink Kinesis 连接器，减少自定义开发。
Kinesis 提供低延迟的数据流处理，适用于实时数据处理。
缺点：
增加了架构的复杂性，需要配置和管理多个 AWS 服务。
Kinesis 的成本可能较高，特别是在处理大量数据时
Kinesis 的功能可能不如 Kafka 丰富，特别是在复杂的流处理场景中
Lambda 函数代码：

import json
import boto3

def lambda_handler(event, context):
    kinesis_client = boto3.client('kinesis', region_name='us-east-1')
    stream_name = 'your-kinesis-stream-name'
    
    for record in event['Records']:
        message = record['body']
        kinesis_client.put_record(
            StreamName=stream_name,
            Data=message,
            PartitionKey='partition-key'
        )
    
    return {
        'statusCode': 200,
        'body': json.dumps('Data sent to Kinesis')
    }

Flink 应用程序代码：

import org.apache.flink.api.common.serialization.SimpleStringSchema;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.streaming.connectors.kinesis.FlinkKinesisConsumer;
import org.apache.flink.streaming.api.datastream.DataStream;

import java.util.Properties;

public class KinesisFlinkExample {
    public static void main(String[] args) throws Exception {
        // 创建 Flink 执行环境
        final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

        // 配置 Kinesis 消费者属性
        Properties kinesisConsumerConfig = new Properties();
        kinesisConsumerConfig.setProperty("aws.region", "us-east-1");
        kinesisConsumerConfig.setProperty("flink.stream.initpos", "LATEST");

        // 创建 Kinesis 消费者
        DataStream<String> kinesisStream = env.addSource(new FlinkKinesisConsumer<>(
                "your-kinesis-stream-name", // Kinesis 数据流名称
                new SimpleStringSchema(),   // 数据反序列化模式
                kinesisConsumerConfig       // 配置属性
        ));

        // 处理数据流：这里简单地将数据转换为大写
        DataStream<String> processedStream = kinesisStream.map(String::toUpperCase);

        // 输出处理后的数据到控制台
        processedStream.print();

        // 启动 Flink 作业
        env.execute("Kinesis Flink Example");
    }
}

AWS SQS to Kafka Bridge

方案描述：Kafka Bridge 是一种中间层，可以将不同的数据源（如 SQS）桥接到 Kafka，然后使用 Flink 从 Kafka 消费数据。
步骤 1：设置 Kafka 和 Kafka Bridge
安装 Kafka：确保你已经安装并配置了 Kafka 集群。
安装 Kafka Bridge：Kafka Bridge 是一个开源项目，可以将不同的数据源桥接到 Kafka。你可以使用 Kafka Connect 和相应的 SQS 连接器来实现这一功能。
步骤 2：配置 Kafka Connect 和 SQS 连接器
下载和安装 Kafka Connect：Kafka Connect 是 Kafka 的一部分，用于连接不同的数据源和目标。
下载 SQS 连接器：你可以使用 Confluent 提供的 SQS 连接器或其他开源的 SQS 连接器。
示例配置文件 sqs-source-connector.properties：

name=sqs-source-connector
connector.class=com.amazonaws.services.sqs.connect.SqsSourceConnector
tasks.max=1
aws.access.key.id=your-access-key-id
aws.secret.access.key=your-secret-access-key
aws.region=us-east-1
sqs.url=https://sqs.us-east-1.amazonaws.com/123456789012/your-sqs-queue
kafka.topic=your-kafka-topic

步骤 3：启动 Kafka Connect 和 SQS 连接器
启动 Kafka Connect
验证连接器是否工作：检查 Kafka 主题 your-kafka-topic 是否接收到来自 SQS 的消息。

./bin/connect-standalone.sh config/connect-standalone.properties config/sqs-source-connector.properties

步骤 4：编写 Flink 应用程序
编写一个 Flink 应用程序，从 Kafka 主题中读取数据并进行处理。

import org.apache.flink.api.common.serialization.SimpleStringSchema;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.streaming.connectors.kafka.FlinkKafkaConsumer;
import org.apache.flink.streaming.api.datastream.DataStream;

import java.util.Properties;

public class KafkaFlinkExample {
    public static void main(String[] args) throws Exception {
        // 创建 Flink 执行环境
        final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

        // 配置 Kafka 消费者属性
        Properties kafkaConsumerConfig = new Properties();
        kafkaConsumerConfig.setProperty("bootstrap.servers", "localhost:9092");
        kafkaConsumerConfig.setProperty("group.id", "flink-group");

        // 创建 Kafka 消费者
        DataStream<String> kafkaStream = env.addSource(new FlinkKafkaConsumer<>(
                "your-kafka-topic",         // Kafka 主题
                new SimpleStringSchema(),   // 数据反序列化模式
                kafkaConsumerConfig         // 配置属性
        ));

        // 处理数据流：这里简单地将数据转换为大写
        DataStream<String> processedStream = kafkaStream.map(String::toUpperCase);

        // 输出处理后的数据到控制台
        processedStream.print();

        // 启动 Flink 作业
        env.execute("Kafka Flink Example");
    }
}

优点：
可以利用 Kafka 的高吞吐量和成熟的 Flink Kafka 连接器。
更好地支持分布式和高并发消费。
缺点：
需要设置和维护 Kafka 集群、Kafka Connect 和 Kafka Bridge，增加了系统的复杂性。
引入 Kafka 作为中间层可能会增加一些延迟。

选择方案的考虑因素

复杂性：自定义 SourceFunction 提供了最大的灵活性，但实现起来最复杂,需要手动处理 SQS 的细节。使用社区连接器或第三方库可以减少开发工作量。
性能和吞吐量：如果需要高并发和低延迟，使用 Kinesis 或 Kafka 作为中间层可能更合适。
维护性：引入第三方库或中间层服务可能会减少自定义代码量，但需要权衡维护的成本和复杂性。

选择哪种方案取决于系统的具体需求和约束条件，包括数据量、实时性要求、开发时间和维护成本等。

算法学习领域的宝藏 wylee 算法学习 leetcode
labuladong的算法笔记仓库是算法学习领域的宝藏项目，它围绕LeetCode题目，以培养算法思维为核心，提供丰富学习资源与多种实用工具，助力学习者提升算法能力。项目核心内容：仓库包含60多篇原创文章，基于LeetCode题目展开，全面覆盖各种算法题型与技巧，旨在培养学习者的算法思维，避免单纯的代码堆砌。文章注重思路解释和思维框架构建，通过总结算法套路，帮助学习者少走弯路。学习资源与工具算法可
Sa-Token完全学习指南
目录1.Sa-Token简介1.1什么是Sa-Token？1.2Sa-Token架构图1.3Sa-Tokenvs其他框架1.4适用场景2.环境搭建与快速开始2.1Maven依赖SpringBoot环境WebFlux环境2.2基础配置application.yml配置2.3创建启动类2.4第一个登录接口2.5统一响应类2.6全局异常处理3.核心API详解3.1StpUtil核心方法登录相关APITo
Spring框架详细教程文档 z小天才b Spring spring java 后端
目录1.Spring框架概述1.1什么是Spring框架1.2Spring的发展历程1.3Spring的核心特性1.3.1轻量级框架1.3.2控制反转(IoC)1.3.3面向切面编程(AOP)1.3.4容器功能1.4Spring的优势1.5Spring生态系统2.Spring核心概念2.1控制反转(IoC-InversionofControl)2.1.1什么是控制反转2.1.2控制反转的好处2.2
SpringBoot多数据源动态切换方案：AbstractRoutingDataSource详解 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot多数据源动态切换
Spring Boot 项目启动时按需初始化加载数据我叫晨曦啊 spring boot spring boot java 后端
1、新建类，类上添加注解@Component，该类用于在项目启动时处理数据加载任务；2、该类实现ApplicationRunner接口，并重写run方法；3、在重写的run方法里处理数据加载任务；注意：有定时加载数据需求的话，添加定时任务即可；一次性加载大数据量时可能内存溢出；同一个项目中，可以定义多个ApplicationRunner的实现类；存在多个ApplicationRunner的实现类时
TensorRT-LLM：大模型推理加速引擎的架构与实践
前言：技术背景与发展历程：随着GPT-4、LLaMA等千亿级参数模型的出现，传统推理框架面临三大瓶颈：显存占用高（单卡可达80GB）、计算延迟大（生成式推理需迭代处理）、硬件利用率低（Transformer结构存在计算冗余）。根据MLPerf基准测试，原始PyTorch推理的token生成速度仅为12.3tokens/s（A100显卡）。一、TensorRT-LLM介绍：TensorRT-LLM是
Pod调度、嵌入式脚本、Pod标签管理 yanjiaweiya 云原生 kubernetes 容器
多容器Pod案例3排错[root@master~]#vimweb2.yaml---kind:PodapiVersion:v1metadata:name:web2namespace:defaultspec:containers:-name:nginximage:myos:nginx-name:apacheimage:myos:httpdstatus:{}[root@master~]#kubectla
云原生--微服务、CICD、SaaS、PaaS、IaaS 青秋. 云原生 docker 云原生微服务 kubernetes serverless service_mesh ci/cd
往期推荐浅学React和JSX-CSDN博客一文搞懂大数据流式计算引擎Flink【万字详解，史上最全】-CSDN博客一文入门大数据准流式计算引擎Spark【万字详解，全网最新】_大数据spark-CSDN博客目录1.云原生概念和特点2.常见云模式3.云对外提供服务的架构模式3.1IaaS（Infrastructure-as-a-Service）3.2PaaS（Platform-as-a-Servi
字符串的模糊匹配方法介绍超级土豆粉前端 javascript typescript html
字符串的模糊匹配方法介绍目录字符串的模糊匹配方法介绍一、编辑距离（LevenshteinDistance）复杂度分析二、Jaro-Winkler距离复杂度分析三、最长公共子序列（LCS）复杂度分析四、模糊搜索（FuzzySearch）复杂度分析五、正则表达式复杂度分析六、第三方库复杂度分析总结在日常开发和数据处理中，我们经常会遇到需要判断两个字符串是否“相似”或“接近”的场景，这时就需要用到字符串
Tesla的FSD 架构设计 WSSWWWSSW 智能驾驶汽车人工智能 FSD
特斯拉的FSD（完全自动驾驶）架构设计以端到端神经网络为核心，结合专用硬件加速、海量数据训练和持续OTA迭代，形成了一套高度集成的系统。以下从硬件、软件、算法、数据处理和安全机制五个维度展开分析：一、硬件架构：从HW3.0到AI5的算力跃迁HW3.0基础设计采用三星14nm工艺的定制SoC，包含12个Cortex-A72CPU核心、2个NPU（合计73.7TOPS算力）和Mali-G71GPU，支
2025 年前端主流框架对比和竞争格局及趋势发展
2025年前端框架的竞争格局呈现出主流框架稳定演进、新兴技术快速渗透的特点，同时全栈整合、跨端效能、AI集成成为核心发展方向。以下是基于最新行业动态和技术实践的深度解析：一、主流框架竞争态势与核心能力1.React：企业级生态的持续统治力市场地位：全球使用率超40%，尤其在金融、社交等数据密集型场景占据主导。字节跳动、腾讯等大厂的复杂Web应用仍以React为首选。技术突破：并发模式（Concur
后端框架再见，再也不见(๑>؂<๑） java
后端开发中，使用框架可以提高开发效率、简化代码编写，并提供丰富的功能和工具支持。以下是一些流行的后端框架：SpringFramework：特点：SpringFramework是一个全功能的Java开发框架，提供了依赖注入、面向切面编程、事务管理等功能，广泛用于构建企业级应用。生态系统：Spring生态系统庞大，包括SpringBoot用于快速搭建项目、SpringData用于数据访问、Spring
高压电缆护层安全的智能防线：TLKS-PLGD 监控设备深度解析李子圆圆安全
在现代电力系统庞大复杂的网络中，高压电缆护层是守护电力传输的"隐形铠甲"，其安全直接影响电网稳定。传统监测手段响应慢、精度低，难以满足安全运维需求。TLKS-PLGD高压电缆护层环流监控设备应运而生，提供智能化解决方案。智能监测：全方位守护TLKS-PLGD专为高压电缆护层安全研发，融合实时监测、智能预警、远程管控技术，构建高精度监控体系。其功能强大：能实时监测接地电流，捕捉细微波动预判隐患；支持
12.组件的实现原理青阳流月 vue3 前端 javascript vue.js
将一个大的页面分为多个组件,每个组件都可以完成独立的功能并且可以被复用。1.渲染组件从用户角度,是一个描述对象constmyComponent1={name:'myComponent1',data(){return{name:'wjt'}}}从渲染器角度,是一个特殊的虚拟DOMconstmyComponent2={//type:Fragment,//描述片段type:Text,//描述节点prop
微服务项目网关集成swagger bbober 后端-微服务-框架微服务架构云原生
微服务项目网关中集成swagger并使用knife4j进行增强前言本文场景为：使用SpringCloud框架，MyBatisPlus持久层框架；注册中心：nacos，配置中心：nacos；主要模块有：业务模块、网关模块、common模块（共享）；网关路由从配置中心动态拉取；其他情况动态调整。spring-boot-start版本：2.7.12（3版本以上只支持OpenApi3规范，差距较大）使用O
stack_queue扩展学习 --- 反向迭代器茉莉玫瑰花茶 C++反向迭代器 C/C++
反向迭代器的实现思路源码及框架分析迭代器是用来遍历容器的，是一种封装，它不需要去关注容器的底层实现（底层是数组，链表，还是树等等这些结构），我们都是用统一的方式去对容器进行访问，访问行为是类似指针的。我们之前学习了普通迭代器和const迭代器：普通迭代器：能读能写；const迭代器：只能读，只能遍历数据，得到数据，不能修改数据，是不能写的。我们之前学的普通迭代器是正向迭代器，如果我想逆方向遍历呢？
【项目日记（一）】-仿mudou库one thread oneloop式并发服务器实现 @Aurora. 服务器运维
1、模型框架客户端处理思想：事件驱动模式事件驱动处理模式：谁触发了我就去处理谁。（如何知道触发了）技术支撑点：I/O的多路复用（多路转接技术）1、单Reactor单线程：在单个线程中进行事件驱动并处理对所有客户端进行IO事件监控、哪个客户端触发了事件，就去处理谁处理：接收它的请求，进行业务处理，进行响应。优点：单线程操作，操作都是串行化的，思想简单，（不需要考虑进程或者线程间的通信问题，以及安全问
Spark运行架构 EmoGP Spark spark 架构大数据
Spark框架的核心是一个计算引擎，整体来说，它采用了标准master-slave的结构如下图所示，它展示了一个Spark执行时的基本结构，图形中的Driver表示master，负责管理整个集群中的作业任务调度，图形中的Executor则是slave，负责实际执行任务。由上图可以看出，对于Spark框架有两个核心组件：DriverSpark驱动器节点，用于执行Spark任务中的main方法，负
什么是DO、DTO、VO、BO、AO，还在傻傻分不清？今天一文带你了解这些概率 Gq.xxu java 系统架构
在分层架构的Java应用中，DO、DTO、VO、BO、AO等概念用于解耦不同层级的数据传递和业务逻辑。它们分别承担不同职责，以下是对这些概念的详细解释：1.DO（DataObject/DomainObject）定义：与数据库表结构直接映射的对象，通常由DAO层操作。用途：在数据访问层（DAO）中承载数据库查询结果，如UserDO对应user表字段。特点：属性与数据库字段一一对应。仅包含数据，不包含
【LLM】Llama-Index 架构 FOUR_A LLM llama 架构
数据源（DataSources）PDF/文档数据库API网页音频/视频知识库自定义源数据连接器（DataConnectors）用于从各种数据源提取和加载数据，以便进行索引和查询。1.SimpleDirectoryReader含义：简单目录读取器。功能：主要用于读取本地文件系统中的目录内容。它可以列出目录中的文件和子目录，通常用于文件管理或数据预处理阶段。例如，在一个数据处理项目中，你可能需要列出某
Ubuntu 25.04安装搜狗输入法不喝水的鱼儿 ubuntu linux 运维
0x00安装思路1.卸载ibus和fcitx5。#更新系统软件包sudoaptupdate#卸载Fcitx5和IBus（如果存在）sudoaptremove--purgefcitx5*ibus*#清理系统残留sudoaptautoremove&&sudoaptautoclean2.安装fcitx4。#安装Fcitx4输入法框架sudoaptinstallfcitx#设置Fcitx开机自启动sudo
Python打卡：Day46 剑桥折刀s python打卡 python
importtorchimporttorch.nnasnnimporttorch.optimasoptimimporttorchvisionfromtorchvisionimportdatasets,transformsfromtorch.utils.dataimportDataLoaderfromtorch.utils.tensorboardimportSummaryWriterimportnu
深度学习-Tensor
Tensor张量：与numpy中的ndarray不同之处：tensor可以在GPU或其他专用硬件上运行，以加速计算。一、Tensor初始化1.直接从数据中创建data=[[1,2],[3,4]]x_data=torch.tensor(data)2.从numpy数组创建np_array=np.array(data)x_np=torch.from_numpy(np_array)3.从另一个Tensor
（二）MATERIAL DESIGN框架安装和使用 Chen住气* UI主题框架的Material Design C#ui
在WPF中使用MaterialDesign需要安装MaterialDesignThemes程序包。通过安装该程序包，您将获得MaterialDesign所需的样式和控件，以及相关的资源字典引用。通过NuGet包管理器进行安装的具体步骤如下：打开VisualStudio。在解决方案资源管理器中，右键单击项目名称，选择“管理NuGet程序包”。在NuGet程序包管理器中，选择“浏览”选项卡。在搜索框中
UniApp的学习 xuzhihuan焕 uni-app 学习
一.Vue.js基础基本概念：总之，Vue.js是一个简洁、灵活、高效的前端JavaScript框架，具有响应式数据绑定、组件化开发、虚拟DOM等特点，适用于构建各种类型的Web应用。Vue.js介绍：了解Vue.js的起源、特点以及基本概念。特点：简洁易用：Vue.js的API简洁明了，学习曲线较为平缓，使得开发者能够快速上手。响应式数据绑定：Vue.js提供了响应式的数据绑定机制，当数据发生变
Java 实现后端调用 Chromium 浏览器无头模式截图的方案一只帆記 Java SpringBoot java 开发语言
Java实现后端调用Chromium浏览器无头模式截图的方案1.使用Playwright优点：功能强大、支持多浏览器（Chromium/Firefox/WebKit）、支持异步操作。实现方式：利用Playwright创建无头浏览器实例；使用Java的调度任务框架（如ScheduledExecutorService）定时触发截图逻辑。示例代码结构：ScheduledExecutorServicesc
mybatis打印完整mysql_mybatis 通过拦截器打印完整的sql语句以及执行结果操作 weixin_39672680
开发过程中，如果使用mybatis做为ORM框架，经常需要打印出完整的sql语句以及执行的结果做为参考。虽然mybatis结合日志框架可以做到，但打印出来的通常都是sql和参数分开的。有时我们需要调试这条sql的时候，就需要把参数填进去，这样未免有些浪费时间。此时我们可以通过实现mybatis拦截器来做到打印带参数的完整的sql，以及结果通过json输出到控制台。直接看代码和使用方法吧：MyBat
基于轻量级虚拟化技术的实时嵌入式系统资源隔离与动态调度优化瑕疵热点资讯 rpc 网络协议网络
博客主页：瑕疵的CSDN主页Gitee主页：瑕疵的gitee主页⏩文章专栏：《热点资讯》基于轻量级虚拟化技术的实时嵌入式系统资源隔离与动态调度优化基于轻量级虚拟化技术的实时嵌入式系统资源隔离与动态调度优化基于轻量级虚拟化技术的实时嵌入式系统资源隔离与动态调度优化引言轻量级虚拟化技术的核心原理1.轻量级虚拟化的定义2.轻量级虚拟化的技术架构资源隔离机制详解1.时间隔离2.空间隔离3.通信隔离动态调度
关于uniapp m0_73928262 开发语言 uni-app
目录前言一、uniapp是什么？二、uniapp的由来三、uniapp的基本概念四、uniapp的使用场景五、uniapp框架格式和基本概念六、如何使用uniapp七、如何使用uniapp创建文件总结前言Uni-app是由Dcloud公司推出的一个多端开发框架，可以使用Vue开发一次代码，产出多个平台的应用程序，包括iOS、Android、H5、小程序等。这种“一次开发，多端输出”的开发方式大大减
Java手动打印执行过的sql GoodStudyAndDayDayUp java sql 开发语言
1.拦截器packagecom.xxx.platform.common.interceptor;importcom.baomidou.dynamic.datasource.toolkit.DynamicDataSourceContextHolder;importcom.xxx.platform.common.aop.OLAPQuery;importcom.xxx.platform.constant
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR

Big Data 流处理框架 Flink

Big Data 流处理框架 Flink

什么是 Flink

Flink 的主要特性

典型应用场景

Amazon Elastic MapReduce (EMR) VS Flink

架构和运行时环境

实时处理能力

开发和编程模型

操作和管理

应用场景

总结

Flink 支持的数据源

Flink 如何消费 AWS SQS 数据源

自定义 Source Function

Flink Connector for AWS SQS (社区贡献或第三方库)

借助 AWS Lambda 和 Kinesis

选择方案的考虑因素

你可能感兴趣的:(Big,Data,大数据,flink,Big,Data,流处理框架,实时数据处理)