不断学习的克里斯

【Flink】DataStream API—执行环境、源算子、转换算子、输出算子

前言

一、执行环境

1、创建执行环境

2、执行模式(Execution Mode)

3、触发执行

二、源算子（Source）

1、读取数据的算子就是源算子。

2、源算子种类

3、Flink 支持的数据类型

三、转换算子（Transformation）

1、基本转换算子

2、聚合算子（Aggregation）

3、匿名函数（Lambda）

4、富函数类（Rich Function Classes）

5、物理分区

四、输出算子（Sink）

1、连接到外部系统

2、输出到文件

3、输出到 Kafka

4、输出到 Redis

5、输出到 Elasticsearch

6、输出到 MySQL（JDBC）

7、自定义 Sink 输出

前言

Flink 有非常灵活的分层 API 设计，其中的核心层就是 DataStream/DataSet API 。由于新版

本已经实现了流批一体， DataSet API 将被弃用，官方推荐统一使用 DataStream API 处理流数

据和批数据。

DataStream （数据流）本身是 Flink 中一个用来表示数据集合的类（ Class）。一个 Flink 程序，其实就是对 DataStream 的各种转换。一个Flink程序的构成：

获取执行环境（execution environment）
读取数据源（source）
定义基于数据的转换操作（transformations）
定义计算结果的输出位置（sink）
触发程序执行（execute）

一、执行环境

1、创建执行环境

（1）getExecutionEnvironment

最简单的方式，就是直接调用 getExecutionEnvironment 方法。它会根据当前运行的上下文

直接得到正确的结果：如果程序是独立运行的，就返回一个本地执行环境；如果是创建了 jar

包，然后从命令行调用它并提交到集群执行，那么就返回集群的执行环境。

StreamExecutionEnvironment env = 
StreamExecutionEnvironment.getExecutionEnvironment();

（2）createLocalEnvironment

这个方法返回一个本地执行环境。可以在调用时传入一个参数，指定默认的并行度；如果

不传入，则默认并行度就是本地的 CPU 核心数。

StreamExecutionEnvironment localEnv = 
StreamExecutionEnvironment.createLocalEnvironment();

（3）createRemoteEnvironment

这个方法返回集群执行环境。需要在调用时指定 JobManager 的主机名和端口号，并指定

要在集群中运行的 Jar 包。

StreamExecutionEnvironment remoteEnv = StreamExecutionEnvironment
 .createRemoteEnvironment(
     "host", // JobManager 主机名
     1234, // JobManager 进程端口号
     "path/to/jarFile.jar" // 提交给 JobManager 的 JAR 包
);

2、执行模式(Execution Mode)

从 1.12.0 版本起， Flink 实现了 API 上的流批统一。 DataStream API 新增了一个重要特

性：可以支持不同的“执行模式”（ execution mode ），通过简单的设置就可以让一段 Flink 程序

在流处理和批处理之间切换。这样一来， DataSet API 也就没有存在的必要了。

流执行模式（STREAMING）
批执行模式（BATCH）
自动模式（AUTOMATIC）

（1）设置方式

通过命令行配置

bin/flink run -Dexecution.runtime-mode=BATCH ...

通过代码配置

StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

env.setRuntimeMode(RuntimeExecutionMode.BATCH);

建议 : 不要在代码中配置，而是使用命令行。这同设置并行度是类似的：在提交作业时指

定参数可以更加灵活，同一段应用程序写好之后，既可以用于批处理也可以用于流处理。而在代码中硬编码（hard code ）的方式可扩展性比较差，一般都不推荐。

3、触发执行

Flink 是由事件驱动的，只有等到数据到来了才会触发真正的计算，这也被称为“延迟执行”或“懒执行”（lazy execution ）。所以我们需要显式地调用执行环境的 execute() 方法来触发程序执行。 execute() 方法将一直等待作业完成，然后返回一个执行结果（JobExecutionResult ）。

二、源算子（Source）

1、读取数据的算子就是源算子。

Flink 代码中通用的添加 source 的方式，是调用执行环境的 addSource() 方法：

DataStream stream = env.addSource(...);

该方法传入一个对象参数，需要实现 SourceFunction 接口；返回 DataStreamSource 。这里的

DataStreamSource 类继承自 SingleOutputStreamOperator 类，又进一步继承自 DataStream 。所以很明显，读取数据的 source 操作是一个算子，得到的是一个数据流（ DataStream ）。

POJO：一个简单的Java类，这个类没有实现/继承任何特殊的java接口或者类，不遵循任何主要java模型，约定或者框架的java对象。在理想情况下，POJO不应该有注解。方便数据的解析和序列化。

2、源算子种类

（1）从集合中读取数据

// 构建集合
ArrayList clicks = new ArrayList<>();
clicks.add(new Event("Mary","./home",1000L));
clicks.add(new Event("Bob","./cart",2000L));
DataStream stream = env.fromCollection(clicks);

// 不构建集合，直接列出元素
DataStreamSource stream2 = env.fromElements(
 new Event("Mary", "./home", 1000L),
 new Event("Bob", "./cart", 2000L)
);

（2）从文件读取数据

一个比较常见的方式就是读取日志文件。这也是批处理中最常见的读取方式：

DataStream stream = env.readTextFile("clicks.csv");

（3）从 Socket 读取数据

DataStream stream = env.socketTextStream("localhost", 7777);

（4）从 Kafka 读取数据

Kafka 和 Flink 天生一对，是当前处理流式数据的双子星。在如今的实时流处理应用中，由 Kafka 进行数据的收集和传输， Flink 进行分析计算，这样的架构已经成为众多企业的首选。

引入 Kafka 连接器的依赖


 org.apache.flink
 flink-connector-kafka_2.12
 1.13.0

然后调用 env.addSource() ，传入 FlinkKafkaConsumer 的对象实例

StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
 env.setParallelism(1);
 Properties properties = new Properties();
 properties.setProperty("bootstrap.servers", "hadoop102:9092");
 properties.setProperty("group.id", "consumer-group");
 properties.setProperty("key.deserializer", 
"org.apache.kafka.common.serialization.StringDeserializer");
 properties.setProperty("value.deserializer", 
"org.apache.kafka.common.serialization.StringDeserializer");
 properties.setProperty("auto.offset.reset", "latest");
 DataStreamSource stream = env.addSource(new FlinkKafkaConsumer(
     "clicks",
     new SimpleStringSchema(),
     properties
 ));

（5）自定义 Source

创建一个自定义的数据源，实现 SourceFunction 接口。

主要重写两个关键方法： run()和 cancel() 。

run()方法：使用运行时上下文对象（SourceContext）向下游发送数据；
cancel()方法：通过标识位控制退出循环，来达到中断数据源的效果。

3、Flink 支持的数据类型

（1）类型系统

TypeInformation 类是 Flink 中所有类型描述符的基类。它涵盖了类型的一些基本属性，并为每个数据类型生成特定的序列化器、反序列化器和比较器。

（2）基本类型

所有 Java 基本类型及其包装类，再加上 Void 、 String 、 Date 、 BigDecimal 和 BigInteger 。

（3）数组类型

包括基本类型数组（ PRIMITIVE_ARRAY ）和对象数组 (OBJECT_ARRAY)

（4）复合数据类型

Java 元组类型（TUPLE）：这是 Flink 内置的元组类型，是 Java API 的一部分。最多

25 个字段，也就是从 Tuple0~Tuple25 ，不支持空字段

Scala 样例类及 Scala 元组：不支持空字段
行类型（ROW）：可以认为是具有任意个字段的元组,并支持空字段
POJO：Flink 自定义的类似于 Java bean 模式的类

（5）辅助类型

Option、Either、List、Map 等

（6）泛型类型（GENERIC）

（7）类型提示（Type Hints）

Flink 还具有一个类型提取系统，可以分析函数的输入和返回类型，自动获取类型信息，

从而获得对应的序列化器和反序列化器。但是，由于 Java 中泛型擦除的存在，在某些特殊情

况下（比如 Lambda 表达式中），自动提取的信息是不够精细的。

在 word count 流处理程序，我们在将 String 类型的每个词转换成（word ，count）二元组后，就明确地用 returns 指定了返回的类型。因为对于 map 里传入的 Lambda 表达式，系统只能推断出返回的是 Tuple2 类型，而无法得到 Tuple2 。只有显式地告诉系统当前的返回类型，才能正确地解析出完整数据。

.map(word -> Tuple2.of(word, 1L))
.returns(Types.TUPLE(Types.STRING, Types.LONG));

三、转换算子（Transformation）

1、基本转换算子

（1）映射（map）：就是一个“一一映射”，消费一个元素就产出一个元素

// 传入匿名类，实现 MapFunction
 stream.map(new MapFunction() {
     @Override
     public String map(Event e) throws Exception {
         return e.user;
     }
 });

// 传入 MapFunction 的实现类
 stream.map(new UserExtractor()).print();

（2）过滤：filter 转换操作，顾名思义是对数据流执行一个过滤，通过一个布尔条件表达式设置过滤条件，对于每一个流内元素进行判断，若为 true 则元素正常输出，若为 false 则元素被过滤掉。

// 传入匿名类实现 FilterFunction
 stream.filter(new FilterFunction() {
     @Override
     public boolean filter(Event e) throws Exception {
         return e.user.equals("Mary");
     }
 });

（3）扁平映射：

flatMap 操作又称为扁平映射，主要是将数据流中的整体（一般是集合类型）拆分成一个一个的个体使用。消费一个元素，可以产生 0 到多个元素。flatMap 可以认为是“扁平化”（flatten）和“映射”（map）两步操作的结合，也就是先按照某种规则对数据进行打散拆分，再对拆分后的元素做转换处理。 flatMap 并没有直接定义返回值类型，而是通过一个（Collector）来指定输出。

同 map 一样，flatMap 也可以使用 Lambda 表达式或者 FlatMapFunction 接口实现类的方式来进行传参，返回值类型取决于所传参数的具体逻辑，可以与原数据流相同，也可以不同。

2、聚合算子（Aggregation）

（1）按键分区（keyBy）：在 Flink 中，需要先进行分区，再做聚合；这个操作就是通过 keyBy 来完成的。keyBy 是聚合前必须要用到的一个算子。keyBy 通过指定键（key），可以将一条流从逻辑上划分成不同的分区（partitions）。这里所说的分区，其实就是并行处理的子任务，也就对应着任务槽（task slot）。

// 使用 Lambda 表达式
 KeyedStream keyedStream = stream.keyBy(e -> e.user);

// 使用匿名类实现 KeySelector
 KeyedStream keyedStream1 = stream.keyBy(new KeySelector() {
     @Override
     public String getKey(Event e) throws Exception {
         return e.user;
     }
 });

（2）简单聚合

 stream.keyBy(r -> r.f0).sum(1).print();
 stream.keyBy(r -> r.f0).sum("f1").print();

 stream.keyBy(r -> r.f0).max(1).print();
 stream.keyBy(r -> r.f0).max("f1").print();

 stream.keyBy(r -> r.f0).min(1).print();
 stream.keyBy(r -> r.f0).min("f1").print();

 stream.keyBy(r -> r.f0).maxBy(1).print();
 stream.keyBy(r -> r.f0).maxBy("f1").print();

 stream.keyBy(r -> r.f0).minBy(1).print();
 stream.keyBy(r -> r.f0).minBy("f1").print();

// 如果数据流的类型是 POJO 类，那么就只能通过字段名称来指定，不能通过位置来指定了。

（3）归约聚合（reduce）

调用 KeyedStream 的 reduce 方法时，需要传入一个参数，实现 ReduceFunction 接口。

与简单聚合类似， reduce 操作也会将 KeyedStream 转换为 DataStream 。它不会改变流的元

素数据类型，所以输出类型和输入类型是一样的。

对于一组数据，我们可以先取两个进行合并，然后再将合并的结果看作一个数据、再跟后面的数据合并，最终会将它“简化”成唯一的一个数据

public interface ReduceFunction extends Function, Serializable {
    T reduce(T value1, T value2) throws Exception;
}

3、匿名函数（Lambda）

Flink 的所有算子都可以使用 Lambda 表达式的方式来进行编码，但是，当 Lambda 表

达式使用 Java 的泛型时，我们需要显式的声明类型信息。

//map 函数使用 Lambda 表达式，返回简单类型，不需要进行类型声明
 DataStream stream1 = clicks.map(event -> event.url);

// flatMap 使用 Lambda 表达式，必须通过 returns 明确声明返回类型
DataStream stream2 = clicks.flatMap((Event event, Collector 
out) -> {
    out.collect(event.url);
}).returns(Types.STRING);

// 使用显式的 ".returns(...)"
 DataStream> stream3 = clicks
 .map( event -> Tuple2.of(event.user, 1L) )
 .returns(Types.TUPLE(Types.STRING, Types.LONG));
 stream3.print();

4、富函数类（Rich Function Classes）

与常规函数类的不同主要在于，富函数类可以获取运行环境的上下文，并拥有一些生命周期方法，所以可以实现更复杂的功能。

Rich Function 有生命周期的概念。典型的生命周期方法有：

open()方法，是 Rich Function 的初始化方法，也就是会开启一个算子的生命周期。当一个算子的实际工作方法例如 map()或者 filter()方法被调用之前，open()会首先被调用。所以像文件 IO 的创建，数据库连接的创建，配置文件的读取等等这样一次性的工作，都适合在 open()方法中完成。
close()方法，是生命周期中的最后一个调用的方法，类似于解构方法。一般用来做一些清理工作。需要注意的是，这里的生命周期方法，对于一个并行子任务来说只会调用一次；而对应的，实际工作方法，例如 RichMapFunction 中的 map()，在每条数据到来后都会触发一次调用。

另外，富函数类提供了 getRuntimeContext() 方法可以获取到运行时上下文的一些信息，例如程序执行的并行度，任务名称，以及状态（state ）。这使得我们可以大大扩展程序的功能，特别是对于状态的操作，使得 Flink 中的算子具备了处理复杂业务的能力。

一个常见的应用场景就是，如果我们希望连接到一个外部数据库进行读写操作，那么将连

接操作放在 map() 中显然不是个好选择——因为每来一条数据就会重新连接一次数据库；所以我们可以在 open() 中建立连接，在 map()中读写数据，而在 close() 中关闭连接。

public class MyFlatMap extends RichFlatMapFunction> {
 @Override
 public void open(Configuration configuration) {
        // 做一些初始化工作
         // 例如建立一个和 MySQL 的连接
 }

 @Override
 public void flatMap(IN in, Collector

 
       5、物理分区 
        keyBy  是一种逻辑分区（ logical partitioning）操作。物理分区与 keyBy 另一大区别在于，keyBy 之后得到的是一个 KeyedStream，而物理分区之后结果仍是 DataStream，且流中元素数据类型保持不变。常见的物理分区策略有随机分配（Random）、轮询分配（Round-Robin）、重缩放（Rescale）和广播（Broadcast）。 
        
        
        
         （1） 随机分区（ shuffle ）  
         
         最简单的重分区方式就是直接“洗牌”。通过调用  DataStream  的 .shuffle()方法，将数据随机地分配到下游算子的并行任务中去。因为是完全随机的，所以对于同样的输入数据, 每次执行得到的结果也不会相同。

 
       
       // 经洗牌后打印输出，并行度为 4
 stream.shuffle().print("shuffle").setParallelism(4); 
       
       
        （2） 轮询分区（ Round-Robin ）  
        
        轮询也是一种常见的重分区方式。简单来说就是“发牌”，按照先后顺序将数据做依次分发。通过调用  DataStream  的 .rebalance() 方法，就可以实现轮询重分区。 rebalance 使用的是 Round-Robin  负载均衡算法，可以将输入流数据平均分配到下游的并行任务中去。  
        
        
         
        // 经轮询重分区后打印输出，并行度为 4
 stream.rebalance().print("rebalance").setParallelism(4); 
         （3） 重缩放分区（ rescale ）  
         
         重缩放分区和轮询分区非常相似。当调用  rescale() 方法时，其实底层也是使用  Round-Robin 算法进行轮询，但是只会将数据轮询发送到下游并行任务的一部分中，如图 5-11  所示。也就是说，“发牌人”如果有多个，那么 rebalance  的方式是每个发牌人都面向所有人发牌；而  rescale 的做法是分成小团体，发牌人只给自己团体内的所有人轮流发牌。  
         
         
         
          
          从底层实现上看， rebalance 和 rescale  的根本区别在于任务之间的连接机制不同。 rebalance  
          
          将会针对所有上游任务（发送数据方）和所有下游任务（接收数据方）之间建立通信通道，这  
          
          是一个笛卡尔积的关系；而  rescale  仅仅针对每一个任务和下游对应的部分任务之间建立通信  
          
          通道，节省了很多资源。  
          
         
         
         （4）广播（ broadcast ）  
         
         这种方式其实不应该叫做“重分区”，因为经过广播之后，数据会在不同的分区都保留一份，可能进行重复处理。可以通过调用 DataStream  的  broadcast() 方法，将输入数据复制并发送到下游算子的所有并行任务中去。  
         
         
         
          （5）全局分区（ global ）  
          
          全局分区也是一种特殊的分区方式。这种做法非常极端，通过调用 .global()方法，会将所有的输入流数据都发送到下游算子的第一个并行子任务中去。这就相当于强行让下游任务并行度变成了 1，所以使用这个操作需要非常谨慎，可能对程序造成很大的压力。 
          
          
          
           （6） 自定义分区（ Custom ）  
           
           在调用时，方法需要传入两个参数，第一个是自定义分区器（ Partitioner ）对象，第二个  
           
           是应用分区器的字段，它的指定方式与  keyBy  指定  key  基本一样：可以通过字段名称指定，  
           
           也可以通过字段位置索引来指定，还可以实现一个  KeySelector 。  
           
          
         
        
       // 将自然数按照奇偶分区
 env.fromElements(1, 2, 3, 4, 5, 6, 7, 8)
 .partitionCustom(new Partitioner() {
     @Override
     public int partition(Integer key, int numPartitions) {
         return key % 2;
     }
     }, new KeySelector() {
     @Override
     public Integer getKey(Integer value) throws Exception {
         return value;
     }
     })
 .print().setParallelism(2); 
       四、输出算子（Sink） 
        Flink  程序中所有对外的输出操作，一般都是利用  Sink 算子完成的。Sink 在 Flink 中代表了将结果数据收集起来、输出到外部的意思， print 方法其实就是一种 Sink，它表示将数据流写入标准控制台打印输出。 
        
        
        stream.addSink(new SinkFunction(…)); 
        
        
         addSink  方法同样需要传入一个参数，实现的是 SinkFunction  接口。在这个接口中只需要重写一个方法  invoke(), 用来将指定的值写入到外部系统中。这个方法在每条数据记录到来时都会调用： 
         
         
        
       1、连接到外部系统 
       
       
        
                像 Kafka  之类流式系统， Flink  提供了完美对接， source/sink  两端都能连接，可读可写；而对于 Elasticsearch 、文件系统（ FileSystem ）、 JDBC  等数据存储系统，则只提供了输出写入的 sink  连接器。  
        
       2、输出到文件  
        
         Flink  为此专门提供了一个流式文件系统的连接器： StreamingFileSink ，它继承自抽象类 RichSinkFunction，而且集成了  Flink  的检查点（ checkpoint ）机制，用来保证精确一次（ exactly  
         
         once）的一致性语义。StreamingFileSink 为批处理和流处理提供了一个统一的 Sink，它可以将分区文件写入 Flink支持的文件系统。它可以保证精确一次的状态一致性，大大改进了之前流式文件 Sink 的方式。 
         
         
         
          它的主要操作是将数据写入桶（ buckets ），每个桶中的数据都可以分割成一个个大小有限的分  
          
          区文件，这样一来就实现真正意义上的分布式文件存储。我们可以通过各种配置来控制“分桶”  
          
          的操作；默认的分桶方式是基于时间的，我们每小时写入一个新的桶。换句话说，每个桶内保  
          
          存的文件，记录的都是  1  小时的输出数据。 
          
          
           
          
          
         3、输出到 Kafka  
          Flink 与 Kafka 的连接器提供了端到端的精确一次（exactly once）语义保证，这在实际项目中是最高级别的一致性保证。具体步骤如下： 
         （1）添加 Kafka 连接器依赖  
         （2）启动 Kafka 集群  
          （3）编写输出到  Kafka  的示例代码 
          
         
         
         
         public static void main(String[] args) throws Exception {
     StreamExecutionEnvironment env = 
     StreamExecutionEnvironment.getExecutionEnvironment();
     env.setParallelism(1);

     Properties properties = new Properties();
     properties.put("bootstrap.servers", "hadoop102:9092");
     DataStreamSource stream = env.readTextFile("input/clicks.csv");
     stream
         .addSink(new FlinkKafkaProducer(
             "clicks",
             new SimpleStringSchema(),
             properties
     ));

     env.execute();
 } 
          FlinkKafkaProducer  继承了抽象类 TwoPhaseCommitSinkFunction，这是一个实现了 “ 两阶段提交 ” 的  RichSinkFunction 。两阶段提交提供了 Flink  向  Kafka  写入数据的事务性保证，能够真正做到精确一次（ exactly once ）的状态一致性。 
          
          
          数据管道：Flink 从 Kakfa 的一个 topic 读取消费数据，然后进行处理转换，最终将结果数据写入 Kafka 的另一个 topic——数据从 Kafka 流入、经 Flink处理后又流回到 Kafka 去，这就是所谓的“数据管道”应用。 
          
          
          
          4、输出到 Redis  
           Redis  是一个开源的内存式的数据存储，提供了像字符串（ string ）、哈希表（ hash ）、列表  
           
           （ list ）、集合（ set ）、排序集合（ sorted set ）、位图（ bitmap ）、地理索引和流（ stream ）等一系 列常用的数据结构。因为它运行速度快、支持的数据类型丰富，在实际项目中已经成为了架构  
           
           优化必不可少的一员，一般用作数据库、缓存，也可以作为消息代理。 
           
           
           
           5、输出到 Elasticsearch  
           ElasticSearch 是一个分布式的开源搜索和分析引擎，适用于所有类型的数据。ElasticSearch 有着简洁的 REST 风格的 API，以良好的分布式特性、速度和可扩展性而闻名，在大数据领域 应用非常广泛。  
           6、输出到 MySQL（JDBC）  
            尽管在大数据处理中直接与  MySQL  交互的场景不多，但最终处理的计算结果是要给外部应用消费使用的，而外部应用读取的数据存储往往就是 MySQL 。所以我们也需要知道如何将数据输出到  MySQL  这样的传统数据库。 
            
            
            
             （1）添加依赖  
             
             
             
              
                 
               
               org.apache.flink  
               
               flink-connector-jdbc_${scala.binary.version}  
               
               ${flink.version}  
               
                 
               
               
                 
               
               mysql  
               
               mysql-connector-java  
               
               5.1.47  
               
                 
               
              
             
            
            
             （2）启动 MySQL，在 database 库下建表 clicks  
             
             
             
              
               mysql> create table clicks(  
               
               -> user varchar(20) not null,  
               
               -> url varchar(100) not null); 
               
              
             
            
           
          
         
        
       
       
        （3）编写输出到 MySQL 的代码 
        
        
        
        stream.addSink(JdbcSink.sink(
                "INSERT INTO clicks (user, url) VALUES (?, ?)",
                (statement, r) -> {
                    statement.setString(1, r.user);
                    statement.setString(2, r.url);
                },
                new JdbcConnectionOptions.JdbcConnectionOptionsBuilder()   
                // MySQL5.7的写法
                        .withUrl("jdbc:mysql://localhost:3306/ct_2022")
                        .withDriverName("com.mysql.jdbc.Driver")
                        .withUsername("root")
                        .withPassword("root")
                        .build()
            )
 ); 
        7、自定义 Sink 输出 
        
       
       
        例如， Flink  并没有提供  HBase  的连接器，所以需要我们自己写。  
        
        
         （1）导入依赖  
         
         
          
             
           
           org.apache.hbase  
           
           hbase-client  
           
           ${hbase.version}  
           
            
           
          
         
        
       
       
        （2）编写输出到  HBase  的代码

@dataclass装饰器简单用法 yuuki456 python 开发语言
dataclass是从Python3.7版本开始，作为标准库中的模块被引入，提供便捷的数据类创建和管理方式。引言Dataclass是Dataclasses模块的一种装饰器，当使用@dataclass装饰器时，会自动生成一些特殊的方法，包括：__init__:根据类属性初始化实例。__repr__:用于打印或调试时显示实例信息。__eq__:用于比较两个实例是否相等。还可以根据需要生成__lt__,
Python@dataclass装饰器实践首尔的初雪是眼泪 python python windows
目录1.基本使用1.1示例：基本的数据类1.2__init__自动生成2.字段的默认值2.1带有默认值的字段2.2field()函数3.不可变数据类(frozen=True)4.比较与排序4.1支持排序的dataclass5.继承与dataclass5.1继承dataclass6.总结在Python中，@dataclass是一个非常有用的装饰器，它能够自动为类生成一些常见的方法，例如__init_
Python @dataclass 装饰器详解添财小哥 python 开发语言
1.用途和主要功能@dataclass是Python3.7引入的一个装饰器（位于标准库dataclasses模块中），用于简化“纯数据”类的定义。它自动为类生成常用的特殊方法（如init、repr、eq等），避免手动编写冗余模板代码。这样定义的数据类在代码量和可读性上都有显著优势，如便于维护、减少错误。使用@dataclass后，我们“可以直接创建和操作对象，而无需手动编写这些基础方法”。总体而言
Spring Cloud Bus 和 Spring Cloud Stream 中国lanwp springboot
SpringCloudBus和SpringCloudStream都是SpringCloud生态中的消息通信组件，但它们的定位和使用场景有显著区别：1.SpringCloudBus核心定位：分布式系统的消息广播（配置刷新、事件传播）。典型场景：通过消息中间件（如RabbitMQ、Kafka）广播配置变更事件，实现所有微服务配置的集中刷新（如结合/actuator/refresh或/actuator/
C#关于DataGridView控件的使用总结 fangyuan621 数据库 Microsoft Visual Studio c#
DataGridView常用方法：dataGridView1.ReadOnly=true;//全部单元格只读dataGridView1.Columns[1].ReadOnly=true;///指定单元格设置只读（列）第一列 dataGridView1.Rows[2].ReadOnly=true;///指定单元格设置只读（行）第二行 dataGridView1[1,2].ReadOnly=true;
pychram虚拟环境中安装不同python版本小炫y python
安装AnacondaAnaconda|TheWorld'sMostPopularDataSciencePlatform安装时选justme路径可以改，其他默认都可以。然后打开anacondaprompt输入指令安装需要的python版本，condacreate-npython39Python=3.9再输入y确认查看python虚拟环境路径，condainfo-e然后在pycharm中设置一下就可以
【python数据分析】数据建模之Kmeans聚类斑点鱼 SpotFish python 数据建模聚类 python 数据分析
K-means聚类：最常用的机器学习聚类算法，且为典型的基于距离的聚类算法。K均值：基于原型的、划分的距离技术，它试图发现用户指定个数(K)的簇以欧式距离作为相似度测度Kmeans聚类案例分析：make_blobs聚类数据生成器#导入模块from sklearn.cluster import KMeansfromsklearn.datasetsimportmake_blobs#创建数据x,y_tr
Java ArrayList 扩容机制笑衬人心。 JAVA学习笔记 java 开发语言笔记后端
一、ArrayList简介ArrayList是Java集合框架中基于数组实现的可变长度列表，其核心特性是：支持随机访问（通过索引）支持动态扩容插入/删除效率较低（非尾部操作）二、底层数据结构//JDK11+transientObject[]elementData;//实际存储元素的数组三、容量与初始状态默认构造函数publicArrayList(){this.elementData=DEFAULT
【脚本】Linux磁盘目录挂载脚本(不分区) 锅锅来了 Linux 运维进阶必备【案例分享】linux 网络运维
以下是一个不带分区，直接挂载整个磁盘到指定目录的脚本。该脚本会检查磁盘是否已挂载，自动创建文件系统（可选），并配置开机自动挂载：#!/bin/bash#磁盘直接挂载脚本（不分区）#使用方法:sudo./mount_disk_raw.sh/dev/sdb/mnt/dataext4[format]#参数检查if[$#-lt2];thenecho"用法:$0[文件系统类型=ext4][是否格式化=yes
Milvus数据库创建 cts618 Milvus分布式向量数据库数据库 milvus oracle
URL：https://milvus.io/docs/zh/manage_databases.mdfrompymilvusimportMilvusClient"""URL：https://milvus.io/docs/zh/manage_databases.md"""#创建数据库client=MilvusClient(uri="",token="")client.create_database(d
Milvus知识库创建
importconfigparserimporttimeimportrandomfrompymilvusimportMilvusClientfrompymilvusimportDataTypecfp=configparser.RawConfigParser()cfp.read('config.ini')milvus_uri=cfp.get('example','uri')token=cfp.get
数据库Mysql基础------第一部分数据的准备与基础命令 Judy~judy 数据库数据库 mysql
一、初识数据库一、为什么要用数据库？数据库（Database）是按照数据结构来组织、存储和管理数据的仓库数据库随时随地的存在，并且使用，简单的说，数据库就是收集数据的结构。数据涉及很多，例如一个产品属于种类，并且有自己的数据标签，这就是为什么要用关系型数据。在关系数据库，我们建模数据包括产品，品类，标签等等，所有这些都用一个表格，包含行和列，就像Excel中的电子表格。从文件中读取数据的反序列化操
低代码数字孪生智慧钢厂组态监控界面图扑可视化三维可视化数字孪生数据大屏组态监控智慧钢厂
2024年4月，中国钢铁工业协会发布了《钢铁行业数字化转型评估报告（2023年）》（以下简称《报告》）。《报告》指出，绝大部分钢铁企业建立了数字化转型相关管理组织和团队，并加强其规划落实，系统间的综合集成能力进一步加强。在研发、制造、服务全生命周期管控以及产业链协同等方面需继续深化，这也是现阶段钢铁企业数字化转型需重点建设的内容。钢铁行业作为典型的流程制造业，通过融合先进的信息技术和大数据分析，既
HarmonyOS Next 记事本应用开发实践鱼弦 harmonyos 华为
HarmonyOSNext记事本应用开发实践引言在移动互联网时代，记事本应用作为基础生产力工具，仍然是用户日常使用频率最高的应用类型之一。随着HarmonyOSNext的发布，华为推出了全新的应用开发框架和工具链，为开发者提供了构建全场景分布式应用的能力。本文将全面介绍基于HarmonyOSNext平台的记事本应用开发实践，从技术背景到具体实现，再到部署与优化，为开发者提供完整的开发指南。技术背景
UI前端与大数据的深度融合：打造智慧应用的新生态前端开发与ui设计的老司机 ui 前端大数据
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!在数字化转型的浪潮中，UI前端与大数据正逐渐成为推动智慧应用发展的核心力量。UI前端作为用户与应用程序交互的直接界面，负责提供直观、便捷且吸引人的用户体验；而大数据则凭借其强大的数据收集、分析和预测能力，为应用程序
鸿蒙应用发布全解析：应用模块化的实践操作系统内核探秘操作系统内核揭秘 OS harmonyos 华为 ai
鸿蒙应用发布全解析：应用模块化的实践关键词：鸿蒙系统、应用模块化、分布式能力、原子化服务、应用发布、HarmonyOS、开发实践摘要：本文全面解析鸿蒙(HarmonyOS)应用发布的核心机制，重点探讨应用模块化设计在鸿蒙生态中的实践。文章从鸿蒙系统架构出发，深入分析模块化应用的设计原理、开发流程和发布策略，结合实际案例展示如何利用鸿蒙的分布式能力和原子化服务特性构建高效、灵活的应用架构。同时，本文
数字孪生：未来城市管理的革命性技术大有数据可视化信息可视化
一、数字孪生技术概述数字孪生技术是一种通过创建虚拟模型与物理实体之间实时交互的技术。它借助物联网、大数据、云计算、人工智能等前沿技术，实现对物理实体的精准映射与动态仿真。数字孪生的核心在于构建一个与物理世界相对应的虚拟模型，该模型能够实时反映物理实体的状态，并通过数据分析与模拟优化其性能。在城市管理领域，数字孪生技术为城市管理者提供了一种全新的视角和工具。城市是一个复杂的巨系统，涉及基础设施、交通
鸿蒙应用开发全攻略：调试与性能优化实践 vvilkin的学习备忘 #HarmonyOS harmonyos 华为
引言：为什么鸿蒙开发需要特别关注调试与优化？在移动应用开发领域，鸿蒙操作系统（HarmonyOS）作为华为推出的全场景分布式操作系统，为开发者带来了全新的机遇和挑战。与传统的Android/iOS开发相比，鸿蒙开发在分布式能力、跨设备协同和性能优化方面有着独特的要求。据统计，经过充分优化的鸿蒙应用启动速度可提升40%，内存占用减少30%，这直接关系到用户体验和应用市场竞争力。本文将系统性地介绍鸿蒙
Spring Cloud Gateway高并发限流——基于Redis实现方案解析极客智谷技术积累分布式限流
本文是一个基于SpringCloudGateway的分布式限流方案，使用Redis+Lua实现高并发场景下的精准流量控制。该方案支持动态配置、多维度限流（API路径/IP/用户），并包含完整的代码实现和性能优化建议。一、架构设计限流过滤器动态推送放行拦截客户端SpringCloudGatewayRedis集群限流规则配置中心微服务返回429状态码二、核心代码实现自定义限流过滤器@Component
Python大数据分析&人工智能教程 - Django-Celery异步处理（深入解析与实战案例） AI_DL_CODE python 数据分析 Django Celery异步处理 Celery
文章目录1.概念介绍1.1Django框架概述1.2Celery异步任务队列1.3AMQP协议与消息路由2.环境搭建2.1安装Django和Celery2.2配置Redis作为消息代理3.Celery架构与工作原理3.1Celery组件介绍3.2任务生命周期3.3任务调度与执行3.3.1定时任务3.3.2异步任务调用3.3.3任务结果查询4.Django与Celery集成4.1创建Celery实例
EasyExcel分次插入Excel Jerry_carry excel java
@GetMapping("/muiltAppend")publicStringmuiltAppend(){Stringfilename="multi_append_data.xlsx";//创建ExcelWriter对象ExcelWriterexcelWriter=EasyExcel.write(filename,User.class).build();//创建WriteSheet对象WriteS
Python大数据分析&人工智能教程 - Django-RestFramework框架（深入解析+实操案例） AI_DL_CODE python 数据分析 django RestFramework框架
文章目录1.Django-RestFramework基础1.1Django-RestFramework概述1.2安装与配置1.3构建第一个API1.3.1定义模型1.3.2创建序列化器1.3.3定义视图1.3.4配置URL路由1.4进阶功能1.4.1权限控制1.4.2限流1.5实战案例1.5.1创建图书1.5.2查询图书1.5.3更新图书1.5.4删除图书2.序列化器(Serializers)2.
达梦dsc与mpp集群机制比较 wyllove97 数据库 dba
达梦数据库现有2套分布式产品，即DMdsc共享存储集群以及DMmpp非共享存储集群DMdsc共享存储集群：该产品功能类似于oraclerac，具有高可用性和高伸缩性的特征，可提供横向扩展，实现超单一服务器的功能。其提升了错误恢复能力，并且随着系统增长而逐步扩展。一旦系统发生失败，该集群对用户保证最高可用性，保障关键业务数据不被丢失。拓扑图如下图所示：在配置DMdsc时，需配置两套网络，一套用于提供
【19】Day 0 C9800设计和部署最佳实践剪刀石头布[]~(￣▽￣)~* Cisco Wireless Learning 思科Wireless 网络思科 WLAN C9800
1.概述本文主要针对C9800进行私有部署设计部分的介绍，以及WiFi7迁移的最佳实践。2.C9800私有部署C9800的无线部署选项分为如下几种：集中式部署：主要定义为Localmode分布式部署：主要定义为FlexconnectSDA部署：即SoftwaredefinedAccess2.1.集中部署特点中大型园区网；AP处于Local模式；客户端流量直接在无线控制器处通过L2trunk链路桥接
Gradio全解10——Data Science And Plots：数据科学与绘图龙焰智能 Gradio全解教程 Gradio Plots Data Science Datatime filters eventlistner 交互式绘图聚合绘图
Gradio全解10——DataScienceAndPlots：数据科学与绘图前言本篇摘要10.DataScienceAndPlots：数据科学与绘图10.1API参数10.1.1PlotAPI参数10.1.2EventListenersAPI参数10.2Plots绘图示例10.2.1常用绘图示例1.使用pd.Dataframe绘图2.添加Color并划分系列值3.AggregatingValue
LabVIEW调用Excel宏实现数据可视化 LabVIEW开发 LabVIEW知识 LabVIEW参考程序 LabVIEW知识 LabVIEW程序 LabVIEW功能
通过LabVIEW的ActiveX接口，调用Excel应用程序，实现打开指定Excel工作簿并运行其中宏（如“GraphData”宏），将工作表数据以图表形式展示。通过ActiveX自动化技术，打通LabVIEW与Excel交互通道，让Excel的数据可视化能力为LabVIEW程序所用。内容功能组件交互：利用LabVIEW的ActiveX节点，先创建Excel_Application对象并控制其可
算法备案 | 算法备案必要性、算法类型、备案流程极创信息人工智能 AIGC
一、进行算法备案的必要性在当今的数字化时代，算法已经广泛应用于各个行业，引起了监管部门的高度关注，因为算法产品可能会带来一些潜在的风险。为了规范互联网信息服务中的算法推荐活动，抵制诸如深度生成合成、算法歧视、“大数据杀熟”、诱导沉迷等不合理应用，各个国家都先后出台了一系列关于算法管理的法律法规。在我国，《数据安全法》、《个人信息保护法》、《互联网信息服务算法推荐管理规定》等法律法规明确对算法的使用
集装箱智慧通关系统如何用AI技术重塑物流效率？
在全球贸易和物流高速发展的今天，港口、物流园区及企业的闸口管理面临巨大挑战——如何提升通关效率、保障货物安全并降低运营成本？集装箱智慧通关系统依托先进的AI视觉识别、物联网及大数据技术，为行业提供了智能化解决方案。核心技术：AI视觉+物联网赋能传统闸口依赖人工核验集装箱号、车辆信息，效率低且易出错。而智慧通关系统通过高精度摄像头+AI算法，可自动识别集装箱编号、货车车牌、货物类型等关键信息，准确率
python连接db2的官方库ibm_db的api 数据-脚本-资源-管道 ibm-db python 数据库 python
IBM_DBAPI详细文档ibm_db.active描述检查指定的数据库连接是否处于活动状态传入参数connection:有效的数据库连接资源返回值True:资源处于活动状态False:资源未处于活动状态例子importibm_dbconn=ibm_db.connect("DATABASE=testdb;HOSTNAME=localhost;PORT=50000;PROTOCOL=TCPIP;UI
LabVIEW键盘鼠标监测控制 LabVIEW开发 LabVIEW知识 LabVIEW参考程序 LabVIEW设备控制 LabVIEW知识 LabVIEW程序 LabVIEW功能
通过InputDeviceControlVIs，实现对键盘和鼠标活动的监测。通过AcquireInputDataVI在循环中持续获取输入数据，InitializeKeyboard与InitializeMouseVIs先获取设备ID引用，用于循环内监测操作；运行时可输出按键信息（KeysPressed）、鼠标水平/垂直位置（Horizontal/VerticalMousePosition）、鼠标按键
Java实现的基于模板的网页结构化信息精准抽取组件：HtmlExtractor yangshangchuan 信息抽取 HtmlExtractor 精准抽取信息采集
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件，本身并不包含爬虫功能，但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。 HtmlExtractor是为大规模分布式环境设计的，采用主从架构，主节点负责维护抽取规则，从节点向主节点请求抽取规则，当抽取规则发生变化，主节点主动通知从节点，从而能实现抽取规则变化之后的实时动态生效。如
java编程思想 -- 多态百合不是茶 java 多态详解
一: 向上转型和向下转型面向对象中的转型只会发生在有继承关系的子类和父类中（接口的实现也包括在这里）。父类：人子类：男人向上转型： Person p = new Man() ; //向上转型不需要强制类型转化向下转型： Man man =
[自动数据处理]稳扎稳打,逐步形成自有ADP系统体系 comsci dp
对于国内的IT行业来讲,虽然我们已经有了"两弹一星",在局部领域形成了自己独有的技术特征,并初步摆脱了国外的控制...但是前面的路还很长.... 首先是我们的自动数据处理系统还无法处理很多高级工程...中等规模的拓扑分析系统也没有完成,更加复杂的
storm 自定义日志文件商人shang storm cluster logback
Storm中的日志级级别默认为INFO，并且，日志文件是根据worker号来进行区分的，这样，同一个log文件中的信息不一定是一个业务的，这样就会有以下两个需求出现： 1. 想要进行一些调试信息的输出 2. 调试信息或者业务日志信息想要输出到一些固定的文件中不要怕，不要烦恼，其实Storm已经提供了这样的支持，可以通过自定义logback 下的 cluster.xml 来输
Extjs3 SpringMVC使用 @RequestBody 标签问题记录 21jhf
springMVC使用 @RequestBody(required = false) UserVO userInfo 传递json对象数据，往往会出现http 415，400,500等错误，总结一下需要使用ajax提交json数据才行，ajax提交使用proxy，参数为jsonData，不能为params；另外，需要设置Content-type属性为json，代码如下：（由于使用了父类aaa
一些排错方法文强chu 方法
1、java.lang.IllegalStateException: Class invariant violation at org.apache.log4j.LogManager.getLoggerRepository(LogManager.java:199)at org.apache.log4j.LogManager.getLogger(LogManager.java:228) at o
Swing中文件恢复我觉得很难小桔子 swing
我那个草了！老大怎么回事，怎么做项目评估的？只会说相信你可以做的，试一下，有的是时间！用java开发一个图文处理工具，类似word，任意位置插入、拖动、删除图片以及文本等。文本框、流程图等，数据保存数据库，其余可保存pdf格式。ok,姐姐千辛万苦，
php 文件操作 aichenglong PHP 读取文件写入文件
1 写入文件 @$fp=fopen("$DOCUMENT_ROOT/order.txt", "ab"); if(!$fp){ echo "open file error" ; exit; } $outputstring="date:"." \t tire:".$tire."
MySQL的btree索引和hash索引的区别 AILIKES 数据结构 mysql 算法
Hash 索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B-Tree 索引。可能很多人又有疑问了，既然 Hash 索引的效率要比 B-Tree 高很多，为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢
JAVA的抽象--- 接口 --实现百合不是茶
抽象接口实现接口 //抽象类 ,方法 //定义一个公共抽象的类 ,并在类中定义一个抽象的方法体抽象的定义使用abstract abstract class A 定义一个抽象类例如： //定义一个基类 public abstract class A{ //抽象类不能用来实例化，只能用来继承 //
JS变量作用域实例 bijian1013 作用域
<script> var scope='hello'; function a(){ console.log(scope); //undefined var scope='world'; console.log(scope); //world console.log(b);
TDD实践（二） bijian1013 java TDD
实践题目：分解质因数 Step1：单元测试： package com.bijian.study.factor.test; import java.util.Arrays; import junit.framework.Assert; import org.junit.Before; import org.junit.Test; import com.bijian.
[MongoDB学习笔记一]MongoDB主从复制 bit1129 mongodb
MongoDB称为分布式数据库，主要原因是1.基于副本集的数据备份， 2.基于切片的数据扩容。副本集解决数据的读写性能问题，切片解决了MongoDB的数据扩容问题。事实上，MongoDB提供了主从复制和副本复制两种备份方式，在MongoDB的主从复制和副本复制集群环境中，只有一台作为主服务器，另外一台或者多台服务器作为从服务器。本文介绍MongoDB的主从复制模式，需要指明
【HBase五】Java API操作HBase bit1129 hbase
import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.ha
python调用zabbix api接口实时展示数据 ronin47
zabbix api接口来进行展示。经过思考之后，计划获取如下内容： 1、获得认证密钥 2、获取zabbix所有的主机组 3、获取单个组下的所有主机 4、获取某个主机下的所有监控项
jsp取得绝对路径 byalias 绝对路径
在JavaWeb开发中，常使用绝对路径的方式来引入JavaScript和CSS文件，这样可以避免因为目录变动导致引入文件找不到的情况，常用的做法如下：一、使用${pageContext.request.contextPath} 　　代码” ${pageContext.request.contextPath}”的作用是取出部署的应用程序名，这样不管如何部署，所用路径都是正确的。
Java定时任务调度：用ExecutorService取代Timer bylijinnan java
《Java并发编程实战》一书提到的用ExecutorService取代Java Timer有几个理由，我认为其中最重要的理由是：如果TimerTask抛出未检查的异常，Timer将会产生无法预料的行为。Timer线程并不捕获异常，所以 TimerTask抛出的未检查的异常会终止timer线程。这种情况下，Timer也不会再重新恢复线程的执行了;它错误的认为整个Timer都被取消了。此时，已经被
SQL 优化原则 chicony sql
一、问题的提出　在应用系统开发初期，由于开发数据库数据比较少，对于查询SQL语句，复杂视图的的编写等体会不出SQL语句各种写法的性能优劣，但是如果将应用系统提交实际应用后，随着数据库中数据的增加，系统的响应速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是SQL语句的优化。对于海量数据，劣质SQL语句和优质SQL语句之间的速度差别可以达到上百倍，可见对于一个系统
java 线程弹球小游戏 CrazyMizzz java 游戏
最近java学到线程，于是做了一个线程弹球的小游戏，不过还没完善这里是提纲 1.线程弹球游戏实现 1.实现界面需要使用哪些API类 JFrame JPanel JButton FlowLayout Graphics2D Thread Color ActionListener ActionEvent MouseListener Mouse
hadoop jps出现process information unavailable提示解决办法 daizj hadoop jps
hadoop jps出现process information unavailable提示解决办法 jps时出现如下信息： 3019 -- process information unavailable3053 -- process information unavailable2985 -- process information unavailable2917 --
PHP图片水印缩放类实现 dcj3sjt126com PHP
<?php class Image{ private $path; function __construct($path='./'){ $this->path=rtrim($path,'/').'/'; } //水印函数，参数：背景图，水印图，位置，前缀,TMD透明度 public function water($b,$l,$pos
IOS控件学习：UILabel常用属性与用法 dcj3sjt126com ios UILabel
参考网站： http://shijue.me/show_text/521c396a8ddf876566000007 http://www.tuicool.com/articles/zquENb http://blog.csdn.net/a451493485/article/details/9454695 http://wiki.eoe.cn/page/iOS_pptl_artile_281
完全手动建立maven骨架 eksliang java eclipse Web
建一个 JAVA 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=App [-Dversion=0.0.1-SNAPSHOT] [-Dpackaging=jar] 建一个 web 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=web-a
配置清单 gengzg 配置
1、修改grub启动的内核版本 vi /boot/grub/grub.conf 将default 0改为1 拷贝mt7601Usta.ko到/lib文件夹拷贝RT2870STA.dat到 /etc/Wireless/RT2870STA/文件夹拷贝wifiscan到bin文件夹，chmod 775 /bin/wifiscan 拷贝wifiget.sh到bin文件夹，chm
Windows端口被占用处理方法 huqiji windows
以下文章主要以80端口号为例，如果想知道其他的端口号也可以使用该方法..........................1、在windows下如何查看80端口占用情况?是被哪个进程占用?如何终止等. 这里主要是用到windows下的DOS工具,点击"开始"--"运行",输入&
开源ckplayer 网页播放器，跨平台(html5, mobile)，flv, f4v, mp4, rtmp协议. webm, ogg, m3u8 ！天梯梦 mobile
CKplayer，其全称为超酷flv播放器，它是一款用于网页上播放视频的软件，支持的格式有：http协议上的flv,f4v,mp4格式，同时支持rtmp视频流格式播放，此播放器的特点在于用户可以自己定义播放器的风格，诸如播放/暂停按钮，静音按钮，全屏按钮都是以外部图片接口形式调用，用户根据自己的需要制作出播放器风格所需要使用的各个按钮图片然后替换掉原始风格里相应的图片就可以制作出自己的风格了，
简单工厂设计模式 hm4123660 java 工厂设计模式简单工厂模式
简单工厂模式（Simple Factory Pattern）属于类的创新型模式，又叫静态工厂方法模式。是通过专门定义一个类来负责创建其他类的实例，被创建的实例通常都具有共同的父类。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工厂模式是工厂模式家族中最简单实用的模式，可以理解为是不同工厂模式的一个特殊实现。
maven笔记 zhb8015 maven
跳过测试阶段： mvn package -DskipTests 临时性跳过测试代码的编译： mvn package -Dmaven.test.skip=true maven.test.skip同时控制maven-compiler-plugin和maven-surefire-plugin两个插件的行为，即跳过编译，又跳过测试。指定测试类 mvn test
非mapreduce生成Hfile，然后导入hbase当中 Stark_Summer map hbase reduce Hfile path实例
最近一个群友的boss让研究hbase，让hbase的入库速度达到5w+/s，这可愁死了，4台个人电脑组成的集群，多线程入库调了好久，速度也才1w左右，都没有达到理想的那种速度，然后就想到了这种方式，但是网上多是用mapreduce来实现入库，而现在的需求是实时入库，不生成文件了，所以就只能自己用代码实现了，但是网上查了很多资料都没有查到，最后在一个网友的指引下，看了源码，最后找到了生成Hfile
jsp web tomcat 编码问题王新春 tomcat jsp pageEncode
今天配置jsp项目在tomcat上，windows上正常，而linux上显示乱码，最后定位原因为tomcat 的server.xml 文件的配置，添加 URIEncoding 属性： <Connector port="8080" protocol="HTTP/1.1" connectionTi

【Flink】DataStream API—执行环境、源算子、转换算子、输出算子

前言

一、执行环境

1、创建执行环境

2、执行模式(Execution Mode)

3、触发执行

二、源算子（Source）

1、读取数据的算子就是源算子。

2、源算子种类

3、Flink 支持的数据类型

三、转换算子（Transformation）

1、基本转换算子

2、聚合算子（Aggregation）

3、匿名函数（Lambda）

4、富函数类（Rich Function Classes）

5、物理分区

四、输出算子（Sink）

1、连接到外部系统

2、输出到文件

3、输出到 Kafka

4、输出到 Redis

5、输出到 Elasticsearch

6、输出到 MySQL（JDBC）

7、自定义 Sink 输出

你可能感兴趣的:(Flink,大数据,flink,分布式,big,data)