leo825...

Flink学习笔记（一）：Flink重要概念和原理

文章目录

1、Flink 介绍
2、Flink 概述
3、Flink 组件介绍
- 3.1、Deploy 物理部署层
- 3.2、Runtime 核心层
- 3.3、API&Libraries 层
- 3.4、扩展库
4、Flink 四大基石
- 4.1、Checkpoint
- 4.2、State
- 4.3、Time
- 4.4、Window
5、Flink 的应用场景
- 5.1、Event-driven Applications【事件驱动】
- 5.2、Data Analytics Applications【数据分析】
- 5.3、Data Pipeline Applications【数据管道】
6、Flink 的优势
- 6.1、主要优势
- 6.2、其他优势
7、Flink 编程模型
- 7.1、抽象的层级
- 7.2、程序和数据流
- 7.3、并行的数据流
- 7.4、窗口（Windows）
- 7.5、时间（Time）
- 7.6、有状态的数据操作（Stateful Operations）
- 7.7、容错的 Checkpoint
- 7.8、流上的批处理
8、Flink 分布式执行环境
- 8.1、任务和运算（算子）链（Tasks and Operator Chains）
- 8.2、Job Managers，Task Managers，Clients
- 8.3、Task Slots 和资源
- 8.4、状态后端
- 8.5、保存点（Savepoints）

1、Flink 介绍

Apache Flink是一个框架和分布式处理引擎，用于对无限制和有限制的数据流进行有状态的计算。Flink被设计为可以在所有常见的集群环境中运行，以内存速度和任何规模执行计算。
官网：https://flink.apache.org/
官网中文：https://flink.apache.org/zh/
Flink 开发文档：https://nightlies.apache.org/flink/flink-docs-release-1.12/zh/
本示例以 1.12 版本进行介绍，当前版本更新至 1.17 。

2、Flink 概述

    Apache Flink是一个面向数据流处理和批量数据处理的可分布式的开源计算框架，它基于同一个Flink流式执行模型（streaming execution model），能够支持流处理和批处理两种应用类型。由于流处理和批处理所提供的SLA(服务等级协议)是完全不相同，流处理一般需要支持低延迟、Exactly-once保证，而批处理需要支持高吞吐、高效处理，所以在实现的时候通常是分别给出两套实现方法，或者通过一个独立的开源框架来实现其中每一种处理方案。比较典型的有：实现批处理的开源方案有MapReduce、Spark；实现流处理的开源方案有Storm；Spark的Streaming 其实本质上也是微批处理。
    Flink在实现流处理和批处理时，与传统的一些方案完全不同，它从另一个视角看待流处理和批处理，将二者统一起来：Flink是完全支持流处理，也就是说作为流处理看待时输入数据流是无界的；批处理被作为一种特殊的流处理，只是它的输入数据流被定义为有界的。
    Flink 官方提供了Java、Scala、Python 语言接口用以开发 Flink 应用程序，但是 Flink 的源码是使用 Java 语言进行开发的，且 Flink 被阿里收购后(2019 年1 月 8 日)，未来的主要编程语言可能主要会是 Java，且 GitHub 上关于 Flink 的项目，大多数是使用 Java 语言编写的。

3、Flink 组件介绍

3.1、Deploy 物理部署层

Flink 支持本地运行、能在独立集群或者在被 YARN 管理的集群上运行，也能部署在云上，该层主要涉及 Flink 的部署模式，目前 Flink 支持多种部署模式：本地、集群(Standalone、YARN)、云(GCE/EC2)、Kubenetes。Flink 能够通过该层能够支持不同平台的部署，用户可以根据需要选择使用对应的部署模式。

3.2、Runtime 核心层

Runtime 层提供了支持 Flink 计算的全部核心实现，为上层 API 层提供基础服务，该层主要负责对上层不同接口提供基础服务，也是 Flink 分布式计算框架的核心实现层，支持分布式 Stream 作业的执行、JobGraph 到 ExecutionGraph 的映射转换、任务调度等。将 DataSteam 和 DataSet 转成统一的可执行的 Task Operator，达到在流式引擎下同时处理批量计算和流式计算的目的。

3.3、API&Libraries 层

Flink 首先支持了 Scala 和 Java 的 API、Python 。DataStream、DataSet、Table、SQL API，作为分布式数据处理框架，Flink 同时提供了支撑计算和批计算的接口，两者都提供给用户丰富的数据处理高级 API ，例如 Map、FlatMap 操作等，也提供比较低级的 Process Function API，用户可以直接操作状态和时间等底层数据。

3.4、扩展库

Flink 还包括用于复杂事件处理的CEP，机器学习库 FlinkML，图处理库 Gelly等。Table 是一种接口化的 SQL 支持，也就是 API 支持(DSL)，而不是文本化的 SQL 解析和执行。

4、Flink 四大基石

Flink 之所以能这么流行，离不开它最重要的四个基石：Checkpoint、State、Time、Window。

4.1、Checkpoint

    这是 Flink 最重要的一个特性。
    Flink基于 Chandy-Lamport 算法实现了一个分布式的一致性的快照，从而提供了一致性的语义。
    Chandy-Lamport算法实际上在1985年的时候已经被提出来，但并没有被很广泛的应用，而Flink则把这个算法发扬光大了。
    Spark 最近在实现 Continue streaming，Continue streaming 的目的是为了降低处理的延时，其也需要提供这种一致性的语义，最终也采用了 Chandy-Lamport 这个算法，说明Chandy-Lamport 算法在业界得到了一定的肯定。(https://zhuanlan.zhihu.com/p/53482103)

4.2、State

提供了一致性的语义之后，Flink 为了让用户在编程时能够更轻松、更容易地去管理状态，还提供了一套非常简单明了的 State API，包括里面的有 ValueState、ListState 、MapState ，近期添加了 BroadcastState ，使用 State API 能够自动享受到这种一致性的语义。

4.3、Time

除此之外，Flink 还实现了 Watermark 的机制，能够支持基于事件的时间的处理，能够容忍迟到/乱序的数据。

4.4、Window

另外流计算中一般在对流数据进行操作之前都会先进行开窗，即基于一个什么样的窗口上做这个计算。Flink提供了开箱即用的各种窗口，比如滑动窗口、滚动窗口、会话窗口以及非常灵活的自定义的窗口。

5、Flink 的应用场景

Flink 功能强大，支持开发和运行多种不同种类的应用程序。它的主要特性包括：批流一体化、精密的状态管理、事件时间支持以及精确一次的状态一致性保障等。Flink 不仅可以运行在包括 YARN、 Mesos、Kubernetes 在内的多种资源管理框架上，还支持在裸机集群上独立部署。在启用高可用选项的情况下，它不存在单点失效问题。事实证明，Flink 已经可以扩展到数千核心，其状态可以达到 TB 级别，且仍能保持高吞吐、低延迟的特性。世界各地有很多要求严苛的流处理应用都运行在 Flink 之上。
https://flink.apache.org/zh/use-cases/

5.1、Event-driven Applications【事件驱动】

    事件驱动型应用是一类具有状态的应用，它从一个或多个事件流提取数据，并根据到来的事件触发计算、状态更新或其他外部动作。
    事件驱动型应用是在计算存储分离的传统应用基础上进化而来。在传统架构中，应用需要读写远程事务型数据库。相反，事件驱动型应用是基于状态化流处理来完成。在该设计中，数据和计算不会分离，应用只需访问本地(内存或磁盘)即可获取数据。
    系统容错性的实现依赖于定期向远程持久化存储写入 checkpoint。下图描述了传统应用和事件驱动型应用架构的区别。

    从某种程度上来说，所有的实时的数据处理或者是流式数据处理都应该是属于Data Driven，流计算本质上是Data Driven 计算。应用较多的如风控系统，当风控系统需要处理各种各样复杂的规则时，Data Driven 就会把处理的规则和逻辑写入到Datastream 的API 或者是ProcessFunction 的API 中，然后将逻辑抽象到整个Flink 引擎，当外面的数据流或者是事件进入就会触发相应的规则，这就是Data Driven 的原理。在触发某些规则后，Data Driven 会进行处理或者是进行预警，这些预警会发到下游产生业务通知，这是Data Driven 的应用场景，Data Driven 在应用上更多应用于复杂事件的处理。

典型实例：

欺诈检测(Fraud detection)
异常检测(Anomaly detection)
基于规则的告警(Rule-based alerting)
业务流程监控(Business process monitoring)
Web应用程序(社交网络)

5.2、Data Analytics Applications【数据分析】

数据分析任务需要从原始数据中提取有价值的信息和指标。如下图所示，Flink 同时支持流式及批量分析应用。

Data Analytics Applications：包含 Batch analytics (批处理分析)和 Streaming analytics (流处理分析)
Batch analytics：可以理解为周期性查询：Batch Analytics 就是传统意义上使用类似于 Map Reduce、Hive、Spark Batch 等，对作业进行分析、处理、生成离线报表。比如Flink应用凌晨从 Recorded Events 中读取昨天的数据，然后做周期查询运算，最后将数据写入 Database 或者 HDFS ，或者直接将数据生成报表供公司上层领导决策使用。
Streaming analytics：可以理解为连续性查询：比如实时展示双十一天猫销售 GMV(Gross Merchandise Volume 成交总额)，用户下单数据需要实时写入消息队列，Flink 应用源源不断读取数据做实时计算，然后不断的将数据更新至 Database 或者 K-VStore ，最后做大屏实时展示。

典型实例：

电信网络质量监控
移动应用中的产品更新及实验评估分析
消费者技术中的实时数据即席分析
大规模图分析

5.3、Data Pipeline Applications【数据管道】

    什么是数据管道？
    提取-转换-加载(ETL)是一种在存储系统之间进行数据转换和迁移的常用方法。ETL 作业通常会周期性地触发，将数据从事务型数据库拷贝到分析型数据库或数据仓库。数据管道和 ETL 作业的用途相似，都可以转换、丰富数据，并将其从某个存储系统移动到另一个。但数据管道是以持续流模式运行，而非周期性触发。因此数据管道支持从一个不断生成数据的源头读取记录，并将它们以低延迟移动到终点。
    例如：数据管道可以用来监控文件系统目录中的新文件，并将其数据写入事件日志；另一个应用可能会将事件流物化到数据库或增量构建和优化查询索引。和周期性 ETL 作业相比，持续数据管道可以明显降低将数据移动到目的端的延迟。此外，由于它能够持续消费和发送数据，因此用途更广，支持用例更多。下图描述了周期性 ETL 作业和持续数据管道的差异。

Periodic ETL：比如每天凌晨周期性的启动一个 Flink ETL Job，读取传统数据库中的数据，然后做ETL，最后写入数据库和文件系统。
Data Pipeline：比如启动一个 Flink 实时应用，数据源(比如数据库、Kafka )中的数据不断的通过 Flink Data Pipeline 流入或者追加到数据仓库(数据库或者文件系统)，或者 Kafka 消息队列。Data Pipeline 的核心场景类似于数据搬运并在搬运的过程中进行部分数据清洗或者处理，而整个业务架构图的左边是 Periodic ETL，它提供了流式 ETL 或者实时 ETL，能够订阅消息队列的消息并进行处理，清洗完成后实时写入到下游的 Database 或 File system 中。

典型实例：

电子商务中的持续 ETL(实时数仓)
当下游要构建实时数仓时，上游则可能需要实时的 Stream ETL。这个过程会进行实时清洗或扩展数据，清洗完成后写入到下游的实时数仓的整个链路中，可保证数据查询的时效性，形成实时数据采集、实时数据处理以及下游的实时 Query。
电子商务中的实时查询索引构建(搜索引擎推荐)
搜索引擎这块以淘宝为例，当卖家上线新商品时，后台会实时产生消息流，该消息流经过Flink 系统时会进行数据的处理、扩展。然后将处理及扩展后的数据生成实时索引，写入到搜索引擎中。这样当淘宝卖家上线新商品时，能在秒级或者分钟级实现搜索引擎的搜索。

6、Flink 的优势

6.1、主要优势

Flink 具备统一的框架处理有界和无界两种数据流的能力
部署灵活，Flink 底层支持多种资源调度器，包括Yarn、Kubernetes 等。Flink 自身带的Standalone 的调度器，在部署上也十分灵活。
极高的可伸缩性，可伸缩性对于分布式系统十分重要，阿里巴巴双 11 大屏采用 Flink 处理海量数据，使用过程中测得 Flink 峰值可达17 亿条/秒。
极致的流式处理性能。Flink 相对于 Storm 最大的特点是将状态语义完全抽象到框架中，支持本地状态读取，避免了大量网络 IO，可以极大提升状态存取的性能。

6.2、其他优势

同时支持高吞吐、低延迟、高性能
Flink 是目前开源社区中唯一一套集高吞吐、低延迟、高性能三者于一身的分布式流式数据处理框架。Spark 只能兼顾高吞吐和高性能特性，无法做到低延迟保障,因为Spark是用批处理来做流处理; Storm 只能支持低延时和高性能特性，无法满足高吞吐的要求。下图显示了 Apache Flink 与 Apache Storm 在完成流数据清洗的分布式任务的性能对比。
支持事件时间(Event Time)概念
在流式计算领域中，窗口计算的地位举足轻重，但目前大多数框架窗口计算采用的都是系统时间(Process Time)，也就是事件传输到计算框架处理时，系统主机的当前时间。Flink 能够支持基于事件时间(Event Time)语义进行窗口计算，这种基于事件驱动的机制使得事件即使乱序到达甚至延迟到达，流系统也能够计算出精确的结果，保持了事件原本产生时的时序性，尽可能避免网络传输或硬件系统的影响。
支持有状态计算
Flink1.4开始支持有状态计算，所谓状态就是在流式计算过程中将算子的中间结果保存在内存或者文件系统中，等下一个事件进入算子后可以从之前的状态中获取中间结果，计算当前的结果，从而无须每次都基于全部的原始数据来统计结果，极大的提升了系统性能，状态化意味着应用可以维护随着时间推移已经产生的数据聚合。
支持高度灵活的窗口(Window)操作
Flink 将窗口划分为基于 Time 、Count 、Session、以及Data-Driven等类型的窗口操作，窗口可以用灵活的触发条件定制化来达到对复杂的流传输模式的支持，用户可以定义不同的窗口触发机制来满足不同的需求。
基于轻量级分布式快照(Snapshot/Checkpoints)的容错机制
Flink 能够分布运行在上千个节点上，通过基于分布式快照技术的Checkpoints，将执行过程中的状态信息进行持久化存储，一旦任务出现异常停止，Flink 能够从 Checkpoints 中进行任务的自动恢复，以确保数据处理过程中的一致性，Flink 的容错能力是轻量级的，允许系统保持高并发，同时在相同时间内提供强一致性保证。
基于 JVM 实现的独立的内存管理
Flink 实现了自身管理内存的机制，通过使用散列，索引，缓存和排序有效地进行内存管理，通过序列化/反序列化机制将所有的数据对象转换成二进制在内存中存储，降低数据存储大小的同时，更加有效的利用空间。使其独立于 Java 的默认垃圾收集器，尽可能减少 JVM GC 对系统的影响。
基于 JVM 实现的独立的内存管理
Flink 实现了自身管理内存的机制，通过使用散列，索引，缓存和排序有效地进行内存管理，通过序列化/反序列化机制将所有的数据对象转换成二进制在内存中存储，降低数据存储大小的同时，更加有效的利用空间。使其独立于 Java 的默认垃圾收集器，尽可能减少 JVM GC 对系统的影响。
SavePoints 保存点
对于 7 * 24 小时运行的流式应用，数据源源不断的流入，在一段时间内应用的终止有可能导致数据的丢失或者计算结果的不准确。比如集群版本的升级，停机运维操作等。值得一提的是，Flink 通过SavePoints 技术将任务执行的快照保存在存储介质上，当任务重启的时候，可以从事先保存的 SavePoints 恢复原有的计算状态，使得任务继续按照停机之前的状态运行。Flink 保存点提供了一个状态化的版本机制，使得能以无丢失状态和最短停机时间的方式更新应用或者回退历史数据。
灵活的部署方式，支持大规模集群
Flink 被设计成能用上千个点在大规模集群上运行。除了支持独立集群部署外，Flink 还支持 YARN 和 Mesos 方式部署。
Flink 的程序内在是并行和分布式的
数据流可以被分区成 stream partitions，operators 被划分为 operator subtasks;这些 subtasks 在不同的机器或容器中分不同的线程独立运行；operator subtasks 的数量就是operator的并行计算数，不同的 operator 阶段可能有不同的并行数；如下图所示，source operator 的并行数为 2，但最后的 sink operator 为1；
丰富的库
Flink 拥有丰富的库来进行机器学习，图形处理，关系数据处理等。

7、Flink 编程模型

7.1、抽象的层级

有状态的数据流处理层
最底层的抽象仅仅提供有状态的数据流，它通过处理函数（Process Function）嵌入到数据流api(DataStream API). 用户可以通过它自由的处理单流或者多流，并保持一致性和容错。同时用户可以注册事件时间和处理时间的回调处理，以实现复杂的计算逻辑。
核心API层
它提供了数据处理的基础模块，像各种transformation, join,aggregations,windows,stat 以及数据类型等等
Table API层
定了围绕关系表的DSL(领域描述语言)。Table API遵循了关系模型的标准：Table类型关系型数据库中的表，API也提供了相应的操作，像select,project,join,group-by,aggregate等。Table API声明式的定义了逻辑上的操作（logical operation）不是code for the operation；Flink会对Table API逻辑在执行前进行优化。同时代码上，Flink允许混合使用Table API和DataStram/DataSet API
SQL层
它很类似Table API的语法和表达，也是定义与Table API层次之上的，但是提供的是纯SQL的查询表达式。

7.2、程序和数据流

用户实现的 Flink 程序是由 Stream 和 Transformation 这两个基本构建块组成，其中 Stream 是一个中间结果数据，而 Transformation 是一个操作，它对一个或多个输入 Stream 进行计算处理，输出一个或多个结果 Stream 。当一个Flink程序被执行的时候，它会被映射为 Streaming Dataflow 。一个 Streaming Dataflow 是由一组 Stream 和 Transformation Operator 组成，它类似于一个 DAG 图，在启动的时候从一个或多个 Source Operator 开始，结束于一个或多个 Sink Operator。
下面是一个由 Flink 程序映射为 Streaming Dataflow 的示意图，如下所示：

上图中，FlinkKafkaConsumer 是一个 Source Operator，map、keyBy、timeWindow、apply是Transformation Operator，RollingSink 是一个 Sink Operator。

7.3、并行的数据流

在 Flink 中，程序天生是并行和分布式的：一个 Stream 可以被分成多个 Stream 分区（Stream Partitions），一个 Operator 可以被分成多个 Operator Subtask ，每一个 Operator Subtask 是在不同的线程中独立执行的。一个 Operator 的并行度，等于 Operator Subtask 的个数，一个 Stream 的并行度总是等于生成它的 Operator 的并行度。有关 Parallel Dataflow 的实例，如下图所示：

上图 Streaming Dataflow 的并行视图中，展现了在两个 Operator 之间的 Stream 的两种模式：

One-to-one 模式：比如从 Source[1] 到 map()[1] ，它保持了 Source 的分区特性（Partitioning）和分区内元素处理的有序性，也就是说 map()[1] 的 Subtask 看到数据流中记录的顺序，与 Source[1] 中看到的记录顺序是一致的。
Redistribution 模式：这种模式改变了输入数据流的分区，比如从 map()[1] 、map()[2] 到keyBy()/window()/apply()[1]、keyBy()/window()/apply()[2]，上游的 Subtask 向下游的多个不同的 Subtask 发送数据，改变了数据流的分区，这与实际应用所选择的 Operator 有关系。
另外，Source Operator 对应 2 个 Subtask，所以并行度为 2 ，而 Sink Operato r的 Subtask 只有1个，故而并行度为 1 。

7.4、窗口（Windows）

流处理中的聚合操作（counts,sums等等）不同于批处理，因为数据流是无限，无法在其上应用聚合，所以通过限定窗口(window)的范围，来进行流的聚合操作。例如：5分钟的数据计数，或者计算100个元素的总和等等。
窗口可以由时间驱动 (every 30 seconds) 或者数据驱动(every 100 elements)。如：滚动窗口tumbling windows（无叠加），滑动窗口sliding windows（有叠加），以及会话窗口session windows(被无事件活动的间隔隔开)。

7.5、时间（Time）

三种不同的时间概念：

事件时间 Event Time：事件的创建时间，通常通过时间中的一个时间戳来描述
摄入时间 Ingestion time：事件进入Flink 数据流的source的时间
处理时间 Processing Time:Processing Time表示某个Operator对事件进行处理时的本地系统时间（是在TaskManager节点上）

7.6、有状态的数据操作（Stateful Operations）

在流处理中，有些操作仅仅在某一时间针对单一事件（如事件转换map），有些操作需要记住多个事件的信息并进行处理（window operators）,后者的这些操作称为有状态的操作。有状态的操作一般被维护在内置的 key/value 存储中。这些状态信息会跟数据流一起分区并且分布存储，并且可以通过有状态的数据操作来访问。因此这些 key/value 的状态信息仅在带 key 的数据流（通过 keyBy() 函数处理过）中才能访问到。数据流按照 key 排列能保证所有的状态更新都是本地操作，保证一致性且无事务问题。同时这种排列方式使 Flink 能够透明的再分发状态信息和调整数据流分区。

7.7、容错的 Checkpoint

Flink 通过流回放和设置检查点的方式实现容错。一个checkpoint关联了输入流中的某个记录和相应状态和操作。数据流可以从checkpoint中进行恢复，并保证一致性（exactly-once 的处理语义）。 Checkpoint的间隔关系到执行是的容错性和恢复时间。

7.8、流上的批处理

Flink 把批处理作为特殊的流处理程序来执行，许多概念也都可以应用的批处理中，除了一些小的不同：

批处理的API(DataSet API )不使用 checkpoints ，恢复通过完整的流回放来实现；
DataSet API 的有状态操作使用简单的内存和堆外内存的数据结构，而不是key/value 的索引；
DataSet API 引入一种同步的迭代操作，这个仅应用于有界数据流。

8、Flink 分布式执行环境

Flink 部署方式：

Local — 本地单机模式，学习测试时使用；
Standalone — 独立集群模式，Flink 自带集群，开发测试环境使用；
StandaloneHA — 独立集群高可用模式，Flink 自带集群，开发测试环境使用；
On Yarn — 计算资源统一由 Hadoop YARN 管理，生产环境使用。部署前提，最新版本1.17要求 java 11 以上版本，1.12 还可以使用 java 8 版本。

8.1、任务和运算（算子）链（Tasks and Operator Chains）

在 Flink 分布式执行环境中，会将多个运算子任务 Operator Subtask 串起来组成一个 Operator Chain ，实际上就是一个运算链。每个运算会在TaskManager 上一个独立的线程中执行。将算子串连到任务中是一种很好的优化：它能减少线程间的数据交接和缓存，并且提高整体的吞吐，降低处理的时延。这种串联的操作，可以通过 API 来进行配置。如下图的数据流就有 5 个子任务，通过5个并行的线程来执行，所示：

8.2、Job Managers，Task Managers，Clients

Flink的运行时，由两种类型的进程组成：

JobManagers：也就是 masters ，协调分布式任务的执行。用来调度任务，协调 checkpoints ，协调错误恢复等等。至少需要一个 JobManager ，高可用的系统会有多个，一个 leader ，其他是 standby；
TaskManagers：也就是 workers ，用来执行数据流任务或者子任务，缓存和交互数据流。至少需要一个 TaskManager；
Client: Client 不是运行是和程序执行的一部分，它是用来准备和提交数据流到JobManagers。之后，可以断开连接或者保持连接以获取任务的状态信息。

从上图可以分析出 Flink 运行时的整体状态。 Flink 的 Driver 程序会将代码逻辑构建成一个 Program Dataflow(区分source,operator,sink等等)，在通过 Graph Builder 构建 DAG 的 Dataflow graph, 构建 job ,划分出 task 和subtask 等等。 Client 将 job 提交到 JobManager。Client 通过 Actor System 和 JobManager 进行消息通讯，接收 JobManager 返回的状态更新和任务执行统计结果。JobMangaer 按照 Dataflow 的 Task 和 Subtask 的划分，将任务调度分配到各个 TaskManager 中进行执行。TaskManager 会将内存抽象成多个 TaskSlot，用于执行 Task 任务。 JobManagers 与 TaskManagers 之间的任务管理，Checkpoints 的触发，任务状态，心跳等等消息处理都是通过 ActorSystem。

8.3、Task Slots 和资源

每个Worker (Task Manager)是一个 JVM 进程，通常会在单独的线程里执行一个或者多个子任务。为了控制一个Worker能够接受多少个任务，会在 Worker 上抽象多个 Task Slot (至少一个)。每个 Task Slot 代表固定的资源子集。比如一个 TaskManager 有 3 个 Slots，每个 Slot 能管理对这个 Worker 分配的资源的 3 分之 1 的内存。对资源分槽，意味着 Subtask 不会同其他 Subtasks 竞争内存，同时可以预留一定的可用内存。目前 Task Slot 没有对 CPU 进行隔离，仅是针对内存。通过动态的调整 task slots 的个数，用户可以定义哪些子任务可以相互隔离。只有一个 slot 的 TaskManager 意味着每个任务组运行在一个单独 JVM 中。在拥有多个 slot 的 TaskManager 上， subtask 共用 JVM ，可以共用 TCP 连接和心跳消息，同时可以共用一些数据集和数据结构，从而减小任务的开销。

默认情况下，Flink允许子任务共享slots,即便它们是不同任务的子任务，只要属于同一个job。这样的结果就是一个slot会负责一个job的整个pipeline。共用slot有两个好处:

Flink 集群的task slot的个数就是job的最高并行度。
更实现更好的资源利用。没有共享的slots，非密集的 source/map() subtask 会占用和 window 这类密集型的 subtask 同样多的资源。使用共享的slot的将充分的利用分槽的资源，使代价较大的 subtask 能够均匀的分布在 TaskManager 上。如，下图中的共享slot的执行模式中可以并行运行6个pipeline而上图的只可以运行2个pipeline。同时APIs也提供了资源组的机制，可以实现不想进行资源隔离的情况。实践中，比较好的每个TaskManager的task slot的默认数量最好是CPU的核数。

8.4、状态后端

数据的 KV 索引信息存储在设定的状态后端的存储中。一种是内存中的 Hash map，另一种是存在 Rocksdb（KV存储）中。另外，状态后端还是实现了在时间点上对 KV 状态的快照，并作为 Checkpoint 的一部分存储起来。

8.5、保存点（Savepoints）

    通过 Data Stream API 编写的程序可以从一个保存点重新开始执行。即便你更新了你的程序和Flink集群都不会有状态数据丢失。
    保存点是手动触发的，触发时会将它写入状态后端。 Savepoints 的实现也是依赖 Checkpoint 的机制。Flink 程序在执行中会周期性的在worker 节点上进行快照并生成Checkpoint。因为任务恢复的时候只需要最后一个完成的 Checkpoint 的，所以旧有的 Checkpoint 会在新的 Checkpoint 完成时被丢弃。
    Savepoints 和周期性的 Checkpoint 非常的类似，只是有两个重要的不同。一个是由用户触发，而且不会随着新的 Checkpoint 生成而被丢弃。

你可能感兴趣的:(大数据学习,flink,学习,笔记)

5802 怪蛋第七天作业 #裂变增长实验室# 时光里的喵
我叫徐源，今天任务目标，发只有结果的圈，被动引流！完成状态已经完成这几天操作下来，有个很大的疑惑，就是这次的实操和裂变是针对运营圈么，群内大佬的案例都是做运营圈的，资料和话术被动引流！想看看和交流学习非运营圈，其它宝妈，家长，女性，或者其它行业案例，爬了几天楼好像是没有，但自己想要的是非运营圈的流量，天天这样资料话术引流运营圈，就不知道有啥目的了，毕竟我不做运营圈的社群和知识付费！希望能有些非运营
你为什么不想努力笑笑奇谈
近期，我一个平时不爱学习的同事，经常看书，她说，当浮躁，沉不下心来的时候，应该去书中找寻那份安静。受她影响，我重温了一遍《复活》。《复活》是俄国作家列夫·托尔斯泰创作的长篇小说，该书取材于一件真实事件，主要描写男主人公聂赫留朵夫引诱姑妈家女仆玛丝洛娃，使她怀孕并被赶出家门。后来，她沦为妓女，因被指控谋财害命而受审判。男主人公以陪审员的身份出庭，见到从前被他引诱的女人，深受良心谴责。他为她奔走伸冤，
MySQL高可用集群SSRK：5步打造无感知故障切换墨瑾轩一起学学数据库【一】mysql adb 数据库
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣大家好！今天我们要聊的是MySQL高可用集群的一种高级形态——SSRK（SuperSimpleandReliableKeepalived）。SSRK集群结合了InnoDBCluster、MySQLRouter和Keepalived，不仅提供了高可用性，还实现了
Linux下SPI驱动：SPI设备驱动简介
一.简介Linux下的SPI驱动框架和I2C很类似，都分为主机控制器驱动和设备驱动，主机控制器也就是SOC的SPI控制器接口，SPI设备驱动也就是所操作的SPI设备的驱动。本文来学习一下Linux下SPI设备驱动。二.Linux下SPI驱动：SPI设备驱动简介1.spi_driver结构体spi设备驱动也和i2c设备驱动也很类似，Linux内核使用spi_driver结构体来表示spi设备驱动，我
“养娃如种树•家长成长营”～能量分享卡片26#0617～坚持Day26 馨元_亲子教育_生活本真
父母好好学习孩子天天向上父母要学会懂孩子俗话说，知己知彼，百战不殆！要想给孩子最好的教育，首先就要了解孩子；然后，才能对症下药，药到而病除。孩子的内心是脆弱的，所以他们渴望被爱，渴望来自家庭的温暖，一旦实现不了就会叛逆，甚至在犯错的道路上越走越远，越陷越深。因此，明智的父母通常都能让孩子感受到自己的爱。父母的信任是对孩子的最好鼓励，孩子很希望得到父母的信任，像朋友一样平等交流。如果父母不能理解这一
彻底解决＂‘vue-cli-service‘ 不是内部或外部命令＂的问题！晷龙烬龙鳞拆解（前端深渊）vue.js 前端 npm
以龙息淬炼代码，在时光灰烬中重铸技术星河欢迎来到晷龙烬的博客✨！这里记录技术学习点滴，分享实用技巧，偶尔聊聊奇思妙想～原创内容✍️，转载请注明出处～感谢支持❤️！请尊重原创！欢迎在评论区交流！引言我最近拉取了一个Vue2的老项目，各种尝试，最终卡在了“vue-cli-service不是内部或外部命令”的这个错误提示上，令人倍感挫败。本文聚焦这一常见难题，提供我解决的思路，以供参考。一、问题分析该错
Javaweb笔记笙鹿鸣 html 前端 html5
HTMLHTML网页常用基础知识网页结构JavaSEC/SClientserver客户端–服务器JavaWebB/SBroswerServer浏览器–服务器网页的组成部分：内容（结构）、表现、行为HTML:HyperTextMarkupLanguage(超文本标记语言)ALT+F2选择浏览器HTML书写规范：表示整个html页面的开始头信息标题标题body是页面的主体内容页面主体内容表示整个htm
日常修炼夏摩山谷深处
修炼一：【工作篇】1.关于和领导交流在分配任务时，要马上搞明白你的任务是啥，不要因不好意思假装听懂了，再去猜领导的意思，万一猜错了，时间浪费了，工作也白做了，还会留下不好的印象。向领导征求意见时，提前准备好你的备选方案，多让领导去做选择题而不是问答题。2.关于工作学习建议主动学习，主动去接受任务，能学多少学多少。把握两个原则“令行禁止”和“法无禁止即可为“。前者的意思是当你被安排了多个任务时，直系
情感主播培训有哪些项目，说说我的经历糖葫芦不甜
作为一名从情感主播培训中走出来的“新人”，我想分享一些我所经历的培训项目以及这段经历如何塑造了我。5星公会，免费加入，一对一指导扶持↓微信在文章底部。培训的第一步，是从理论根基开始。我们系统地学习了情感解析的技巧，包括如何识别不同情绪背后的深层需求、理解人际关系的动态变化等。作为主播，声音是我们最直接的“武器”。培训中，我们接受了专业的声音训练，包括发音技巧、语调控制、情感融入等，旨在通过声音传递
《朗读手册》|持续默读：朗读的最佳拍档吉林付巍巍
暑假阅读计划教育有一条通则是：“人在暑假会变笨”。研究发现，所有人——不论是优等生还是学习差的学生——在暑假的学习速度都较慢。有些人甚至更早居然发生退步。许多原因导致了暑假退步现象。要避免这种事情的发生，就给孩子们朗读并让他们自己阅读。SSR在家中进行也有效在家里家长的角色非常重要。你可以拟定一个适合你们全家的BBS计划。对于不习惯长时间阅读的孩子，一开始可以把时间规定在10分钟或者是15分钟，等
投射与感赏 0324_cb8d
投射儿子今天上课专心，能跟上老师的节奏。投射儿子这次期中考试能达到他的目标。投射儿子对老师和家人有感恩的心，开启学习动力，向目标努力。投射老师看见孩子的进步，给他鼓励，让孩子找到信心找到正能量。投射女儿今天阳光自信，今天测验全对。投射女儿的字写得越来越好。投射今天我有稳稳的情绪，爱自己多一点，让孩子感受到妈妈的爱。感赏儿子周六去跟同学看电影后安时回家，后面的补课很专心，得到老师的表扬。感赏儿子周天
莹莹的感恩日记第211天季如言
❤2022年9月7日星期三❤莹莹感恩日记第211天1.感恩宇宙万物恩赐予我的一切，让我非常幸福的迎接崭新的一天，让我身心健康，精力充沛，思维敏捷，可高效的进行工作，学习和生活，谢谢，谢谢，谢谢。2.感恩我的国家繁荣富强，和平昌盛，让我所在的国家社会稳定，蓬勃发展，欣欣向荣，让我能生活在和平时代，谢谢，谢谢，谢谢。3.感恩今天的我能量满满，我又非常哇塞的输出第211天感恩日记，我太棒了，感恩坚持的自
京东内部优惠券怎么领？京东怎么找内部优惠券？氧惠评测
京东内部优惠券的领取方式多样，以下是一些主要途径和具体步骤：月入十万必看！都在挣钱！推荐几个月入几千到几万的靠谱副业项目！（公众号：善士思维笔记）氧惠APP是与以往完全不同的抖客+淘客app！2024全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（训练营导师每天出单带货几万单）。注册即可享受高补贴+0撸+捡漏等带货新体验。送万元推广大礼包，教你如何1年做到百万团队。金珊
python 抓取小红书小五咔咔咔 python 开发语言
python相关学习资料：https://edu.51cto.com/video/3832.htmlhttps://edu.51cto.com/video/4102.htmlhttps://edu.51cto.com/video/1158.htmlPython抓取小红书数据的科普文章小红书是一个流行的社交电商平台，用户可以分享购物心得、生活点滴等。本文将介绍如何使用Python语言抓取小红书的数据
7月18日本周复盘总结风雨过后见彩虹llc
一、本周完成的打卡任务1.早起打卡7天2.阅读打卡6天3.日更写作打卡7篇4.跑步打卡4次5.朗诵课1次二、本周总结跑步，坚持打卡4次，共跑25公里，本周有很大的进步，成功挑战10公里，用时1小时4分，平均配速6’27”，并且正常工作学习，为自己点赞；早起，坚持得还不错，几乎每天都是5点45起床，继继保持；阅读，本周阅读《掌控习惯》，每天阅读1小时，按计划完成任务，还写了读后感，非常开心；日更写作
利用 Python 爬取小红书热门笔记并进行标签关键词分析程序员威哥最新爬虫实战项目 python 笔记开发语言
一、背景与目标小红书（RED）作为中国最活跃的内容社区之一，拥有大量关于美妆、穿搭、美食、旅游等领域的用户生成内容（UGC）。对于产品、品牌方或研究人员来说，提取热门笔记的标签关键词，可以有效捕捉用户关注点、消费趋势及内容热词。本项目目标：使用Python爬取小红书某个话题下的热门笔记；分析每篇笔记中的标题、正文、标签等字段；利用NLP技术提取高频关键词；对关键词进行可视化与聚类分析。二、技术难点
2023-04-27 花开生两面
投射我儿读书明理，修身做人，每天阳光快乐，情绪平和稳定，越来越会调节自己的情绪和压力。投射我儿对家人、他人、社会都常怀一颗感恩之心，是一个暖心的男子汉。投射我儿对自己未来人生规划清晰，建立学习中短期目标，并为此不断努力。投射我儿生活、学习自律，扎实打好各学科基础，高质量完成各科作业，门门成绩F，大二期末成绩能进入本专业年级前15名，拿到保研资格。投射我儿愿意住在学校和同学们一起学习、生活，并交到一
二下最后一月如何进行复习啸夜雨
现在是六月初，距离咱们期末考试已经不到一个月的时间了。此次微信家长周会，是为了帮助各位家长督促各位学生的学习状况。语文复习方面：语文方面，已经全部学习完毕并且进行了第一轮的复习。这里需要强调的是，三个背诵项目本来就是家庭作业，但是很多我班三十多位学生的家长没有第一时间跟上背诵的进度导致我班只好利用上课的时间来进行检查背诵，严重拖延了我班上课的进度！我班第一批《千字文》《朱子治家格言》背诵只有十一名
Spring Cloud Gateway过滤器精确控制异常返回(实战，控制http返回码和message字段) 程序员欣宸
欢迎访问我的GitHub这里分类和汇总了欣宸的全部原创(含配套源码)：https://github.com/zq2599/blog_demos本篇概览前文《SpringCloudGateway过滤器精确控制异常返回(分析篇)》咱们阅读源码，了解到SpringCloudGateway是如何处理全局异常信息的，学了那么多理论，不免手痒想实战验证学习效果，今天咱们就来写代码，最终目标是改写下图两个红框中
高标准开展干部教育培训为建设高素质干部队伍铸魂赋能 3f8a10c62f8c
近日，全国组织部长会议以电视电话会议形式在京召开，中共中央政治局委员、中组部部长陈希强调，着眼建设堪当民族复兴重任的高素质干部队伍，不断优化干部选育管用工作，坚持德配其位、才配其位选准用好干部。大力发现培养干部，是新时代赋予组织部门的职责和使命，组织部门应紧紧围绕新时代干部管理要求，对干部要“学习与实践”结合，助力干部快速成长，进一步激发干部担当作为，干事创业、创先争优。多举措并举，抓好新时代干部
按时写作|2021-04-17 格莱在创作
旷野上的风和老人.jpg（哈哈，声明一下：所有在发布的图片均为格莱诺本人的摄影作品）按时写作是一种训练方式，是通往作家之路的一种办法。就像是人们常说的那样，要想成为作家，你就要天天写，要想成为画家，你就要天天画。是的，每天都要按时写作，成为习惯，结合不断的输入，水到渠成的那天便是指日可待。按时写作是自己生活的笔记，是用来保存记忆场景、对话，以及为自己的创作埋下种子，还有训练文笔流畅，提升思辨力等等
2023-03-20 王歌
上周在103班上了一节家长开放课《做个百数表》。课堂上，我设置了三个教学环节：1.让学生自主完成百数表里面空缺的数字宝宝。2.小组合作寻找百数表中发现的规律。3.通过习题练习巩固百数表中发现的规律。本节课，我始终只作为课堂的引导者，真正的主体是学生。这种自主创作的模式，学生真正得到了学习机会，同时也培养了学生的小组合作精神。
基于YOLOv8的Web端交互式目标检测系统设计与实现 YOLO实战营 YOLO 前端目标检测人工智能 ui 目标跟踪计算机视觉
1.引言目标检测是计算机视觉领域的一项重要任务，它在安防监控、自动驾驶、医疗影像分析等领域有着广泛的应用。近年来，随着深度学习技术的快速发展，YOLO(YouOnlyLookOnce)系列算法因其出色的速度和精度平衡而备受关注。本文将详细介绍如何基于最新的YOLOv8模型构建一个Web端交互式目标检测系统，包含完整的UI界面设计和数据集处理流程。本系统将实现以下功能：基于YOLOv8的高效目标检测
S早起晨读练习day11 贺笙
#day11#/ʌ/、/æ/第十一天的学习内容关于study的发音今天有学到，昨天确实是习惯造成的错误，有/r/音的是另一个单词sturdy：a、形容词，坚定地；强壮的，健全的；坚固的，耐用的；精力充沛的；b、名词，（羊的）晕倒病；第二个是关于published的尾音是/t/而不是/d/；第三是magazine的重音，以前没有读重音的意识，以后要多加注意；第四，S今天早上关于昨天大家联系问题的纠正
孩子学习写作的好方法-写日记憧憬着的人儿
这是我之前在亲子群中的一次学姐分享，分享孩子写日记的经历以及如何引导的经历。从一开始，我对写日记有自己的定义，简单来说，就是每日天气每日发生每日感受。它可以平淡如水一字带过，可波澜壮阔长篇大论。他是输出，我们的大脑天生懒惰，不喜欢这活。所以开始，我们得让他足够简单可行。大脑先接受再强化再内化成生活的一部分！它的长期效果我就不讲了，大家都特别清晰。打磨一个人的思维，文字的力量是巨大的。最后我再讲讲它
交错并联Buck+LLC变换器的建模与控制优化研究
交错并联Buck+LLC变换器的建模与控制优化研究前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。摘要本文针对宽输入电压范围(200-450V)、多电压输出(12-48V)的高效DC-DC变换系统，提出了一种基于交错并联Buck预调节器和LLC谐振变换器的两级式拓扑结构。中间母线电压设定为200V，系统输出功率为1500W，要求电压和
基于卷积神经网络与小波变换的医学图像超分辨率算法复现神经网络15044 python 算法 cnn 算法人工智能图像处理开发语言神经网络深度学习
基于卷积神经网络与小波变换的医学图像超分辨率算法复现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。1.引言医学图像超分辨率技术在临床诊断和治疗规划中具有重要意义。高分辨率的医学图像能够提供更丰富的细节信息，帮助医生做出更准确的诊断。近年来，深度学习技术在图像超分辨率领域取得了显著进展。本文将复现一种结合卷积神经网络(CNN)、小波变
使用MMDetection中的Mask2Former和X-Decoder训练自定义数据集及结果复现神经网络15044 算法 python 分类矩阵人工智能数据挖掘深度学习
使用MMDetection中的Mask2Former和X-Decoder训练自定义数据集及结果复现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。1.引言1.1研究背景实例分割是计算机视觉领域的重要任务，它要求模型不仅要检测图像中的对象，还要精确地分割出每个对象的像素级掩码。近年来，基于Transformer的模型在实例分割任务上取得
焦点团队网络初级第30期张瑞宾持续分享第139天2022.1.06（周四）张瑞宾
约练挑战（总第6次）次约练，咨询师第3次，来访者1次，观察员2次学习焦点以来，感觉自己越来越稳，和患者沟通方式上已经有了很大的区别，现在很多的是在关注正向和解决，而没有把自己一生的角度放得很高，让他自己当自己的主人，双专家模式。虽说现在自己还不是一个合格的咨询师，但是感觉已经有了很多成长，也有了一些变化。今天做了一次来访者给自己的感觉是现在比以前能打开很多了，放松，安全的氛围，关注人是第1位，即便
深度学习系列-----＞环境搭建（Ubuntu）二师兄用飘柔深度学习历程深度学习 ubuntu 人工智能 pytorch python
1、前言电脑基础系统硬件情况：系统：ubuntu18.04、显卡：GTX1050Ti；后续的环境搭建都在此基础上进行。此次学习选择Pytorch作为深度学习的框架，选择的原因主要由于PyTorch在研究领域特别受欢迎，较多的论文框架也是基于其开发。2、anaconda+python3安装测试在学习深度学习的过程中会涉及到使用不同版本python包的问题，而anaconda可以便捷获取包且对包能够进
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>