Vicky_Tang

大数据——Flink 知识点整理

1. Flink 的特点

2. Flink 和 SparkStreaming 的对比

3. Flink 和 Blink、Alink之间的关系

4. JobManager 和 TaskManager 的职责

5. Flink 集群部署有哪些模式

6. Flink Dataflow 介绍

7. Parallelism 和 Slot 的理解

8. Flink 执行图

9. DatastreamAPI 常见的Transform 算子

10. Flink 中窗口类型

11. Flink 中窗口函数的分类

12. Flink 中 window的功能

13. 谈谈对 Flink 中时间语义的理解

14. 谈谈对 Flink 中 Watermark 的理解

15. 谈谈对 Flink 状态编程的理解

16. 谈谈 Flink 中是如何实现对状态（state）的存储、访问及维护的（状态后端——state backend）

17. Flink 检查点算法

18. Flink 的重启策略

19. Flink 中 TableAPI 和 FlinkSQL 的基本使用，1.9 版本以后引入了 Blink Planner

20. 谈谈对于 Flink 中广播状态（broadcast State）的理解

21. Flink 中如何保证端到端的状态一致性

22. 两阶段提交对 Sink 系统的要求

23. Flink 的监控主要看哪些指标（Mertics）

24. Flink 中如何实现反压

25. Flink 的优化

26. Flink 中 CEP 的应用

1. Flink 的特点

Flink 具有高吞吐、低延时、高性能的特点
支持基于时间语义、窗口及状态编程
同时还具备了 checkpoint 和 savepoint 的功能

2. Flink 和 SparkStreaming 的对比

Flink支持实时流处理，而 SparkStreaming 是通过微批处理的方式来实现实时处理，牺牲了吞吐量
Flink 支持状态编程，而 SparkStreaming 不支持
Flink：JobManager、TaskManager SparkStreaming：master、worker

3. Flink 和 Blink、Alink之间的关系

Blink 是Flink的一个分支版本，由阿里团队开发，在Flink 1.9版本之后，融入了Blink Table API 的Blink Planner
Alink 是基于 Flink 的通用算法平台，也是由阿里团队开发，更多的是用于机器学习和人工智能。

4. JobManager 和 TaskManager 的职责

JobManager

协调 Flink 应用程序的分布式执行。它决定何时调度下一个 task（或一组 task）、对完成的 task 或执行失败做出反应、协调 checkpoint、并且协调从失败中恢复等等。这个进程由三个不同的组件组成：

ResourceManager：负责 Flink 集群中的资源提供、回收、分配。它管理 task
slots，这是 Flink 集群中资源调度的单位。Flink 为不同的环境和资源提供者（例如
YARN、Kubernetes 和 standalone 部署）实现了对应的 ResourceManager。
Dispatcher：提供了一个 REST 接口，用来提交 Flink 应用程序执行，并为每个提交的作业启动一个新的 JobMaster。它还运行 Flink WebUI 用来提供作业执行信息。
JobMaster：负责管理单个JobGraph的执行。Flink 集群中可以同时运行多个作业，每个作业都有自己的 JobMaster。

TaskManager

执行作业流的 task，并且缓存和交换数据流。在 TaskManager 中资源调度的最小单位是 task slot。TaskManager 中 task slot 的数量表示并发处理 task 的数量。

对于分布式执行，Flink 将算子的 subtasks 链接成 tasks。每个 task 由一个线程执行。将算子链接成 task 是个有用的优化：它减少线程间切换、缓冲的开销，并且减少延迟的同时增加整体吞吐量。

每个 task slot 代表 TaskManager 中资源的固定子集。例如，具有 3 个 slot 的 TaskManager，会将其托管内存 1/3 用于每个 slot。分配资源意味着 subtask 不会与其他作业的 subtask 竞争托管内存，而是具有一定数量的保留托管内存。注意此处没有 CPU 隔离；当前 slot 仅分离 task 的托管内存。

通过调整 task slot 的数量，用户可以定义 subtask 如何互相隔离。每个 TaskManager 有一个 slot，这意味着每个 task 组都在单独的 JVM 中运行。具有多个 slot 意味着更多 subtask 共享同一 JVM。同一 JVM 中的 task 共享 TCP 连接（通过多路复用）和心跳信息。它们还可以共享数据集和数据结构，从而减少了每个 task 的开销。

5. Flink 集群部署有哪些模式

StandAlone、StandAlone HA、Flink on Yarn（Yarn Session、Pre-Job）

6. Flink Dataflow 介绍

Dataflow：Flink 程序在执行的时候会被映射成一个数据流模型

Operator：数据模型中每一个操作被称为 Operator，Operator 可以被分为 Source、Transform、Sink

Operator Chain：客户端在提交任务的时候会对 Operator 进行优化，如果 Operator 在数据传递过程中保持数据的分区数和数据的排序不变，则会将 Operator 进行合并，合并后被称为 Operator Chain，实际上就是一个执行链，每个执行链会在 TaskManager 上的一个独立的线程中执行，即 SubTask

Partition：数据流模型是分布式的和并行的，执行中会形成1~n个分区

SubTask：多个分区任务可以并行，每一个都是独立运行在一个线程中，也就是一个 Subtask 子任务

Parallelism：并行度，就是可一个同时真正执行的子任务数/分区数

7. Parallelism 和 Slot 的理解

Slot 是静态的概念，是指 TaskManager 具有的并发执行能力

Parallelism 是动态的概念，是指程序运行时实际使用的并发能力

设置合适的 Parallelism 能提高运算效率，太多和太少都不行，正常情况下 Parallelism <= Slot

设置Parallelism有多种方式，优先级为 API > env > p > file

8. Flink 执行图

Flink 中执行图可以分为4层：StreamGraph -> JobGraph -> ExecutionGraph -> 物理执行图

StreamGraph：根据用户通过 Stream API 编写的代码生成的最初的图，表示程序的拓扑结构

JobGraph：StreamGraph 经过优化后生成了 JobGraph 提交给 JobManager 的数据结构。主要优化是将多个符合条件的节点 chain 在一起作为一个节点（Operator Chain），这样可以减少数据在节点之间流动所需要的序列化/反序列化/传输消耗

ExecutionGraph：JobManager 根据 JobGraph 生成 ExecutionGraph，是 JobGraph的并行化版本，是调度层最核心的数据结构

物理执行图：JobManager 根据 ExecutionGraph 对 Job 进行调度后，在各个 TaskManager 上部署 Task 后形成的“图”，并不是一个具体的数据结构

9. Flink 代码实现步骤（以 wordcount 为例）

//1. 创建环境（Execution Environment）
val env = SteamExecutionEnvironment.getExecutionEnvironment

//2. 加载数据源（Source）
val dataStream = env.readTextFile("D:\\study\\wordcount\\input")

//3. 数据转换（Transform）
val result = dataStream.flatMap(_.split(" ")).map((_,1)).keyBy(0).sum(1)

//4. 结果输出（Sink）
result.print()

//5. 执行程序(Execute)
env.execute()

10. DatastreamAPI 常见的Transform 算子

单流：

Map
FlatMap
Filter
KeyBy
Reduce
Aggregations
max/maxBy min/minBy

多流：

union
connect
join
coMap/coFlatMap
process

11. Flink 中窗口类型

针对上游数据是keyedStream还是非keyedStream可以分为Keyed Windows 和 Non-Keyed Windows

基于数量的 CountWindow

//滚动窗口
//指的是同一个 key 的数据达到5个才执行，不是总共的数据达到5
streamKeyBy.countWindow(5)

//滑动窗口
//指定步长为2，当单个 key 满足2个时就执行一次，但是计算的窗口是大小为5的值，而这里的窗口大小指的也是同一个 key 达到5条
streamKeyBy.countWindow(5,2)

基于时间的 TimeWindow

//滚动窗口
//每5秒一个窗口
streamKeyBy.window(TumblingProcessingTimeWindows.of(Time.seconds(5)))

//滑动窗口
//每10秒一个窗口，5秒的滑动，5秒执行一次，计算的是10秒的数据
streamKeyBy.window(SlidingProcessingTimeWindows.of(Time.seconds(10),Time.seconds(5)))

//会话窗口
//会话窗口在时间窗口中使用，如果窗口中没数据的话就不触发执行
streamKeyBy.window(ProcessingTimeSessionWindows.withGap(Time.seconds(5)))

12. Flink 中窗口函数的分类

增量聚合函数：

每条数据到来就进行计算，保持一个简单的状态。场景：求和

ReduceFunction（reduce）、AggregateFunction（aggregate）

全窗口函数：

先把窗口所有数据收集起来，等计算的时候遍历所有数据。场景：窗口内排序

相比于增量聚合函数，全窗口函数能够取到更多的上下文信息，例如窗口信息，状态的信息

ProcessWindowFunction（process）、WindowFunction（apply）

案例

13. Flink 中 window的功能

reduce、aggregate：对窗口内的数据进行聚合计算
process、apply：可以获得窗口内的上下文信息，如窗口信息和状态信息
assigner：分配器，将数据流中的元素分配到对应的窗口
trigger：触发器，定义 window 什么时候触发计算
evictor：剔除器，定义移除某些数据的逻辑
allowedLateness：允许处理迟到的数据
sideOutputLateData：将迟到的数据放入侧输出流
getSideOutput：获取侧输出流

14. 谈谈对 Flink 中时间语义的理解

三种时间概念：事件时间、接入时间、处理时间

事件时间：EventTime，数据产生的时间
接入时间：IngestionTime，数据进入 Flink 的时间
处理时间：ProcessTime，数据被算子处理的时间

关于窗口起始时间的计算值

左闭右开

timestamp-(timestamp-offset+windowSize)%windowSize

15. 谈谈对 Flink 中 Watermark 的理解

为什么引入 Watermark

由于网络或者系统等外部因素的影响，数据被传输到 Flink 的时间往往不是按照事件产生的顺序传输过来的，因而会造成乱序或者延迟等问题。在此情况下，引入了 Watermark 机制，用于衡量数据到达的进度和完整性

Watermark 的计算

Flink 将最新读取数据的最大的 EventTime 减去固定的时间间隔作为 Watermark。固定的时间间隔其实就是指最大延迟时间。如果有一条数据的 Watermark 大于了某个窗口的 EndTime，就会默认该窗口内的数据已经全部到达并触发执行

package org.example.window
import java.time.Duration

import org.apache.flink.api.common.eventtime.{SerializableTimestampAssigner, WatermarkStrategy}
import org.apache.flink.streaming.api.scala._
import org.apache.flink.streaming.api.windowing.assigners.{EventTimeSessionWindows, SlidingEventTimeWindows, TumblingEventTimeWindows}
import org.apache.flink.streaming.api.windowing.time.Time
import org.example.bean.TrainAlarm

 //设定eventTime 和 watertime 处理乱序时间
 
object AssignEventTimeAndWm {
  def main(args: Array[String]): Unit = {
    val env = StreamExecutionEnvironment.getExecutionEnvironment
    env.setParallelism(1)
    val inputStream= env.socketTextStream("master", 666)
      .map(line => {
        val ps = line.split(",")
        TrainAlarm(ps(0), ps(1).toLong, ps(2).toDouble)
      })
      .assignTimestampsAndWatermarks(
      //Duration 设置延迟时长 watermark = 当前已经到达的最大eventTime - 延时时长
      //只要比watermark小的窗口就可以触发
      WatermarkStrategy.forBoundedOutOfOrderness(Duration.ofSeconds(5))
        .withTimestampAssigner(new SerializableTimestampAssigner[TrainAlarm] {
          //设置eventTime是哪个字段
          override def extractTimestamp(element: TrainAlarm, l: Long): Long = {
            element.ts*1000L
          }
        })
    )

    inputStream.keyBy(_.id)
      .window(TumblingEventTimeWindows.of(Time.seconds(5)))
      .max("temp")
      .print()

     env.execute()
  }
}

案例

16. 谈谈对 Flink 状态编程的理解

状态：可以理解为是数据流在计算处理的中间结果，一般接个富函数或者 ProcessFunction 获取状态

Flink 会进行状态管理，包括状态一致性、故障处理以及高效存储和访问，以便开发人员可以专注于应用程序的逻辑
在 Flink 中，状态由每一个 Task 维护，状态始终与特定的算子相关联
状态的类型
- 算子状态：算子状态的作用范围限定为算子任务
  - 列表状态（List state）
  - 联合列表状态（Union list state）
  - 广播状态（Broadcast state）
- 键控状态：根据输入数据流中定义的键（key）来维护和访问。不同的 key 维护自己的状态，并且不同 key 的状态不同
  - 值状态（Value state）：将状态表示为单个值
  - 列表状态（List state）：将状态表示为一组数据的列表
  - 映射状态（Map state）：将状态表示为一组Key-Value对
  - 聚合状态（Reducing state&Aggregate state）：将状态表示为一个用于聚合的操作。将一个新到的值直接带入进去做聚合操作


package org.example.state

import org.apache.flink.api.common.state.ValueStateDescriptor
import org.apache.flink.streaming.api.functions.KeyedProcessFunction
import org.apache.flink.streaming.api.scala._
import org.apache.flink.util.Collector
import org.example.bean.TrainAlarm

/**
 * 10 s 内温度连续上升就报警
 * 定义三个状态：温度状态、时间状态、个数状态
 * 如果是第一条数据，更新温度状态值、注册10s后触发的定时器并更行时间状态，个数状态设置为1
 * 如果不是第一条数据，
 *    如果温度比温度状态的值大，更新温度状态值，个数状态设置 +1
 *    如果温度比温度状态的值小，删除定时器（从时间状态中取时间）个数状态设置为1，重新注册定时器，更新温度状态值
 */
object TrainTempAlarmWithState2 {
  def main(args: Array[String]): Unit = {
    val env = StreamExecutionEnvironment.getExecutionEnvironment
    env.setParallelism(1)

    val rst = env.socketTextStream("master", 666)
      .map(line => {
        val ps = line.split(",")
        TrainAlarm(ps(0), ps(1).toLong, ps(2).toDouble)
      }).assignAscendingTimestamps(_.ts*1000L)
      .keyBy(_.id)
      .process(new TempRiseWithTime())
      .print()
    env.execute()
  }
}
class TempRiseWithTime extends KeyedProcessFunction[String,TrainAlarm,String]{
  //定义三个状态：温度状态、时间状态、个数状态
  lazy val tempState = getRuntimeContext.getState[Double](new ValueStateDescriptor[Double]("tempstate",classOf[Double]))
  lazy val timeState = getRuntimeContext.getState[Long](new ValueStateDescriptor[Long]("timestate",classOf[Long]))
  lazy val countState = getRuntimeContext.getState[Int](new ValueStateDescriptor[Int]("countstate",classOf[Int]))
  override def processElement(value: TrainAlarm, ctx: KeyedProcessFunction[String, TrainAlarm, String]#Context, out: Collector[String]): Unit = {
    if (tempState.value()==0 || timeState.value() ==0){
      tempState.update(value.temp)
      ctx.timerService().registerEventTimeTimer(value.ts*1000L+10000L)
      timeState.update(value.ts*1000L+10000L)
      countState.update(1)
    }else{
      if (value.temp>= tempState.value()){
        tempState.update(value.temp)
        countState.update(countState.value()+1)
      }else{
        ctx.timerService().deleteEventTimeTimer(timeState.value())
        countState.update(1)
        ctx.timerService().registerEventTimeTimer(value.ts*1000L+10000L)
        timeState.update(value.ts*1000L+10000L)
        tempState.update(value.temp)
      }
    }
  }

  override def onTimer(timestamp: Long, ctx: KeyedProcessFunction[String, TrainAlarm, String]#OnTimerContext, out: Collector[String]): Unit = {
    if(countState.value()>=2){
      out.collect(ctx.getCurrentKey + " is alarming")
      tempState.clear()
      timeState.clear()
      countState.clear()
    }
  }
}

17. 谈谈 Flink 中是如何实现对状态（state）的存储、访问及维护的（状态后端——state backend）

状态后端主要负责的两件事：

本地状态的管理
将检查点（checkpoint）状态写入远程存储

Flink 提供的三种状态后端：

MemoryStateBackend：存储在TaskManager内存中，速度快，已丢失------生产环境基本不用
FsStateBackend：将checkpoint存储到持久化文件系统（FileSystem），而对于本地状态，也会存到TaskManager内存中，还是会受内存溢出（OOM）影响
RockDBstateBackend：将所有状态序列化后，存入到本地的RockDB中，而RockDB是基于KV的，可以看作是一个本地数据库（实际使用内存+磁盘）。checkpoint存到持久化文件系统（FileSystem）上。

另外，如果设置的是 RockDBStateBackend，需要先引入依赖

 
    org.apache.flink 
    flink-statebackend-rocksdb_2.12 
    ${flink.version}

18. Flink 检查点算法

一般检查点实现方式：暂停应用，保存检查点，再重新恢复应用

Flink 实现了基于 Chandy-Lamport 算法的分布式快照。将检查点的保存和数据处理分离开，不暂停整个应用

具体实现方式：

Flink 会在输入数据集上间隔性的生成 Checkpoint barrier，通过栅栏（barrier）将间隔时间段内的数据划分到对应的 checkpoint 中

对于 barrier 已经到达的分区，继续到达的数据会被缓冲，暂时不会被处理

19. Flink 的重启策略

作用：可以控制在发生故障是如何重新启动作业

如果未启用检查点，则使用“无重启”策略，如果激活了检查点并且尚未配置重启策略，会采用“固定延迟”策略Integer.MAX_VALUE尝试重启

重启策略分为4种：固定延迟重启策略、故障率重启策略、无重启策略、后备重启策略

固定延迟重启策略：

尝试给定重启作业的次数，如果超过最大尝试次数则作业失败，两次连续重启尝试之间，会有一个固定的延迟等待时间

通过在 flink-conf.yaml 中配置参数：

# fixed-delay:固定延迟策略
restart-strategy: fixed-delay

# 尝试5次，默认Integer.MAX_VALUE
restart-strategy.fixed-delay.attempts: 5

# 设置延迟时间10s，默认为 akka.ask.timeout时间
restart-strategy.fixed-delay.delay: 10s

通过代码中修改：

val env = StreamExecutionEnvironment.getExecutionEnvironment

//设置最大尝试次数为5，重启间隔为10秒
env.setRestartStrategy(RestartStrategies.fixedDelayRestart(5,Time.seconds,10))

故障率重启策略：

在故障后重新作业，当设置的故障率（failure rate）超过每个时间间隔的故障是，作业最终失败。在两次连续尝试之间，策略延迟等待一段时间

在 flink-conf.yaml 中配置参数：

# 设置重启策略为failure-rate
restart-strategy: failure-rate

# 失败作业之前的给定时间间隔内的最大重启次数，默认1
restart-strategy.failure-rate.max-failures-per-interval: 3

# 测量故障率的时间间隔。默认1min
restart-strategy.failure-rate.failure-rate-interval: 5min

# 两次连续重启尝试之间的延迟，默认akka.ask.timeout时间
restart-strategy.failure-rate.delay: 10s

在代码中设置：

val env = StreamExecutionEnvironment.getExecutionEnvironment();

// 3为最大失败次数；5min为测量的故障时间；10s为2次间的延迟时间
env.setRestartStrategy(RestartStrategies.failureRateRestart(3,Time.minutes(5),Time.seconds(10)));

无重启策略：

作业直接失败，不尝试重启

在 flink-conf.yaml 中配置：

restart-strategy: none

在代码中设置：

val env = StreamExecutionEnvironment.getExecutionEnvironment();
env.setRestartStrategy(RestartStrategies.noRestart());

后备重启策略：

使用集群定义的重新启动策略。这对于启用检查点的流式传输程序很有帮助。

20. Flink 中 TableAPI 和 FlinkSQL 的基本使用，1.9 版本以后引入了 Blink Planner

使用 TableAPI 和 FlinkSQL需要导入的依赖

 
	org.apache.flink 
	flink-table-api-scala-bridge_2.12 
	${flink.version} 
 
 
	org.apache.flink 
	flink-table-planner-blink_2.12 
	${flink.version} 
 
 
	org.apache.flink 
	flink-table-common 
	${flink.version} 
 
 
	org.apache.flink 
	flink-csv 
	${flink.version} 

	  
	 org.apache.flink
	 flink-json 
	 ${flink.version}

程序结构

创建表环境

	val bsEnv = StreamExecutionEnvironment.getExecutionEnvironment
    bsEnv.setParallelism(1)
    //推荐使用BlinkPlanner
    val bsSettings = EnvironmentSettings.newInstance().useBlinkPlanner().inStreamingMode().build()
    val bsTableEnv = StreamTableEnvironment.create(bsEnv, bsSettings)

连接外部数据源，创建输入表

tableEnv.executeSql("CREATE TEMPORARY TABLE table1 ... WITH ( 'connector' = ... )")

连接外部数据输出，创建输出表

tableEnv.executeSql("CREATE TEMPORARY TABLE outputTable ... WITH ( 'connector' = ... )")

TableAPI实现查询操作

 val table2 = tableEnv.from("table1").select(...)

FlinkSQL实现查询操作

val table3 = tableEnv.sqlQuery("SELECT ... FROM table1 ...")

将查询结果放入输出表中

val tableResult = table2.executeInsert("outputTable") tableResult...

TableAPI 和 FlinkSQL 的使用，官网给出的案例非常详细，在写代码时可以借鉴：Apache Flink Documentation | Apache Flink

21. 谈谈对于 Flink 中广播状态（broadcast State）的理解

简单理解：一个地吞吐量流包含了一组规则，我们向对来自另一个留的所有元素基于及规则进行评估计算。

场景：动态更新计算规则、大小表关联

与其他操作符状态的区别：

（1）它有一个map格式，用于定义存储结构

（2）它仅对具有广播流和非广播流输入的特定操作符可用

（3）这样的操作符可以具有不同名称的多个广播状态

操作流程

22. Flink 中如何保证端到端的状态一致性

什么是状态一致性：

有状态的流处理，每个算子任务都可以有自己的状态。所谓的状态一致性，其实就是我们所说的计算结果要保证准确。一条数据不应该被丢失，也不应该被重复计算。在遇到故障时可以恢复状态，恢复以后得重新计算，结果应该也是完全正确的。

状态一致性分类：

At-Most-Once（最多一次）：

当任务故障时，最简单的做法就是什么都不干，既不恢复丢失的数据，也不重复数据。最多处理一次事件。数据可能会丢失。但是处理的速度快。

At-Least-Once（至少一次）：

在大多数的真实应用场景，我们不希望数据丢失。所有的事件都会被处理，而且可以被多次处理。

Exactly-Once（精确一次）：★★★★★

恰好保证每个事件只被处理了一次，既没有数据丢失，也没有数据重复处理的情况出现

端到端的 Exactly-Once：★★★★★

内部保证：checkpoint
Source 端：可重置数据的读取位置，比如 kafka 的偏移量可以手动维护，提交。
Sink 端：从故障恢复时，数据不会重复写入外部系统。（幂等写入、事务写入）

注：
幂等写入：就是说一个操作，可以重复执行很多次，但只导致一次结果更改，后面再重复执行就不起作用了。
事务写入：原子性，一个事务中的一系列操作，要么全部成功，要么一个不做。
实现的思想，构建的事务对应着 checkpoint，等到 checkpoint 真正完成的时候，才把所有对应的结果写入 Sink 系统中。实现方式，预写日志（GenericWriteAheadSink）和两阶段提交（TwoPhaseCommitSinkFunction）。
案例：
Flink 与 Kafka 端到端的 Exactly-Once：

Flink 内部：利用 checkpoint 机制，把状态存盘，发生故障时可以恢复，保证内部的状态一致性。
Source：KafkaConsumer 作为 Source，可以将偏移量作为状态保存下来，如果后续任务发现了故障，恢复的时候可以由连接器重置偏移量，重新消费数据，保证一致性。
Sink ： KafkaProducer 作为 Sink ，采用两阶段提交 Sink ，需要实现TwoPhaseCommitSinkFunction。

package cn.jixiang.checkpoint

import java.lang
import java.util.{Properties, Random}

import org.apache.flink.api.common.RuntimeExecutionMode
import org.apache.flink.api.common.restartstrategy.RestartStrategies
import org.apache.flink.api.common.serialization.SimpleStringSchema
import org.apache.flink.api.common.time.Time
import org.apache.flink.runtime.state.hashmap.HashMapStateBackend
import org.apache.flink.streaming.api._
import org.apache.flink.streaming.api.environment.CheckpointConfig.ExternalizedCheckpointCleanup
import org.apache.flink.streaming.api.scala._
import org.apache.flink.streaming.connectors.kafka.FlinkKafkaProducer.Semantic
import org.apache.flink.streaming.connectors.kafka.{FlinkKafkaConsumer, FlinkKafkaProducer, KafkaSerializationSchema}
import org.apache.kafka.clients.consumer.ConsumerConfig
import org.apache.kafka.clients.producer.ProducerRecord

/***
  * 从Kafka读取数据，实现WC，写回到Kafka。
  * 实现端到端的状态一致性保证。
  */
object End2EndExactlyOnce {
  def main(args: Array[String]): Unit = {
    val env = StreamExecutionEnvironment.getExecutionEnvironment
    env.setParallelism(1)
    env.setRuntimeMode(RuntimeExecutionMode.AUTOMATIC)

    // 设置checkpoint
    val hashMapStateBackend = new HashMapStateBackend()
    env.setStateBackend(new HashMapStateBackend())
    env.getCheckpointConfig.setCheckpointStorage("file:///D:\\Note\\Projects\\02\\Flink\\cha01\\ckp")
    env.enableCheckpointing(1000,CheckpointingMode.EXACTLY_ONCE)
    env.getCheckpointConfig.setMinPauseBetweenCheckpoints(500)
    env.getCheckpointConfig.setCheckpointTimeout(60000)
    env.getCheckpointConfig.setTolerableCheckpointFailureNumber(10)
    env.getCheckpointConfig.enableExternalizedCheckpoints(ExternalizedCheckpointCleanup.RETAIN_ON_CANCELLATION)
    env.setRestartStrategy(RestartStrategies.fixedDelayRestart(3,Time.milliseconds(600)))

    // 从Kafka读取数据
    val props1 = new Properties()
    props1.setProperty(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG, "master:9092")
    props1.setProperty(ConsumerConfig.GROUP_ID_CONFIG, "group-1")
    props1.setProperty(ConsumerConfig.AUTO_COMMIT_INTERVAL_MS_CONFIG, "2000")
    props1.setProperty(ConsumerConfig.ENABLE_AUTO_COMMIT_CONFIG, "true")
    props1.setProperty(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, "latest")

    val kafkaSource = new FlinkKafkaConsumer[String]("test1",new SimpleStringSchema(),props1)
    //提交offset到kafka
    kafkaSource.setCommitOffsetsOnCheckpoints(true)
    val inputData: DataStream[String] = env.addSource(kafkaSource)

    // transformation转换
    val result = inputData
      .flatMap(_.split(" "))
      .map(t => {
        val random = new Random()
        val num = random.nextInt(5)
        if (num == 2){
          println(num)
          throw new Exception("哎呀呀，是异常呀")
        }
        (t,1)
      })
      .keyBy(_._1)
      .sum(1)
      .map(t => t._1 + ":" + t._2)

    // 往Kafka写入数据
    val props2 = new Properties()
    props2.setProperty("bootstrap.servers", "master:9092")
    // 默认情况下，Kafka broker 将 transaction.max.timeout.ms 设置为 15 分钟。
    // 此属性不允许为大于其值的 producer 设置事务超时时间。
    // 默认情况下，FlinkKafkaProducer 将 producer config 中的 transaction.timeout.ms 属性设置为 1 小时
    // 因此在使用 Semantic.EXACTLY_ONCE 模式之前应该增加 transaction.max.timeout.ms 的值。
    props2.setProperty("transaction.timeout.ms",1000*60*5+"")

    val myProducer = new FlinkKafkaProducer[String]("test2",
      new KafkaSerializationSchema[String]() {
        override def serialize(element: String, timestamp: lang.Long): ProducerRecord[Array[Byte], Array[Byte]] = {
          new ProducerRecord[Array[Byte], Array[Byte]]("test2",element.getBytes,element.getBytes("utf-8"))
        }
      },
      props2,
      Semantic.EXACTLY_ONCE
    )

    result.print()
    result.addSink(myProducer)

    env.execute("Flink + Kafka")
  }
}

23. 两阶段提交对 Sink 系统的要求

外部系统必须提供事务支持。Kafka、Mysql

原因：

在 checkpoint 隔离期间，必须开启事务并接收数据写入。

在收到 checkpoint 完成的通知之前，事务必须是“等待提交状态”，如果在此状态下 sink 系统关闭了事务（例如超时），则未提交的数据就会丢失

Sink 任务必须能够在进程失败后恢复事务（利用了事务的持久性中的 rollback 机制）

提交事务必须是幂等操作（事务的一致性）

24. Flink 的监控主要看哪些指标（Mertics）

Counter：对流处理的数据进行累加计数
Guage：可以反映一个值，比如查看内存使用情况
Meter：值统计吞吐量和时间单位内发生“事件”的次数。计算方式：事件次数除以使用的时间
Histogram：用于统计一些数据的分布，如Quantile、Mean、StdDev、Max、Min等

25. Flink 中如何实现反压

什么是反压：

消息处理速度 < 消息的发送速度，消息拥堵，系统运行不畅，通过Consumer 给 Producer 一个反馈，告知所能接受数据的大小，从而使 Producer 减少发送数据的频率

反压的影响：

checkpoint 的时长：checkpoint barrier 跟随普通数据流动，如果数据处理被阻塞，使得 checkpoint barrier 流经整个数据管道的时长变长，导致 checkpoint 总体时间变长
state 大小：为保证 Exactly-Once 准确一次，对于有两个以上输入管道的 Operator，checkpoint barrier 需要对齐，即接受到较快的输入管道的 barrier 后，它后面数据会被缓存起来但不处理，直到较慢的输入管道的 barrier 也到达。这些被缓存的数据会被放到 state 里面，导致 checkpoint 变大。

反压机制：

Flink1.5 之前是基于 TCP 的反压机制

弊端：
- 单个 Task 导致的反压，会阻断整个 TM-TM 的 socket，连checkpoint barrier 也无法发出
- 反压传播路径太长，导致生效延迟较大

Flink1.5 之后采用 Credit-base 反压机制

数据写入端将数据写入到buffer中。
判断当前的credit值是否大于0。
如果credit > 0，则将数据写出，并更新credit值。数据写出的时候会在msg上带上当前生成端的数据量backlog。
如果credit <= 0，则不写

26. Flink 的优化

内存管理、数据去重（使用布隆过滤器）、数据倾斜、checkpoint优化、代码重用

参考《大数据—— Flink 的优化》

27. Flink 中 CEP 的应用

什么是CEP：复杂事件处理（Complex Event Processing）

实现方式：将数据流通过一定的规则匹配（模式），然后输出用户想得到的数据

使用场景：

风控检测：对用户异常行为模式、数据异常流向实时检测
策略营销：向特定行为的用户进行湿湿的精准营销
运维监控：监控设备运行参数，灵活配置多指标的发生规则

往期面试题整理：

《大数据——Java 知识点整理》

《大数据——MySQL 知识点整理》

《大数据—— Hadoop 知识点整理》

《大数据—— Hive 知识点整理》

《大数据—— HBase 知识点整理》

《大数据—— Scala 知识点整理》

《大数据—— Spark Core 知识点整理》

你可能感兴趣的:(Flink,flink,面试,big,data,大数据)

Java开发-面试题-0014-@Component, @Controller, @Repository,@Mapper,@Service有何区别 CodeZeng1998 面试题 java 开发语言 spring boot
更多内容欢迎关注我（持续更新中，欢迎Star✨）Github：CodeZeng1998/Java-Developer-Work-Note技术公众号：CodeZeng1998（纯纯技术文）生活公众号：好锅（Lifeismorethancode）其他平台：CodeZeng1998、好锅@Component,@Controller,@Repository,@Mapper,@Service有何区别：@Co
Spring Data JDBC 详解 m0_74823933 面试学习路线阿里巴巴 spring java 数据库
目录一、JPA背景?二、SpringBoot整合SpringdataJDBC??1.配置数据源?2.配置Druid的admin后台??3.Spring-data-jdbc常用接口查询策略1)?CrudRepository增删改查2)PagingAndSortingRepository分页排序一、JPA背景早期的JPA的特性是懒加载和关联查询，一下能查出所有的关联信息，但我们开发者在查询SQL的时候
融合网络实训室初步建设方案设想武汉唯众智创网络融合网络实训室融合网络融合网络实验室网络融合实训室网络融合实验室
一、引言在数字化浪潮席卷全球的当下，网络技术已然成为推动社会发展和经济增长的关键力量。从日常的生活购物到企业的运营管理，从便捷的社交沟通到前沿的科研探索，网络技术无处不在，深刻地改变着人们的生活与工作方式。随着5G、物联网、云计算、大数据等新兴技术的迅猛发展，网络技术领域对于专业人才的需求呈现出爆发式增长。据权威机构预测，未来几年，网络技术相关岗位的人才缺口将持续扩大。这些岗位不仅要求从业者具备扎
mysql迁移docker_docker迁入迁出mysql 困困斐 mysql迁移docker
docker迁出mysql数据库测试环境：docker服务器mysql服务器IP192.168.163.19192.168.163.16操作系统CentOS7.8CentOS7.8docker版本Docker18.09.9/数据库版本MySQL8.0.22MySQL8.0.221.查看docker相关情况[root@docker-test/data/mysql/data]$dockerps启动my
软件测试工程师面试题（含答案）美团程序员自动化测试软件测试软件测试面试软件测试软件测试面试面试职场和发展
面试题列表1、自我介绍，涉及工作经历答：基本信息+擅长测试方向+个人突出亮点+以往工作经历等等。2、在公司中测试的流程是什么答：测试流程：需求评审>测试计划>测试计划>测试方案>编写用例>执行用例>回归测试>提交缺陷报告>提交测试报告3、举例一个项目，在项目中做了什么答：可以聊聊做了性能、自动化、工具开发，测试平台开发、功能等自己擅长的地方。4、如何提升测试效率，如何保障测试质量答：测试人员应该从
云原生：K8s（Kubernetes）高频典型面试题汇总老舅的火箭爱扫地云原生 kubernetes 容器
1.简述etcd及其特点？答：etcd是CoreOS团队发起的开源项目，是一个管理配置信息和服务发现（servicediscovery）的项目，它的目标是构建一个高可用的分布式键值（key-value）数据库，基于Go语言实现。特点：l简单：支持REST风格的HTTP+JSONAPIl安全：支持HTTPS方式的访问l快速：支持并发1k/s的写操作l可靠：支持分布式结构，基于Raft的一致性算法，R
软件测试面试题 bobob_ Testing
您所熟悉的测试用例设计方法都有哪些？请分别以具体的例子来说明这些方法在测试用例设计工作中的应用。答：有黑盒和白盒两种测试种类，黑盒有等价类划分法，边界分析法，因果图法和错误猜测法。白盒有逻辑覆盖法，循环测试路径选择，基本路径测试。例子：在一次输入多个条件的完整性查询中。利用等价类划分法则和边界分析法则，首先利用等价划分法，可以一个或多个结果是OK的测试用例，然后确认多个NG的测试用例，然后利用边界
鸿蒙开发2024【面试题库】讲解，近期需要面试的可千万别错过！鸿蒙系统小能手Mr.Li 鸿蒙开发 harmonyos 面试鸿蒙 OpenHarmony 鸿蒙系统程序员移动开发
1.请简述鸿蒙OS与AndroidOS的主要区别是什么？设备兼容性：鸿蒙OS是一款面向各种设备的分布式操作系统，支持手机、平板电脑、智能手表、智能家居、汽车等多种设备类型，并能在这些设备之间实现无缝切换和共享数据。而Android系统则主要用于移动设备，如手机和平板电脑。系统架构：鸿蒙OS采用分布式技术架构，通过分布式技术实现多设备间的协作和数据共享，更加灵活、安全、高效。而Android则采用单
【面经】2025年软件测试面试题，精选100 道（附答案）测试界的路飞软件测试面试面试软件测试职场和发展软件测试面试
测试技术面试题1、我现在有个程序，发现在Windows上运行得很慢，怎么判别是程序存在问题还是软硬件系统存在问题？2、什么是兼容性测试？兼容性测试侧重哪些方面？3、测试的策略有哪些？4、正交表测试用例设计方法的特点是什么？5、描述使用bugzilla缺陷管理工具对软件缺陷（BUG）跟踪的管理的流程？6、描述测试用例设计的完整过程？7、你觉得bugzilla在使用的过程中，有什么问题？8、单元测试的
数据库核心技术面试题深度剖析：主从同步、二级索引与Change Buffer 后端数据库mysql
在数据库相关岗位的面试中，主从同步、二级索引、ChangeBuffer是高频考察点。本文将从面试题角度拆解这三个技术点，覆盖底层原理、性能优化、设计思想，并结合实际场景与高频追问，助你构建系统性回答框架。一、主从同步：高可用架构的灵魂1.基础问题：主从同步的基本流程是什么？答：核心流程：主库将事务写入Binlog（二进制日志）从库的IO线程拉取Binlog到本地RelayLog从库的SQL线程重放
嵌入式SDIO 总线面试题及参考答案大模型大数据攻城狮 fpga开发嵌入式面经 SPI USB接口 SD总线 SDIO总线牛客网
目录SDIO总线与SD总线的核心区别是什么？(附框架图）简述SDIO总线物理接口的组成及其功能（CLK、CMD、DAT0-DAT3）。SDIO总线支持的最大数据传输位宽是多少？如何配置？解释SDIO总线中的主从模式架构及通信流程。SDIO卡的功能类型有哪些（如Wi-Fi、蓝牙、GPS）？SDIO总线时钟信号（CLK）的作用及典型频率范围SDIO协议中的OCR寄存器作用是什么？如何通过CMD5获取卡
前端存储后端响应数据方式详解 z2637305611 前端
在前端存储后端响应数据是常见需求，可以优化性能（减少重复请求）、支持离线访问或提升用户体验。以下是超详细的实现方式和注意事项：一、前端存储后端数据的核心步骤1.获取后端数据使用fetch或axios发送请求：//使用fetchfetch('https://api.example.com/data').then(response=>response.json()).then(data=>saveDa
大模型和数据要素赋能实体零售行业数字化转型建设和实施方案优享智库大模型数据要素数据治理数据仓库主数据零售
大模型和数据要素赋能实体零售行业数字化转型建设和实施方案更多参考公众号：优享智库引言项目背景与意义数字化转型目标与期望实施方案概述零售行业现状及挑战实体零售行业现状数字化转型面临的挑战市场需求与趋势分析大模型与数据要素赋能策略大模型技术及应用场景数据要素采集、整合与治理赋能策略制定与实施路径数字化转型关键技术与解决方案人工智能技术及应用大数据分析与挖掘技术云计算、物联网等技术支持定制化解决方案设计
开源Nextcloud+Onlyoffice实现多人协同在线编辑功能(基本配置) 运维归一多人共享编辑私人网盘 nextcloud onlyoffice
系统软件版本CentOS7NextCloud21本文只介绍基本安装，不适用于企业级一、安装Nextcloud1、容器方式安装dockerrun-d--namenextcloud-p8000:80-v/data/nextcloud:/var/www
vue3:request.js中请求方法，api封装请求，方法请求 25号底片~ javascript 前端 vue.js
方法一request.js//封装GET请求exportconstget=(url,params={})=>{returnrequest.get(url,{params});};//封装POST请求exportconstpost=(url,data={})=>{returnrequest.post(url,data);};api封装import{post}from'@/utils/request'
面试视角深度解析：索引冗余 vs 覆盖索引 vs 全表扫描的终极抉择 dblens 数据库管理和开发工具 mysql 面试 java 数据库
一、核心概念解析（面试破题关键）1.索引冗余（IndexRedundancy）本质：同一字段存在多个重复或包含关系的索引典型场景重复索引：INDEX(a)和INDEX(a)前缀冗余：已有INDEX(a,b,c)时再建INDEX(a,b)隐式覆盖：主键索引与唯一索引的列重叠面试考点如何通过SHOWINDEX识别冗余索引冗余索引对写性能的影响公式：写入耗时=基础耗时×(索引数+1)存储成本计算：单个索
02、数据结构与算法 - 基础：数组 - 吊打面试官星星学霸数据结构与算法 -吊打面试官 python 开发语言 java 算法数据结构
更多系列教程，每天更新更多教程关注：xxxueba.com星星学霸本篇博客我们介绍数据结构的鼻祖------数组，可以说数组几乎能表示一切的数据结构，在每一门编程语言中，数组都是重要的数据结构，当然每种语言对数组的实现和处理也不相同，但是本质是都是用来存放数据的的结构，这里我们以Java语言为例，来详细介绍Java语言中数组的用法。Java中数组的介绍在Java中，数组是用来存放同一种数据类型的集
面试求助：接口测试用例设计主要考虑哪些方面？海姐软件测试 lua 开发语言
一、基础功能验证1.正常场景覆盖关键点：验证接口在合法输入下的正确响应（状态码、数据结构、业务逻辑）。案例：json复制//用户登录接口输入：{"username":"合法用户","password":"正确密码"}预期：200OK+token返回+数据库登录记录更新2.异常场景覆盖关键点：触发错误码（4xx/5xx）的边界条件。测试维度：参数缺失/类型错误（如整型传字符串）非法参数值（如手机号格
电机控制常见面试问题（十三）小雀丝电机控制电机嵌入式硬件
文章目录一、直流电机与交流电机的基本工作原理二、永磁同步电机和异步电机区别三.PID控制器的原理及其在电机速度控制中的应用四.电机驱动电路设计的关键因素五.电机发热过高的有效原因以及处理办法六.常见电机过载保护方法及其工作原理七.电机振动的原因以及处理八.电机电流波形分析判断电机故障–一、直流电机与交流电机的基本工作原理直流电机中，直流发电机是电枢在原动机拖动下旋转，其导体切割主磁极固定磁场产生感
postgresql 数据库使用 what_2018 数据库数据库 postgresql oracle
目录索引查看索引创建删除索引修改数据库时区索引查看索引 select*frompg_indexeswheretablename='t_table_data'; 或者select*frompg_statio_all_indexeswhererelname='t_table_data';创建CREATEINDEXix_table_data_timeONt_table_data(id,create_ti
AWS DevOps 面试问题及答案 m0_65697474 1024程序员节
常规AWSDevOps问题什么是DevOps？DevOps是一套集成软件开发(Dev)和IT运营(Ops)的实践，旨在缩短开发生命周期并根据业务目标频繁提供功能、修复和更新。使用AWS进行DevOps有哪些好处？AWS提供弹性计算云(EC2)、弹性容器服务(ECS)和ElasticBeanstalk等灵活服务，可帮助自动化和扩展开发和部署管道。功能包括可扩展性、自动化、CI/CD、基础设施即代码(
深度解析前端面试八股文：核心知识点与高效应对策略赵大仁前端面试职场和发展
深度解析前端面试八股文：核心知识点与高效应对策略1.引言前端面试是每位开发者迈向职业进阶的重要环节，涉及HTML、CSS、JavaScript、性能优化、浏览器原理、网络、安全、框架（Vue/React）等核心知识点。本文不仅会覆盖前端面试的高频八股文，还会结合生动的案例，让你在面试时能够脱离死记硬背，从理解中突破！2.HTML&CSS高频考点2.1HTML语义化问题：什么是HTML语义化？为什么
C# WinForm【DataTable分页查询与数据导出到Excel】 Easonflowers VS实战 c#excel
准备：主要控件saveFileDialog保存文件bindingNavigator分页控件bindingSource绑定数据源引用命名空间usingSystem;usingSystem.Data;usingSystem.Windows.Forms;usingExcel=Microsoft.Office.Interop.Excel;usingSystem.Data.SqlClient;namespa
COMP9321 25T1 后端
COMP932125T1Assignment1(15marks)IntroductionTheNSWFuelCheckdatasetismaintainedbytheNSWGovernment.ItallowsmotoriststoaccesshistoricalandliveinformationaboutfuelpricesacrossNSW.Wehavedownloadedthe“FuelC
C# DataTable 导出CSV 文件并在客户端下载茶暖人凉 c#excel
publicstaticboolExportToCSV(System.Data.DataTabledt){stringstrLine="";stringpathFile=String.Format("{0}{1}.csv",HttpContext.Current.Server.MapPath("Excel/"),"客户列表");//文件保存路径及名称FileInfofi=newFileInfo(p
python记录运行时间_计算python程序运行时间 weixin_39668408 python记录运行时间
本文介绍三种方法用来计算python程序的运行时间，考虑多现在计算机都是多进程执行环境，本文介绍的方法，前两种统计了其它进程的时间，实际上是python程序执行开始和结束的时间，只有最后一个方法，是计算的python程序的独自占用的CPU时间，但是python官方已经不再推荐。各位同学可以根据自己的应用情况选择考虑。1，用datatime模块，秒级精度>>>importdatetime>>>dat
京准电钟分享：医院网络内NTP时间同步服务器作用是什么？北京华人开创公司北斗卫星授时 NTP时间同步 GPS对时装置 NTP 时间同步服务器网络时间服务器 NTP时间服务器网络系统时钟同步
京准电钟分享：医院网络内NTP时间同步服务器作用是什么？京准电钟分享：医院网络内NTP时间同步服务器作用是什么？时间同步技术必定将是整个大数据处理系统的重要支撑和保障。时间同步技术使数据产生与处理系统的所有节点具有全局的、统一的标准时间，从而使系统中的所有各种消息、事件、节点、数据等具备正确的逻辑性、协调性以及可追溯性。大数据产生与处理系统是各种计算设备集群的，计算设备将统一、同步的标准时间用于记
Java高频面试之集合-11 牛马baby java 面试哈希算法
hello啊，各位观众姥爷们！！！本baby今天来报道了！哈哈哈哈哈嗝面试官：详细说说hashmap的put和get操作HashMap的put和get操作是核心功能，其底层通过数组+链表/红黑树实现，结合哈希计算与冲突处理完成键值对的存取。以下是详细流程和关键逻辑分析：一、put操作流程publicVput(Kkey,Vvalue){returnputVal(hash(key),key,value
这些用例设计题，你在面试时遇到过吗？ bug管理者软件测试面试软件测试面试
功能测试点赞功能：1.点击点赞按钮，是否可以成功点赞，并显示点赞图标和微信昵称；2.点赞成功后是否可以取消点赞；3.没有网络情况下是否可以点赞；4.点赞成功后是否可以评论；5.是否按照点赞顺序进行排序；6.点赞刚好一排可以显示多少头像；7.是否有点赞人数限制；8.是否可以多次点赞/取消点赞；9.点赞成功后，原“点赞”字样是否变为“取消”；10.朋友圈是否可以看到共同好友的点赞；11.是否可以点赞刚
免费实时汇率查询Api接口金米kk 第三方
接口地址https://api.it120.cc/gooking/forex/rate?fromCode=CNY&toCode=USD接口说明本接口使用GET方式请求即可，你可以直接将地址复制到浏览器中打开查看效果如上面的例子，查询的是人民币（CNY）和美元（USD）之间的汇率关系，也就是1美元（USD）等于多少人民币（CNY）接口返回{"code":0,"data":{"rate":6.5749
继之前的线程循环加到窗口中运行 3213213333332132 java thread JFrame JPanel
之前写了有关java线程的循环执行和结束，因为想制作成exe文件，想把执行的效果加到窗口上，所以就结合了JFrame和JPanel写了这个程序，这里直接贴出代码，在窗口上运行的效果下面有附图。 package thread; import java.awt.Graphics; import java.text.SimpleDateFormat; import java.util
linux 常用命令 BlueSkator linux 命令
1.grep 相信这个命令可以说是大家最常用的命令之一了。尤其是查询生产环境的日志，这个命令绝对是必不可少的。但之前总是习惯于使用（grep -n 关键字文件名）查出关键字以及该关键字所在的行数，然后再用（sed -n '100,200p' 文件名），去查出该关键字之后的日志内容。但其实还有更简便的办法，就是用（grep -B n、-A n、-C n 关键
php heredoc原文档和nowdoc语法 dcj3sjt126com PHP heredoc nowdoc
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body> <?
overflow的属性周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
《我所了解的Java》——总体目录 g21121 java
准备用一年左右时间写一个系列的文章《我所了解的Java》，目录及内容会不断完善及调整。在编写相关内容时难免出现笔误、代码无法执行、名词理解错误等，请大家及时指出，我会第一时间更正。 &n
[简单]docx4j常用方法小结 53873039oycg docx
本代码基于docx4j-3.2.0，在office word 2007上测试通过。代码如下: import java.io.File; import java.io.FileInputStream; import ja
Spring配置学习云端月影 spring配置
首先来看一个标准的Spring配置文件 applicationContext.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&q
Java新手入门的30个基本概念三 aijuans java 新手 java 入门
17.Java中的每一个类都是从Object类扩展而来的。　　18.object类中的equal和toString方法。　　equal用于测试一个对象是否同另一个对象相等。　　toString返回一个代表该对象的字符串,几乎每一个类都会重载该方法,以便返回当前状态的正确表示.(toString 方法是一个很重要的方法)　　 19.通用编程:任何类类型的所有值都可以同object类性的变量来代替。　
《2008 IBM Rational 软件开发高峰论坛会议》小记 antonyup_2006 软件测试敏捷开发项目管理 IBM 活动
我一直想写些总结,用于交流和备忘,然都没提笔,今以一篇参加活动的感受小记开个头,呵呵! 其实参加《2008 IBM Rational 软件开发高峰论坛会议》是9月4号,那天刚好调休.但接着项目颇为忙,所以今天在中秋佳节的假期里整理了下. 参加这次活动是一个朋友给的一个邀请书,才知道有这样的一个活动,虽然现在项目暂时没用到IBM的解决方案,但觉的参与这样一个活动可以拓宽下视野和相关知识.
PL/SQL的过程编程,异常,声明变量,PL/SQL块百合不是茶 PL/SQL的过程编程异常 PL/SQL块声明变量
PL/SQL; 过程; 符号; 变量; PL/SQL块; 输出; 异常; PL/SQL 是过程语言(Procedural Language)与结构化查询语言(SQL)结合而成的编程语言PL/SQL 是对 SQL 的扩展,sql的执行时每次都要写操作
Mockito(三)--完整功能介绍 bijian1013 持续集成 mockito 单元测试
mockito官网：http://code.google.com/p/mockito/，打开documentation可以看到官方最新的文档资料。一.使用mockito验证行为 //首先要import Mockito import static org.mockito.Mockito.*; //mo
精通Oracle10编程SQL(8)使用复合数据类型 bijian1013 oracle 数据库 plsql
/* *使用复合数据类型 */ --PL/SQL记录 --定义PL/SQL记录 --自定义PL/SQL记录 DECLARE TYPE emp_record_type IS RECORD( name emp.ename%TYPE, salary emp.sal%TYPE, dno emp.deptno%TYPE ); emp_
【Linux常用命令一】grep命令 bit1129 Linux常用命令
grep命令格式 grep [option] pattern [file-list] grep命令用于在指定的文件(一个或者多个,file-list)中查找包含模式串(pattern)的行,[option]用于控制grep命令的查找方式。 pattern可以是普通字符串，也可以是正则表达式，当查找的字符串包含正则表达式字符或者特
mybatis3入门学习笔记白糖_ sql ibatis qq jdbc 配置管理
MyBatis 的前身就是iBatis，是一个数据持久层(ORM)框架。 MyBatis 是支持普通 SQL 查询，存储过程和高级映射的优秀持久层框架。MyBatis对JDBC进行了一次很浅的封装。以前也学过iBatis，因为MyBatis是iBatis的升级版本，最初以为改动应该不大，实际结果是MyBatis对配置文件进行了一些大的改动，使整个框架更加方便人性化。
Linux 命令神器：lsof 入门 ronin47 lsof
lsof是系统管理/安全的尤伯工具。我大多数时候用它来从系统获得与网络连接相关的信息，但那只是这个强大而又鲜为人知的应用的第一步。将这个工具称之为lsof真实名副其实，因为它是指“列出打开文件（lists openfiles）”。而有一点要切记，在Unix中一切（包括网络套接口）都是文件。有趣的是，lsof也是有着最多
java实现两个大数相加，可能存在溢出。 bylijinnan java实现
import java.math.BigInteger; import java.util.regex.Matcher; import java.util.regex.Pattern; public class BigIntegerAddition { /** * 题目：java实现两个大数相加，可能存在溢出。 * 如123456789 + 987654321
Kettle学习资料分享，附大神用Kettle的一套流程完成对整个数据库迁移方法 Kai_Ge Kettle
Kettle学习资料分享 Kettle 3.2 使用说明书目录概述..........................................................................................................................................7 1.Kettle 资源库管
[货币与金融]钢之炼金术士 comsci 金融
自古以来,都有一些人在从事炼金术的工作.........但是很少有成功的那么随着人类在理论物理和工程物理上面取得的一些突破性进展...... 炼金术这个古老
Toast原来也可以多样化 dai_lm android toast
Style 1：默认 Toast def = Toast.makeText(this, "default", Toast.LENGTH_SHORT); def.show(); Style 2：顶部显示 Toast top = Toast.makeText(this, "top", Toast.LENGTH_SHORT); t
java数据计算的几种解决方法3 datamachine java hadoop ibatis r-langue r
4、iBatis 简单敏捷因此强大的数据计算层。和Hibernate不同，它鼓励写SQL，所以学习成本最低。同时它用最小的代价实现了计算脚本和JAVA代码的解耦，只用20%的代价就实现了hibernate 80%的功能,没实现的20%是计算脚本和数据库的解耦。复杂计算环境是它的弱项，比如：分布式计算、复杂计算、非数据
向网页中插入透明Flash的方法和技巧 dcj3sjt126com html Web Flash
将 Flash 作品插入网页的时候，我们有时候会需要将它设为透明，有时候我们需要在Flash的背面插入一些漂亮的图片，搭配出漂亮的效果……下面我们介绍一些将Flash插入网页中的一些透明的设置技巧。　　一、Swf透明、无坐标控制　　首先教大家最简单的插入Flash的代码，透明，无坐标控制：　　注意wmode="transparent"是控制Flash是否透明
ios UICollectionView的使用 dcj3sjt126com
UICollectionView的使用有两种方法，一种是继承UICollectionViewController，这个Controller会自带一个UICollectionView；另外一种是作为一个视图放在普通的UIViewController里面。个人更喜欢第二种。下面采用第二种方式简单介绍一下UICollectionView的使用。 1.UIViewController实现委托，代码如
Eos平台java公共逻辑蕃薯耀 Eos平台java公共逻辑 Eos平台 java公共逻辑
Eos平台java公共逻辑 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:20:4
SpringMVC4零配置--Web上下文配置【MvcConfig】 hanqunfeng springmvc4
与SpringSecurity的配置类似，spring同样为我们提供了一个实现类WebMvcConfigurationSupport和一个注解@EnableWebMvc以帮助我们减少bean的声明。 applicationContext-MvcConfig.xml  <
解决ie和其他浏览器poi下载excel文件名乱码 jackyrong Excel
使用poi,做传统的excel导出，然后想在浏览器中，让用户选择另存为，保存用户下载的xls文件，这个时候，可能的是在ie下出现乱码（ie,9,10,11),但在firefox,chrome下没乱码，因此必须综合判断，编写一个工具类： /** * * @Title: pro
挥洒泪水的青春 lampcy 编程生活程序员
2015年2月28日，我辞职了，离开了相处一年的触控，转过身--挥洒掉泪水，毅然来到了兄弟连，背负着许多的不解、质疑——”你一个零基础、脑子又不聪明的人，还敢跨行业，选择Unity3D？“，”真是不自量力••••••“，”真是初生牛犊不怕虎•••••“，••••••我只是淡淡一笑，拎着行李----坐上了通向挥洒泪水的青春之地——兄弟连！这就是我青春的分割线，不后悔，只会去用泪水浇灌——已经来到
稳增长之中国股市两点意见-----严控做空，建立涨跌停版停牌重组机制 nannan408
对于股市，我们国家的监管还是有点拼的，但始终拼不过飞流直下的恐慌，为什么呢？笔者首先支持股市的监管。对于股市越管越荡的现象，笔者认为首先是做空力量超过了股市自身的升力，并且对于跌停停牌重组的快速反应还没建立好，上市公司对于股价下跌没有很好的利好支撑。我们来看美国和香港是怎么应对股灾的。美国是靠禁止重要股票做空，在
动态设置iframe高度(iframe高度自适应) Rainbow702 JavaScript iframe contentDocument 高度自适应局部刷新
如果需要对画面中的部分区域作局部刷新，大家可能都会想到使用ajax。但有些情况下，须使用在页面中嵌入一个iframe来作局部刷新。对于使用iframe的情况，发现有一个问题，就是iframe中的页面的高度可能会很高，但是外面页面并不会被iframe内部页面给撑开，如下面的结构： <div id="content"> <div id=&quo
用Rapael做图表 tntxia rap
function drawReport(paper,attr,data){ var width = attr.width; var height = attr.height; var max = 0; &nbs
HTML5 bootstrap2网页兼容（支持IE10以下） xiaoluode html5 bootstrap
<!DOCTYPE html> <html> <head lang="zh-CN"> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge">