weixin_39907316

connect flink_Flink从入门到入土（详细教程）

和其他所有的计算框架一样，flink也有一些基础的开发步骤以及基础，核心的API，从开发步骤的角度来讲，主要分为四大部分

1.Environment

Flink Job在提交执行计算时，需要首先建立和Flink框架之间的联系，也就指的是当前的flink运行环境，只有获取了环境信息，才能将task调度到不同的taskManager执行。而这个环境对象的获取方式相对比较简单

//批处理环境

val env =ExecutionEnvironment.getExecutionEnvironment//流式数据处理环境

val env = StreamExecutionEnvironment.getExecutionEnvironment

2.Source

Flink框架可以从不同的来源获取数据，将数据提交给框架进行处理, 我们将获取数据的来源称之为数据源.

2.1.从集合读取数据

一般情况下，可以将数据临时存储到内存中，形成特殊的数据结构后，作为数据源使用。这里的数据结构采用集合类型是比较普遍的

importorg.apache.flink.streaming.api.scala._/*** description: SourceList

* date: 2020/8/28 19:02

* version: 1.0

*@author阳斌

* 邮箱：[email protected]

* 类的说明：从集合读取数据*/object SourceList {

def main(args: Array[String]): Unit={//1.创建执行的环境

val env: StreamExecutionEnvironment =StreamExecutionEnvironment.getExecutionEnvironment//2.从集合中读取数据

val sensorDS: DataStream[WaterSensor] =env.fromCollection(//List(1,2,3,4,5)

List(

WaterSensor("ws_001", 1577844001, 45.0),

WaterSensor("ws_002", 1577844015, 43.0),

WaterSensor("ws_003", 1577844020, 42.0)

)

)//3.打印

sensorDS.print()//4.执行

env.execute("sensor")

}/*** 定义样例类：水位传感器：用于接收空高数据

*@paramid 传感器编号

*@paramts 时间戳

*@paramvc 空高*/

case classWaterSensor(id: String, ts: Long, vc: Double)

}

2.2从文件中读取数据

通常情况下，我们会从存储介质中获取数据，比较常见的就是将日志文件作为数据源

importorg.apache.flink.streaming.api.scala._/*** description: SourceList

* date: 2020/8/28 19:02

* version: 1.0

*@author阳斌

* 邮箱：[email protected]

* 类的说明：从文件读取数据*/object SourceFile {

def main(args: Array[String]): Unit={//1.创建执行的环境

val env: StreamExecutionEnvironment =StreamExecutionEnvironment.getExecutionEnvironment//2.从指定路径获取数据

val fileDS: DataStream[String] = env.readTextFile("input/data.log")//3.打印

fileDS.print()//4.执行

env.execute("sensor")

}

}/*** 在读取文件时，文件路径可以是目录也可以是单一文件。如果采用相对文件路径，会从当前系统参数user.dir中获取路径

* System.getProperty("user.dir")*/

/*** 如果在IDEA中执行代码，那么系统参数user.dir自动指向项目根目录，

* 如果是standalone集群环境, 默认为集群节点根目录，当然除了相对路径以外，

* 也可以将路径设置为分布式文件系统路径，如HDFS

val fileDS: DataStream[String] =

env.readTextFile( "hdfs://hadoop02:9000/test/1.txt")*/

如果是standalone集群环境, 默认为集群节点根目录，当然除了相对路径以外，也可以将路径设置为分布式文件系统路径，如HDFS

val fileDS: DataStream[String] =env.readTextFile("hdfs://hadoop02:9000/test/1.txt")

默认读取时，flink的依赖关系中是不包含Hadoop依赖关系的，所以执行上面代码时，会出现错误。

解决方法就是增加相关依赖jar包就可以了

2.3 kafka读取数据

Kafka作为消息传输队列，是一个分布式的，高吞吐量，易于扩展地基于主题发布/订阅的消息系统。在现今企业级开发中，Kafka 和 Flink成为构建一个实时的数据处理系统的首选

2.3.1 引入kafka连接器的依赖

org.apache.flink

flink-connector-kafka-0.11_2.11

1.10.0

2.3.2 代码实现参考

importjava.util.Propertiesimportorg.apache.flink.streaming.api.scala._importorg.apache.flink.streaming.connectors.kafka.FlinkKafkaConsumer011importorg.apache.flink.streaming.util.serialization.SimpleStringSchema/*** description: SourceList

* date: 2020/8/28 19:02

* version: 1.0

*@author阳斌

* 邮箱：[email protected]

* 类的说明：从kafka读取数据*/object SourceKafka {

def main(args: Array[String]): Unit={

val env: StreamExecutionEnvironment=StreamExecutionEnvironment.getExecutionEnvironment

val properties= newProperties()

properties.setProperty("bootstrap.servers", "hadoop02:9092")

properties.setProperty("group.id", "consumer-group")

properties.setProperty("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer")

properties.setProperty("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer")

properties.setProperty("auto.offset.reset", "latest")

val kafkaDS: DataStream[String]=env.addSource(newFlinkKafkaConsumer011[String]("sensor",newSimpleStringSchema(),

properties)

)

kafkaDS.print()

env.execute("sensor")

}

2.4 自定义数据源

大多数情况下，前面的数据源已经能够满足需要，但是难免会存在特殊情况的场合，所以flink也提供了能自定义数据源的方式

2.4.1 创建自定义数据源

importcom.atyang.day01.Source.SourceList.WaterSensorimportorg.apache.flink.streaming.api.functions.source.SourceFunctionimportscala.util.Random/*** description: ss

* date: 2020/8/28 20:36

* version: 1.0

*@author阳斌

* 邮箱：[email protected]

* 类的说明：自定义数据源*/

class MySensorSource extendsSourceFunction[WaterSensor] {

var flg= trueoverride def run(ctx: SourceFunction.SourceContext[WaterSensor]): Unit={while( flg ) {//采集数据

ctx.collect(

WaterSensor("sensor_" +new Random().nextInt(3),1577844001,new Random().nextInt(5)+40)

)

Thread.sleep(100)

}

override def cancel(): Unit={

flg= false;

}

3.Transform

在Spark中，算子分为转换算子和行动算子，转换算子的作用可以通过算子方法的调用将一个RDD转换另外一个RDD，Flink中也存在同样的操作，可以将一个数据流转换为其他的数据流。

转换过程中，数据流的类型也会发生变化，那么到底Flink支持什么样的数据类型呢，其实我们常用的数据类型，Flink都是支持的。比如：Long, String, Integer, Int, 元组，样例类，List, Map等。

3.1 map

映射：将数据流中的数据进行转换, 形成新的数据流，消费一个元素并产出一个元素

参数：Scala匿名函数或MapFunction

返回：DataStream

importorg.apache.flink.streaming.api.scala._/*** description: SourceList

* date: 2020/8/28 19:02

* version: 1.0

*@author阳斌

* 邮箱：[email protected]

* 类的说明：从集合读取数据*/object Transfrom_map {

def main(args: Array[String]): Unit={//1.创建执行的环境

val env: StreamExecutionEnvironment =StreamExecutionEnvironment.getExecutionEnvironment//2.从集合中读取数据

val sensorDS: DataStream[WaterSensor] =env.fromCollection(//List(1,2,3,4,5)

List(

WaterSensor("ws_001", 1577844001, 45.0),

WaterSensor("ws_002", 1577844015, 43.0),

WaterSensor("ws_003", 1577844020, 42.0)

)

val sensorDSMap= sensorDS.map(x => (x.id+"_1",x.ts+"_1",x.vc + 1))//3.打印

sensorDSMap.print()//4.执行

env.execute("sensor")

}/*** 定义样例类：水位传感器：用于接收空高数据

*@paramid 传感器编号

*@paramts 时间戳

*@paramvc 空高*/

case classWaterSensor(id: String, ts: Long, vc: Double)

}

3.1.1 MapFunction

Flink为每一个算子的参数都至少提供了Scala匿名函数和函数类两种的方式，其中如果使用函数类作为参数的话，需要让自定义函数继承指定的父类或实现特定的接口。例如：MapFunction

sensor-data.log 文件数据

sensor_1,1549044122,10sensor_1,1549044123,20sensor_1,1549044124,30sensor_2,1549044125,40sensor_1,1549044126,50sensor_2,1549044127,60sensor_1,1549044128,70sensor_3,1549044129,80sensor_3,1549044130,90sensor_3,1549044130,100

importorg.apache.flink.streaming.api.scala._/*** description: SourceList

* date: 2020/8/28 19:02

* version: 1.0

*@author阳斌

* 邮箱：[email protected]

* 类的说明：从文件读取数据*/object SourceFileMap {

def main(args: Array[String]): Unit={//1.创建执行的环境

val env: StreamExecutionEnvironment =StreamExecutionEnvironment.getExecutionEnvironment//2.从指定路径获取数据

val fileDS: DataStream[String] = env.readTextFile("input/sensor-data.log")

val MapDS=fileDS.map(

lines=>{//更加逗号切割获取每个元素

val datas: Array[String] = lines.split(",")

WaterSensor(datas(0), datas(1).toLong, datas(2).toInt)

}

)//3.打印

MapDS.print()//4.执行

env.execute("map")

}/*** 定义样例类：水位传感器：用于接收空高数据

*@paramid 传感器编号

*@paramts 时间戳

*@paramvc 空高*/

case classWaterSensor(id: String, ts: Long, vc: Double)

}

importorg.apache.flink.api.common.functions.MapFunctionimportorg.apache.flink.streaming.api.scala._/*** description: SourceList

* date: 2020/8/28 19:02

* version: 1.0

*@author阳斌

* 邮箱：[email protected]

* 类的说明：从文件读取数据*/object Transform_MapFunction {

def main(args: Array[String]): Unit={//1.创建执行的环境

val env: StreamExecutionEnvironment =StreamExecutionEnvironment.getExecutionEnvironment//2.从指定路径获取数据

val sensorDS: DataStream[String] = env.readTextFile("input/sensor-data.log")

sensorDS.map()//3.打印//MapDS.print()//4.执行

env.execute("map")

}/*** 自定义继承 MapFunction

* MapFunction[T,O]

* 自定义输入和输出

**/

class MyMapFunction extendsMapFunction[String,WaterSensor]{

override def map(t: String): WaterSensor={

val datas: Array[String]= t.split(",")

WaterSensor(datas(0),datas(1).toLong,datas(2).toInt)

}

}/*** 定义样例类：水位传感器：用于接收空高数据

*@paramid 传感器编号

*@paramts 时间戳

*@paramvc 空高*/

case classWaterSensor(id: String, ts: Long, vc: Double)

}

3.1.2 RichMapFunction

所有Flink函数类都有其Rich版本。它与常规函数的不同在于，可以获取运行环境的上下文，并拥有一些生命周期方法，所以可以实现更复杂的功能。也有意味着提供了更多的，更丰富的功能。例如：RichMapFunction

sensor-data.log 文件数据同上一致

importorg.apache.flink.api.common.functions.{MapFunction, RichMapFunction}importorg.apache.flink.configuration.Configurationimportorg.apache.flink.streaming.api.scala._/*** description: SourceList

* date: 2020/8/28 19:02

* version: 1.0

*@author阳斌

* 邮箱：[email protected]

* 类的说明：从文件读取数据*/object Transform_RichMapFunction {

def main(args: Array[String]): Unit={//1.创建执行的环境

val env: StreamExecutionEnvironment =StreamExecutionEnvironment.getExecutionEnvironment//2.从指定路径获取数据

val sensorDS: DataStream[String] = env.readTextFile("input/sensor-data.log")

val myMapDS: DataStream[WaterSensor]= sensorDS.map(newMyRichMapFunction)//3.打印

myMapDS.print()//4.执行

env.execute("map")

}/*** 自定义继承 MapFunction

* MapFunction[T,O]

* 自定义输入和输出

**/

class MyRichMapFunction extendsRichMapFunction[String,WaterSensor]{

override def map(value: String): WaterSensor={

val datas: Array[String]= value.split(",")//WaterSensor(datas(0), datas(1).toLong, datas(2).toInt)

WaterSensor(getRuntimeContext.getTaskName, datas(1).toLong, datas(2).toInt)

}//富函数提供了生命周期方法

override def open(parameters: Configuration): Unit ={}

override def close(): Unit={}

}/*** 定义样例类：水位传感器：用于接收空高数据

*@paramid 传感器编号

*@paramts 时间戳

*@paramvc 空高*/

case classWaterSensor(id: String, ts: Long, vc: Double)

}

Rich Function有一个生命周期的概念。典型的生命周期方法有：

open()方法是rich function的初始化方法，当一个算子例如map或者filter被调用之前open()会被调用

close()方法是生命周期中的最后一个调用的方法，做一些清理工作

getRuntimeContext()方法提供了函数的RuntimeContext的一些信息，例如函数执行的并行度，任务的名字，以及state状态

3.1.3 flatMap

扁平映射：将数据流中的整体拆分成一个一个的个体使用，消费一个元素并产生零到多个元素

参数：Scala匿名函数或FlatMapFunction

返回：DataStream

importorg.apache.flink.streaming.api.scala._/*** description: SourceList

* date: 2020/8/28 19:02

* version: 1.0

*@author阳斌

* 邮箱：[email protected]

* 类的说明：FlatMap*/object Transform_FlatMap {

def main(args: Array[String]): Unit={//1.创建执行环境

val env: StreamExecutionEnvironment =StreamExecutionEnvironment.getExecutionEnvironment

env.setParallelism(1)//2.读取数据

val listDS: DataStream[List[Int]] =env.fromCollection(

List(

List(1, 2, 3, 4),

List(5, 6, 7,1,1,1)

)

val resultDS: DataStream[Int]= listDS.flatMap(list =>list)

resultDS.print()//4. 执行

env.execute()

}

3.2. filter

过滤：根据指定的规则将满足条件(true)的数据保留，不满足条件(false)的数据丢弃

参数：Scala匿名函数或FilterFunction

返回：DataStream

importorg.apache.flink.streaming.api.scala._/*** description: SourceList

* date: 2020/8/28 19:02

* version: 1.0

*@author阳斌

* 邮箱：[email protected]

* 类的说明：Filter*/object Transform_Filter {

def main(args: Array[String]): Unit={//1.创建执行环境

val env: StreamExecutionEnvironment =StreamExecutionEnvironment.getExecutionEnvironment

env.setParallelism(1)//2.读取数据

val listDS: DataStream[List[Int]] =env.fromCollection(

List(

List(1, 2, 3, 4,1, 2, 3, 4),

List(5, 6, 7,1,1,1,1, 2, 3, 4,1, 2, 3, 4),

List(1, 2, 3, 4),

List(5, 6, 7,1,1,1),

List(1, 2, 3, 4),

List(5, 6, 7,1,1,1)

)

)//true就留下，false就抛弃

listDS.filter(num =>{

num.size>5})

.print("filter")//4. 执行

env.execute()

}

3.3 keyBy

在Spark中有一个GroupBy的算子，用于根据指定的规则将数据进行分组，在flink中也有类似的功能，那就是keyBy，根据指定的key对数据进行分流

分流：根据指定的Key将元素发送到不同的分区，相同的Key会被分到一个分区(这里分区指的就是下游算子多个并行节点的其中一个)。keyBy()是通过哈希来分区的

参数：Scala匿名函数或POJO属性或元组索引，不能使用数组

返回：KeyedStream

importorg.apache.flink.streaming.api.scala._/*** description: SourceList

* date: 2020/8/28 19:02

* version: 1.0

*@author阳斌

* 邮箱：[email protected]

* 类的说明：FlatMap*/object Transform_KeyBy {

def main(args: Array[String]): Unit={//1.创建执行环境

val env: StreamExecutionEnvironment =StreamExecutionEnvironment.getExecutionEnvironment

env.setParallelism(1)//2.读取数据

val sensorDS: DataStream[String] = env.readTextFile("input/sensor-data.log")//3.转换为样例类

val mapDS =sensorDS.map(

lines=>{

val datas= lines.split(",")

WaterSensor(datas(0), datas(1).toLong, datas(2).toInt)

}

)//4. 使用keyby进行分组//TODO 关于返回的key的类型：//1. 如果是位置索引或字段名称，程序无法推断出key的类型，所以给一个java的Tuple类型//2. 如果是匿名函数或函数类的方式，可以推断出key的类型，比较推荐使用//*** 分组的概念：分组只是逻辑上进行分组,打上了记号(标签)，跟并行度没有绝对的关系//同一个分组的数据在一起(不离不弃)//同一个分区里可以有多个不同的组//val sensorKS: KeyedStream[WaterSensor, Tuple] = mapDS.keyBy(0)//val sensorKS: KeyedStream[WaterSensor, Tuple] = mapDS.keyBy("id")

val sensorKS: KeyedStream[WaterSensor, String] =mapDS.keyBy(_.id)//val sensorKS: KeyedStream[WaterSensor, String] = mapDS.keyBy(//new KeySelector[WaterSensor, String] {//override def getKey(value: WaterSensor): String = {//value.id//}//}//)

sensorKS.print().setParallelism(5)//4. 执行

env.execute()

}/*** 定义样例类：水位传感器：用于接收空高数据

*@paramid 传感器编号

*@paramts 时间戳

*@paramvc 空高*/

case classWaterSensor(id: String, ts: Long, vc: Double)

}

3.4 shuffle

打乱重组(洗牌)：将数据按照均匀分布打散到下游

参数：无

返回：DataStream

importorg.apache.flink.streaming.api.scala._/*** description: SourceList

* date: 2020/8/28 19:02

* version: 1.0

*@author阳斌

* 邮箱：[email protected]

* 类的说明：FlatMap*/object Transform_Shuffle {

def main(args: Array[String]): Unit={//1.创建执行环境

val env: StreamExecutionEnvironment =StreamExecutionEnvironment.getExecutionEnvironment

env.setParallelism(1)//2.读取数据

val sensorDS: DataStream[String] = env.readTextFile("input/sensor-data.log")

val shuffleDS=sensorDS.shuffle

sensorDS.print("data")

shuffleDS.print("shuffle")//4. 执行

env.execute()

}

3.5. split

在某些情况下，我们需要将数据流根据某些特征拆分成两个或者多个数据流，给不同数据流增加标记以便于从流中取出。

需求：将水位传感器数据按照空高高低(以40cm,30cm为界)，拆分成三个流

importorg.apache.flink.streaming.api.scala._/*** description: SourceList

* date: 2020/8/28 19:02

* version: 1.0

*@author阳斌

* 邮箱：[email protected]

* 类的说明：FlatMap*/object Transform_Split {

def main(args: Array[String]): Unit={//1.创建执行环境

val env: StreamExecutionEnvironment =StreamExecutionEnvironment.getExecutionEnvironment

env.setParallelism(1)//2.读取数据

val sensorDS: DataStream[String] = env.readTextFile("input/sensor-data.log")//3.转换成样例类

val mapDS: DataStream[WaterSensor] =sensorDS.map(

lines=>{

val datas: Array[String]= lines.split(",")

WaterSensor(datas(0), datas(1).toLong, datas(2).toInt)

}

)

val splitSS: SplitStream[WaterSensor]=mapDS.split(

sensor=>{if (sensor.vc < 40) {

Seq("normal")

}else if (sensor.vc < 80) {

Seq("Warn")

}else{

Seq("alarm")

}

)//4. 执行

env.execute()

}/*** 定义样例类：水位传感器：用于接收空高数据

*@paramid 传感器编号

*@paramts 时间戳

*@paramvc 空高*/

case classWaterSensor(id: String, ts: Long, vc: Double)

}

3.6 select

将数据流进行切分后，如何从流中将不同的标记取出呢，这时就需要使用select算子了。

importorg.apache.flink.streaming.api.scala._/*** description: SourceList

* date: 2020/8/28 19:02

* version: 1.0

*@author阳斌

* 邮箱：[email protected]

* 类的说明：FlatMap*/object Transform_Split {

def main(args: Array[String]): Unit={//1.创建执行环境

val env: StreamExecutionEnvironment =StreamExecutionEnvironment.getExecutionEnvironment

env.setParallelism(1)//2.读取数据

val sensorDS: DataStream[String] = env.readTextFile("input/sensor-data.log")//3.转换成样例类

val mapDS: DataStream[WaterSensor] =sensorDS.map(

lines=>{

val datas: Array[String]= lines.split(",")

WaterSensor(datas(0), datas(1).toLong, datas(2).toInt)

}

)

val splitDS: SplitStream[WaterSensor]=mapDS.split(

sensor=>{if (sensor.vc < 40) {

Seq("info")

}else if (sensor.vc < 80) {

Seq("warn")

}else{

Seq("error")

}

)

val errorDS: DataStream[WaterSensor]= splitDS.select("error")

val warnDS: DataStream[WaterSensor]= splitDS.select("warn")

val infoDS: DataStream[WaterSensor]= splitDS.select("info")

infoDS.print("info")

warnDS.print("warn")

errorDS.print("error")//4. 执行

env.execute()

}/*** 定义样例类：水位传感器：用于接收空高数据

*@paramid 传感器编号

*@paramts 时间戳

*@paramvc 空高*/

case classWaterSensor(id: String, ts: Long, vc: Double)

}

3.7 connect

在某些情况下，我们需要将两个不同来源的数据流进行连接，实现数据匹配，比如订单支付和第三方交易信息，这两个信息的数据就来自于不同数据源，连接后，将订单支付和第三方交易信息进行对账，此时，才能算真正的支付完成。

Flink中的connect算子可以连接两个保持他们类型的数据流，两个数据流被Connect之后，只是被放在了一个同一个流中，内部依然保持各自的数据和形式不发生任何变化，两个流相互独立。

importorg.apache.flink.streaming.api.scala._/*** description: SourceList

* date: 2020/8/28 19:02

* version: 1.0

*@author阳斌

* 邮箱：[email protected]

* 类的说明：FlatMap*/object Transform_Connect {

def main(args: Array[String]): Unit={//1.创建执行环境

val env: StreamExecutionEnvironment =StreamExecutionEnvironment.getExecutionEnvironment

env.setParallelism(1)//2.读取数据

val sensorDS: DataStream[String] = env.readTextFile("input/sensor-data.log")//3.转换成样例类

val mapDS: DataStream[WaterSensor] =sensorDS.map(

lines=>{

val datas: Array[String]= lines.split(",")

WaterSensor(datas(0), datas(1).toLong, datas(2).toInt)

}

)//4. 从集合中再读取一条流

val numDS: DataStream[Int] = env.fromCollection(List(1, 2, 3, 4, 5, 6))

val resultCS: ConnectedStreams[WaterSensor, Int]=mapDS.connect(numDS)//coMap表示连接流调用的map，各自都需要一个 function

resultCS.map(

sensor=>sensor.id,

num=>num+1).print()//4. 执行

env.execute()

}/*** 定义样例类：水位传感器：用于接收空高数据

*@paramid 传感器编号

*@paramts 时间戳

*@paramvc 空高*/

case classWaterSensor(id: String, ts: Long, vc: Double)

}

3.8 union

对两个或者两个以上的DataStream进行union操作，产生一个包含所有DataStream元素的新DataStream

connect与 union 区别：

union之前两个流的类型必须是一样，connect可以不一样

connect只能操作两个流，union可以操作多个。

importorg.apache.flink.streaming.api.scala._/*** description: SourceList

* date: 2020/8/28 19:02

* version: 1.0

*@author阳斌

* 邮箱：[email protected]

* 类的说明：FlatMap*/object Transform_Union {

def main(args: Array[String]): Unit={//1.创建执行环境

val env: StreamExecutionEnvironment =StreamExecutionEnvironment.getExecutionEnvironment

env.setParallelism(1)//2. 从集合中读取流

val num1DS: DataStream[Int] = env.fromCollection(List(1, 2, 3, 4))

val num2DS: DataStream[Int]= env.fromCollection(List(7, 8, 9, 10))

val num3DS: DataStream[Int]= env.fromCollection(List(17, 18, 19, 110))//TODO union 真正将多条流合并成一条流//合并的流，类型必须一致//可以合并多条流，只要类型一致

num1DS.union(num2DS).union(num3DS)

.print()//4. 执行

env.execute()

}/*** 定义样例类：水位传感器：用于接收空高数据

*@paramid 传感器编号

*@paramts 时间戳

*@paramvc 空高*/

case classWaterSensor(id: String, ts: Long, vc: Double)

}

3.9 Operator

Flink作为计算框架，主要应用于数据计算处理上，所以在keyBy对数据进行分流后，可以对数据进行相应的统计分析

3.9.1 滚动聚合算子(Rolling Aggregation)

这些算子可以针对KeyedStream的每一个支流做聚合。执行完成后，会将聚合的结果合成一个流返回，所以结果都是DataStream

sum()

min()

max()

3.9.2 reduce

一个分组数据流的聚合操作，合并当前的元素和上次聚合的结果，产生一个新的值，返回的流中包含每一次聚合的结果，而不是只返回最后一次聚合的最终结果。

importorg.apache.flink.streaming.api.scala._/*** description: SourceList

* date: 2020/8/28 19:02

* version: 1.0

*@author阳斌

* 邮箱：[email protected]

* 类的说明：Reduce*/object Transform_Reduce {

def main(args: Array[String]): Unit={//1.创建执行环境

val env: StreamExecutionEnvironment =StreamExecutionEnvironment.getExecutionEnvironment

env.setParallelism(1)//2.读取数据

val sensorDS: DataStream[String] = env.readTextFile("input/sensor-data.log")//3.转换成样例类

val mapDS: DataStream[WaterSensor] =sensorDS.map(

lines=>{

val datas: Array[String]= lines.split(",")

WaterSensor(datas(0), datas(1).toLong, datas(2).toInt)

}

)

val sensorKS: KeyedStream[WaterSensor, String]=mapDS.keyBy(_.id)//输入的类型一样，输出类型和输出类型也要一样//组内的第一条数据，不进入reduce计算

val reduceDS: DataStream[WaterSensor] =sensorKS.reduce(

(ws1, ws2)=>{

println(ws1+ "<===>" +ws2)

WaterSensor(ws1.id, System.currentTimeMillis(), ws1.vc+ws2.vc)

}

)

reduceDS.print("reduce")//4. 执行

env.execute()

}/*** 定义样例类：水位传感器：用于接收空高数据

*@paramid 传感器编号

*@paramts 时间戳

*@paramvc 空高*/

case classWaterSensor(id: String, ts: Long, vc: Double)

}

3.9.3process

Flink在数据流通过keyBy进行分流处理后，如果想要处理过程中获取环境相关信息，可以采用process算子自定义实现 1)继承KeyedProcessFunction抽象类，并定义泛型：[KEY, IN, OUT]

class MyKeyedProcessFunction extendsKeyedProcessFunction[String, WaterSensor, String]{}

重写方法//自定义KeyedProcessFunction,是一个特殊的富函数//1.实现KeyedProcessFunction，指定泛型：K - key的类型， I - 上游数据的类型， O - 输出的数据类型//2.重写 processElement方法，定义每条数据来的时候的处理逻辑

/*** 处理逻辑：来一条处理一条

*@paramvalue 一条数据

*@paramctx 上下文对象

*@paramout 采集器：收集数据，并输出*/override def processElement(value: WaterSensor, ctx: KeyedProcessFunction[String, WaterSensor, String]#Context, out: Collector[String]): Unit={

out.collect("我来到process啦，分组的key是="+ctx.getCurrentKey+",数据=" +value)//如果key是tuple，即keyby的时候，使用的是位置索引或字段名称，那么key获取到是一个tuple//ctx.getCurrentKey.asInstanceOf[Tuple1].f0//Tuple1需要手动引入Java的Tuple

}

完整代码：

importorg.apache.flink.streaming.api.functions.KeyedProcessFunctionimportorg.apache.flink.streaming.api.scala._importorg.apache.flink.util.Collector/*** description: SourceList

* date: 2020/8/28 19:02

* version: 1.0

*@author阳斌

* 邮箱：[email protected]

* 类的说明：Reduce*/object Transform_Process {

def main(args: Array[String]): Unit={//1.创建执行环境

val env: StreamExecutionEnvironment =StreamExecutionEnvironment.getExecutionEnvironment

env.setParallelism(1)//2.读取数据

val sensorDS: DataStream[String] = env.readTextFile("input/sensor-data.log")//3.转换成样例类

val mapDS: DataStream[WaterSensor] =sensorDS.map(

lines=>{

val datas: Array[String]= lines.split(",")

WaterSensor(datas(0), datas(1).toLong, datas(2).toInt)

}

)//按照ID 进行分组

val sensorKS: KeyedStream[WaterSensor, String] =mapDS.keyBy(_.id)

sensorKS.process(newMyKeyedProcessFunction)//4. 执行

env.execute()

}//自定义KeyedProcessFunction,是一个特殊的富函数//1.实现KeyedProcessFunction，指定泛型：K - key的类型， I - 上游数据的类型， O - 输出的数据类型//2.重写 processElement方法，定义每条数据来的时候的处理逻辑

class MyKeyedProcessFunction extendsKeyedProcessFunction[String, WaterSensor, String] {/*** 处理逻辑：来一条处理一条

*@paramvalue 一条数据

*@paramctx 上下文对象

*@paramout 采集器：收集数据，并输出*/override def processElement(value: WaterSensor, ctx: KeyedProcessFunction[String, WaterSensor, String]#Context, out: Collector[String]): Unit={

}

}/*** 定义样例类：水位传感器：用于接收空高数据

*@paramid 传感器编号

*@paramts 时间戳

*@paramvc 空高*/

case classWaterSensor(id: String, ts: Long, vc: Double)

}

4.Sink

Sink有下沉的意思，在Flink中所谓的Sink其实可以表示为将数据存储起来的意思，也可以将范围扩大，表示将处理完的数据发送到指定的存储系统的输出操作

之前我们一直在使用的print方法其实就是一种Sink。

@PublicEvolvingpublic DataStreamSinkprint(String sinkIdentifier) {

PrintSinkFunction printFunction = new PrintSinkFunction(sinkIdentifier, false);return this.addSink(printFunction).name("Print to Std. Out");

}

官方提供了一部分的框架的sink。除此以外，需要用户自定义实现sink

本文作者：Java知音@阳斌

你可能感兴趣的:(connect,flink)

因为mysql 8新的认证插件导致主从复制的IO线程失败库海无涯 mysql
1、错误信息Last_IO_Error:errorconnectingtomaster'[email protected]:3306'-retry-time:60retries:1message:Authenticationplugin'caching_sha2_password'reportederror:Authenticationrequiressecureconnection.2、
SpringBoot集成Flink-CDC，实现对数据库数据的监听 rkmhr_sef 面试学习路线阿里巴巴 spring boot flink 数据库
一、什么是CDC？CDC是ChangeDataCapture（变更数据获取）的简称。核心思想是，监测并捕获数据库的变动（包括数据或数据表的插入、更新以及删除等），将这些变更按发生的顺序完整记录下来，写入到消息中间件中以供其他服务进行订阅及消费。二、Flink-CDC是什么？CDCConnectorsforApacheFlink是一组用于ApacheFlink的源连接器，使用变更数据捕获(CDC)从
深入解析Flink Kafka Connector的分布式流数据采集架构与底层实现数据与算法架构提升之路 #Flink flink kafka conector 源码
目录1.FlinkKafka连接器的分布式流采集架构1.1架构组成1.2分布式流模型2.数据分区分配策略3.为什么重写序列化和偏移量管理3.1与Flink分布式架构集成3.2与Flink检查点机制集成同时承接多级并行架构3.3OffsetsInitializer与细粒度偏移量控制3.4与Flink的Source接口统一4.版本兼容性管理5.有界流处理支持5.1实现原理5.2API使用示例5.3多种
MMO基础游戏服务器架构（三）：多线程消息队列晴空～蓝兮 MMO双端游戏架构游戏服务器架构 c#
更多代码细节，球球各位观众老爷给鄙人的开源项目点个Star，持续更新中~[项目开源地址]3.单例消息分发类：MessageRouter消息包MessageBlock：使用值类型Struct降低GCpublicstructMessageBlock{publicBaseConnectionsender;publicIMessagemessage;}BaseManager：泛型类型安全的单例对象类，继承
docker 内容器访问另一个容器中的服务 docker容器网络
docker中有两个容器，分别名为mq和hyperf，想在hyperf中访问mq可以使用下面的方法1.创建网络dockernetworkcreatemynetwork2.将使用到的容器(如业务容器，mysql，redis，mq等容器)都加入到网络中dockernetworkconnectmynetworkhyperfdockernetworkconnectmynetworkmqdockernetw
自用基于 TypeScript 的 WebSocket 客户端封装 Luke Paul Na typescript websocket javascript
代码本体exportinterfaceIWSOptions{url?:string;sendContent?:string|object;token?:string;reconnectInterval?:number;heartbeatInterval?:number;heartbeatContent?:string|object;onOpen?:()=>void;onMessage?:(data
Apache大数据旭哥优选大数据选题 Apache大数据旭大数据定制选题 java hadoop spark 开发语言 idea hive 数据库架构
定制旭哥服务，一对一，无中介包安装+答疑+售后态度和技术都很重要定制按需求做要求不高就实惠一点定制需提前沟通好怎么做，这样才能避免不必要的麻烦python、flask、Django、mapreduce、mysqljava、springboot、vue、echarts、hadoop、spark、hive、hbase、flink、SparkStreaming、kafka、flume、sqoop分析+推
【教程】MYSQL中my.ini配置文件内容解读陳青雲安装教程 mysql adb 数据库
文章目录前言InnoDB设置1.`innodb_buffer_pool_size`2.`innodb_log_file_size`总结安全设置1.`secure-file-priv`2.`sql_mode`总结其他设置1.`max_allowed_packet`2.`max_connections`性能优化1.`query_cache_type`2.`thread_cache_size`总结win
flink作业访问zk出现acl报错问题分析 spring208208 大数据组件线上问题分析 flink zookeeper 大数据
#问题现象向yarn集群提交flink作业的时候会出现zkacl的异常经确认：1.zk相关acl密码没有更改过2.重新部署客户端配置后提交任务同样报错3.修改flink的zk目录，重启后可以正常运行任务(在zk重新生了新的znode节点)#问题分析1.首先确认是否是权限的问题，即程序中zk用户没有权限操作zk上的flink节点目录确认集群上zookeeper的flink的acl权限，确认为flin
Flink Cdc TiDB详解 24k小善 flink 大数据 java
1.什么是FlinkTiDBCDC？简单说就是用Flink实时抓取TiDB数据库的数据变化（比如新增、修改、删除），并将这些变化数据以流的形式处理，用于实时分析、同步到其他系统等场景。TiDB本身是分布式数据库，而Flink是流处理引擎，两者的结合适合需要高吞吐、低延迟的大规模数据处理场景[7][8]。2.底层原理TiDB侧：通过TiCDC组件（TiDB的变更数据捕获工具）捕获数据变更，类似MyS
Flink CDC 与 SeaTunnel CDC 简单对比窝窝和牛牛 flink 大数据 cdc SeaTunnel
FlinkCDC与SeaTunnelCDC简单对比CDC技术概述变更数据捕获（ChangeDataCapture，简称CDC）是一种用于捕获数据库中数据变更的技术，能够实时识别、捕获并输出数据库中的插入、更新和删除操作。CDC技术在现代数据架构中扮演着至关重要的角色，特别是在实时数据集成、数据同步和事件驱动架构等场景中。CDC的工作原理CDC主要通过以下几种方式捕获数据变更：基于日志的CDC：直接
Oracle SQL 开发实战：高效技巧与核心特性解析 McRfee sql
OracleSQL开发实战：高效技巧与核心特性解析OracleSQL开发实战：高效技巧与核心特性解析一、引言：OracleSQL的核心优势二、高效SQL编写技巧1.避免全表扫描的黄金法则2.用WITH子句简化复杂查询3.MERGE语句实现智能更新三、Oracle独有特性深度解析1.分析函数：窗口计算的利器2.CONNECTBY层级查询3.虚拟列（VirtualColumn）4.FLASHBACK闪
Flink相关面试题努力的搬砖人. 面试 java 后端 flink
以下是150道ApacheFlink面试题及其详细回答，涵盖了Flink的基础知识、核心架构、API使用、性能调优等多个方面，每道题目都尽量详细且简单易懂：Flink基础概念类1.什么是ApacheFlink？ApacheFlink是一个开源的流处理和批处理框架，能够实现快速、可靠、可扩展的大数据处理。它既可以处理无界的数据流，也可以处理有界的数据批，提供了低延迟和高吞吐量的实时数据处理能力。Fl
Spring系列学习之Spring Messaging消息支持 m0_74825488 面试学习路线阿里巴巴 spring linq java
英文原文：https://docs.spring.io/spring-boot/docs/current/reference/html/boot-features-messaging.html目录JMSActiveMQ支持Artemis支持使用JNDIConnectionFactory发送消息接收消息AMQPRabbitMQ支持发送消息接收消息ApacheKafka支持发送消息接收消息Kafka流
HarmonyOS Next～HarmonyOS应用开发工具之AppGallery Connect Bruce_xiaowei 总结经验编程笔记 harmonyos 华为
HarmonyOS应用开发工具之AppGalleryConnect一、AppGalleryConnect概述1.1定位与核心价值AppGalleryConnect（AGC）是华为面向HarmonyOS开发者打造的全生命周期服务平台，作为HarmonyOS应用开发的核心工具链，提供从开发、测试、上架到运营的全流程支持。其核心价值体现在：服务集成化：聚合40+云端服务能力开发效率提升：平均缩短30%开
OpenSSL 3.0.2 报 dh key too small 的问题 aseity 运维经验 git linux ssl svn
问题复现运行命令curl访问一个https网站，可能会出现"dhkeytoosmall"的问题。>curl-v--insecurehttps://some_web_site*Trying175.21.4.7:443...*Connectedtosome_web_site(175.21.4.7)port443(#0)*ALPN:offersh2,http/1.1*TLSv1.3(OUT),TLSha
linux执行python脚本conda库_Pycharm使用远程linux服务器conda/python环境在本地运行的方法(图解）)... weixin_39992462
Pycharm使用远程linux服务器conda/python环境在本地运行的方法(图解))1.首先在PycharmTools->Deployment->Configurations打开新建SFTP输入host:ip地址username密码然后点击TestConnection出现下图，则测试成功因为已经连接成功，这时候已经可以读取远程服务器的目录了：2.选择项目mapping(可以跳过3.在Set
brew mysql client_Mac安装mysqlclient过程解析 weixin_39630440 brew mysql client
尝试在虚拟环境下通过pip安装：pipinstallmysqlclient然后报错：OSError:mysql_confignotfound找到官方文档https://github.com/PyMySQL/mysqlclient-python，解释说安装前需安装另一个模块：brewinstallmysql-connector-c但是报错：查看报错信息，在安装mysql-connector-c前先b
Android Google Pay接入 2401_87017192 android windows
//TheBillingClientisready.Youcanquerypurchaseshere.}}@OverridepublicvoidonBillingServiceDisconnected(){//Trytorestarttheconnectiononthenextrequestto//GooglePlaybycallingthestartConnection()method.}});
MySQL Connector / Python weixin_30369087
MySQLConnector/Python允许Python程序使用符合Python数据库API规范v2.0（PEP249）的API访问MySQL数据库。MySQLConnector/Python包括对以下内容的支持：几乎所有MySQLServer提供的功能都包括MySQLServer版本5.7。Connector/Python8.0也支持XDevAPI。有关使用XDevAPI的MySQLConne
Python 3 介绍（二十二）--mysql-connector-python 小蘑菇二号零基础学 Python--快速入门 Python 快速入门 adb
目录安装mysql-connector-python基本使用示例1.连接到数据库2.插入数据3.更新数据4.删除数据进阶功能1.使用事务2.批量插入数据3.使用字典游标错误处理总结mysql-connector-python是一个用于Python的MySQL数据库驱动程序，它允许Python应用程序与MySQL数据库进行交互。这个驱动程序提供了高级别的API，支持多种Python版本，并且兼容多种
深度学习与目标检测系列(六) 本文约(4.5万字) | 全面解读复现ResNet | Pytorch | 小酒馆燃着灯深度学习目标检测 pytorch 人工智能 ResNet 残差连接残差网络
文章目录解读Abstract—摘要翻译精读主要内容Introduction—介绍翻译精读背景RelatedWork—相关工作ResidualRepresentations—残差表达翻译精读主要内容ShortcutConnections—短路连接翻译精读主要内容DeepResidualLearning—深度残差学习ResidualLearning—残差学习翻译精读ResNet目的以前方法本文改进本质
hdc工具安装、常用命令及使用技巧 MardaWang HarmonyOS NEXT harmonyos 华为
介绍：hdc（OpenHarmonyDeviceConnector）是为开发人员提供的用于设备连接调试的命令行工具，该工具需支持部署在Windows/Linux/Mac等系统上与OpenHarmony设备（或模拟器）进行连接调试通信。简单来讲，hdc是OpenHarmony提供的用于开发人员调试硬件、应用的命令行工具，用在电脑与开发板之间的交互。hdc适用于OpenHarmony应用、硬件开发及测
连接mysql：Error: connect ECONNREFUSED ::1:3306 at TCPConnectWrap mysqlexpress
问题描述笔者把服务器上的node，从14升级到18再次使用express的连接池连接mysql的时候（mysql版本：2.18.1）出现连接不上的报错报错信息如下：Error:connectECONNREFUSED::1:3306atTCPConnectWrap.afterConnect[asoncomplete](node:net:1555:16)--------------------atPr
Java：Apache HttpClient中HttpRoute用法的介绍 netyeaxi Java java apache 开发语言
当使用ApacheHttpClient组件时，经常会用到它的连接池组件。典型的代码如下：PoolingHttpClientConnectionManagerconnectionManager=newPoolingHttpClientConnectionManager();connectionManager.setMaxTotal(httpConfig.getMaxPoolTotal());conn
腾讯云Centos Stream 9 yum源 ☆凡尘清心☆ 腾讯云 centos 云计算
1.CentOS-Stream-BaseOS.repo#CentOS-Stream-BaseOS.repo##ThemirrorlistsystemusestheconnectingIPaddressoftheclientandthe#updatestatusofeachmirrortopickcurrentmirrorsthataregeographically#closetotheclient
通过接收tcp命令实现程序自我重新运行 C++ 老炮儿的技术栈 tcp/ip 网络网络协议
一个用C++实现的示例程序，该程序监听TCP连接，当接收到特定的自定义协议命令（这里是"RESTART"）时，会重新运行自身。#include#include#include#include#include#include#include#include#definePORT12345#defineBUFFER_SIZE1024voidhandle_connection(intsockfd){
网络编程、URI和URL的区别、TCP/IP协议、IP和端口、URLConnection 述雾学java Java核心基础 tcp/ip java java基础网络编程
DAY12.1Java核心基础网络编程在互联网时代，网络在生活中处处可见，javaWeb占据了很大一部分那如何实现javaWeb编程呢？Web编程就是运行在同一个网络下面的终端，使得它们之间可以进行数据传输计算机网络基本知识计算机网络是通过硬件设施，传输媒介把不同物理地址上的计算机网络进行连接，形成一个资源共享和数据传输的网络系统两台终端进行连接需要遵守规定的网络协议语法：数据信息的结构语义：描述
MTK ADSP yyc_audio 嵌入式硬件
MTK音频硬件概念AFE：音频前端硬件audiofrontendhwAFEMEMIF(FE):PCMDMA,memoryread/writeAudiointerconnection:connectionfabricforaudiosubmodule。核心路由器件。负责FE和BE之间的连接和路由。DAI(BE):DigitalAudioI/F,eTDM/I2S/DMIC.–EnhancedTDM,c
Vue3连接SSE，并且返回结果用打字机效果呈现陈琦鹏前端 javascript 前端 vue.js
话不多说直接上代码连接SSEimport{ref,onMounted,onUnmounted}from'vue';constsse=ref()constreconnectAttempts=ref(0)consttimer=ref()onMounted(()=>{initSSE();})onUnmounted(()=>{if(sse.value){sse.value.close();}//清除定时器
安装数据库首次应用 Array_06 java oracle sql
可是为什么再一次失败之后就变成直接跳过那个要求 enter full pathname of java.exe的界面这个java.exe是你的Oracle 11g安装目录中例如：【F:\app\chen\product\11.2.0\dbhome_1\jdk\jre\bin】下的java.exe 。不是你的电脑安装的java jdk下的java.exe！注意第一次，使用SQL D
Weblogic Server Console密码修改和遗忘解决方法 bijian1013 Welogic
在工作中一同事将Weblogic的console的密码忘记了，通过网上查询资料解决，实践整理了一下。一.修改Console密码打开weblogic控制台，安全领域 --> myrealm -->&n
IllegalStateException: Cannot forward a response that is already committed Cwind java Servlets
对于初学者来说，一个常见的误解是：当调用 forward() 或者 sendRedirect() 时控制流将会自动跳出原函数。标题所示错误通常是基于此误解而引起的。示例代码： protected void doPost() { if (someCondition) { sendRedirect(); } forward(); // Thi
基于流的装饰设计模式木zi_鸣设计模式
当想要对已有类的对象进行功能增强时，可以定义一个类，将已有对象传入，基于已有的功能，并提供加强功能。自定义的类成为装饰类模仿BufferedReader，对Reader进行包装，体现装饰设计模式装饰类通常会通过构造方法接受被装饰的对象，并基于被装饰的对象功能，提供更强的功能。装饰模式比继承灵活，避免继承臃肿，降低了类与类之间的关系装饰类因为增强已有对象，具备的功能该
Linux中的uniq命令被触发 linux
Linux命令uniq的作用是过滤重复部分显示文件内容，这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个及以后更多个重复行将被删去，行比较是根据所用字符集的排序序列进行的。该命令加工后的结果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“- ”表示，则从标准输入读取。 AD： uniq [选项] 文件说明：这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个
正则表达式Pattern 肆无忌惮_ Pattern
正则表达式是符合一定规则的表达式，用来专门操作字符串，对字符创进行匹配，切割，替换，获取。例如，我们需要对QQ号码格式进行检验规则是长度6~12位不能0开头只能是数字，我们可以一位一位进行比较，利用parseLong进行判断，或者是用正则表达式来匹配[1-9][0-9]{4,14} 或者 [1-9]\d{4,14} &nbs
Oracle高级查询之OVER (PARTITION BY ..) 知了ing oracle sql
一、rank()/dense_rank() over(partition by ...order by ...) 现在客户有这样一个需求，查询每个部门工资最高的雇员的信息，相信有一定oracle应用知识的同学都能写出下面的SQL语句： select e.ename, e.job, e.sal, e.deptno from scott.emp e, (se
Python调试矮蛋蛋 python pdb
原文地址： http://blog.csdn.net/xuyuefei1988/article/details/19399137 1、下面网上收罗的资料初学者应该够用了，但对比IBM的Python 代码调试技巧： IBM：包括 pdb 模块、利用 PyDev 和 Eclipse 集成进行调试、PyCharm 以及 Debug 日志进行调试： http://www.ibm.com/d
webservice传递自定义对象时函数为空，以及boolean不对应的问题 alleni123 webservice
今天在客户端调用方法 NodeStatus status=iservice.getNodeStatus(). 结果NodeStatus的属性都是null。进行debug之后，发现服务器端返回的确实是有值的对象。后来发现原来是因为在客户端，NodeStatus的setter全部被我删除了。本来是因为逻辑上不需要在客户端使用setter，结果改了之后竟然不能获取带属性值的
java如何干掉指针，又如何巧妙的通过引用来操作指针————>说的就是java指针百合不是茶
C语言的强大在于可以直接操作指针的地址，通过改变指针的地址指向来达到更改地址的目的,又是由于c语言的指针过于强大，初学者很难掌握， java的出现解决了c，c++中指针的问题 java将指针封装在底层，开发人员是不能够去操作指针的地址，但是可以通过引用来间接的操作：定义一个指针p来指向a的地址（&是地址符号）：
Eclipse打不开，提示“An error has occurred.See the log file ***/.log” bijian1013 eclipse
打开eclipse工作目录的\.metadata\.log文件，发现如下错误： !ENTRY org.eclipse.osgi 4 0 2012-09-10 09:28:57.139 !MESSAGE Application error !STACK 1 java.lang.NoClassDefFoundError: org/eclipse/core/resources/IContai
spring aop实例annotation方法实现 bijian1013 java spring AOP annotation
在spring aop实例中我们通过配置xml文件来实现AOP，这里学习使用annotation来实现，使用annotation其实就是指明具体的aspect,pointcut和advice。1.申明一个切面(用一个类来实现)在这个切面里,包括了advice和pointcut AdviceMethods.jav
[Velocity一]Velocity语法基础入门 bit1129 velocity
用户和开发人员参考文档 http://velocity.apache.org/engine/releases/velocity-1.7/developer-guide.html 注释 1.行级注释## 2.多行注释#* *# 变量定义使用$开头的字符串是变量定义，例如$var1, $var2, 赋值使用#set为变量赋值，例
【Kafka十一】关于Kafka的副本管理 bit1129 kafka
1. 关于request.required.acks request.required.acks控制者Producer写请求的什么时候可以确认写成功，默认是0， 0表示即不进行确认即返回。 1表示Leader写成功即返回，此时还没有进行写数据同步到其它Follower Partition中 -1表示根据指定的最少Partition确认后才返回，这个在 Th
lua统计nginx内部变量数据 ronin47 lua nginx　统计
server { listen 80; server_name photo.domain.com; location /{set $str $uri; content_by_lua ' local url = ngx.var.uri local res = ngx.location.capture(
java-11.二叉树中节点的最大距离 bylijinnan java
import java.util.ArrayList; import java.util.List; public class MaxLenInBinTree { /* a. 1 / \ 2 3 / \ / \ 4 5 6 7 max=4 pass "root"
Netty源码学习-ReadTimeoutHandler bylijinnan java netty
ReadTimeoutHandler的实现思路：开启一个定时任务，如果在指定时间内没有接收到消息，则抛出ReadTimeoutException 这个异常的捕获，在开发中，交给跟在ReadTimeoutHandler后面的ChannelHandler，例如 private final ChannelHandler timeoutHandler = new ReadTim
jquery验证上传文件样式及大小(好用) cngolon 文件上传 jquery验证
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <script src="jquery1.8/jquery-1.8.0.
浏览器兼容【转】 cuishikuan css 浏览器 IE
浏览器兼容问题一：不同浏览器的标签默认的外补丁和内补丁不同问题症状：随便写几个标签，不加样式控制的情况下，各自的margin 和padding差异较大。碰到频率:100% 解决方案：CSS里 *{margin:0;padding:0;} 备注：这个是最常见的也是最易解决的一个浏览器兼容性问题，几乎所有的CSS文件开头都会用通配符*来设
Shell特殊变量：Shell $0, $#, $*, $@, $?, $$和命令行参数 daizj shell $#$?特殊变量
前面已经讲到，变量名只能包含数字、字母和下划线，因为某些包含其他字符的变量有特殊含义，这样的变量被称为特殊变量。例如，$ 表示当前Shell进程的ID，即pid，看下面的代码： $echo $$ 运行结果 29949 特殊变量列表变量含义 $0 当前脚本的文件名 $n 传递给脚本或函数的参数。n 是一个数字，表示第几个参数。例如，第一个
程序设计KISS 原则-------KEEP IT SIMPLE, STUPID! dcj3sjt126com unix
翻到一本书，讲到编程一般原则是kiss：Keep It Simple, Stupid.对这个原则深有体会，其实不仅编程如此，而且系统架构也是如此。 KEEP IT SIMPLE, STUPID! 编写只做一件事情，并且要做好的程序；编写可以在一起工作的程序，编写处理文本流的程序，因为这是通用的接口。这就是UNIX哲学.所有的哲学真正的浓缩为一个铁一样的定律，高明的工程师的神圣的“KISS 原
android Activity间List传值 dcj3sjt126com Activity
第一个Activity： import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import android.app.Activity;import android.content.Intent;import android.os.Bundle;import a
tomcat 设置java虚拟机内存 eksliang tomcat 内存设置
转载请出自出处：http://eksliang.iteye.com/blog/2117772 http://eksliang.iteye.com/ 常见的内存溢出有以下两种: java.lang.OutOfMemoryError: PermGen space java.lang.OutOfMemoryError: Java heap space ------------
Android 数据库事务处理 gqdy365 android
使用SQLiteDatabase的beginTransaction()方法可以开启一个事务，程序执行到endTransaction() 方法时会检查事务的标志是否为成功，如果程序执行到endTransaction()之前调用了setTransactionSuccessful() 方法设置事务的标志为成功则提交事务，如果没有调用setTransactionSuccessful() 方法则回滚事务。事
Java 打开浏览器 hw1287789687 打开网址 open浏览器 open browser 打开url 打开浏览器
使用java 语言如何打开浏览器呢? 我们先研究下在cmd窗口中,如何打开网址使用IE 打开 D:\software\bin>cmd /c start iexplore http://hw1287789687.iteye.com/blog/2153709 使用火狐打开 D:\software\bin>cmd /c start firefox http://hw1287789
ReplaceGoogleCDN：将 Google CDN 替换为国内的 Chrome 插件 justjavac chrome Google google api chrome插件
Chrome Web Store 安装地址： https://chrome.google.com/webstore/detail/replace-google-cdn/kpampjmfiopfpkkepbllemkibefkiice 由于众所周知的原因，只需替换一个域名就可以继续使用Google提供的前端公共库了。同样，通过script标记引用这些资源，让网站访问速度瞬间提速吧
进程VS.线程 m635674608 线程
资料来源： http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001397567993007df355a3394da48f0bf14960f0c78753f000 1、Apache最早就是采用多进程模式 2、IIS服务器默认采用多线程模式 3、多进程优缺点优点：多进程模式最大
Linux下安装MemCached 字符串 memcached
前提准备：1. MemCached目前最新版本为：1.4.22，可以从官网下载到。2. MemCached依赖libevent，因此在安装MemCached之前需要先安装libevent。2.1 运行下面命令，查看系统是否已安装libevent。[root@SecurityCheck ~]# rpm -qa|grep libevent libevent-headers-1.4.13-4.el6.n
java设计模式之--jdk动态代理（实现aop编程） Supanccy2013 java DAO 设计模式 AOP
与静态代理类对照的是动态代理类，动态代理类的字节码在程序运行时由Java反射机制动态生成，无需程序员手工编写它的源代码。动态代理类不仅简化了编程工作，而且提高了软件系统的可扩展性，因为Java 反射机制可以生成任意类型的动态代理类。java.lang.reflect 包中的Proxy类和InvocationHandler 接口提供了生成动态代理类的能力。 &
Spring 4.2新特性-对java8默认方法(default method)定义Bean的支持 wiselyman spring 4
2.1 默认方法(default method) java8引入了一个default medthod; 用来扩展已有的接口,在对已有接口的使用不产生任何影响的情况下,添加扩展使用default关键字 Spring 4.2支持加载在默认方法里声明的bean 2.2 将要被声明成bean的类 public class DemoService {