卤蛋x001

flink 1.12 时间语义与WaterMark

一. 在新版本中 flink 默认处理的是事件时间而不是以前默认的处理时间在学习的时候安装新版本步骤容易报错大概的意思就是设置mark 或者将事件类型换成 Processing Time

 @deprecated In Flink 1.12 the default stream time characteristic has been changed to
      *             [[TimeCharacteristic.EventTime]] , thus you don't need to call this method for
      *             enabling event-time support anymore. Explicitly using processing-time windows and
      *             timers works in event-time mode. If you need to disable watermarks, please use
      *             [[org.apache.flink.api.common.ExecutionConfig#setAutoWatermarkInterval(long]]. If
      *             you are using [[TimeCharacteristic.IngestionTime]], please manually set an
      *             appropriate [[WatermarkStrategy]]. If you are using generic "time window"
      *             operations (for example [[KeyedStream.timeWindow()]] that change behaviour based
      *             on the time characteristic, please use equivalent operations that explicitly
      *             specify processing time or event time.

In Flink 1.12 the default stream time characteristic has been changed to [[TimeCharacteristic.EventTime]]
二这里主要是对设置watermark 一些示例代码主要方便像我一样初学者的一些迷惑

  val env = StreamExecutionEnvironment.getExecutionEnvironment
    //   val value = env.socketTextStream("localhost",7777)
    val value = env.addSource(new PerSource)

    env.setRestartStrategy(RestartStrategies.noRestart())
    //每15秒内 每个传感器的最小值
    env.setRestartStrategy(RestartStrategies.noRestart())
    //处理的类型 时流还是批处理  还是自动 建议不要去设置
    // env.setRuntimeMode(RuntimeExecutionMode.AUTOMATIC)
    //这里是设置自动生成水印的时间间隔 因为由于大数据数据量很大所以每一个数据都生成一个水印会浪费性能 况且很多时候一批数据中有很多数据时间是一样的 所以这里都是用周期性的生成水印 默认是200毫秒这里也可以根据自身设定
    env.getConfig.setAutoWatermarkInterval(200L)
    //这里最新的flink 是事件时间为默认项
    //这里就是设置所要处理事件的类型 事件时间 处理时间  数据进入时间 如果是处理时间那么就不需要设置太多因为本身就是自身处理的时间但是出现乱序后 会影响 数据最终的准确性
   // env.setStreamTimeCharacteristic(TimeCharacteristic.ProcessingTime) //处理时间
    val value1 = value
      //必须加上 flink
		//这里就是分配时间戳和水印了  分配时间戳的意思就是 此次处理数据是按照哪个字段为时间 来进行处理 而 水印就是延迟时间去关闭桶 这里有很多设置一般都是使用过 flink自己封装好的方法  比如BoundedOutOfOrdernessTimestampExtractor
      /*.assignTimestampsAndWatermarks(new timestamps.BoundedOutOfOrdernessTimestampExtractor[SensorReading](Time.seconds(1)) {
        override def extractTimestamp(element: SensorReading): Long = {
          element.timestamp
        }
      })*/
      // .assignTimestampsAndWatermarks(new waterMarkDeom(Time.seconds(3)))
     //如果使用最新的会发现 上面的使用方式 已经被标记了 推荐是用过 WatermarkStrategy 水印的策略 来进行设置 ， 这里 flink 也封装了三个方法 为我们所用1）1）1)forBoundedOutOfOrderness 就是平时用的有界输出数据 2）.forMonotonousTimestamps()自增长输出 这里自增长大概意思就是事件时间没有乱序都是正确的 不需要去设置水印（有不对的地方欢迎指正 目前也是正在学习） 3） noWatermarks 这个就不用翻译了大家都懂 然后需要在后面添加事件时间的取自哪个字段也是 flink自己封装的方法.withTimestampAssigner 时间戳分配器 其中有两个重写的方法 一个是添加 SerializableTimestampAssigner 另一个 TimestampAssignerSupplier 这里我只用了第一个第二个没有研究 等有懂的大佬 来评论告诉下 然后 最后还一个.withIdleness(Duration.ofMillis(1))) 这个方法可添加也可以不添加 就不会影响启动了 翻译的大概意思是就是flink 为分布式 处理流式框架 在由上游数据发送下游的时候需要等到所有分区的数据到达后 以最后的数据到达时间为时间但是有可能出现超时会影响下一步操作所以这个配置了之后大概的意思是保留空闲分区的时间之后将不会影响向下游广播 数据操作流程
     .assignTimestampsAndWatermarks(WatermarkStrategy.forBoundedOutOfOrderness(Duration.ofMillis(1 )).withTimestampAssigner(new SerializableTimestampAssigner[SensorReading]() {
         override def extractTimestamp(element: SensorReading, recordTimestamp: Long): Long = {
           element.timestamp*1000L
         }
       }).withIdleness(Duration.ofMillis(1)))
        /*.assignTimestampsAndWatermarks(WatermarkStrategy.forMonotonousTimestamps().withTimestampAssigner(new SerializableTimestampAssigner[SensorReading]() {
          override def extractTimestamp(element: SensorReading, recordTimestamp: Long): Long = {
            element.timestamp*1000L
          }
        }))*/
      /*.assignTimestampsAndWatermarks(WatermarkStrategy.forGenerator(new waterMarkStrategyDemo).withTimestampAssigner(new SerializableTimestampAssigner[SensorReading] {
        override def extractTimestamp(element: SensorReading, recordTimestamp: Long): Long = {
          element.timestamp
        }
      }).withIdleness(Duration.ofSeconds(1)))*/
      //WatermarkStrategy.forGenerator(new waterMarkStrategyDemo)
    /*  .assignTimestampsAndWatermarks(WatermarkStrategy.forGenerator(new waterMarkStrategyDemo)withTimestampAssigner(new SerializableTimestampAssigner[SensorReading] {
        override def extractTimestamp(element: SensorReading, recordTimestamp: Long): Long = {
          element.timestamp
        }
      }))*/
     /* .assignTimestampsAndWatermarks(WatermarkStrategy.forMonotonousTimestamps().withTimestampAssigner((new SerializableTimestampAssigner[SensorReading]() {
        override def extractTimestamp(element: SensorReading, recordTimestamp: Long): Long = {
          element.timestamp
        }
      })))*/
     //排好序的升序的 数据 来的时间 不用定义watermark 数据没有乱序
       //.assignAscendingTimestamps(x=>x.timestamp*1000)
      .keyBy(_.id)
      //.timeWindow(Time.seconds(12)).reduce((x, y) => x)
      //滚动窗口 头尾相接、
      .timeWindow(Time.seconds(1))
      //这个设置时允许时间窗口处理过后 保留窗口的时间 大概的意思比如 0-1秒的窗口操作了但是保留1毫秒 然后在这1毫秒内 如果还有0-1秒的数据到来也会参与到数据的操作
      .allowedLateness(Time.milliseconds(1))
      //.aggregate(AggregationType.MAX,2)
      //输出哪个数据延迟到来 这就是将保留窗口 都已经关闭了 0-1秒的数据 来了 就会进入到这里测流输出 在之后可用value1.getSideOutput(new OutputTag[SensorReading]("later")) 接住 然后 可以在处理比如 发送到一个 延迟数据 topic 然后 跟以前的业务数据 操作 来避免数据丢失 比如最小值 那么跟 最新的数据取比对 如果 比最新的数据要小 那么就更新如果不是 就可以抛弃了
      .sideOutputLateData(new OutputTag[SensorReading]("later"))
      //.window(TumblingProcessingTimeWindows.of(Time.seconds(1)))//滑动时间窗口
      // .window(SlidingEventTimeWindows.of(Time.seconds(10), Time.seconds(5)))

     .reduce((x, y) => x)
    //.window(EventTimeSessionWindows.withGap(Time.seconds(1)))//会话时间窗口  1s进来的都算一个桶
    // .timeWindow()准备弃除
    //  .countWindow(10)
    // .trigger(new sw)
    // .evictor(new sa)
    // .allowedLateness(Time.seconds(1))
    // .sideOutputLateData(new OutputTag("ds"))
    // unit.getSideOutput(new OutputTag("ds"))
    value1.print("ok")
    val value2: DataStream[SensorReading] = value1.getSideOutput(new OutputTag[SensorReading]("later"))

    env.execute("ss ss")

四 flinksql 创建事件时间

flinksql 添加水印 wartermark

第一如果是时间戳类型可以直接使用TIMESTAMP 类型
给的是日期可以用 varchar() 类型然后用 TO_TIMESTAMP() 类型去转换

           """|CREATE TABLE file (
              |id varchar(20) not null,
              |ts bigint,
              |pt varchar(20),    --如果是时间戳 可以用 TIMESTAMP 类型
              |KS AS TO_TIMESTAMP(pt), --如果使用 TIMESTAMP 类型 这里可以省略 直接吧 pt当成事件时间 WATERMARK FOR pt AS pt - INTERVAL '5' SECOND 
              |WATERMARK FOR KS AS KS - INTERVAL '5' SECOND
              |)
              | with
              |(
              |  'connector' = 'filesystem',
              |  'path' = 'C:\\Users\\zhou\\IdeaProjects\\flinktable\\conf\\input.txt',
              |  'format' = 'csv'
              |)
              |
              |""".stripMargin

flink Table 流处理添加事件时间一定要添加水印指定谁是事件时间

val value: DataStream[String] = env.readTextFile("C:\\Users\\zhou\\IdeaProjects\\flinktable\\conf\\input.txt")
     val unit = value.map(x => {
       val strings = x.split(",")
       Demo(strings(0), strings(1).toInt, strings(2).toLong)
     }
       //打水印 时间时间
     ).assignTimestampsAndWatermarks(WatermarkStrategy.forBoundedOutOfOrderness(Duration.ofMillis(1)).withTimestampAssigner(new SerializableTimestampAssigner[Demo]() {
       override def extractTimestamp(element: Demo, recordTimestamp: Long): Long = {
         element.timeStr
       }
       //指定两个方式的时间时间 timeStr 我的 时间戳本身就是毫秒的所以不用乘 1000L 
//bsTableEnv.fromDataStream(unit,'id,'age,'timeStr,'pt.proctime())
  val table: Table = bsTableEnv.fromDataStream(unit, 'id, 'age, 'timeStr.rowtime)

五 Group Windows （分组窗口）

- Group Windows 使用 windows （w:GroupWindow）子句定义的，并且必须由 as  子句指定一个别名

- 为了按窗口对表分组，窗口的别名必须在group by 子句中 像常规的分组字段一段引用

// table  api
 input.window([w:GroupWindow] as 'w') // 定于窗口 例如 滑动 或者滚动 别名 w
.groupBy(`w,`a) // 按照字段a 和窗口 w 分组
.select('a,'b.sum) //聚合
//滚动窗口要用Tumble 类定义
// 
.window(Tumble over 10.minutes on `rowtime as ` w) //rowtime  proctime 是定义好的事件时间或者处理时间的字段名称替换
// 处理时间
.window(Tumble over 10.minutes on `proctime as ` w)
// Row-count  Window  滚动是的计数窗口 处理时间
.window(Tumble over 10.rows on `proctime as ` w)

// 滑动窗口 Slide 
.window(Slide over 10.minutes every  5.minutes on `rowtime as ` w)
}

    - Table Api 提供了一组具有特定语句的预定义的window 类 这些类会被转化为底层 DataStream 或者 DataSet 的窗口操作

//sql 
// Group Windows 定义在 SQL中查询Group BY 子句中 
TUMBLE( time_attr,interval) --第一个蚕食是时间字段 第二个参数时间是长度 （滚动）
HOP( time_attr,interval,interval) --第一个蚕食是时间字段 第二个参数滑动步长 第三个参数是窗口长度   (滑动)

  
 import java.time.Duration
 
 import akka.stream.actor.WatermarkRequestStrategy
 import com.ibm.icu.impl.locale.LocaleDistance.Data
 import org.apache.flink.api.common.eventtime._
 import org.apache.flink.streaming.api.TimeCharacteristic
 import org.apache.flink.streaming.api.scala._
 import org.apache.flink.streaming.api.windowing.assigners.TumblingEventTimeWindows
 import org.apache.flink.streaming.api.windowing.time.Time
 import org.apache.flink.table.api._
 import org.apache.flink.table.api.bridge.scala._
 import org.apache.flink.table.descriptors.{Csv, FileSystem, Rowtime, Schema}
 import org.apache.flink.types.Row
 import ru.yandex.clickhouse.ClickHouseArray
 
 
 
 object flinkSql {
   def main(args: Array[String]): Unit = {
     val env = StreamExecutionEnvironment.getExecutionEnvironment
 
     val bsSettings = EnvironmentSettings.newInstance().useBlinkPlanner().inStreamingMode().build()
     //  env.setStreamTimeCharacteristic(TimeCharacteristic.ProcessingTime)
     val bsTableEnv = StreamTableEnvironment.create(env, bsSettings)
 /*
01,23,1621412815000
03,21,1621412820000
01,32,1621412825000
02,42,1621412835000
02,23,1621412845000
01,42,1621412855000
03,24,1621412915000
02,21,1621412825000
03,53,1621412835000

*/
      val value: DataStream[String] = env.readTextFile("C:\\Users\\zhou\\IdeaProjects\\flinktable\\conf\\input.txt")
      val unit = value.map(x => {
        val strings = x.split(",")
        Demo(strings(0), strings(1).toInt, strings(2).toLong)
      }
        //打水印 时间时间
      ).assignTimestampsAndWatermarks(WatermarkStrategy.forBoundedOutOfOrderness(Duration.ofMillis(1)).withTimestampAssigner(new SerializableTimestampAssigner[Demo]() {
        override def extractTimestamp(element: Demo, recordTimestamp: Long): Long = {
          element.timeStr
        }
      }))
//table api
     val table: Table = bsTableEnv.fromDataStream(unit, 'id, 'age, 'timeStr.rowtime)
     val table1 = table.window(Tumble over 5.minutes()  on 'timeStr as 'w).groupBy('w,'id).select('id,'age.sum() as 'was)
     table1.toAppendStream[Row].print("s")
     env.execute("ssss")
/*
input 
01,23,2021-05-05 00:01:00
03,21,2021-05-05 00:01:05
01,32,2021-05-05 00:01:07
02,42,2021-05-05 00:01:10
02,23,2021-05-05 00:01:12
01,42,2021-05-05 00:01:15
03,24,2021-05-05 00:01:20
02,21,2021-05-05 00:01:21
03,53,2021-05-05 00:01:22

*/

//sql     
     bsTableEnv.executeSql(
       """
         |CREATE TABLE file (
         |id varchar(20) not null,
         |ts bigint,
         |pt varchar(20),    --如果是时间戳 可以用 TIMESTAMP 类型
         |KS AS TO_TIMESTAMP(pt),
         |WATERMARK FOR KS AS KS - INTERVAL '5' SECOND
 
         |)
         | with
         |(
         |  'connector' = 'filesystem',
         |  'path' = 'C:\\Users\\zhou\\IdeaProjects\\flinktable\\conf\\input.txt',
         |  'format' = 'csv'
         |)
         |
         |""".stripMargin)
     bsTableEnv.executeSql(
       """
         |CREATE TABLE fileout (
         |id varchar(20) not null,
         |ts bigint
         |)
         | with
         |(
         |  'connector' = 'print'
         |)
         |
         |""".stripMargin)
     bsTableEnv.executeSql("insert into fileout select id,sum(ts) from file  group by id ,tumble(KS,interval '30' second) ")
  
 
   }
 }
 
 case class Demo(id: String, age: Int, timeStr: Long)

五 Over Windows （分组窗口）

Over Window 聚合是标准SQL中已有的（over子句），可以在查询的SELECT 子句中定义
Over window 聚合会针对每个输入行机选相邻范围内的聚合
Over windows 使用window（w:overwindow*）子句定义并在select () 方法中通过别名来引用

// table  api
input.window([w:OverWindow] as 'w') 
.select('a,'b.sum over 'w)

Table API 提供了Over类，来配置Over窗口的属性
无界Over Window
1. 可以在事件时间或处理时间以及指定为为时间间隔或行计数范围内，定义Over Windows
2. 无界 over window 是使用常量指定的
// 无界的事件时间 over window
.window(Over partitionBy 'a orderBy 'rowtime preceding UNBOUNDED_RANGE as ’ w )
//无界的处理时间 over window
.window(Over partitionBy 'a orderBy 'proctime preceding UNBOUNDED_RANGE as ’ w )
//无界的事件时间 Row-count over window
.window(Over partitionBy 'a orderBy 'rowtime preceding UNBOUNDED_ROW as ’ w )
//无界的处理时间 Row-count over window
.window(Over partitionBy 'a orderBy 'proctime preceding UNBOUNDED_ROW as ’ w )

import java.time.Duration

import akka.stream.actor.WatermarkRequestStrategy
import com.ibm.icu.impl.locale.LocaleDistance.Data
import org.apache.flink.api.common.eventtime._
import org.apache.flink.streaming.api.TimeCharacteristic
import org.apache.flink.streaming.api.scala._
import org.apache.flink.streaming.api.windowing.assigners.TumblingEventTimeWindows
import org.apache.flink.streaming.api.windowing.time.Time
import org.apache.flink.table.api._
import org.apache.flink.table.api.bridge.scala._
import org.apache.flink.table.descriptors.{Csv, FileSystem, Rowtime, Schema}
import org.apache.flink.types.Row
import ru.yandex.clickhouse.ClickHouseArray



object flinkSql {
  def main(args: Array[String]): Unit = {
    val env = StreamExecutionEnvironment.getExecutionEnvironment

    val bsSettings = EnvironmentSettings.newInstance().useBlinkPlanner().inStreamingMode().build()
    //  env.setStreamTimeCharacteristic(TimeCharacteristic.ProcessingTime)
    val bsTableEnv = StreamTableEnvironment.create(env, bsSettings)

     val value: DataStream[String] = env.readTextFile("C:\\Users\\zhou\\IdeaProjects\\flinktable\\conf\\inputONE.txt")
     val unit = value.map(x => {
       val strings = x.split(",")
       Demo(strings(0), strings(1).toInt, strings(2).toLong)
     }
       //打水印 时间时间
     ).assignTimestampsAndWatermarks(WatermarkStrategy.forBoundedOutOfOrderness(Duration.ofMillis(1)).withTimestampAssigner(new SerializableTimestampAssigner[Demo]() {
       override def extractTimestamp(element: Demo, recordTimestamp: Long): Long = {
         element.timeStr
       }
     }))
    val table: Table = bsTableEnv.fromDataStream(unit, 'id, 'age, 'timeStr.rowtime)
  //Over Window---------------------

    //SQL
    bsTableEnv.executeSql(
      """
        |CREATE TABLE file (
        |id varchar(20) not null,
        |ts bigint,
        |pt varchar(20),    --如果是时间戳 可以用 TIMESTAMP 类型
        |KS AS TO_TIMESTAMP(pt),
        |WATERMARK FOR KS AS KS - INTERVAL '5' SECOND

        |)
        | with
        |(
        |  'connector' = 'filesystem',
        |  'path' = 'C:\Users\zhou\IdeaProjects\flinktable\conf\input.txt',
        |  'format' = 'csv'
        |)
        |
        |""".stripMargin)
    bsTableEnv.executeSql(
      """
        |CREATE TABLE fileout (
        |id varchar(20) not null,
        |ts bigint
        |)
        | with
        |(
        |  'connector' = 'print'
        |)
        |
        |""".stripMargin)

    bsTableEnv.executeSql(
      """insert into fileout
        |select id,sum(ts)  over ow from file
        |window ow as
        |( partition by id order by KS rows between 2 preceding and current row )""".stripMargin)
    // Table API -------------------------------
   /* val table1 = table.window(Over partitionBy 'id orderBy 'timeStr preceding UNBOUNDED_RANGE as 'w).select('id,'age.sum() over  'w ,'timeStr)
    table1.toAppendStream[Row].print("s")
    env.execute("over ")*/
  }
}

case class Demo(id: String, age: Int, timeStr: Long)

C语言笔记 - 模运算符（%）的用法 UkjUnity c语言笔记算法 C语言
在C语言中，模运算符（%）是一种常见的运算符，用于计算两个整数相除后得到的余数。它的使用非常简单，但在实际的编程中有很多有用的应用场景。本文将详细介绍模运算符的用法，并提供一些相关的源代码示例。基本用法模运算符采用百分号（%）表示，它的作用是计算两个整数相除后的余数。例如，表达式"10%3"将返回1，因为10除以3的余数是1。下面是一个基本示例：#includeintmain(){intdivid
Semtech 新的3.3V TVS RClamp3374N 在以太网上的雷击防护应用 _Nickelback
作者:JackChengSemtech上网日期:2012年04月16日评论[0]分享到:新浪微博qq空间qq微博人人网百度搜藏字号：关键字：RClamp2574NSemtech浪涌Semtech新的3.3VTVSRClamp3374N保护八线介绍Semtech的RClamp2574N可以被配置以保护高达8个高速线（四对线）应用，如机顶盒，服务器，笔记本，和台式电脑。这些应用通常不需要同一水平的闪电
Docker技术全景解析：从核心原理到实践应用 Liudef06小白 docker 容器运维
Docker技术全景解析：从核心原理到实践应用引言：容器化革命的引擎2013年诞生的Docker并非容器技术的发明者，却成功地将Linux容器（LXC）这一底层技术转化为开发者友好的标准化工具。它通过镜像封装、环境一致性和资源隔离三大创新，解决了“在我机器上能跑，线上为什么不行”这一行业顽疾。Docker的核心突破在于创建了跨环境的应用交付标准——开发者构建的Docker镜像可在开发笔记本、测试服
python笔记-Selenium谷歌浏览器驱动下载 hero.zhong python 笔记 selenium
Selenium谷歌浏览器驱动下载地址：https://googlechromelabs.github.io/chrome-for-testing/#stable下面是遇到的问题：python网络爬虫技术中使用谷歌浏览器代码，报错：OSError:[WinError193]%1不是有效的Win32应用程序：遇到错误OSError:[WinError193]%1不是有效的Win32应用程序通常意味着
Pixhawk源码笔记五：存储与EEPROM管理 zhouxinlin2009
这里，我们对APMEEPROM存储接口进行讲解。如有问题，可以交流[email protected]。新浪@WalkAnt，转载本博客文章，请注明出处，以便更大范围的交流，谢谢。第六部分存储与EEPROM管理详细参考：http://dev.ardupilot.com/wiki/learning-ardupilot-storage-and-eeprom-management/用户参数、航点、集结点、地图
【ESP32最全学习笔记（基础篇）——7.ESP32 ADC – 使用 Arduino IDE 读取模拟值】「已注销」 ESP32学习笔记学习 ESP32 单片机嵌入式硬件 Arduino
关于本教程：ESP32基础篇1.ESP32简介2.ESP32Arduino集成开发环境3.VS代码和PlatformIO4.ESP32引脚5.ESP32输入输出6.ESP32脉宽调制7.ESP32模拟输入☑8.ESP32中断定时器9.ESP32深度睡眠
【Unity笔记02】订阅事件-自动开门
流程当玩家移动到触发区域的时候，门自动打开事件系统usingSystem;usingSystem.Collections;usingSystem.Collections.Generic;usingUnityEngine;publicclassEventSystem:MonoBehaviour{publicstaticEventSystemInstance{get;privateset;}publi
Golang基础笔记九之方法与接口后端go方法接口类型判断
本文首发于公众号：Hunter后端原文链接：Golang基础笔记九之方法与接口本篇笔记介绍Golang里方法和接口，以下是本篇笔记目录：方法接口用结构体实现类的功能1、方法首先介绍一下方法。方法是与特定类型关联的函数，我们在实现一个函数前，绑定一个类型，就实现了这个类型的方法。比如我们想实现一个结构体的方法，可以如下操作：typePersonstruct{ Namestring Age int
如何在YashanDB中实现多级缓存策略数据库
随着大数据时代的到来，数据存储和访问的效率要求越来越高。数据库技术在面对海量数据、高并发访问时，性能瓶颈逐渐凸显，尤其是响应时间和系统吞吐量成为开发者和DBA关注的重点。为了解决这些问题，缓存策略被引入作为一种有效的解决方案。然而，不同类型的缓存（如内存缓存、磁盘缓存等）之间需要协调工作，以达到最佳性能。在此背景下，YashanDB作为一个云原生数据库，支持多级缓存策略，为数据访问提供了灵活的加速
设计模式笔记_创建型_工厂模式
1.工厂模式简介工厂模式是一种创建型设计模式，主要用于创建对象实例。它通过定义一个接口或抽象类来创建对象，而不是直接实例化具体类，从而将对象的创建过程与使用过程分离。工厂模式通常分为两种类型：简单工厂模式（SimpleFactory）：这种模式并不是GoF设计模式之一，但在实际应用中非常常见。简单工厂模式通过一个工厂类来负责创建对象，根据传入的参数的不同，返回不同类型的实例。工厂方法模式（Fact
TypeReference解决Fastjson反序列化时泛型擦除问题-笔记饕餮争锋笔记 java
com.alibaba.fastjson.TypeReference是Fastjson库中的一个泛型类型引用类，主要用于解决Java泛型在运行时类型擦除的问题。它使得在反序列化JSON数据时能够保留完整的泛型类型信息（如List,Map等），确保数据被正确解析为预期的复杂类型。TypeReference是一个抽象类，我们通常通过创建一个匿名内部类来使用它(例如newTypeReference(){
Python爬虫笔记汇总大厂_jvS python 爬虫笔记
except:print(“爬取失败”)4.网络图片爬取及存储#实例4：爬取图片‘’‘r.content#表示返回内容的二进制格式’‘’importrequestsimportosroot=‘./Pic/’path=root+url.split(‘/’)[-1].split(‘@’)[0]url=‘http://img0.dili360.com/ga/M00/02/AB/wKgBzFQ26i2AW
爬虫的笔记整理咸鱼时日翻身爬虫笔记
网络爬虫首先要认识http和https协议在浏览器中发送一个http请求：1.输入一个URL地址之后，向http服务器发送请求，主要分为GET和POST两种方法2.输入URL之后，发送一个request请求，这时候服务器把response文件对象发送回浏览器3.浏览器中解析返回的HTML，其中引用了许多的其他文件，images，css文件，JS文件等，再次法中request去获取这些内容4.所有的
2024年最全kali无线渗透之用wps加密模式可破解wpa模式的密码12_kali wps，网络安全开发究竟该如何学习 2401_84558314 程序员 wps web安全学习
一、网安学习成长路线图网安所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。二、网安视频合集观看零基础学习视频，看视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。三、精品网安学习书籍当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔
计算机网络（网页显示过程，TCP三次握手，HTTP1.0，1.1，2.0，3.0，JWT cookie）老虎0627 计算机网络计算机网络 tcp/ip 网络协议
前言最近一直在看后端开发的面经，里面涉及到了好多计算机网络的知识，在这里以问题的形式写一个学习笔记（其中参考了:JavaGuide和小林coding这两个很好的学习网站）1.当键入网址后，到网页显示，其间发生了什么？（1）首先浏览器会解析URL。（如确定协议像Http或Https）（2）然后通过DNS服务器把域名解析为IP地址。（找到服务器啦）（3）接着TCP协议三次握手和服务器建立连接。（客户端
蛋白质结构预测/功能注释/交互识别/按需设计，中国海洋大学张树刚团队直击蛋白质智能计算核心任务 hyperai
蛋白质作为生命活动的主要承担者，在人体生理功能中扮演关键角色。然而传统研究面临结构解析成本高昂、功能注释严重滞后、新型蛋白质设计效率低下等挑战。近年来，生命科学对蛋白质复杂特性解析的需求日益迫切，大数据、深度学习、多模态计算等技术的突破性发展，为构建蛋白质智能计算体系提供了全新的发展契机。蛋白质智能计算体系的构建，使得蛋白质在大规模功能注释、交互预测及三维结构建模等领域取得显著成果，为药物发现与生
自然语言处理-基于预训练模型的方法-笔记
自然语言处理-基于预训练模型的方法-笔记【下载地址】自然语言处理-基于预训练模型的方法-笔记《自然语言处理-基于预训练模型的方法》由哈尔滨工业大学出版，深入探讨了NLP领域的前沿技术与预训练模型的应用。本书系统介绍了预训练模型的基本概念、发展历程及常见模型的原理，并通过丰富的实践案例与代码实现，帮助读者掌握这些技术在自然语言处理任务中的实际应用。无论是初学者、研发人员，还是希望提升NLP能力的研究
PyQt5—QTextEdit 学习笔记寄思～ Python——PyQt5笔记 qt 学习笔记 python
第二章控件学习一、QTextEdit基础认知QTextEdit是PyQt/PySide框架中用于处理富文本内容的强大控件，它不仅支持纯文本编辑，还能处理HTML、图片等复杂内容，是开发文本编辑器、日志查看器等应用的核心组件。二、最简单的QTextEdit实现下面是一个创建QTextEdit并显示的基础案例，适合零基础入门：importsysfromPyQt5.QtWidgetsimportQApp
管理大数据存储的十大技巧 weixin_34238633 大数据数据库运维
在1990年，每一台应用服务器都倾向拥有直连式系统(DAS)。SAN的构建则是为了更大的规模和更高的效率提供共享的池存储。Hadoop已经逆转了这一趋势回归DAS。每一个Hadoop集群都拥有自身的——虽然是横向扩展型——直连式存储，这有助于Hadoop管理数据本地化，但也放弃了共享存储的规模和效率。如果你拥有多个实例或Hadoop发行版，那么你就将得到多个横向扩展的存储集群。而我们所遇到的最大挑
陈强《计量经济学及Stata应用》学习笔记——持续更新 WangSoooCute 学习笔记
1导论1.1什么是计量经济学econometrics几种关系：相关关系、因果关系、逆向因果关系reversecausality、双向因果关系被解释变量dependentvariable解释变量explanatoryvariable=regressor=自变量independentvariable=协变量covariateunobservable的误差项errorterm=随机扰动项stochast
【计算机毕业设计】基于Springboot的办公用品管理系统+LW 枫叶学长(专业接毕设) Java毕业设计实战案例课程设计 spring boot 后端
博主介绍：✌全网粉丝3W+,csdn特邀作者、CSDN新星计划导师、Java领域优质创作者,掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等设计与开发。主要内容：
医咖会免费STATA教程学习笔记——单因素方差分析 Unacandoit stata 单因素方差分析
单因素方差分析和单因素回归分析相同1.单因素方差分析需要满足的假设：（1）因变量为连续变量（2）至少有一个分类变量（大于等于2类）（3）观测值相互独立（4）没有异常值（5）服从正态分布（6）方差齐性2.准备工作（1）导入数据集：webusesystolic,clear（2）检验是否存在异常值：方法一：图形——箱线图——在变量中选择systolic——确定方法二：grahboxsystolic,ov
Java NIO 模型笔记笑衬人心。 JAVA学习笔记 java nio 笔记
目录JavaNIO概述JavaBIOvsNIONIO三大核心组件Channel（通道）Buffer（缓冲区）Selector（选择器）Channel详解Buffer详解Selector详解NIO工作流程图示例代码讲解NIO模型的优缺点NIO与Netty简介总结JavaNIO概述JavaNIO（NewI/O）是从Java1.4开始引入的一套新的I/OAPI。主要用于构建高性能、高并发的网络通信程序。
解决部分机型浏览器使用pdf.js 出现 undefined is not an object(evaluating ‘response.body.getReader‘) 报错问题 HHH 917 pdf javascript pdf 前端
问题undefinedisnotanobject(evaluating‘response.body.getReader’)参考小王子的笔记本的技术博客仔细分析源码后发现，PDFjs的getDocument方法不仅可以接收URL作为参数，还可以接收多种类型：而fetch方法返回的Response对象恰恰拥有arrayBuffer方法，可以将数据转为ArrayBuffer对象解决PDF.getDocu
SVN笔记之SVN启动模式
SVN开源代码的版本控制系统一、生命周期创建版本库→检出→更新→执行变更→复查变化→修复错误→解决冲突→提交更改二、SVN启动模式首先,在服务端进行SVN版本库的相关配置手动新建版本库目录mkdir/opt/svn利用svn命令创建版本库svnadmincreate/opt/svn/runoob使用命令svnserve启动服务svnserve-d-r目录--listen-port端口-r:配置方式
subversion安装、备份、安全认证实践笔记——宋轶聪 etune subversion svn apache tortoisesvn 工作存储
在windows上配置svn的方法在linux10.117.100.130上安装svnsvn库的导入导出查看svn服务器版本SVN备份策略Svn服务配置和维护常用命令linux下启动和停止win下启动和停止svn把svn加为系统服务配置apache通过http访问svnsvn命令行====================================在windows上的配置方法=========
STM32 开发笔记：从环境搭建到任务调度嵌入式的小萌新 stm32 笔记嵌入式硬件
今天体验了一把augment确实好用，记录一下STM32开发笔记：从环境搭建到任务调度️环境准备必需工具STM32CubeMX：图形化配置工具，用于初始化MCU外设和生成基础代码STM32CubeCLT：包含编译工具链（arm-none-eabi-gcc）和烧录工具（STM32_Programmer_CLI）CMake：跨平台构建系统，用于管理项目编译流程OpenOCD：开源调试器（可选，用于DA
Hadoop核心组件最全介绍 Cachel wood 大数据开发 hadoop 大数据分布式 spark 数据库计算机网络
文章目录一、Hadoop核心组件1.HDFS(HadoopDistributedFileSystem)2.YARN(YetAnotherResourceNegotiator)3.MapReduce二、数据存储与管理1.HBase2.Hive3.HCatalog4.Phoenix三、数据处理与计算1.Spark2.Flink3.Tez4.Storm5.Presto6.Impala四、资源调度与集群管
【机器学习笔记 Ⅱ】11 决策树模型巴伦是只猫机器学习机器学习笔记决策树
决策树模型（DecisionTree）详解决策树是一种树形结构的监督学习模型，通过一系列规则对数据进行分类或回归。其核心思想是模仿人类决策过程，通过不断提问（基于特征划分）逐步逼近答案。1.核心概念节点类型：根节点：起始问题（最佳特征划分点）。内部节点：中间决策步骤（特征判断）。叶节点：最终预测结果（类别或数值）。分支：对应特征的取值或条件判断（如“年龄≥30？”）。2.构建决策树的关键步骤(1)
【机器学习笔记 Ⅱ】10 完整周期
机器学习的完整生命周期（End-to-EndPipeline）机器学习的完整周期涵盖从问题定义到模型部署的全过程，以下是系统化的步骤分解和关键要点：1.问题定义（ProblemDefinition）目标：明确业务需求与机器学习任务的匹配性。关键问题：这是分类、回归、聚类还是强化学习问题？成功的标准是什么？（如准确率>90%、降低10%成本）输出：项目目标文档（含评估指标）。2.数据收集（DataC
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

flink 1.12 时间语义与WaterMark

五 Group Windows （分组窗口）

五 Over Windows （分组窗口）

你可能感兴趣的:(笔记,大数据,flink)