langzitianya

Flink学习笔记(二)

以下笔记基于对尚硅谷Java版Flink(2020版)的学习,Flink版本1.10

目录

Flink中的Window

Window概述

Window类型

滚动窗口(Tumbling Windows)

滑动窗口(Sliding Windows)

会话窗口(Session Windows)

全局窗口(global window)

Window API

时间语义与Wartermark

Flink中的时间语义

EventTime的引入

Watermark基本概念

Watermark的引入

窗口迟到数据的三种处理方法

Flink中的Window

Window概述

streaming流式计算是一种被设计用于处理无限数据集的数据处理引擎，无限数据集是指一种不断增长的本质上无限的数据集，而window是一种切割无限数据为有限块进行处理的手段。
Window是无限数据流处理的核心，Window将一个无限的stream拆分成有限大小的“buckets”桶，我们可以在这些桶上做计算操作。

Window类型

时间窗口(TimeWindow)：滚动时间窗口，滑动时间窗口，会话窗口
计数窗口(CountWindow)：滚动计数窗口，滑动计数窗口

滚动窗口(Tumbling Windows)

将数据依据固定的窗口长度对数据进行切片
特点：时间对齐，窗口长度固定，没有重叠
滚动窗口分配器将每个元素分配到一个指定窗口大小的窗口中，滚动窗口有一个固定的大小，并且不会出现重叠。
适用场景：适合做BI统计等（做每个时间段的聚合计算）

滑动窗口(Sliding Windows)

滑动窗口是固定窗口的更广义的一种形式，滑动窗口由固定的窗口长度和滑动间隔组成
特点：时间对齐，窗口长度固定，可以有重叠
滑动窗口分配器将元素分配到固定长度的窗口中，与滚动窗口类似，窗口的大小由窗口大小参数来配置，另一个窗口滑动参数控制滑动窗口开始的频率。因此，滑动窗口如果滑动参数小于窗口大小的话，窗口是可以重叠的，在这种情况下元素会被分配到多个窗口中
适用场景：对最近一个时间段内的统计（求某接口最近5min的失败率来决定是否要报警）

会话窗口(Session Windows)

由一系列事件组合一个指定时间长度的timeout间隙组成，类似于web应用的session，也就是一段时间没有接收到新数据就会生成新的窗口
特点：时间无对齐
session窗口分配器通过session活动来对元素进行分组，session窗口跟滚动窗口和滑动窗口相比，不会有重叠和固定的开始时间和结束时间的情况，相反，当它在一个固定的时间周期内不再收到元素，即非活动间隔产生，那个这个窗口就会关闭
一个session窗口通过一个session间隔来配置，这个session间隔定义了非活跃周期的长度，当这个非活跃周期产生，那么当前的session将关闭并且后续的元素将被分配到新的session窗口中去

全局窗口(global window)

Window API

// 对全数据开窗，会造成并行度变成1，不建议使用
dataStream.windowAll(WindowAssigner assigner)

// 分组流开窗，返回WindowedStream
keyedStream.window(WindowAssigner assigner)
  // 基于事件时间的滚动时间窗口：
  //   TumblingEventTimeWindows.of(Time size)
  //   TumblingEventTimeWindows.of(Time size, Time offset)
  // 基于处理时间的滚动时间窗口：
  //   TumblingProcessingTimeWindows.of(Time size)
  //   TumblingProcessingTimeWindows.of(Time size, Time offset)
  // 基于事件时间的滑动时间窗口：
  //   SlidingEventTimeWindows.of(Time size, Time slide)
  //   SlidingEventTimeWindows.of(Time size, Time slide, Time offset)
  // 基于处理时间的滑动时间窗口：
  //   SlidingProcessingTimeWindows.of(Time size, Time slide)
  //   SlidingProcessingTimeWindows.of(Time size, Time slide, Time offset)
  // 基于事件时间的会话窗口：
  //   EventTimeSessionWindows.withGap(Time size)
  // 基于处理时间的会话窗口：
  //   ProcessingTimeSessionWindows.withGap(Time size)
// 分组流开滚动时间窗口，返回WindowedStream
keyedStream.timeWindow(Time size)
// 分组流开滑动时间窗口，返回WindowedStream
keyedStream.timeWindow(Time size, Time slide)
// 分组流开滚动计数窗口，返回WindowedStream
keyedStream.countWindow(long size)
// 分组流开滑动计数窗口，返回WindowedStream
keyedStream.countWindow(long size, long slide)

// 滚动计算
windowedStream.sum(int positionToSum)
windowedStream.sum(String field)
windowedStream.max(int positionToMax)
windowedStream.max(String field)
windowedStream.min(int positionToMin)
windowedStream.min(String field)
  // 指定字段以外的部分，取第一条记录的信息
windowedStream.maxBy(int positionToMax)
windowedStream.maxBy(String field)
windowedStream.minBy(int positionToMin)
windowedStream.minBy(String field)
  // 指定字段以外的部分，取最大/最小记录的信息

增量聚合函数
每条数据到来就进行计算，保持一个简单的状态。等到窗口中的所有数据聚合完成的时候，再输出结果。效率高，延时低。

// ReduceFunction
windowedStream.reduce(ReduceFunction function)
  // 实现ReduceFunction接口,在reduce方法里参数1为状态行,参数2为新数据,返回值为输出
// AggregateFunction
windowedStream.aggregate(AggregateFunction function)
  // 实现AggregateFunction接口，实现下面的方法
  //   createAccumulator()             创建累加器(状态存储用)
  //   add(IN value, ACC accumulator)  处理一条数据，并返回累加器
  //   getResult(ACC accumulator)      通过累加器获取输出内容
  //   merge(ACC a, ACC b)             合并两个累加器，返回具有合并状态的累加器

全窗口函数
先把窗口所有数据收集起来（到桶里），等到计算的时候会遍历所有数据，并输出结果。

// WindowFunction
windowedStream.apply(WindowFunction function)
  // 实现WindowFunction接口,在apply方法里通过当前窗口的所有数据计算出需要输出的数据
// ProcessWindowFunction
process(ProcessWindowFunction function)
  // 实现ProcessWindowFunction接口,在process方法里通过当前窗口的所有数据计算出需要输出的数据

其它可选API

// 触发器,定义 window 什么时候关闭，触发计算并输出结果
windowedStream.trigger(Trigger trigger)
// 移除器,定义移除某些数据不参与计算的逻辑
windowedStream.evictor(Evictor evictor)
// 允许处理迟到的数据，叠加到已经计算的结果上。即窗口结果计算完成后，先输出一条，先不关闭，迟到数据每来一条再叠加到计算结果输出一次。
windowedStream.allowedLateness(Time lateness)
// 将迟到的数据放入侧输出流，时间窗口已经关闭，但是仍有迟到的数据，那么把迟到的数据和相应窗口的侧输出流数据做另外计算。
  windowedStream.sideOutputLateData(OutputTag outputTag)
// 获取侧输出流
singleOutputStreamOperator.getSideOutput(OutputTag sideOutputTag)

时间语义与Wartermark

Flink中的时间语义

Event Time：是事件创建的时间。它通常由事件中的时间戳描述，例如采集的日志数据中，每一条日志都会记录自己的生成时间，Flink通过时间戳分配器访问事件时间戳。
Ingestion Time：是数据进入Flink的时间。
Processing Time：是每一个执行基于时间操作的算子的本地系统时间，与机器相关，默认的时间属性就是Processing Time。

EventTime的引入

// 从调用时刻开始给env创建的每一个stream追加时间特征
env.setStreamTimeCharacteristic(TimeCharacteristic.EventTime)

Watermark基本概念

Watermark是一种衡量Event Time进展的机制。
Watermark是用于处理乱序事件的，而正确的处理乱序事件，通常用Watermark机制结合window来实现。
数据流中的Watermark用于表示timestamp小于Watermark的数据，都已经到达了，因此，window的执行也是由Watermark触发的。
Watermark可以理解成一个延迟触发机制，我们可以设置Watermark的延时时长t，每次系统会校验已经到达的数据中最大的maxEventTime，然后认定eventTime小于maxEventTime - t的所有数据都已经到达，如果有窗口的停止时间等于maxEventTime – t，那么这个窗口被触发执行。
当Flink接收到数据时，会按照一定的规则去生成Watermark，这条Watermark就等于当前所有到达数据中的maxEventTime - 延迟时长，也就是说，Watermark是基于数据携带的时间戳生成的，一旦Watermark比当前未触发的窗口的停止时间要晚，那么就会触发相应窗口的执行。
由于event time是由数据携带的，因此，如果运行过程中无法获取新的数据，那么没有被触发的窗口将永远都不被触发。
Watermark 就是触发前一窗口的“关窗时间”，一旦触发关门那么以当前时刻为准在窗口范围内的所有所有数据都会收入窗中。
只要没有达到水位那么不管现实中的时间推进了多久都不会触发关窗。

Watermark是一种特殊的数据，值只能增加不能减少。
在并行处理时，如果上游有多个，则当前处理已其中最小的那个watermark为准，并且会把watermark向下游广播。

Watermark的引入

提取时间戳并周期性取得watermark

// 设置提取watermark的周期间隔,默认为200毫秒
env.getConfig().setAutoWatermarkInterval(long interval);
// 设置周期性提取器
dataStream.assignTimestampsAndWatermarks(AssignerWithPeriodicWatermarks timestampAndWatermarkAssigner)
  // 实现AssignerWithPeriodicWatermarks接口,在extractTimestamp方法里返回数据的时间戳,在getCurrentWatermark方法里返回当前的watermark
// 设置周期性提取器：有界无序时间戳提取器,参数为watermark的延迟时长
dataStream.assignTimestampsAndWatermarks(new BoundedOutOfOrdernessTimestampExtractor(Time.seconds(10)) {
              @Override
              public long extractTimestamp(UserBehavior element) {
                  return element.timestamp * 1000;
              }
          } );
// 设置周期性提取器：升序时间戳提取器,watermark的延迟时长为0
dataStream.assignTimestampsAndWatermarks(new AscendingTimestampExtractor() {
              @Override
              public long extractAscendingTimestamp(UserBehavior element) {
                  return element.timestamp * 1000;
              }
          });

提取时间戳并断点式取得watermark

// 设置断点式提取器
dataStream.assignTimestampsAndWatermarks(AssignerWithPunctuatedWatermarks timestampAndWatermarkAssigner)
  // 实现AssignerWithPunctuatedWatermarks接口,在extractTimestamp方法里返回数据的时间戳,在checkAndGetNextWatermark方法里返回当前的watermark

窗口迟到数据的三种处理方法

1.使用watermark的延迟时长延迟窗口的关闭,watermark到达窗口结束时间时输出一个结果，如果没有设置allowedLateness就立即关闭窗口，如果设置了allowedLateness就不关闭。
2.使用.allowedLateness(Time lateness)设置迟到数据延迟等待时间,在等待时间内每来一条数据，再叠加到计算结果输出一次。超过时间后，关闭窗口。
3.使用.sideOutputLateData(OutputTag outputTag)把窗口关闭后迟到的数据输出到侧输出流，后续使用侧输出流做处理。

你可能感兴趣的:(大数据,flink,学习,java,教程)

编程语言Top5榜单：最容易学的编程语言VS最难学的编程语言披荆斩棘的GG web安全安全跳槽
编程语言Top5榜单：最容易学的编程语言VS最难学的编程语言询问程序员哪种编程语言最容易学习，这就像是询问某人他们最爱看的电影。每个人的选择都是基于个人偏好，因此不存在一个普遍适用的"最佳"答案。然而，如果不掌握一些主流的编程语言，想要成为一名杰出的软件工程师也是不现实的。柒柒罗列了一个最容易学习和最难学的编程语言Top5榜单，我们一起来看看。【教程****领取方式在文末！！】简单易学的编程语言H
前端 Vue.js 动画效果实现技巧大厂前端小白菜前端 vue.js javascript ai
前端Vue.js动画效果实现技巧关键词：Vue.js、动画、过渡、CSS动画、JavaScript动画、性能优化、交互设计摘要：本文将深入探讨Vue.js中实现动画效果的多种技巧，从基础的CSS过渡到复杂的JavaScript动画，涵盖过渡组件使用、动画性能优化、第三方库集成等实用内容。通过丰富的代码示例和实际案例，帮助开发者掌握在Vue应用中创建流畅、吸引人的动画效果。背景介绍目的和范围本文旨在
参加网络学习收获心得临江253王馨卉
在七月份以及八月初的几次培训中，我分别接触了不同种类的教育媒介以及教学工具，刷新了我的教学观念。在此我想简单的对几次学习做一个分享。第一部分结合梁校长的讲解，首先刷新了我对PPT应用于教学过程中的认知，以前只觉得这就是代替板书的一种工具，简单明了就行，但是现在认识到设计一个PPT要注意到情境创设，化抽象为直观以及它交互练习的特别作用。根据单页PPT设计的要求，我对字体大小，多少以及颜色都进行了调整
周末来了北上的路上没有你
很开心，又一个周末来了。昨天对我是一个启示，今天，我觉得自己精神状态好多了。有人很真诚的告诉你你的缺点，你正好也处在心理的困境中，这样才能有最好的效果，要是以前，也许我早就生气了。早上学习了教育云平台，然后按照女儿的期盼去电影院给订了电影票，去上了两节课。中午回家吃饭，女儿看到电影票，开心得不得了，对我说，妈妈，你真棒。我也感觉到很开心。下午上课，看手机，给同事帮忙。明天要监考，今天第七节课后开会
有没有简单的日入1000赚钱途径(掌握日入1000赚钱方法) 幸运副业
有没有简单的日入1000赚钱途径(掌握日入1000赚钱方法)每个人都希望能够找到一种简单的日入1000赚钱途径。虽然没有一种途径能够让你一夜暴富，但是通过一些有效的方法和平台，你完全可以在短时间内实现日入1000的目标。在这篇文章中，我们将为你分享一些实用的赚钱方法和推荐多职猫兼职平台。推荐一篇找兼职必看的免费教程：《手机兼职，300-500/天，一单一结，大量要人》在这里可以找到各种手机截图兼职
C#语法基础总结（超级全面）（二） inwith C#语法基础 c#开发语言
文章目录c#语法基本元素关键字操作符（operator）类型转换标识符（Identifier）语句try语句迭代语句（循环语句）索引器文本（字面值）五大数据类型引用类型：值类型：变量、对象与内存装箱和拆箱类类的实例化类的三大成员（属性、方法、事件）属性（property）方法（函数）方法参数值参数引用参数输出参数数组参数具名参数可选参数扩展方法（this参数）方法的重载构造器（constructo
阿里云服务器怎么购买？购买阿里云服务器图文教程分享阿里云最新优惠和活动汇总
阿里云服务器怎么购买？阿里云服务器可以通过快速购买、自定义购买和活动购买三种方式去购买，快速购买流程比较简单，几乎是一键购买云服务器，自定义购买可以根据自己的需求来选择云服务器，相对来说购买流程最复杂，活动购买则主要是价格比快速购买和自定义购买更加便宜，下面是购买阿里云服务器图文教程分享。一、通过活动购买阿里云服务器图文教程绝大部分阿里云用户都是通过这种方式购买，首先是因为大部分用所需要的云服务器
1 《王者速读法》读后感书山有路是为勤
检视阅读打破了一些传统观点，如1人与书的关系；书是人类最忠实的仆人，朕只有三十分钟2如何在30分钟内阅读一本书的方法论3学习输出：高效输入，高效输出，良性循环结论:值的精读分析阅读
20201-01-02 潘jane
姓名:潘珊群公司:宁波市镇海承迪文具有限公司盛和塾第456期六项精进反省一组成员（日精进打卡第736天）【知～学习】：《六项精进》背诵0遍共30遍.《大学》背诵0遍共30遍.朗读0遍共0遍.学习强国每天早上和晚上累计1小时以上······【经典名句分享】奇迹，是努力的另一个名字！【行～实践】一、修身：（对自己个人）1.晨起一杯温开水2.早睡早起3.多喝水4.每天一粒钙片5.饭后水果二、齐家：（对家
2021-11-09 bcd9015d7411
2021.11.09中原焦点团队焦莉霞，本周第一次约练。今天作为来访者进行了第一次约练，感受到了咨询师老师的稳和能视察到行为背后原因的深厚功底。也让我看到了自己想要的是什么，在我摇摆不定，混乱的思绪中，如果不摇摆将会有什么选择。随着老师深情的陪伴，让我的情绪有了一个宣泄口，诉说即疗愈，顿时感觉心里舒畅了很多，回复了力量，也更理性的去看待一些问题，只有自己不断的学习、成长才能带动孩子，带着期待等待孩
中原焦点团队网络初级第30期杨明霞分享第16天 54dea169dd4d
昨天晚上参加了焦点学习的第三次课，每次课都有不一样的收获和感悟。1.不带情绪做事情，或少点情绪做事。2.关注人不关注事。3.看似圆点都是新的起点。4.关注本身就是强化。5.关注资源，资源多了，短板就少了。6.要刻意练习才能掌握。7.关注白，扩大白，白多黑就少。8.了解他，尊重他，才能帮到他。云手三步1.接住接纳才有沟通，沟通才有合作，合作才有改变的机会。2.顺势后退是自身的修为，要允许当事人发泄情
2019-11-11晨间日记野老说史
今天光棍节起床：6：05就寝：9：30天气：晴6～17℃心情：好纪念日：叫我起床的不是闹钟是梦想年度目标及关键点：本月重要成果：今日三只青蛙/番茄钟成功日志-记录三五件有收获的事务学风整顿散步财务检视人际的投入开卷有益-学习/读书/听书三焦，以横膈膜和肚脐为界中医把人体五脏六腑分成三个部分：上焦中焦和下焦。上焦主清应该升，下焦主浊应该降中焦运转健康与饮食今日步数：18693今日锻炼：10000今日
初识linux（一）：全面了解linux目录结构&基础操作指令详解 whelloworldw linux系统编程 linux 运维服务器
今天小风将带着大家进行有关liunx部分章节的学习，由于是第一节初识linux部分的内容，所以内容理解起来并不会太过困难。在本篇博客中，小风将向大家具体讲解一下内容：初识Linux操作系统初识Xshell登录命令,简单了解一下操作系统基本概念使用常用Linux命令，了解linux系统目录结构和访问方式一、初识linux操作系统1.linux发展史1991年10月5日，赫尔辛基大学的一名研究生Lin
9月11日丰盛日记之日（脓肿修复历程2）贵在坚持的小生活
8天的住院后，周一终于带着赤裸裸的四个刀口出院了，迎接我的依旧是无法坐和长久的站立，但，我知道我距离“好”不远了……1.回家的心情和在医院的心情截然不一样，而且感受着身体越来越好的滋味，还是不错的，内心丰盈！期待越来越好，且不复发。海上嘉年华的桥2.躺在床上，看着小伙伴们在群里的聊天，知道大家工作学习积极热烈，在脑海中想象办公室的情景，大家在工作学习的路上不断成长和进步，我心生羡慕；尤其是能“坐着
java cas aba问题_Java CAS操作的ABA问题自考大三学狗 java cas aba问题
CAS介绍比较并交换(compareandswap,CAS)，是原子操作的一种，可用于在多线程编程中实现不被打断的数据交换操作，从而避免多线程同时改写某一数据时由于执行顺序不确定性以及中断的不可预知性产生的数据不一致问题。CAS操作基于CPU提供的原子操作指令实现，各个编译器根据这个特点实现了各自的原子操作函数。来源维基百科：C语言：由GNU提供了对应的__sync系列函数完成原子操作。Windo
2019.2.4-2.10周复盘幸福快乐的小熊熊
一健康管理这周有三天走的挺多。二财务风险信用卡，花呗还款。三家庭经营春节期间，家人都有聚会，家庭氛围总体还是比较和谐的。四人际社群grace阅读营自告奋勇报了打卡提醒员。小鹿老师电影群，很幸运的中了育儿课程。五学习成长听释若老师写作课，最后时刻完成第2次作业。六休闲活动这周除了和家人朋友聚会。就是完成作业，看了春晚。本周收获这周能完成第2次作业，对自己也有了信心。试着培养一个微习惯，小到不可能失败
c语言如何宏定义枚举型结构体,C语言学习笔记--枚举&结构体搁浅的鲎 c语言如何宏定义枚举型结构体
枚举枚举是一种用户定义的数据类型，它用关键字enum以如下语法格式来声明：enum枚举类型名字{名字0，名字1，。。。，名字n}；枚举类型名字通常并不真的使用，要用的是大括号里面的名字，因为它们就是常量符号，它们的类型是int，值则依次从0到n。如：enumcolor{red,yellow,green};就创建了3个常量，red的值是0，yellow的值是1，green的值是2。当需要一些可以排列
Arduino小车遥控器构建指南轩辕姐姐
本文还有配套的精品资源，点击获取简介：本项目基于Arduino微控制器平台，实现通过蓝牙设备对小车进行远程控制。它结合了硬件搭建、编程和无线通信技术，适用于电子爱好者和初学者。项目中，Arduino板作为控制中心，接收蓝牙模块的指令来控制小车的运动。项目包含“蓝牙指令文件”处理通信和“材料的清单”详细列出所需硬件组件。学习者通过PPT指南进行硬件搭建和编程，最终实现小车的遥控操作。1.Arduin
Spring框架整合Redis哨兵模式的实战教程轩辕姐姐
本文还有配套的精品资源，点击获取简介：Spring框架作为Java企业级开发的重要组件，与Redis高性能键值数据库结合，特别是在其哨兵系统支持下，能实现Redis服务的高可用性。本文详细阐述了如何在Spring项目中整合Redis哨兵模式，包括依赖添加、配置哨兵系统、创建连接工厂、配置RedisTemplate以及异常处理等关键步骤。通过整合，可以确保应用数据存储和缓存的稳定性和连续性，适用于需
随笔21 菜菜菜小姐
今日的关键词：人生若只如初见。最近常常在想这句话，人与人的相处真是很奇妙。我觉得距离感和分寸感真得很重要。可能大概是因为我开始社恐了吧。“社恐”这个词用在我身上可能我身边所有的人都会觉得一点都不像，恰恰相反，在外人眼中我大概是“社交牛逼症”的那一位。其实，只有自己才最了解最真实的自己，成年后的生活，每一个外人所了解的自己都只是我们想让别人看到的自己。这两年，总会有朋友说学习碰到学校的同事，都是我是
STM32精确控制步进电机
目的：学习使用STM32+电机驱动器+步进电机，进行电机运动精确控制。测试环境：MCU主控芯片STM32F103RCT6；A4988步进电机驱动器模块；微型2相4线步进电机10mm丝杆滑台，金属丝杆安装有滑块。10mm二相四线微型步进电机电机的输入接线是4个引脚，需要自己焊线，相电阻53欧，步进角度估计18度，丝杆滑块行程32mm，丝杆转一圈铜滑块大约移动行程0.4mm。步进电机重约7.3g。主要
【自学linux】计算机体系结构和操作系统第二章 java攻城狮k 跟着QS50自学编程 linux 系统架构 unix 服务器
操作系统第一讲-介绍操作系统本门课程使用unix和linux作为案例讲解操作系统是如何工作的。首先学习给虚拟机安装和管理一个典型的linux系统，虚拟机运行在windows下。我们讨论操作系统是什么、它们在计算机环境中的使用和用一点篇幅回顾一下Unix系统的历史。一、介绍1、什么是操作系统(operatingsystemorO/S)?一种典型的大型软件，允许计算机硬件用户：1）运行各式各样的软件(
《幸福的科学》第四章 Harriet打卡 20211018 Harriet温暖眼瞳
一、请回答一下3道思考题：001：你过去做事有“福流”的状态吗，是什么事情？跳舞，工作上完成大的项目，做主持人时行云流水地带动整个气氛，与家人聊天的时候002：内在动机是如何理解，分享一下你参与读书会的动机或者工作的动机是什么？内在动机是指由个体内在需要引起的动机，例如，学生觉得学习有意义或有趣就会积极主动地学习，这就是内在动机。我参与读书的动机是想修炼自己，让自己更优秀。003：读书能让你感受到
深入探索C++ STL：从基础到进阶
目录引言一、什么是STL二、STL的版本三、STL的六大组件容器（Container）算法（Algorithm）迭代器（Iterator）仿函数（Functor）空间配置器（Allocator）配接器（Adapter）四、STL的重要性五、如何学习STL六、STL的缺陷总结引言在C++的世界里，标准模板库（STL）是一项极为强大的工具。它不仅为开发者提供了可复用的组件库，更是一个融合了数据结构与算
教育之旅（175）张宝花
昨天大宝在家宅了一天，玩游戏、学习、练太极、做家务，大宝每天帮妈妈洗碗、做饭，锻炼大宝的劳动能力，二宝昨天考了一天试，理综210多，英语近90分，总分近500分了，考完试二宝累极了，直喊头疼，超负荷的脑力劳动，晚上又说今天晚上要网上补英语，支持二宝，二宝昨天晚上又学习了几个小时，真的一天很辛苦。我们仨吃了两顿幸福的团圆饭，早上蒸土豆丝，下午扯面，吃得我们仨喜气洋洋。二宝这段时间网课上得很认真，学习
2019.06.23 旋风逸凡
每个人都会有内心被暴击，瞬间感觉世界极致温暖的瞬间吧？！今天早上吃早饭，刚开始一个人坐了一张桌子，吃饭中途，一个身穿快递员服饰的小哥哥和我拼桌，然后就变成了两个素不相识的人在一张桌子上吃饭的情景了。吃完饭，照例拿出我的小本本和书，准备开启一天的学习之旅，对面的快递小哥哥看到之后，问我，你要开始学习了吗？我说是的，他就说要换张桌子去吃，怕影响我学习，我说不用，但最后他还是去了别的桌子。这个瞬间，让我
基于生成对抗网络增强主动学习的超高温陶瓷硬度优化神经网络15044 深度学习算法仿真模型生成对抗网络学习人工智能
复现论文：基于生成对抗网络增强主动学习的超高温陶瓷硬度优化我将使用Python复现这篇关于使用生成对抗网络(GAN)增强主动学习来优化超高温陶瓷(UHTC)硬度的研究论文。以下是完整的实现代码和解释。1.环境准备和数据加载首先，我们需要准备必要的Python库并加载数据。importnumpyasnpimportpandasaspdimportmatplotlib.pyplotaspltimpor
学习笔记(39):结合生活案例，介绍 10 种常见模型宁儿数据安全 #机器学习学习笔记生活
学习笔记(39):结合生活案例，介绍10种常见模型线性回归只是机器学习的“冰山一角”！根据不同的任务场景（分类、回归、聚类等），还有许多强大的模型可以选择。下面我用最通俗易懂的语言，结合生活案例，介绍10种常见模型及其适用场景：一、回归模型（预测连续值，如房价）1.决策树（DecisionTree）原理：像玩“20个问题”游戏，通过一系列判断（如“面积是否>100㎡？”“房龄是否0.5就判为“会”
新生代与老年代中相关参数的设置 Shaw_Young
存储在JVM中的Java对象可以被划分为两类:一类是生命周期较短的瞬时对象,这类对象的创建和消亡都非常迅速另外一类对象的生命周期却非常长,在某些极端的情况下还能够与JVM的生命周期保持一致Java堆区进一步细分的话,可以划分为年轻带(YoungGen)和老年代(OldGen)其中年轻代又可以划分为Eden空间、Survivor0空间和Survivor1空间(有时也叫做from区、to区)配置新生代
榜样就在身边风帆远行
我越来越发觉得建英是我学习的榜样！第一入校时间早。今天早上我们一组校门口值班，7点15我们就开始给学生消毒，到了7：40左右大部分学生已经入校，她说：“真不知道这么晚入校的情况，我最晚7：20都已经到校了。”听了她的话，我真是有点无地自容。下定决心，从明天早上早早到校。第二自习纪律好。每次从她班过，都发现教室里特别安静，学生坐姿端正，都在认真读书会写字，没有嘈杂的声音。这种情况还是得益于她去的早，
Java实现的基于模板的网页结构化信息精准抽取组件：HtmlExtractor yangshangchuan 信息抽取 HtmlExtractor 精准抽取信息采集
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件，本身并不包含爬虫功能，但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。 HtmlExtractor是为大规模分布式环境设计的，采用主从架构，主节点负责维护抽取规则，从节点向主节点请求抽取规则，当抽取规则发生变化，主节点主动通知从节点，从而能实现抽取规则变化之后的实时动态生效。如
java编程思想 -- 多态百合不是茶 java 多态详解
一: 向上转型和向下转型面向对象中的转型只会发生在有继承关系的子类和父类中（接口的实现也包括在这里）。父类：人子类：男人向上转型： Person p = new Man() ; //向上转型不需要强制类型转化向下转型： Man man =
[自动数据处理]稳扎稳打,逐步形成自有ADP系统体系 comsci dp
对于国内的IT行业来讲,虽然我们已经有了"两弹一星",在局部领域形成了自己独有的技术特征,并初步摆脱了国外的控制...但是前面的路还很长.... 首先是我们的自动数据处理系统还无法处理很多高级工程...中等规模的拓扑分析系统也没有完成,更加复杂的
storm 自定义日志文件商人shang storm cluster logback
Storm中的日志级级别默认为INFO，并且，日志文件是根据worker号来进行区分的，这样，同一个log文件中的信息不一定是一个业务的，这样就会有以下两个需求出现： 1. 想要进行一些调试信息的输出 2. 调试信息或者业务日志信息想要输出到一些固定的文件中不要怕，不要烦恼，其实Storm已经提供了这样的支持，可以通过自定义logback 下的 cluster.xml 来输
Extjs3 SpringMVC使用 @RequestBody 标签问题记录 21jhf
springMVC使用 @RequestBody(required = false) UserVO userInfo 传递json对象数据，往往会出现http 415，400,500等错误，总结一下需要使用ajax提交json数据才行，ajax提交使用proxy，参数为jsonData，不能为params；另外，需要设置Content-type属性为json，代码如下：（由于使用了父类aaa
一些排错方法文强chu 方法
1、java.lang.IllegalStateException: Class invariant violation at org.apache.log4j.LogManager.getLoggerRepository(LogManager.java:199)at org.apache.log4j.LogManager.getLogger(LogManager.java:228) at o
Swing中文件恢复我觉得很难小桔子 swing
我那个草了！老大怎么回事，怎么做项目评估的？只会说相信你可以做的，试一下，有的是时间！用java开发一个图文处理工具，类似word，任意位置插入、拖动、删除图片以及文本等。文本框、流程图等，数据保存数据库，其余可保存pdf格式。ok,姐姐千辛万苦，
php 文件操作 aichenglong PHP 读取文件写入文件
1 写入文件 @$fp=fopen("$DOCUMENT_ROOT/order.txt", "ab"); if(!$fp){ echo "open file error" ; exit; } $outputstring="date:"." \t tire:".$tire."
MySQL的btree索引和hash索引的区别 AILIKES 数据结构 mysql 算法
Hash 索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B-Tree 索引。可能很多人又有疑问了，既然 Hash 索引的效率要比 B-Tree 高很多，为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢
JAVA的抽象--- 接口 --实现百合不是茶
抽象接口实现接口 //抽象类 ,方法 //定义一个公共抽象的类 ,并在类中定义一个抽象的方法体抽象的定义使用abstract abstract class A 定义一个抽象类例如： //定义一个基类 public abstract class A{ //抽象类不能用来实例化，只能用来继承 //
JS变量作用域实例 bijian1013 作用域
<script> var scope='hello'; function a(){ console.log(scope); //undefined var scope='world'; console.log(scope); //world console.log(b);
TDD实践（二） bijian1013 java TDD
实践题目：分解质因数 Step1：单元测试： package com.bijian.study.factor.test; import java.util.Arrays; import junit.framework.Assert; import org.junit.Before; import org.junit.Test; import com.bijian.
[MongoDB学习笔记一]MongoDB主从复制 bit1129 mongodb
MongoDB称为分布式数据库，主要原因是1.基于副本集的数据备份， 2.基于切片的数据扩容。副本集解决数据的读写性能问题，切片解决了MongoDB的数据扩容问题。事实上，MongoDB提供了主从复制和副本复制两种备份方式，在MongoDB的主从复制和副本复制集群环境中，只有一台作为主服务器，另外一台或者多台服务器作为从服务器。本文介绍MongoDB的主从复制模式，需要指明
【HBase五】Java API操作HBase bit1129 hbase
import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.ha
python调用zabbix api接口实时展示数据 ronin47
zabbix api接口来进行展示。经过思考之后，计划获取如下内容： 1、获得认证密钥 2、获取zabbix所有的主机组 3、获取单个组下的所有主机 4、获取某个主机下的所有监控项
jsp取得绝对路径 byalias 绝对路径
在JavaWeb开发中，常使用绝对路径的方式来引入JavaScript和CSS文件，这样可以避免因为目录变动导致引入文件找不到的情况，常用的做法如下：一、使用${pageContext.request.contextPath} 　　代码” ${pageContext.request.contextPath}”的作用是取出部署的应用程序名，这样不管如何部署，所用路径都是正确的。
Java定时任务调度：用ExecutorService取代Timer bylijinnan java
《Java并发编程实战》一书提到的用ExecutorService取代Java Timer有几个理由，我认为其中最重要的理由是：如果TimerTask抛出未检查的异常，Timer将会产生无法预料的行为。Timer线程并不捕获异常，所以 TimerTask抛出的未检查的异常会终止timer线程。这种情况下，Timer也不会再重新恢复线程的执行了;它错误的认为整个Timer都被取消了。此时，已经被
SQL 优化原则 chicony sql
一、问题的提出　在应用系统开发初期，由于开发数据库数据比较少，对于查询SQL语句，复杂视图的的编写等体会不出SQL语句各种写法的性能优劣，但是如果将应用系统提交实际应用后，随着数据库中数据的增加，系统的响应速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是SQL语句的优化。对于海量数据，劣质SQL语句和优质SQL语句之间的速度差别可以达到上百倍，可见对于一个系统
java 线程弹球小游戏 CrazyMizzz java 游戏
最近java学到线程，于是做了一个线程弹球的小游戏，不过还没完善这里是提纲 1.线程弹球游戏实现 1.实现界面需要使用哪些API类 JFrame JPanel JButton FlowLayout Graphics2D Thread Color ActionListener ActionEvent MouseListener Mouse
hadoop jps出现process information unavailable提示解决办法 daizj hadoop jps
hadoop jps出现process information unavailable提示解决办法 jps时出现如下信息： 3019 -- process information unavailable3053 -- process information unavailable2985 -- process information unavailable2917 --
PHP图片水印缩放类实现 dcj3sjt126com PHP
<?php class Image{ private $path; function __construct($path='./'){ $this->path=rtrim($path,'/').'/'; } //水印函数，参数：背景图，水印图，位置，前缀,TMD透明度 public function water($b,$l,$pos
IOS控件学习：UILabel常用属性与用法 dcj3sjt126com ios UILabel
参考网站： http://shijue.me/show_text/521c396a8ddf876566000007 http://www.tuicool.com/articles/zquENb http://blog.csdn.net/a451493485/article/details/9454695 http://wiki.eoe.cn/page/iOS_pptl_artile_281
完全手动建立maven骨架 eksliang java eclipse Web
建一个 JAVA 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=App [-Dversion=0.0.1-SNAPSHOT] [-Dpackaging=jar] 建一个 web 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=web-a
配置清单 gengzg 配置
1、修改grub启动的内核版本 vi /boot/grub/grub.conf 将default 0改为1 拷贝mt7601Usta.ko到/lib文件夹拷贝RT2870STA.dat到 /etc/Wireless/RT2870STA/文件夹拷贝wifiscan到bin文件夹，chmod 775 /bin/wifiscan 拷贝wifiget.sh到bin文件夹，chm
Windows端口被占用处理方法 huqiji windows
以下文章主要以80端口号为例，如果想知道其他的端口号也可以使用该方法..........................1、在windows下如何查看80端口占用情况?是被哪个进程占用?如何终止等. 这里主要是用到windows下的DOS工具,点击"开始"--"运行",输入&
开源ckplayer 网页播放器，跨平台(html5, mobile)，flv, f4v, mp4, rtmp协议. webm, ogg, m3u8 ！天梯梦 mobile
CKplayer，其全称为超酷flv播放器，它是一款用于网页上播放视频的软件，支持的格式有：http协议上的flv,f4v,mp4格式，同时支持rtmp视频流格式播放，此播放器的特点在于用户可以自己定义播放器的风格，诸如播放/暂停按钮，静音按钮，全屏按钮都是以外部图片接口形式调用，用户根据自己的需要制作出播放器风格所需要使用的各个按钮图片然后替换掉原始风格里相应的图片就可以制作出自己的风格了，
简单工厂设计模式 hm4123660 java 工厂设计模式简单工厂模式
简单工厂模式（Simple Factory Pattern）属于类的创新型模式，又叫静态工厂方法模式。是通过专门定义一个类来负责创建其他类的实例，被创建的实例通常都具有共同的父类。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工厂模式是工厂模式家族中最简单实用的模式，可以理解为是不同工厂模式的一个特殊实现。
maven笔记 zhb8015 maven
跳过测试阶段： mvn package -DskipTests 临时性跳过测试代码的编译： mvn package -Dmaven.test.skip=true maven.test.skip同时控制maven-compiler-plugin和maven-surefire-plugin两个插件的行为，即跳过编译，又跳过测试。指定测试类 mvn test
非mapreduce生成Hfile，然后导入hbase当中 Stark_Summer map hbase reduce Hfile path实例
最近一个群友的boss让研究hbase，让hbase的入库速度达到5w+/s，这可愁死了，4台个人电脑组成的集群，多线程入库调了好久，速度也才1w左右，都没有达到理想的那种速度，然后就想到了这种方式，但是网上多是用mapreduce来实现入库，而现在的需求是实时入库，不生成文件了，所以就只能自己用代码实现了，但是网上查了很多资料都没有查到，最后在一个网友的指引下，看了源码，最后找到了生成Hfile
jsp web tomcat 编码问题王新春 tomcat jsp pageEncode
今天配置jsp项目在tomcat上，windows上正常，而linux上显示乱码，最后定位原因为tomcat 的server.xml 文件的配置，添加 URIEncoding 属性： <Connector port="8080" protocol="HTTP/1.1" connectionTi

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他