Ververica

Apache Flink 误用之痛

整理：lyee（Flink 社区志愿者）

摘要：本文根据 Flink Forward 全球在线会议 · 中文精华版整理而成，围绕着项目的开始、需求分析、开发，以及测试、上线、运维整个生命周期展开，介绍了 Apache Flink 实践中的一些典型误用情况，并给出了相应的更优实践方案。

Flink 实践中最首当其冲的误用就是不按迭代开发的过程操作。最佳实践应该遵循迭代开发的步骤进行，包含以下几个阶段：

项目开始
涉及分析
开发
测试
上线
维护

Tips：点击「阅读原文」可查看更多 Flink 社区最新动态～

1. 项目开始

在开始开发前，我们需要选择正确的切入方式，以下几种往往是最糟糕的开始：

    a) 从一个具有挑战性的用例开始（端对端的 Exactly-once、大状态、复杂的业务逻辑、强实时SLA的组合）   
    b) 之前没有流处理经验   
    c) 不对团队做相关的培训   
    d) 不利用社区

在开发的过程中，其实要认认真真的来规划我们的切入点，首先，要从简单的任务开始循序渐进。要有一定的大数据和流处理的知识积累，尽量参加一些培训，也要利用好社区资源。基于这样的想法，我们就能很快找到切入点。

怎么样去做？社区提供了很多的培训，包括 Flink Forward 和 Vererica 网站上有各种培训课程，大家可以去看。同时，可以充分利用社区。社区还建立了中文的邮件列表，大家可以充分利用中文邮件列表来解决手头的疑难杂症。另外，Stack Overflow 也是个提问的好地方，但在提问前尽量去看一看已有的提问，做到心中有数。

邮件列表：
[email protected]/[email protected]
Stack Overflow：
www.stackoverflow.com

2. 设计分析

方案设计中的一些常见错误思维，往往是由于没有充分思考需求导致的，比如：

    a) 不考虑数据一致性和交付保证   
    b) 不考虑业务升级和应用改进   
    c) 不考虑业务规模问题   
    d) 不深入思考实际业务需求

我们要认真分析需求，同时认真考虑实际交付情况。提到一致性和交付保障，其实可以通过几个问题来引导大家完成这件事，如下图所示：

第1个问题，是否在乎数据的丢失？

如果不在乎，你可以没有 Checkpoint。

第2个问题，是否在乎结果的正确性？

在很多的场景里面，我们非常关注结果的正确性，比如金融领域，但是另外一些场景比如监控或其他简单的使用场景仅需要一个概要的数据统计。如果不在乎结果的正确性，可以考虑用 at-least-once 的模式配置并使用可回放的数据源。相反，如果结果的准确性十分重要，且下游不关心重复记录，那么仅需设置 exactly-once 模式并使用可回放的数据源。如果下游要求数据不能重复，哪怕数据正确也只能发送一次，这种时候就对 sink 有更进一步的限制，在 exactly-once 的模式下，使用可回放的数据源，并且 sink 需要支持事务。

带着这样的思维方式分析业务，才能非常清晰地知道，怎么去使用 Flink，进而避免一些糟糕的事情发生。

完成分析之后，最终目的是什么？我们为什么要有这种选择，而不是一上来就选一个最好的方案？

因为世界上永远没有“最好”，这里的核心因素就是延迟，要根据业务的延迟和准确性需求来均衡去做选择。

当需求都分析好之后，还需要去思考应用是否需要升级。从一个正常的 Flink 作业来讲，我们有几个问题要考虑。第一个，Flink 作业一般都有状态读取，做升级时需要有 savepoint 机制来保障，将状态存储保留在远端，再恢复到新的作业上去。很多场景下都会有升级的需求，这简单列了几点：

a 升级集群版本   
b 业务 bug 的修复
c 业务逻辑（拓扑）的变更

在比较复杂的场景下，作业会有拓扑的变化，如下图：

此处需要添加一个算子，去掉一个 sink 。对于这样的变化，我们要考虑状态的恢复。当 Flink 发现新作业有节点没了，对应的状态无法恢复，就会抛出异常导致升级失败。这时候可以使用参数 --allowNonRestoreState 来忽略此类问题。

另外新作业中还有新建的节点，这个节点就用空状态去初始化即可。除此之外，还需要注意，为了保证作业成功启动并且状态恢复不受影响，我们应该为算子设置 StreamAPI 中的 uid 。当然，如果状态的结构发生了变化，Avro Types 和 POJO 的类型都是支持的，Kryo 是不支持的。最后建议所有 key 的类型尽量不要修改，因为这会涉及 shuffle 和状态的正确性。

资源的使用情况也是必须要考虑的因素之一，下面是一个评估内存和网络 IO 使用的思路。这里我们假设使用的是 Fs State，所有运行时状态都在内存中。不恰当的资源配置可能会造成 OOM 等严重的问题。

完成资源评估后，还需要考虑事件时间和乱序问题。下面是一个具体的例子：

在这个例子中选择哪种时间窗口、何时触发计算，仅凭一句话的需求是无法描述清楚的。只有根据流处理的特性结合实际的业务去认真分析需求，才能将 Flink 技术进行恰当的运用。

还需要注意，Flink 是流批统一的计算引擎，不是所有的业务都能用流处理或者都能用批处理来实现，需要分析自己的场景适合用哪种方式来实现。

3. 开发

3.1 API 的选择

在 DataStream API 和 Table API/SQL 的选择上，如果有强烈的需求控制状态和每条状态到来的行为，要使用 DataStream API；如果是简单的数据提取和关系代数的运算，可以选择 Table API/SQL。在一些场景下，只能选择 DataStream API：

a) 在升级过程中要改变状态
b) 不能丢失迟到的数据
c) 在运行时更改程序的行为

3.2 数据类型

在开发过程中，关于数据类型，有两种误用场景：

a) 使用深度嵌套的复杂数据类型b) KeySelector 中使用任意类型

正确的做法是选择尽可能简单的状态类型，在 KeySelector 中不使用 Flink 不能自动识别的类型。

3.3 序列化

数据类型越简单越好，基于序列化成本的考虑，尽量使用 POJO 和 Avro SpecificRecords。也鼓励大家开发完使用 IDE 的工具本地调试一下，看一下性能瓶颈在哪。

序列化器	Opts/s
PojoSeriallizer	813
Kryo	294
Avro(Reflect API)	114
Avro(SpecificRecord API)	632

图5中是一种效率较低的处理过程，我们应该先进行过滤和投影操作，防止不需要的数据进行多余的处理。

3.4 并发性

两种误用场景及相应容易造成的问题：

任务之间共享静态变量

容易引起 bug；容易造成死锁和竞争问题；带来额外的同步开销。

在用户函数中生成线程

检查点变得复杂易错。

对于想用线程的情况，如果是需要加速作业，可以调整并行度和资源，使用异步IO；如果是需要一些定时任务的触发，可以使用 Flink 自带的 Timer 定时调度任务。

3.5 窗口

尽量避免像图6这样自定义 Window，使用 KeyedProcessFunction 可以使得实现更加简单和稳定。

另外，也要避免图7中的这种滑动窗口，在图7中每个记录被50万个窗口计算，无论是计算资源还是业务延迟都会非常糟糕。

3.6 可查询状态

Queryable State 目前还在不断的完善中，可以用于监控和查询，但在实际投产时还是有一些问题需要注意的，比如对于线程安全访问，RocksDB 状态后端是支持的，而 FS 状态后端是不支持的，另外还有性能和一致性保障等问题需要注意。

3.7 DataStream API 的应用

对图8这种场景，可以使用 DataStreamUtils#reinterpretAsKeyedStream 这个方法，避免面对相同的 key 进行多次 shuffle 。

对图9这种场景，应该把一些初始化的逻辑写在 RichFunction 的 open 方法里。

4. 测试

除了系统测试和 UDF 的单元测试，还应该做 Mini Cluster 测试，在本机运行一个 Mini Cluster 把端到端的业务跑起来，可以及早地发现一些问题。

还有 Harness 测试，它可以精准地帮助完成有状态的任务测试。它可以精准的控制 watermark、元素的 event time 等。可以参考:

https://github.com/knaufk/flink-testing-pyramid。

5. 上线

很多场景会导致业务抖动，一种是实际业务本身就有抖动，其他的比如 Timer、CP 的对齐、GC 等正常现象的发生，还有追数据的场景，开始和追平的时候状态是不一样的，这种情况下也不用担心，有意识地识别这种状况，进而判断这种是正常还是非预期状况。

在线上监控时要注意，metrics 过多会对 JVM 造成很大压力，上报的频率不要选择 subtask，这对资源的开销是很高的。

在配置时要注意，一开始尽量不用 RocksDB 状态后端，FS 状态后端的部署成本低速度也更快。少用网络的文件系统。SlotSharingGroups 的配置尽量使用默认的，避免引发欠机制的破坏，导致资源浪费。

6. 维护

像 Flink 这样快节奏的项目，每个版本都有很多 bug 被修复，及时升级也很重要。

7.PyFlink/SQL/TableAPI 的补充

使用 TableEnvironment 还是 StreamTableEnvironment？推荐 TableEnvironment 。（分段优化）
State TTL 未设置，导致 State 无限增长，或者 State TTL 设置不结合业务需求，导致数据正确性问题。

不支持作业升级，例如增加一个 COUNT SUM 会导致作业 state 不兼容。
解析 JSON 时，重复调度 UDF，严重影响性能，建议替换成 UDTF。
多流 JOIN 的时候，先做小表 JOIN，再做大表 JOIN。目前，Flink 还没有表的 meta 信息，没法在 plan 优化时自动做 join reorder。

作者简介：

本文由 Konstantin Knauf 分享，孙金城进行中文解说。

孙金城（金竹），Apache Member，阿里巴巴高级技术专家。2011 年加入阿里，9 年的阿里工作中，主导过很多内部核心系统，如，阿里集团行为日志，阿里郎，云转码，文档转换等。在 2016 年初开始了解 Apache Flink 社区，由初期的参与社区开发到后来逐渐主导具体模块的开发，到负责 Apache Flink Python API(PyFlink) 的建设。目前是 PMC member of Apache Flink and ALC(Beijing)，以及 Committer for Apache Flink, Apache Beam and Apache IoTDB。

# 如何提前了解 Flink 1.11 新版功能特性？#

机会来了！

6月14日，阿里巴巴计算平台事业部与阿里云开发者社区共同举办的大数据+AI Meetup 系列第一季即将重磅开启，此次 Meetup 邀请了来自阿里巴巴、Databricks、快手、网易云音乐的7位技术专家，集中解读大数据当前热门话题！

其中，Apache Flink Committer，阿里巴巴技术专家李劲松（之信）将现场分享《Flink 1.11 Table&SQL 深度解读》，还有快手春晚项目的独家实践、网易云音乐 Flink + Kafka 的生产落地等。点击「阅读原文」即可预约报名～

▼ 活动亮点 ▼

> 超豪华嘉宾阵容！多位资深技术专家在线分享对行业趋势的洞察！

> 极丰富干货分享！集结大数据热门议题，一次看完：数据处理、数仓、数据湖、AI 等技术实践与生产应用落地。

> 多种奖品拿到手软！直播间已准备超多精美礼品，现场送送送！预约直播并参与互动即有机会领走哦。

点击「阅读原文」即可预约报名！

nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
【讲解】怎么消除妊娠纹 poyan7160
女人是脆弱的，尤其是孕期的女性。辛辛苦苦怀胎十月，经历一次深到骨子里的痛还不够，无奈还要留下一身的妊娠纹。母亲是伟大的，但也是要付出代价的，妊娠纹就是最好的证明。可是，难道真的要带着妊娠纹过一辈子吗?不，坚决不!接下来新时代辣妈告诉你怎么去除妊娠纹?怎么去除妊娠纹——根据肌肤需要补充水分就像敷面膜那样，大家都知道敷面膜的目的是为了给肌肤补充水分。水分对一个人的肌肤很重要，只有有了足够的水分，肌肤才
Java：爬虫框架 dingcho Java java 爬虫
一、ApacheNutch2【参考地址】Nutch是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。Nutch致力于让每个人能很容易,同时花费很少就可以配置世界一流的Web搜索引擎.为了完成这一宏伟的目标,Nutch必须能够做到:每个月取几十亿网页为这些网页维护一个索引对索引文件进行每秒上千次的搜索提供高质量的搜索结果简单来说Nutch支持分
android 更改窗口的层次,浮窗开发之窗口层级 Ms.Bu android 更改窗口的层次
最近在项目中遇到了这样的需求：需要在特定的其他应用之上悬浮自己的UI交互(拖动、输入等复杂的UI交互)，和九游的浮窗类似，不过我们的比九游的体验更好，我们越过了很多授权的限制。浮窗效果很多人都知道如何去实现一个简单的浮窗，但是却很少有人去深入的研究背后的流程机制，由于项目中浮窗交互比较复杂，遇到了些坑查看了很多资料，故总结浮窗涉及到的知识点：窗口层级关系(浮窗是如何“浮”的)？浮窗有哪些限制，如何
误落尘网中，一去三十年不会功夫的谭大侠
图片发自App图片发自App图片发自App《财富自由之路》中开篇就讲述了财富自由的目的是为了时间自由，高中觉得每个月一千块是财富自由，大学觉得每个月两千块是财富自由，毕业时觉得每个月五千是财富自由，现在感觉每个月一万都不一定自由。思来想去，货币贬值也没有这么快，还是自己欲望太大了，欲壑难填。大学有一个梦想去西藏，当时觉得两千块就能去，现在感觉有一万都不够。膨胀了啊！曾经想过时间自由了干什么，我就半
最简单将静态网页挂载到服务器上(不用nginx) 全能全知者服务器 nginx 运维前端 html 笔记
最简单将静态网页挂载到服务器上(不用nginx)如果随便弄个静态网页挂在服务器都要用nignx就太麻烦了，所以直接使用Apache来搭建一些简单前端静态网页会相对方便很多检查Web服务器服务状态：sudosystemctlstatushttpd#ApacheWeb服务器如果发现没有安装web服务器：安装Apache：sudoyuminstallhttpd启动Apache：sudosystemctl
天上的每颗星星都是殉难者的生命摘到月亮了吗
1.“小孩怎么一见到哥哥就脸红”——《偷偷藏不住》2.“娶她是我高中就认定的事”──《痛仰》3.“他扛下一切风雨先你一步成长然后来宠你他真的好喜欢你”——《偏偏宠爱》4.天上的每颗星星都是殉难者的生命——耳东兔子5.未经允许擅自特别喜欢你不好意思了——《默读》6.“许星纯你猜我在干嘛我在等风等风热吻你”——《等风热吻你》7.“我爱你如鲸向海似鸟投林不可避免退无可退”——陆霆骁《许你万丈光芒好》8.
浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
2021-12-11 人生导演
今天读到佛学书籍的一段话：初学者很难直接体验到无我，但可以经常提醒自己：一切事物都是无我的。不断强化这个观念，也会相当有帮助。比如生病了我们一般会说：“我不舒服！我很痛！我很惨！”这时候如果我们提醒自己：没有我，只是这个肉体的某些部分、某些功能出了问题，不舒服、疼痛也只是一时的感受，而感受随时在变化。仅仅是知道没有一个实存的我在生病、在受苦。然后把“一切事物都是无我的”这句话，记到笔记上，并且朗读
读《道德经》28 华南帝虎
甘德礼（读《道德经》28）原创分享609＋277天，光山心协智慧父母课堂持续分享第262天原文知其雄，守其雌，为天下谿。为天下谿，常德不离，复归于婴儿。知其白，守其黑，为天下式。为天下式，常德不忒，复归于无极。知其荣，守共辱，为天下谷。为天下谷，常徳乃足，复归于朴。朴散则为器，圣人用之则为官长，故大制不割。译文越是自己雄强刚猛，越是要守得住雌柔安静，就像山间低凹的溪水样。像溪水一样，那规律性的德就
KVM+GFS分布式存储系统构建KVM高可用 henan程序媛分布式 GFS 高可用 KVM
一、案列分析1.1案列概述本章案例主要使用之前章节所学的KVM及GlusterFs技术,结合起来从而实现KVM高可用。利用GlusterFs分布式复制卷，对KVM虚拟机文件进行分布存储和冗余。分布式复制卷主要用于需要冗余的情况下把一个文件存放在两个或两个以上的节点,当其中一个节点数据丢失或者损坏之后，KVM仍然能够通过卷组找到另一节点上存储的虚拟机文件，以保证虚拟机正常运行。当节点修复之后，Glu
Hadoop 傲雪凌霜，松柏长青后端大数据 hadoop 大数据分布式
ApacheHadoop是一个开源的分布式计算框架，主要用于处理海量数据集。它具有高度的可扩展性、容错性和高效的分布式存储与计算能力。Hadoop核心由四个主要模块组成，分别是HDFS（分布式文件系统）、MapReduce（分布式计算框架）、YARN（资源管理）和HadoopCommon（公共工具和库）。1.HDFS（HadoopDistributedFileSystem）HDFS是Hadoop生
独家收藏：《咬文嚼字》“十大语文差错”3 海滨公园
独家收藏：《咬文嚼字》“十大语文差错”32008年版《咬文嚼字》“十大语文差错”目录1.电视中引用名言经常读错的字是：“有朋自远方来，不亦乐乎”的“乐”。2.社会热词容易读错的是：三聚氰胺。3.高考作文中的高频别字是：“震撼”误为“震憾”。4.旅游景点说明牌的常见别字是：“故里”误为“故裏”。5.新闻报道中容易混淆的词是：狙击/阻击。6.社会机构称谓中容易混淆的词是：营利/盈利。7.出版物上容易用
到底意难平文化学者黎荔
作者：黎荔什么是“意难平”？意思就是内心不能满足，心绪不定，心理上接受不了，不能释怀、放不下，不甘心的感觉，念念不忘却没有回响。《红楼梦》第五回记载，贾宝玉梦游太虚幻境，听了《红楼梦》十二支仙曲。其中曲牌为《终身误》的曲子唱道：“都道是金玉良缘，俺只念木石前盟。空对着山中高士晶莹雪，终不忘世外仙姝寂寞林。叹人间美中不足今方信。纵然是齐眉举案，到底意难平”。宝、黛爱情及宝、钗婚姻悲剧，是《红楼梦》的
maven-assembly-plugin 打包实例带着二娃去遛弯
1.先在pom.xml文件中添加assembly打包插件org.apache.maven.pluginsmaven-assembly-plugin2.6assembly/assembly.xmlmake-assemblypackagesingle说明:1.需要修改的可能就是descriptors标签下面的打包配置文件目录,指定assembly.xml的路径.2.可以添加多个打包配置文件,进行多种形
2023-03-24 卯金刀_fafd
美丽的伊犁河谷流失大半的伤痛伊犁河谷是祖国新疆一块美丽湿润的土地，有赛江南之美誉，这里风景秀丽，美如诗画，是中国最西部的湿地，在干旱的中亚是非常难得的一片肥美良田；原本整个伊犁河谷都是中国的领土，由于晚清腐败，导致失去了大片伊犁河谷，最终只留下小部分的土地，这是祖国的痛，这么美丽的土地失去了是整个中华民族永不可忘的痛，这一切的原因都是由于中俄《伊犁条约》签订。19世纪60~70年代，中国西北地区发
望若不佯
在希望中发芽在失望中成长在欲望中沉沦在绝望中迷茫曾幻想有一天可以有双翅膀飞向天堂曾希望有一天可以有人景仰到达远方曾祈求有一天可以有场暴雨冲刷世界因为梦太美好现实太痛在角落里蜷缩着渴望有一点温暖在黑暗里平躺着渴望有一点阳光天涯海尽岁月成殇泪水凝聚成珊瑚双手雕刻成海鱼身体打磨成镜望这世界遥远望着痛苦的根源望这一切的一切望不努力的人可以走出幻光
2023-02-01 每天微笑愉婉柔
20230201《会痛的不是爱》67笔记我越想抓住，反而错失越多笔记：1执着，简单的说，就是过于在意（在乎），期待（如我所愿），强求（想要的结果）。由着执着，就想去控制，要求；就会有紧张，患得患失，不安等状态。2执着的背后，其实就是欲望（贪求，想得到）和恐惧（怕没有或不够或不好，怕失去）。3越是执着，越是紧抓不放，传达呈现出来的频率状态就越是不信任不自信，就越是恐惧与不安。这样的频率状态，会吸引来
UI 自动化的页面对象管理神器 PO-Manager TesterHome
原文由alex发表于TesterHome社区网站，点击原文链接可于作者直接交流。做UI自动化的同学都知道，UI自动化一个难点就是页面元素的变化，让自动化维护成为一个痛点。在此，为了减轻这个痛点，我在基于Page-Object模式的基础上开发了页面对象维护的工具。该工具为vscode的一个插件，可以通过vscode插件市场搜索PO-Manager来下载安装本文中的页面对象库文件基于json.一个元素
只生欢喜不生愁花间星事
《只生欢喜不生愁》是我很喜欢的一本书，挺适合当下的环境阅读。作者林曦老师是位水墨画家，设计师。她1983年生于重庆，毕业于中央美术学院，年少成名，以手艺人自居。在她的这本艺术生活随笔集里，用自己的切身实践解析艺术美育的本质内涵。分享了艺术学习，写字的乐趣，专注心力的法门与修炼，用中式文人的视角观照当代生活的审美情趣及路径，讨论艺术之道与无用之美，让传统美学回归到现实生活践行中。林曦少年时办过不少画
Kafka详细解析与应用分析芊言芊语 kafka 分布式
Kafka是一个开源的分布式事件流平台（EventStreamingPlatform），由LinkedIn公司最初采用Scala语言开发，并基于ZooKeeper协调管理。如今，Kafka已经被Apache基金会纳入其项目体系，广泛应用于大数据实时处理领域。Kafka凭借其高吞吐量、持久化、分布式和可靠性的特点，成为构建实时流数据管道和流处理应用程序的重要工具。Kafka架构Kafka的架构主要由
送考与年度考核之痛康康的教育视野
今天下午初三中考结束了，轮到我们初二班主任送学生地理生物小中考了。下午一点半，我们班主任各就各位，因为我们要集中的大本营是高三5班，但我推门一看，都是在午休监考老师们，我又合上门，打电话问段长，原来过一会儿学生进来时监考老师们正好去集中了，不影响我们集中。待监考老师们走后，我走进去一看，三三两两的桌子拼成各式“睡床”，地上桌上抽屉里到处都是废纸、饮料瓶、口罩等垃圾，我赶紧叫隔壁班的峰哥帮忙一起整理
《你的顾客需要一个好故事》有感皮皮爱世界
“让顾客成为故事的主人公”，就是营销的终极秘籍。这也是今年罗胖的跨年演讲的“接口理论”的验证和诠释，我们必须要在我们与要解决的问题之间，找到接口，然后深度链接。顶级的营销是要打造一种闭环，简而言之就是发现或者挖掘痛点，然后构建思路和程序来解决痛点，而其中的角色定位，就是两方，即顾客和营销人员，现实中这种对立面的关系让营销加大了难度，顾客更多置身于产品之外，很难完全融入产品细节中，而通过这本书，我们
茶界“董明珠”，黄红缨，她跑了12万公里嫁给了一片山黄红缨茶庄
黄红缨，一个专注农业21年、爱喝茶的女人，深知中国“三农”的痛点，对茶产业土地极度污染、农药化肥滥用、价格混乱、品质低劣等问题深恶痛绝。图片发自App驱车12万余公里走遍全国各大茶区，终于在茶叶生长黄金经纬线上下找到了一片平均海拔1350米的净土，她义无反顾地娶了那片山、嫁给了这片茶，一头扎在云雾高山之间用6年时间开辟了12000多亩茶山，她带着团队钻进灌木林拓荒平整梯田，不远千里从内蒙原生牧场拖
对待工作的态度杨奶茶
今天下午听了教授的一番话，听了很认真，人要学着傻，我就是以为自己很聪明，其实聪明反被聪明误，以前总是眼高手低，总觉得不给好处不做，什么都想谈条件，往往这样我得不到成长而且做事态度也很差，我现在才明白，什么事情先去做，而且认真做好，有一句话是但行好事，莫问前程。首先把事情做好，晚上美美让我做表格，其实我是最头疼表格的，眼睛都看花了，但是我内心里面我是很开心的，我喜欢承担责任，表格不会我可以学，做的慢
Linux下read函数详解威桑 Linux linux 服务器运维
在Linux中，read函数是最常用的系统调用之一，用于从文件或其他输入设备读取数据。它是低级别的I/O操作的核心，直接与操作系统的内核交互，提供了高效的数据读取方式。一、read函数简介read函数的声明如下：#includessize_tread(intfd,void*buf,size_tcount);其中：fd是文件描述符，代表了需要读取的文件或设备。文件描述符可以通过调用open或其他文件
Linux下open函数详解威桑 Linux linux
在Linux中，open函数是文件操作的核心系统调用之一，它用于打开文件并返回一个文件描述符，用于后续的文件操作如读取、写入、关闭等。open函数的原型#include#include#include#includeintopen(constchar*pathname,intflags);intopen(constchar*pathname,intflags,mode_tmode);open函数有
java 技术架构相关文档圣心 java 架构开发语言
在Java中，有许多不同的技术和架构，这里我将列举一些常见的Java技术和架构，并提供一些相关的文档资源。SpringFrameworkSpring是一个开源的Java/JavaEE全功能框架，以Apache许可证形式发布，提供了一种实现企业级应用的方法。官方文档：SpringFrameworkSpringBootSpringBoot是Spring的一个子项目，旨在简化创建生产级的Spring应用
摆脱多巴胺，追求内啡肽安俸丽
多巴胺和内啡肽是人体内的两种激素，都能给人体带来快乐，可以称之为快感增强剂。多巴胺与内啡肽产生的机理不同。多巴胺能立即给人带来短暂的快乐，如刷手机、吃甜食、玩游戏，但是快感过后很快就会失落，也可能是懊悔、空虚。内啡肽却是由痛而生。当人们持续去做一件事，特别是一件需要付出时间和意志力才能得到结果的事，才会得到一个奖赏，体内会分泌内啡肽。如当你坚持跑步、健身、练字，达到一个极点后，一定会产生超级的成就
当野鸡“心理学”变成赚钱的工具 Z小姐不吐不快
今日乘车闲来无事便听起了电台（可在网易云音乐搜索「报刊选读」，点击20180212那一期），听罢，不禁感叹，怪不得「洗稿惯犯」周冲说，“与其教育傻逼，不如赚傻逼点钱。”哎，如果我没啥良心，估计也能赚这钱了。▲图片摘自六神磊磊读金庸《今儿就从头彻底扒一下周冲，看是什么成色》头痛、脚痛，不管是哪里痛，家排疗法总会告诉你，身体的每一处疼痛都喻示着你的“心事”影响身体健康，只要找出病因，无论疼痛还是癌症都
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l

Apache Flink 误用之痛

你可能感兴趣的:(Apache Flink 误用之痛)