Apache Flink

从 Flink Forward Asia 2021，看 Flink 未来开启新篇章

律回春晖渐，万象始更新，这句诗用来形容 2021 年的大数据领域再合适不过，而 Flink 在 2021 年也开启了新的篇章。

2022 年 1 月 8-9 号，Flink Forward Asia (FFA) 线上峰会成功举行。Flink Forward Asia 是由 Apache 官方授权，Apache Flink 中文社区主持举办的会议。目前，Flink Forward Asia 已成为国内最大的 Apache 顶级项目会议之一，是 Flink 开发者和使用者的年度盛会。由于疫情原因，本届峰会仍采用线上直播的形式，峰会首日流量峰值 PV 20W+、UV 10W+；实时观看量峰值 4.5W+。直播页累计 PV 100W+、UV 30W+。在线上峰会的同时，FFA 还举办了首届以实时计算为主题的 Flink Hackathon，共有 267 支参赛队伍，最终 27 支队伍入围参与线下决赛。未来 Flink Hackathon 也会常态化举办，集思广益。

FFA 大会从社区发展，业界影响力以及生态技术演进这三方面总结了 Flink 在过去一年的发展。社区方面，根据 Apache 软件基金会 2021 财年报告公布的各项核心指标，Flink 已连续三年位列 Apache 社区最活跃的项目之一。而作为社区的最小原子，Flink 的社区代码开发者 (Contributor) 已超过 1400 名，年增长率超过 20%。其中尤其值得一提的是 Flink 中文社区的蓬勃发展：Flink 的官方公众号订阅数超过 5 万人，全年推送超过 140 篇和 Flink 技术，生态以及行业实践相关的最新资讯。最近，Flink 社区开通了 Flink 官方视频号，希望通过更加丰富新颖的形式从更多纬度让大家对 Flink 有更全面的了解。此外，Flink 社区重构和改版了去年开通的 Flink 官方学习网站 Flink Learning[1]，希望通过这个学习网站，汇总沉淀和 Flink 相关的学习资料，场景案例以及活动信息，使 Flink Learning 真正成为大家学习研究探索 Flink 的好帮手。

业界方面影响力方面，Flink 已成为业界实时计算的事实标准。越来越多的公司不仅使用 Flink，也积极参与 Flink 的发展与建设，共同完善 Flink。目前，Flink 的代码开发者来自全球超过 100+ 公司。去年举办的 4 场的线下 meet up，阿里巴巴、字节跳动，携程和 360 都提供了大力支持。而今年 FFA 大会有来自互联网，金融，能源，制造业，电信等各个行业的 40+ 知名公司共 87 个主题演讲。从生态技术演进来看，Flink 在云原生，高可用性，流批一体和 AI 四个主打方向上都取得了不错的成绩。特别值得一提的是 Flink 新推出了流批一体的进阶版，流式数仓 (Streaming Warehouse) 这个概念，实现流批实时分析一体化，真正意义上完成流批一体计算和流批一体存储的融合，让整个数仓的数据流动起来。流式数仓将是 Flink 未来最重要的方向之一，在 Flink 社区也会同步推广。

本文将对 Keynote 议题作一些简单的归纳总结，感兴趣的小伙伴们可以在官网[2] 找到相关主题视频观看直播回放。

主会场议题

在主议题之前，阿里巴巴集团副总裁，阿里巴巴开源技术委员会负责人，阿里云智能计算平台负责人贾扬清老师作为开场嘉宾，分享了他对开源在云计算的大背景下的思考：开源，无论是从技术贡献还是生态发展来看，已从最初的替代和补充逐步发展成为创新和引领的角色。阿里巴巴到目前为止已经开源了 2700 多个项目，是国内互联网技术企业中的先锋。而 Flink 作为阿里巴巴最具影响力的开源项目之一，无论是在技术先进性还是生态丰富性上都无可争议。不仅如此，阿里巴巴在过去几年中积极拓展 Flink 的适用场景，通过自身大规模业务打磨迭代开源技术，进而将这些技术回馈 Flink 社区，并携手其他开源项目形成更全面的联合解决方案，真正做到了开源开放，持续回馈，加速普及。

下面来重点聊一聊几个主议题。

1. Flink Next –– Beyond Stream Processing

主议题照例由 Apache Flink 中文社区发起人，阿里巴巴开源大数据平台负责人王峰（花名莫问）老师开启，主要介绍 Flink 社区在 2021 年取得的成果以及未来的发展方向，包括云原生，Flink 容错，流批一体和机器学习四个部分。

■ 云原生 –– 部署架构演进

Flink 部署的三种模式

说起开源大数据的发展，绕不开云原生，两者相依相生相辅相成。作为开源大数据的引擎课代表 Flink 的部署模式是如何在云原生大背景下演进的是个很有趣的话题。

Flink 最早的部署模式是经典的静态 (Static) Standalone模式，这里的静态是指用户必须根据业务估算预留资源，资源少了作业就跑不起来，所以大部分情况下需要按最大资源量来预留。显而易见这种模式对于用户来说既复杂资源利用率也不高。
第二种模式我们称为主动 (Active) 模式，这里的主动是指 Flink 会根据业务资源的使用情况主动的去向底层 Kubernetes 或者 Yarn 申请和释放资源。这种模式需要 Flink 和底层 Kubernetes 或者 Yarn 深度集成，适用于需要对资源深度把控的用户，对中小用户来讲太过复杂。
这就引出了第三种模式我们称为适应性 (Adaptive/Reactive) 模式。在这种模式下，Flink 可以像云上其他应用一样根据所给的资源 (增加或减少资源 pod) 通过改变自身拓扑结构来动态调整运行。

从用户的角度来看，他并不需要了解资源是如何分配的，所以第三种模式对于用户的门槛相对较低。

还有一个值得思考的问题是云原生到底给 Flink 带来了什么，除了弹性资源管理，自带的数据多备份，自适应运维管理，标准化的工具和操作，笔者觉得更重要的是降低用户的使用门槛，用更小的成本给用户提供更简单，稳定和丰富的使用体验。

■ Flink 容错 –– 稳定快速的 Checkpoint

和 Checkpointing 相关的讨论几乎贯穿了 Flink 的整个发展历程，它是整个 Flink 容错架构的核心。Flink 会定期给所有的算子状态做快照检查点 (Checkpoint），如果 Flink 作业失败，作业会从上一个完整的 Checkpoint 恢复。在实际工作中，我们发现引擎这一层很大部分的 Oncall 的问题都跟做 Checkpoint 相关，所以如何能够高频稳定的完成 Checkpoint 是提升 Flink 高可用性 (容错) 的重点。造成做 Checkpoint 失败 (超时) 的主要原因来自两方面：

一是中间数据流动缓慢造成 Checkpoint Barrier 流动缓慢；
二是算子状态过大造成状态数据上传超时。

Flink 针对这两个方面都有重点项目在跟进：Buffer Debloating 和 Generalized Log-Based Checkpoint。

Buffer Debloating 是在不影响吞吐和延迟的前提下缩减上下游需要缓存的数据到刚好算子不空转，目前上游会动态缓存下游 1 秒钟能处理的数据 (这个时间是可以配置的)。Buffer Debloating 在 Flink-1.14 版本已经发布。Generalized Log-Based Checkpoint 是一种基于 log 打点的方式来做 Checkpoint 的方法，类似传统 DB 的 write ahead log，好处是能快速，高频且稳定的做 Checkpoint，代价是需要额外多写/存一份 log。我们知道 Flink 做 Checkpoint 由同步和异步两个过程组成，同步的过程通常很快，主要的耗时在异步上传状态文件这个过程中。Generalized Log-Based Checkpoint 的原理就是将 Checkpointing 这个过程和耗时的异步上传文件这个过程剥离开，也同时和底层状态存储的物化过程解耦。Generalized Log-Based Checkpoint 预计会在 Flink-1.15 版本发布。

分论坛核心技术专场 talk “Flink 新一代流计算和容错 (Flink Fault Tolerance 2.0)” 对这个部分有更为详细的阐述，感兴趣的同学可以找来看看。

■ 流批一体 –– 架构演进和落地

流批一体是近些年 Flink 一直在力推的创新性理念，从最早提出这个理念到当前被广泛接受，莫问老师分享了流批一体在 Flink 的系统架构各个层面演进的过程及其落地场景，如下图所示。

1）架构演进

API 层面，去年流批统一的 SQL/Table API (Declarative API) 首次在阿里巴巴双十一最核心的天猫营销活动分析大屏场景中落地[3]，今年更近一步，完成了 Imperative API 的整合，形成流批统一的 DataStream API，而陈旧的 DataSet API 将逐步被淘汰。架构层面，同一个作业可以同时处理有限数据集和无限数据集；并且 connector 框架可以同时对接流式存储和批式存储，做到一套代码可以处理两套数据源。运行层面，一套调度框架可以同时适用于流和批的作业；流批 shuffle 是 pluggable 的，复用一套 shuffle 接口。阿里巴巴实时计算团队在今年开源了存算分离的 Remote Shuffle Service[4]，放在 Flink 开源项目的 Flink-extended 这个子项目组里面。Flink-extended[5] 里面包含很多其他 Flink 生态项目，有兴趣的同学可以去看一看。

继去年在天猫双十一核心大屏业务上线后，流批一体今年逐步在阿里巴巴更多核心业务上推广。除了阿里巴巴，有越来越多的公司认可流批一体这个理念。今年FFA有个专门的流批一体分论坛，由字节跳动，美团，京东以及小米等公司分享流批一体在其业务中的实践。此外在核心技术专场中有专门针对流批一体架构演进的专场 talk “面向流批一体的 Flink Runtime 新进展”，对这个话题感兴趣的同学可以了解一下。对新版 connector 框架原理感兴趣的同学可以参考核心技术专场中的 “Flink Connector 社区新动向与 Hybrid Source 原理实践”。

2）场景落地

莫问老师指出，流批一体这一技术理念落地需要具体的场景支撑来体现其真正价值，基于此，他分享了流批一体最为典型的两个应用场景。

场景1 Flink CDC：全增量一体化数据集成

在传统的数据集成中，离线和实时数据集成是两套不同的技术栈，需要全量和增量定时合并，时效性也比较差。Flink的流批一体能力结合 Flink CDC 的能力可以实现一体化数据集成：先全量的同步完历史数据后自动接到断点，实时的续传增量数据，实现一站式数据同步（读取数据库全量数据后自动切换，通过 binlog 增量同步）。这里的自动切换的实现基于新版流批一体 Source 框架。

Flink CDC 目前已可以支持大部分主流数据库包括 MySQL、Postgres、Oracle、MongoDB、MariaDB，其他的如 TiDB，DB2，SQL Server 也在积极开发中。对 Flink CDC 如何能够实现一站式数据集成感兴趣的同学可以参考分论坛实时数据湖专场中的talk “Flink CDC 如何简化实时数据入湖入仓”。

场景2 Streaming Warehouse：流式数仓

前面提到，今年的一大亮点是莫问老师提出的流式数仓 (Streaming Warehouse) 这个概念，这个概念提出的大背景是为了解决实时离线数仓一体化的问题。

实时离线数仓一体化这个问题目前比较常用的解决方案是用实时和离线两条链路来实现：

实时流处理链路 (Flink + Kafka) 对数据进行分层ODS，DWD，DWS，并实时写入在线服务层，提供在线服务 (实时 OLAP)；
同时会有一条离线链路定期对实时数据进行补充和历史修正。

这里除了常见的流批不统一带来的开发效率，维护成本，流批口径不统一等问题以外，其实还有一个更隐蔽同时也更难解决的问题：为了保证实时性，实时链路中的 ODS，DWD，DWS 这些分层数据是存在消息队列 (比如 Kafka) 中的，但是消息队列中的数据是没办法有效进行实时分析的，如果引入其他的 OLAP 系统会增加系统复杂度同时也不能保证数据一致性。

为了解决消息队列无法有效率的进行实时分析的问题，Flink 引入了 Dynamic Table 动态表来存放实时链路产生的分层数据，如上图所示。这样一来，Flink 可以通过 Flink SQL 的流批一体能力实时的串联起整个分层数仓；通过 Flink SQL 对 Dynamic Table 的 OLAP 查询提供实时分析的能力。我们可以把这个理解成流批一体的进阶版本流批实时分析一体化，也就是莫问老师这里提出的流式数仓 (StreamHouse = Streaming + Warehouse) 这个概念，真正做到在一套方法论的大框架下实现一套API，一套计算，一套中间存储的全链路一体化。

Dynamic Table (动态表) 不同于一般意义上的 Source和Sink，是 Flink 的内置表。之所以称为动态表是因为此表具有流表二象性。流表二象性通过列存 LSM Tree 和 Log 两种不同的存储形式来支持，分别对应于 Flink SQL 的批 (全量分析) 和流 (增量处理) 两种模式。Dynamic Table 通过 Flink 自身的 Checkpointing 一致性语义机制保证流表二象性在两种存储形式下的一致性语义。这里需要注意的是，流表二象存储的数据一致性问题是混拼系统 (引入其他 OLAP 和消息队列) 无法轻易规避和解决的问题 (因为中间涉及多系统间的一致性读写同步)。如果大家对动态表的实现感兴趣的话可以看一看流批一体分论坛中 “基于 Flink Dynamic Table 构建流批一体数仓” 这个 talk，里面有对 Dynamic Table 更详细的介绍。

这个部分的最后有一个流式数仓的 demo，用上述一体化的方法论展示了流作业在实时 OLAP 分析发现业务逻辑有错后，如何批式做订正并实时支持 OLAP 查询更正的一个流批实时分析一体化的典型场景，还是很受启发的，大家可以看一看。想对流式数仓有更详细了解的同学可以参考莫问老师关于流式数仓的专访[6]。

■ 机器学习 –– Apache Flink ML 2.0 全新架构

机器学习作为 Apache Flink 的另一大重要场景，在今年 Flink 流批一体 API 和架构进一步完善的基础上，基于流批一体 DataStream API 完成重构，全面升级到 Flink ML 2.0。Flink ML 最大的特点是实时离线一体化，以及与之相配套的实时离线一体化管理调度 (Flink AI Flow) 和执行。在 Flink ML 2.0 中有几个新的亮点是值得看一看的：

Flink 基于 DataStream 引擎原生支持全新的迭代计算框架，支持更灵活的分布式同步和异步迭代；
发布了一套新版 Flink ML pipeline API，遵循机器学习用户更熟悉 Scikit-Learn 风格 (Transformer，Estimator，Model)；
支持一体化的深度学习集成，Flink ML Estimator 可以将 Pytorch 和 Tensorflow 拉起；
流批一体能力使得 Flink ML 2.0 可以同时对接流和批的数据集。

Flink ML 2.0 目前已经由阿里巴巴实时计算团队和机器学习团队共同完成，贡献给 Flink 社区，成为 Flink 的一个子项目 Flink-ML[7]。值得一提的是除了阿里巴巴，现在还有很多其他公司也在共同建设 Flink ML 的生态，比如 360 贡献了 Clink[8]。核心技术专场中 “为实时机器学习设计的算法接口与迭代引擎” 这个 talk 详细介绍了 Flink ML 2.0 的架构演进，此外今年 FFA 还有一个机器学习专场，感兴趣的同学可以看一看。

PyFlink 方面，Flink 对 AI 的主流开发语言 Python 的支持更加完备：PyFlink 在功能上完全追平了 Table API 和 Data Stream API 的能力，在性能上创新性的通过 JNI 调用 C，再在 C 里面调用 Python 解析器的方法消除了 Python UDF 和 Java 跨进程通信，使得 Python UDF 性能接近 Java UDF，兼顾开发和运行的效率。分论坛核心技术专场 “基于 FFI 的 PyFlink 下一代 Python 运行时介绍” 有对这部分更详细的解释。

2. 实时计算在字节跳动的发展与展望

主议题第二场由字节跳动计算基础架构负责人师锐老师带来。字节跳动的产品业务场景主要都是以实时信息流推荐为主，因此以 Flink 为支撑的实时计算广泛应用在字节跳动的各个产品中。字节跳动旗下全线产品总 MAU 目前已超过 19 亿，由于其业务特性，其数据量 (EB 级别，1EB = 2^60 Bytes) 和实时推荐的请求量 (百万 QPS) 都是巨大的。我们可以看到在师锐老师分享的字节跳动引擎资源使用的对比图中，Flink 和 Spark 基本持平，这在一般的公司是不太常见的，从这个方面也可以看出字节跳动整个业务线对以 Flink 为基础的流计算的依赖。

字节跳动主要计算引擎资源对比图

字节跳动从 2017 年开始调研并逐步使用 Flink 流式计算，到 2019 年初，所有流式作业已完成从 JStorm 迁移到 Flink。2019 年开始，随着 Flink SQL 和 Flink 批式计算的成熟，Flink Batch 也在字节跳动数据同步等场景相继落地，现在每天大概有 10w+ Flink Batch 作业运行。师锐老师特别提到，从去年开始，流批一体也逐步在字节跳动公司内部推广应用。目前字节跳动全球 Flink 流式作业达到 4w 个，其中 SQL 作业占 30%，使用的 CPU 核数超过 400 万核，晚高峰 Flink 作业处理消息的 QPS 达到 90 亿，Checkpoint 高峰流量吞吐达到 600GB/s，还是很惊人的！

Flink 在字节跳动发展图

在字节跳动的分享中，基于存算分离架构的流批一体消息队列 BMQ 值得提一提 (BMQ 目前承接了字节 90% 的消息队列流量)。在 BMQ 之前，字节使用 Kafka 作为消息队列，集群升级扩缩容需要大量拷贝数据，所以完成一个集群的升级差不多需要一周的时间。为了解决这个问题，字节团队基于存算分离的架构重新设计实现了消息队列，BMQ。在 BMQ 的架构之下，数据存放在分布式文件系统 HDFS 中，Meta 存放在 K-V 存储中。由于 BMQ 的计算层 Proxy 无状态所以非常容易做扩缩容，迁移时间可在分钟级完成。另一方面，BMQ 可以同时提供 Stream API 和 Batch API，所以可以同时支持流和批的消费，实现存储层的流批一体。有些小伙伴可能有疑问，这和上面提到的动态表 (Dynamic Table) 一样吗？笔者觉得还是很不一样的，因为要解决的问题不一样：动态表要解决流批实时分析一体化的问题，所以它的流批存储格式是完全不一样的 (为了分别加速流处理和批查询)；而 BMQ 所有数据只写一份在 HDFS 上，主要还是为支持高效的大规模消息传输和读写服务的。

师锐老师提到他们下一步计划是推进 Flink OLAP 的落地。他指出，Flink 拥有丰富的 connector 生态可以实现跨数据源查询，Flink OLAP 能力在字节内部测试过可以媲美 Presto，甚至在有些情况下更优，现在有关 Flink OLAP 的改进和优化也在积极推进 Flink 社区中。本次 FFA 字节跳动有 7 个分会场 talk，从核心技术提升到行业实践涵盖了方方面面，对 Flink 在字节跳动内部如何演进使用感兴趣的同学可以去看看。

3. 工商银行实时大数据平台建设历程及展望

主议题第三场由中国工商银行大数据平台负责人袁一老师带来，他从金融行业的视角分享了有关工行实时大数据平台建设的历程和思路。

首先我们来看一张描述工行数据流向的示意图，如上图所示。应用产生的数据会写入到 MySQL 或 Oracle 等关系型数据库，之后将数据库产生的日志复制到 Kafka 消息队列中作为实时处理平台的数据源。实时处理平台有三个数据出口：

一是通过 Flink 实时 ETL 可以实现实时数据入湖；
二是将 Flink 的结果输出到 HBase 或者 ES 等联机数据库中提供面向应用的数据中台服务；
三是通过 Presto 或 CK 等分析型引擎，提供面向分析师的 BI 分析能力。

工行内部的高时效业务场景，基本上都可以包含在这条链路体系之中。

聪明的小伙伴们可能已经发现了，上面这条复杂数据链路和 Flink 流式数仓 (Streaming Warehouse) 场景几乎一摸一样。但是通过 Flink 的流式数仓，我们可以把工行的这条中间贯穿很多系统和组件的链路简化成 Flink 单链路，通过 Flink 的动态表 (Dynamic Table) 提供的流批实时分析一体化的能力来完成实时入湖，实时数据服务和实时分析！

另一个比较有趣的点是金融行业的数据中台在设计的时候会特别考虑数据私密和安全的问题。他们采用的方法有以下几种：

采用全生命周期的数据监控审计，用于数据访问的审计和追溯；
在数据发生移动的时候给数据本身加水印可以方便溯源；
通过 SQL 实现自然人级别的动态数据访问权限控制；
通过专家规则和 Machine Learning 来自动识别海量数据中的敏感数据。

这些思想和方法在数据安全，数据私密越来越受重视的今天很有借鉴意义。袁一老师还详细分享很多和金融行业相关的业务场景，相信对业务场景感兴趣的同学应该会有所启发。

4. Deconstructing Stream Storage

主议题的最后一场由 Pravega 中国社区创始人，戴尔科技集团 OSA 软件开发总监滕昱老师压轴：解构流存储。

Pravega 是提供流批统一能力的开源分布式流存储，有如下特点：

相同键值下可以保证数据有序；
可以根据数据流量动态扩缩存储单元；
支持事务性写入；
支持 Checkpointing 和一致性读写；
分层存储设计。

所有的这些特性都封装在 Stream 抽象的设计理念之下，也给流式计算屏蔽了很多流存储端的复杂性。在这次分享中，滕昱老师着重介绍了 Pravega 的分层存储架构 (Tiered Storage)：其底层是一个基于分布式文件/对象存储的持久性主存储，中间是基于内存的全局 Cache 层，最上层是分布式 Log 抽象层。滕昱老师还同时分享了 Pravega 的分层存储架构与 Kafka 和 Pulsar 这两个消息系统在架构上的区别以及对性能的影响，感兴趣的同学可以去详细了解一下。

在 Pravega 的分享中有几个比较有趣的点：

一是 Pravega 针对现在比较火热的物联网边缘计算的定制优化，比如 Pravega 针对多客户端的两阶段数据聚合，在 Writer 进行第一阶段聚合，在 Segment Store 进行第二阶段聚合，极大的提高了吞吐量。这种数据聚合优化非常适用于有大量客户端但每个客户端产生的数据量比较小的情况，而这就是物联网的典型特点。
二是 Pravega 和 Flink 联动的端到端的 auto-scaling。弹性扩缩容是云原生大背景下非常重要的问题，前面提到 Pravega 的一大特点就是可以自动扩缩容，调整 Segment 数目，而这个数目可以很好的作为 Flink Reactive Scaling 的指标，两者相结合后可以做到从计算到存储端到端的 auto-scaling，目前这项工作已在两边社区合作规划中。滕昱老师的分享中还有一个 Demo 展示了 Pravega 和 Flink 联动 scaling 的效果。

滕昱老师表示未来存储和计算，流和表的界限逐渐模糊，Pravega 流批一体的存储设计也暗合了 Flink 未来很重要的一个发展方向。Pravega 社区会积极与包括 Flink 在内的数据湖仓相关的开源社区通力合作，构建解决方案。今年 Pravega 和 Flink 社区共同发布了白皮书，未来也期望和 Flink 社区有更多合作，将 Flink 计算推向数据的产生端，通过 Pravega 能实现数据从端到云的流动。

圆桌会议

今年 FFA 主会场新增加了一个环节圆桌会议 (分北京和上海两场)，邀请了业界来自阿里巴巴，字节跳动，美团，快手，小米，工商银行，戴尔科技集团和小红书在内的多位大数据专家负责人，共同探讨 Flink 以及实时计算的未来。各位大佬友好真诚并且很接地气讨论了很多大家都比较关心的问题，由于篇幅关系，这里仅列出了讨论的部分相关话题，大家可以找视频感受一下：

如何看待 Flink 在实时计算方面已趋于成熟这个话题，目前大家都用实时计算做什么？
实时计算的未来是怎样的 (技术和业务层面)？基于此，Flink 需要探索哪些新的领域，解决哪些关键问题？
有人认为实时计算的门槛和代价比较高，相对偏小众；也有很多人认为实时计算是未来的方向，大数据和 AI 都会向实时化方向演进；大家怎么看这个问题？
Flink 在整个开源大数据生态中应该如何定位，如何保持差异化？
如何看待公司内部技术实践，技术创新与开源社区之间的关系，大家使用和回馈社区的策略又是什么？
使用和贡献开源项目有哪些优势？在公司内部在做 Flink 哪方面的探索？过程中又遇到过哪些挑战？
Flink 在内部使用的未来规划，以及接下来有哪些打算贡献社区的创新技术？
如何看待 Flink 与生态项目之间的 (合作、竞争) 关系？
什么样的开源社区是对大家有帮助的开源社区？同时又是一个可持续发展的社区？

总结和感想

过去的 2021 年是大数据领域的风口年，对于 Apache Flink，实时计算的领跑者，能否抓住这个风口也是很关键的一年。在 Flink SQL 趋于成熟，流批一体在业内逐步接受落地的当口，我们需要思考未来 Flink 何去何从，这也是我们正在做的事情。在此基础上，Flink推出了流批一体的进阶版，流式数仓 (Streaming Warehouse) 这个概念，希望能实现流批实时分析一体化，真正意义上完成流批一体计算和流批一体存储的融合，做到在一套方法论的大框架下实现一套 API，一套计算，一套中间存储的全链路一体化。流式数仓将是 Flink 未来最重要的方向，道阻且长，行则将至，行而不辍，未来可期！

注释

[1] Flink 官方学习网站 Flink Learning（https://flink-learning.org.cn/）

[2] https://flink-forward.org.cn/

[3] 40亿条/秒！Flink流批一体在阿里双11首次落地的背后

[4] Remote Shuffle Service（https://github.com/flink-extended/flink-remote-shuffle）

[5] Flink-extended（https://github.com/flink-extended/）

[6] Apache Flink 不止于计算，数仓架构或兴起新一轮变革

[7] Flink-ML（https://github.com/apache/flink-ml）

[8] Clink（https://github.com/flink-extended/clink）

更多 Flink 相关技术问题，可扫码加入社区钉钉交流群～

你可能感兴趣的:(大数据,编程语言,数据库,人工智能,java)

跟着黑马学MySQL基础篇笔记(1)-概述与SQL 小杜不吃糖 mysql 笔记 sql
03.安装与启动启动netstartmysql80netstopmysql80客户端连接mysql[-h127.0.0.1][-P3306]-uroot-p04.mysql数据模型关系型数据库RDBMS05.通用语法及分类DDL：数据定义语言，用来定义数据库对象（数据库，表，字段）DML：数据操作语言，用来对数据库表中的数据进行增删改DQL：数据查询语言，用来查询数据库中表的记录DCL：数据控制语
adb 如何导出手机的文件风继续吹.. 工具类 Uni-App adb 智能手机 uniapp sqlite
目录1.开启USB调试2.连接设备3.启动ADB4.导出文件使用adbpull命令5.可视化工具预览adb（AndroidDebugBridge）是Android开发中常用的一个工具，它允许开发者通过电脑与Android设备进行通信。如果你想通过adb导出手机上的文件，你可以按照以下步骤业务需求:前端通过使用uni-app的sqlite(关系型数据库系统),存储了大量的机密数据在手机上,直接通过代
PostgreSQL_数据使用与日数据分享程序猿与金融与科技数据库 postgresql
目录前置：1使用1.1获取前复权因子1.2查询股票的纵向数据1.3查询股票的横向数据2日数据分享（截止至：2025-03-21）总结前置：本博文是一个系列。在本人“数据库专栏”-》“PostgreSQL_”开头的博文。本文为该系列最后一篇。1使用1.1获取前复权因子访问优矿官网ticker_list=[]field_list=['secID','tradeDate','accumAdjFactor
PostgreSQL_实例项目总述程序猿与金融与科技数据库 postgresql
目录前置：实例项目总述：前置：1最近新入PostgreSQL，打算用PostgreSQL存储股票日数据，以此为实例记录整个PostgreSQL使用过程2所以这次的博文是一个序列，都放在数据库专栏里，以PostgreSQL_打头3PostgreSQL的安装在这个系列里就不赘述了，安装过程简单。（如果有人实在搞不懂怎么安装，可以留言）实例项目总述：项目描述：股票日数据仓库数据来源：优矿1数据表结构设计
hadoop3.x--搭建hadoop高可用集群（HA模式）运维小菜 hadoop hadoop hdfs
hadoop高可用集群（HA模式）一、安装前1.集群规划2.安装前配置3.安装jdk与hadoop4.克隆虚拟机与互信配置5.搭建zookeeper集群二、HDFS1.配置hdfs2.初始化启动hdfs集群三、MapReduce与Yarn1.配置MapReduce2.配置yarn3.启动yarn四、验证1.查看java进程2.hdfs与yarn前台页面一、安装前1.集群规划hostnameipNN
直方图梯度提升：大数据时代的极速决策引擎万事可爱^ 大数据机器学习深度学习直方图梯度提升 GBDT 算法
一、为什么需要直方图梯度提升？在Kaggle竞赛的冠军解决方案中，超过70%的获奖方案都使用了梯度提升算法。但当数据量突破百万级时，传统梯度提升树（GBDT）面临三大致命瓶颈：训练耗时剧增：每个特征的分割点计算都需要全量数据排序内存消耗爆炸：存储排序后的特征值需要额外空间处理效率低下：无法有效利用现代CPU的多核特性而梯度提升决策树（GBDT）作为集成学习的代表算法，通过迭代构建决策树实现预测能力
SSM卫生人员评审专家申报系统浅浅学姐课程设计毕业设计服务器运维 java 开发语言数据库后端
点赞+收藏+关注→添加文档最下方联系方式咨询本源代码、数据库本人在Java毕业设计领域有多年的经验，陆续会更新更多优质的Java实战项目希望你能有所收获，少走一些弯路。关注我不迷路项目视频SSM347的卫生人员项目申报评审管理系统资料介绍一、设计说明1.1研究背景面对大量的信息，传统的管理系统，都是通过笔记的方式进行详细信息的统计，后来出现电脑，通过电脑输入软件将纸质的信息统计到电脑上，这种方式比
SSM卫生人员评审专家申报系统 Plume98 课程设计毕业设计服务器运维 java 开发语言数据库后端
点赞+收藏+关注→添加文档最下方联系方式咨询本源代码、数据库本人在Java毕业设计领域有多年的经验，陆续会更新更多优质的Java实战项目希望你能有所收获，少走一些弯路。关注我不迷路项目视频SSM347的卫生人员项目申报评审管理系统资料介绍一、设计说明1.1研究背景面对大量的信息，传统的管理系统，都是通过笔记的方式进行详细信息的统计，后来出现电脑，通过电脑输入软件将纸质的信息统计到电脑上，这种方式比
初级：数组与字符串面试题深度剖析佩奇的技术笔记 Java面试小册 java
一、引言在Java开发中，数组和字符串是最常用的数据结构之一。面试官通过相关问题考察候选人对数组和字符串的理解和运用能力，以及在实际开发中解决相关问题的经验。本文将深入剖析常见的数组与字符串面试题，结合实际开发场景，帮助读者全面掌握这些知识点。二、数组面试题：如何对数组进行初始化和遍历？答案：数组的初始化可以使用直接初始化、动态初始化等方式。遍历数组可以使用传统的for循环、增强型for循环（fo
windows使用ssh-copy-id命令的解决方案爱编程的喵喵 Windows实用技巧 windows ssh ssh-copy-id 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了windows使用ssh-copy-
数据库事务：确保数据一致性的关键机制可儿·四系桜数据库 java #MySQL 数据库 java 后端
1.什么是数据库事务定义：事务（Transaction）是数据库管理系统中的一个逻辑工作单元，用于确保一组相关操作要么全部成功执行，要么全部不执行，从而维护数据的一致性和完整性。重要性：在多用户环境下，当多个事务并发执行时，为了保证数据的完整性和一致性，事务的概念变得至关重要。例如，在银行转账系统中，从一个账户扣款并给另一个账户加款这两个操作必须同时成功或者同时失败，否则就会导致资金账目混乱。2.
关于AI OS那点事大囚长科普天地大模型人工智能
AIOS（人工智能操作系统）作为面向智能时代的操作系统，其功能定位和架构设计与传统操作系统（如Linux、Windows、iOS等）存在显著差异。一、AIOS需具备的核心功能智能体全生命周期管理智能体调度与并发：需支持多智能体任务的优先级排序、资源分配及并发执行，例如通过轮询调度或动态优先级算法优化LLM资源利用率。上下文感知与切换：通过上下文管理器实现智能体交互状态的快照保存与恢复，解决LLM生
@Autowired 和 @Resource 注解的区别在努力的韩小豪 spring spring boot java-ee java
前言@Autowired和Resource是Spring中用于依赖注入的注解，但两者在实现机制和使用方式上有显著差异。主要区别1.来源不同@Autowired：由Spring框架提供（org.springframework.beans.factory.annotation），与Spring强耦合。@Resource：由JSR-250规范定义（javax.annotation.Resource），属
【业务场景实战】JWT实现用户登录仰望-星空~~ java
在我们平时登录注册的过程中，我们的信息都会由浏览器发送给后端进行处理，然后再插入到数据库中，下次我们进行登录的时候，只需要输入用户名和密码就可以登录成功进入网站进行操作了。但个人信息暴露在大众面前这是极其不安全的，对于我们的隐私，我们并不希望被别人知道。所以我们在登录的时候，浏览器中进行传递的数据有些是会脱敏、有些是需要进行加密之后才能进行传递的。一、JWT简介JWT（全称JSONWEBToken
【业务场景实战】数据增量同步仰望-星空~~ android
时间过得真快，又是一年求职季，再过几个月我也要找暑假实习了，最近比较忙加上自身状态也不是很好，导致我的博客断更了很长时间。之后我尽量每周一更，好了，今天我们来讲讲关于数据增量同步。在一些比较大、用户量比较多、实时性要求比较高的的系统中，我们通常需要进行数据同步。这不只是为了提高系统的并发量，降低数据库访问的压力，提升用户的体验。同时也是为了让系统能够稳定运行，满足特定的场景需求。对于一些购物网站实
JAVA刷Leecode-贪心算法-分配问题-分发饼干搬砖的水鱼 leetcode 算法 java python leetcode 贪心算法
JAVA刷Leecode-贪心算法算法思想分配问题-分发饼干（135，hard)算法思想采用贪心的策略，保证每次操作都是局部最优解，从而最终的结果是全局最优。贪心算法不是对所有问题都能得到整体最优解，选择的贪心策略必须具有无后效性，即某个状态以前的过程不会影响以后的状态，只和当前的状态相关。包括分配问题（455，135）和区间问题（435）；练习：605，452，763，122，406。分配问题-
使用Spring Boot实现分布式任务调度 weixin_836869520 spring boot 分布式后端
使用SpringBoot实现分布式任务调度大家好，我是微赚淘客系统3.0的小编，是个冬天不穿秋裤，天冷也要风度的程序猿！一、SpringBoot与分布式任务调度概述在分布式系统中，任务调度是一项关键的技术，它能够有效地管理和调度系统中的各种任务，确保任务能够按时执行并具有高可用性和可靠性。SpringBoot作为Java领域流行的开发框架，提供了多种实现分布式任务调度的解决方案。二、SpringB
C++有哪些高级特性值得学习？ c++
C++是一种功能丰富且复杂的编程语言，其中许多高级特性可以帮助开发者编写更高效、更安全、更灵活的代码。以下是一些值得深入学习的C++高级特性：模板编程（Templates）模板是C++中实现泛型编程的核心机制，允许开发者编写与数据类型无关的代码。模板函数cpp复制templateTmax(Ta,Tb){return(a>b)?a:b;}优点：模板函数可以处理多种数据类型，避免了代码重复。应用场景：
鸿蒙开发：ArkTs字符串string
前言本文代码案例基于Api13。字符串在实际的开发中还是非常重要的，牵扯到的用法也是比较多的，比如字符串中的查找，替换，切割等等。字符串（String）是由零个或多个字符组成的有限序列，在计算机编程和数据处理中广泛使用。字符串可以包含字母、数字、标点符号、空格，甚至可以是空字符串（即不包含任何字符的字符串）。字符串是文本信息的基本表示形式，在几乎所有编程语言中都有专门的字符串数据类型或类来处理它们
基于 Redis 的分布式锁实现与优化 Blossom.118 分布式系统与高性能计算领域 redis 分布式数据库 python3.11 算法数据结构推荐算法
在分布式系统中，锁机制是保障数据一致性和并发控制的关键技术之一。Redis作为一种高性能的内存数据库，常被用于实现分布式锁。本文将详细介绍基于Redis的分布式锁的实现原理、代码示例以及优化策略，帮助读者更好地理解和应用这一技术。一、分布式锁的概念与需求在单机系统中，锁的实现相对简单，可以通过操作系统的同步机制或编程语言提供的锁机制来完成。然而，在分布式系统中，多个进程或线程可能运行在不同的机器上
摄影工作室预约管理系统基于Spring BootSSM QQ1978519681计算机程序 spring boot 后端 java 毕业设计计算机毕设
目录摘要一、系统架构二、功能模块2.1用户管理模块2.2摄影师管理模块2.3预约管理模块2.4商品管理模块2.5管理员管理模块三.数据库设计四.技术栈五.安全性与性能六.用户界面与体验七.扩展性与可维护性摘要在数字化与信息化飞速发展的当下，人们的生活节奏日益加快，对于各类服务便捷性、高效性的需求也愈发强烈。摄影服务作为记录生活美好瞬间、留存珍贵回忆的重要方式，深受大众喜爱。然而，传统的摄影工作室预
【人工智能】大模型的幻觉问题：DeepSeek 的解决策略与实践蒙娜丽宁 Python杂谈人工智能人工智能
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界大语言模型（LLM）的“幻觉”问题，即模型生成与事实不符或脱离上下文的内容，是限制其广泛应用的关键挑战之一。本文深入探讨了幻觉问题的成因，包括训练数据的偏差、推理过程中的过度泛化以及缺乏外部验证机制。以DeepSeek系列模型为研究对象，我们分析了其在解
汇编 - 基础知识雨过濯缨汇编语言汇编
文章目录前言1.组成2.指令和数据3.存储器读写4.地址总线5.数据总线6.控制总线7.计算机组成7.1存储器芯片8.内存地址空间总结前言汇编语言是直接在硬件之上工作的编程语言,首先了解硬件系统的结构,才能有效地应用汇编语言对其编程;值得注意的是,汇编指令是机器指令便于记忆的书写格式.此处的汇编语言版本为8086CPU的MASM宏汇编版本1.组成编译器:将汇编指令转换为机器指令的翻译程序编写编
从原理到实践：Go 语言内存优化策略深度解析叶间清风1998 服务器 linux 网络
目录一、引言二、Go语言内存管理基础原理2.1栈与堆内存分配2.2垃圾回收机制剖析三、内存优化策略与实践3.1合理使用指针传递3.2避免不必要的内存分配3.3优化切片与映射的使用3.4控制变量作用域3.5减少闭包导致的变量逃逸四、内存优化工具与性能分析4.1pprof工具的使用4.2其他性能分析辅助手段五、不同场景下的内存优化案例分析5.1高并发Web服务场景5.2大数据处理与分析场景六、总结与展
HCIA-AI人工智能笔记3：数据预处理噗老师华为认证人工智能笔记 wpf 数据处理 AI 华为认证
统讲解数据预处理的核心技术体系，通过Python/Pandas与华为MindSpore双视角代码演示，结合特征工程优化实验，深入解析数据清洗、标准化、增强等关键环节。一、数据预处理技术全景图graphTDA[原始数据]-->B{数据清洗}B-->B1[缺失值处理]B-->B2[异常值检测]B-->B3[重复值删除]A-->C{特征工程}C-->C1[标准化/归一化]C-->C2[离散化分箱]C--
贪心算法（9）（java）最优除法奋进的小暄 java 贪心算法算法
题目：给定一正整数数组nums,nums中的相邻整数将进行浮点除法。例如，[2,3.4]->2/3/4.例如，nums=[2,3,4]，我们将求表达式的值“2/3/4"。但是，你可以在任意位置添加任意数目的括号，来改变算数的优先级。你需要找出怎么添加括号，以便计算后的表达式的值为最大值。以字符串格式返回具有最大值的对应表达式。注意:你的表达式不应该包含多余的括号。输入：【1000，100，10，2
深入解析 Redis 实现分布式锁的最佳实践煜bart 机器人 redis python
前言在分布式系统中，多个进程或线程可能会同时访问同一个共享资源，这就可能导致数据不一致的问题。为了保证数据的一致性，我们通常需要使用分布式锁。Redis作为高性能的内存数据库，提供了一种简单高效的方式来实现分布式锁。本文将深入探讨如何使用Redis来实现分布式锁，并介绍一些优化技巧和最佳实践。---一、为什么需要分布式锁？在单机环境下，我们可以使用synchronized、Lock等方式来控制并发
基于Spring Boot的分布式任务调度实践 Blossom.118 分布式系统与高性能计算领域 wpf spring boot java 后端分布式 spring 开发语言
在现代的分布式系统中，任务调度是一个常见的需求。无论是定时任务的执行，还是根据业务逻辑动态触发的任务，都需要一个高效、可靠的调度框架来管理。SpringBoot作为目前最流行的Java开发框架之一，提供了强大的依赖管理和快速开发的能力，结合分布式任务调度框架，可以极大地提升开发效率和系统的可维护性。本文将介绍如何基于SpringBoot实现一个分布式任务调度系统，主要涉及Elastic-Job框架
解释CALL_FORM,NEW_FORM和OPEN_FORM之间有什么区别？思维导图代码示例（java 架构) 用心去追梦 java 架构开发语言
CALL_FORM,NEW_FORM和OPEN_FORM之间的区别在OracleForms中，CALL_FORM、NEW_FORM和OPEN_FORM是用于管理和启动表单的不同命令。每个命令的行为和用途都有所不同，理解它们的区别对于正确构建和管理Forms应用程序非常重要。1.CALL_FORM定义：调用并运行另一个表单，但不会关闭当前表单。被调用的表单以模式对话框的形式显示，即用户必须完成或取消
我要写整个中文互联网界最牛逼的JVM系列教程 | 「JVM与Java体系架构」章节：JVM的生命周期李阿昀只要你有心人人都是JVM精通者 jvm java 架构
这一讲，我们就来好好谈一谈JVM的生命周期。JVM的生命周期大家做了这么久的开发，应该知道很多的结构其实都有其生命周期吧！而关于JVM的生命周期，这里我们则主要讲述它的三个状态，即虚拟机的启动、虚拟机的执行以及虚拟机的退出，这也是一个结构的生命周期最起码应该具备的三个状态——开始、运行、结束。这就像哲学里面讨论的终极问题一样，我是谁？我从哪里来？我将到哪里去？其实，我觉得先提出我是谁这个问题不太合
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。