Ververica

应用案例 | Blink 有何特别之处？菜鸟供应链场景最佳实践

作者：晨笙、缘桥

菜鸟供应链业务链路长、节点多、实体多，使得技术团队在建设供应链实时数仓的过程中，面临着诸多挑战，如：如何实现实时变Key统计？如何实现实时超时统计？如何进行有效地资源优化？如何提升多实时流关联效率？如何提升实时作业的开发效率？而 Blink 能否解决这些问题？下面一起来深入了解。

背景

菜鸟从2017年4月开始探索 Blink（即 Apache Flink 的阿里内部版本），2017年7月开始在线上环境使用 Blink，作为我们的主流实时计算引擎。

为什么短短几个月的探索之后，我们就选择Blink作为我们主要的实时计算引擎呢？

在效率上，Blink 提供 DataStream、TableAPI、SQL 三种开发模式，强大的 SQL 模式已经满足大部分业务场景，配合半智能资源优化、智能倾斜优化、智能作业压测等功能，可以极大地提升实时作业的开发效率；在性能上，诸如MiniBatch&MicroBatch、维表 Async&Cache、利用 Niagara 进行本地状态管理等内部优化方案，可以极大地提升实时作业的性能；在保障上，Blink 自带的 Failover 恢复机制，能够实现线程级的恢复，可以做到分钟级恢复，配合 Kmonitor 监控平台、烽火台预警平台，可以有效地实现实时作业的数据保障。

接下来，我将结合供应链业务的一些业务场景，简要说明，Blink 如何解决我们遇到的一些实际问题。

回撤机制

订单履行是供应链业务中最常见的物流场景。什么是订单履行呢？当商家 ERP 推单给菜鸟之后，菜鸟履行系统会实时计算出每笔订单的出库、揽收、签收等节点的预计时间，配送公司需要按照各节点的预计时间进行订单的配送。为了保证订单的准点履约，我们经常需要统计每家配送公司每天各个节点的预计单量，便于配送公司提前准备产能。

看似很简单的实时统计加工，我们在开发过程中遇到了什么问题呢？履行重算！当物流订单的上游某个节点延迟时，履行系统会自动重算该笔订单下游所有节点的预计时间。比如某个物流订单出库晚点后，其后的预计揽收时间、预计签收时间都会重算。而对于大部分的实时计算引擎来说，并不能很友好的支持这种变 Key 统计的问题。以前，数据量没那么大的时候，还可以通过 OLAP 数据库来解决这类场景，当量上来后， OLAP 方案的成本、性能都是很大的问题。

除了 OLAP 方案，我们提倡采用 Blink 已经内置的 Retraction 机制，来解决这类变 Key 统计的问题，这也是我们在2017年初就开始尝试 Blink 的重要原因。Blink 的Retraction 机制，使用 State 在内存或者外部存储设备中对数据进行统计处理，当上游数据源对某些汇总 Key 的数据做更新时，Blink 会主动给下游下发一个删除消息从而“撤回”之前的那条消息，并用最新下发的消息对表做更新操作。

下面是一个简化后的案例，供了解Blink Retraction的内部计算过程：

对于上述案例，可以通过 Blink 提供的强大的、灵活的、简易的 SQL 开发模式来实现，只需要几行 SQL 即可完成。

select   plan_tms_sign_time
       ,sum(1) as plan_tms_sign_lgtord_cnt
from
       (select   lg_order_code
                ,last_value(plan_tms_sign_time) as plan_tms_sign_time
        from     dwd_csn_whc_lgt_fl_ord_ri
        group by lg_order_code
        ) ss
group by plan_tms_sign_time
;

维表关联

供应链业务的实体角色非常多（仓、配、分拨、站点、小件员、货主、行业、地区等），实体繁多，这意味着我们在建设实时明细中间层的时候，会使用大量的维表关联，这对 Blink 在维表关联的性能上提出了更高的要求——如何提升大量的大小维表的关联性能？Blink 从来没让用户失望，Blink SQL 模式在维表关联的性能上，也做了大量的优化：

优化1：Async IO，有一些实时计算引擎，维表关联是采用同步访问的方式，即来一条数据，去数据库查询一次，等待返回后输出关联结果。这种方式，可以发现网络等待时间极大地阻碍了吞吐和延迟。而 Blink 采用了异步访问的模式，可以并发地处理多个请求和回复，从而连续地请求之间不需要阻塞等待，吞吐量大大提升。

优化2：缓存，维表关联涉及到大量的维表查询请求，其中可能存在大量相同 Key 的重复请求。Blink SQL 模式提供了缓存的机制，并提供 LRU 和 ALLCache 两种缓存方案。

用户可以通过配置 Cache='LRU' 参数，开启 LRU 缓存优化。开启后，Blink 会为每个 JoinTable 节点创建一个 LRU 本地缓存。当每个查询进来的时候，先去缓存中查询，如果存在则直接关联输出，减少了一次 IO 请求。如果不存在，再发起数据库查询请求，请求返回的结果会先存入缓存中以备下次查询。

如果维表数据不大，用户可以通过配置 Cache='ALL' 参数，对维表进行全量缓存。这样，所有对该维表的查询操作，都会直接走本地缓存模式，几乎没有 IO，关联的性能非常好。

优化3：缓存无效 Key，如果维表很大，无法采用 ALLCache 的方案，而在使用 LRU 缓存时，会存在不少维表中不存在的 Key 。由于命中不了缓存，导致缓存的收益较低，仍然会有大量请求发送到数据库，并且LRU模式下缓存里的key不会永久保留，可以通过调整参数，设置保留时间。

优化4：Distribute By 提高缓存命中率，默认情况下，维表关联的节点与上游节点之间是 Chain 在一起，不经过网络。这在缓存大小有限、Key 总量大、热点不明显的情况下, 缓存的收益可能较低。这种情况下可以将上游节点与维表关联节点的数据传输改成按 Key 分区。这样通常可以缩小单个节点的 Key 个数，提高缓存的命中率。

除了上述几点优化，Blink SQL 模式还在尝试引入 SideInput、Partitioned ALL Cache 等优化方案，相信在随后开源的 Blink 版本中，维表关联的性能会越来越好。

下面是一张来自 Flink Committer 云邪异步查询的流程图，供理解与同步请求的差异。

数据倾斜

无数据不倾斜，我们在实时数仓建设过程中，也当然会遇到数据倾斜问题。在统计卖家的单量时，有些卖家单量大，有些卖家单量小，单量超大的卖家，就会产生数据倾斜；在统计行业的单量时，有些行业单量大，有些行业单量小，单量超大的行业，就会产生数据倾斜；在统计货品的库存流水情况时，有些货品库存流水频繁，一些货品库存流水较少，库存流水超频繁的货品就会产生数据倾斜……

我们应该如何处理数据倾斜问题呢？以统计卖家的单量为例，以前我们会先把订单这个 Key 作 Hash，先针对 Hash 之后的值做一次去重的聚合操作，再在此基础上，再做一次针对原 Key 去重的聚合操作。两次类似的聚合操作，导致代码写起来比较复杂，体力劳动比较多。

2017年，我们的实时数据开始全面切换到 Blink 上，Blink 在数据倾斜这块，又给我们提供了什么的方案呢？Blink 给出的答案是：MiniBatch/MicroBatch+LocalGlobal+PartialFinal。

MiniBatch/MicroBatch，可以实现微批处理，进而减少对 State 的访问，提升吞吐。因为微批处理会导致一定的延迟，最好结合 Blink 提供的允许延迟的相关参数来使用。

LocalGlobal，分为 Local 和 Global 两个阶段，有点类似 MapReduce 中的Combine 和 Reduce 两个阶段。LocalGlobal 可以很好地处理非去重类的聚合操作，但对 Count Distinct 的优化效果一般，因为在 Local 阶段，可能 Distinct Key的去重率并不会很高，进而导致后续的 Global 阶段，仍然会有热点。

PartialFinal，可以很好地解决 Count Distinct 带来的数据倾斜问题。PartialFinal 可以将 Distinct Key 自动打散，先聚合一次，在此基础上，再聚合一次，从而实现打散热点的作用。PartialFinal 跟手动 Hash 再聚合两次的效果一致，通过 Blink 提供的 PartialFinal 参数，可以自动实现，不再需要人为手工编写 Hash 再聚合两次的代码。

由上可以看出，Blink 在数据倾斜的处理上，已经实现了自动化，以前人为编写的打散热点方案，现在几个参数就能全部搞定，大大提升了代码的编写效率。

下面是相关参数，用户可以直接在 Blink 的作业参数中进行配置。

# miniBatch/microBatch攒批的间隔时间
blink.miniBatch.allowLatencyMs=5000
blink.microBatch.allowLatencyMs=5000
# 防止OOM，每个批次最多缓存多少条数据
blink.miniBatch.size=20000

# 开启LocalGlobal
blink.localAgg.enabled=true
# 开启PartialFinal
blink.partialAgg.enabled=true

超时统计

上架是仓储业务的重要组成部分。上架，顾名思义，就是要把到仓的货品，上到仓库的存储货架上。上架一般分为采购上架、销退上架、调拨上架等。及时上架是对仓库的重要考核项之一，无论哪一种类型的上架，我们经常需要针对到货后超过 x 小时未上架的订单进行预警。

但是，Blink 的计算是消息机制，需要上游发送消息才能触发下游计算，而上述的场景中，未上架就说明不会有上架的消息流入 Blink，进而无法完成下游的计算。

对于这种实时超时统计的问题，应该如何来解呢？我们尝试了几种方案，供参考：

方案1：针对部分 Source Connector，Blink 提供了"延时下发"的功能，用户可以通过指定 DataDeliveryDelayMs 参数，实现消息延迟下发。正常的消息正常流入，正常消息也可以通过配置该参数，使其按照自己的需求延时流入。这样，通过正常流入的消息关联延时流入的消息，可以触发 Blink 在消息正常流入时计算一次，在延时消息流入时再触发计算一次。这种方案，可以实现我们的业务需求，但是这种方案会把所有消息重新发送一遍，而不仅仅是到货后超过x小时未上架的消息，这样会造成计算资源的浪费，我们不建议在数据量很大的场景下使用该方案。

方案2：如果有第三方的消息中间件，而这个消息中间件又能支持配置超时下发的规则，这将是一个比较好的方案。据了解，Kafka 的最新版本已经能够根据业务需求，配置消息超时下发的规则。我们只需要在 Blink 中，通过正常流入的消息流关联关键Kafka 超时下发的消息流，就可以触发 Blink 进行超时消息的统计。这样，除了Blink，我们需要同时保障 Kafka 的稳定性。Kafka的超时消息订阅，可以参见：[1]。

方案3：我们能够很自然的想到 CEP，而 Blink 也已经提供了 CEP 的功能，且已经SQL化。用户可以通过 Blink CEP 完成上述业务需求的统计。在实操过程中，我们发现，通过 Blink CEP 统计的结果，往往与真实结果(明细汇总统计)有一定的出入。什么原因呢？原来到货时间，被回传了多次，有可能开始回传的是9点，但是后面发现回传错了，改成了8点，而 CEP 的 Watermark 是全局地向前走的，对于这种场景，无法很好的适配。

方案4：Flink 的 ProcessFunction，是一个 Low-Level 的流处理操作。通过改写其中的 ProcessElement 方法，可以告诉 Blink的State 里面存什么，以及如何更新State；通过改写 OnTimer 方法，可以告诉 State 何时下发超时消息。通过对上述几种方案的原理对比及性能压测，我们最终选择的也是这套方案。由于超时场景，在供应链业务中非常常见，我们已经将该方案沉淀下来，同样的场景，通过 1min 配置下相关参数，即可完成类似场景超时消息的下发。

下面是方案4简化后的实现框架图，供了解相关实现及优势。

零点起跳

每次大促，大屏上零点时刻双十一的零点时刻一直是大家关注的焦点，为了在零点一过就让各项指标尽快在大屏上展现出来，我们进行了一些端到端的优化，供参考。

优化1：合理调整 Blink 读取上游消息源的 FlushInterval 。我们知道 Blink 是以Block 的形式传输数据，如果 Block 一直积攒不满，Block 可能一直等待无法下发。这种情况，我们可以通过调整 FlushInterval 参数，直接控制多长时间往下游 sink 一次。这样，Block 积满或间隔达到满足其中一个条件，Block 就会往下流。

优化2：合理调整 MiniBatch/MicroBatch的size 和 AllowLatency 参数。前文提到，MiniBatch/MicroBatch 是微批处理模式，都会带来一定的延迟，可以通过合理控制 Size 和 AllowLatency 参数，来控制该模式带来的延迟。与优化1一样，两者满足其一，就会往下继续执行。

优化3：合理控制写 Checkpoint 的方式以及 Checkpoint 的大小。利用 Checkpoint 实现 Exactly Once 的容错方式一直是 Flink 作为流引擎的一个亮点。但是过于复杂的运算和网络环境有可能导致 checkpoint 的对齐时间过长，从而导致整个 Job 的延迟变长。同时，Exactly Once 模式下做 Checkpoint 的时间间隔与整个任务中数据流的延迟也是一个 Trade Off。因此我们在处理特别复杂的 Job 时也将这个因素考虑了进去，并没有使用默认的 Exactly Once 方式，而是依旧实际需求采用了 At Least Once 。同时，将 Checkpoint 的周期设置为了60s，尽可能的保证了任务在延迟较小的情况下，在 Failover 的情形下仍然能做到快速恢复。

优化4：除了 Blink 端，在数据服务端，大屏上的实时数据，我们建议采用查询性能优异的 Hbase 作为存储引擎，可以保证零点一过，三秒内便能实现大屏数据的跳动。

……

未来展望

Blink 在不断快速地发展，不仅仅是流处理，当前也开始支持批处理，用户只需要写一套代码就可以同时实现批和流的数据开发，当前在日志型的数据场景上，我们也正在探索利用 Blink 直接实现批流混合模式；不仅仅是半智能资源调优，当前开始内测智能资源调优，Blink 可以根据吞吐量、算子复杂度等因素，对线上作业的资源配置进行全智能自适应调优，再也不用在大促前手动更改资源配置；不仅仅是 Java，更期望有 Python 等多语言生态，来描述计算逻辑，相信开发效率又会上一个新的台阶；不仅仅是 ETL，更期望有更广阔的大数据算法集成，可以实现复杂的大数据AI场景……未来已来，我们相信，Blink 已经做好了迎接未来的准备。

参考资料：

[1]https://ketao1989.github.io/2016/01/02/delayed-message-consume-service-use-kafka/

树莓派搭php,Raspberry Pi 树莓派搭LAMP服务器平平无奇的美女树莓派搭php
目录：为什么要用树莓派?DebianLinux安全性操作系统性能优化配置网络开启sshMakingtheserveravailableontheInternetDNS安装apache安全MySQL安装PHP配置完成本文将会介绍如何把树莓派配置为一台LAMP服务器.这和把XUbuntu配成LAMP服务器有些相似,但是针对树莓派有些需要特殊处理的地方.下面是LAMP服务器的最通用配置:Linux–操作
树莓派raspberry搭建web服务(基于LAMP) 最古琴
撸了今年阿里、头条和美团的面试，我有一个重要发现.......>>>本文永久地址：https://my.oschina.net/bysu/blog/15502121.安装apachesudoapt-getinstallapache2php-gdphp安装完之后，怎么确认是否安装成功了呢？可以通过以下几种方式确认。a.可以查看是否已有相应的服务ps-ef|grepapache会看到4条服务，其中主进
（自用）RocketMQ下载与使用 turncat rocketmq
1、去RocketMQ官网下载压缩包并解压（https://rocketmq.apache.org/zh/download/），添加环境变量。2、启动RocketMQ：进入自己的RocketMQ安装目录下的bin目录，输入下面命令启动nameserver：startmqnamesrv.cmd注：如果端口被占用，可以指定端口文件namesrv.properties文件里面写listenPort=99
深入了解 Kafka：应用场景、架构和GO代码示例 spiker_ kafka 架构 golang
深入了解Kafka：应用场景、架构和GO代码示例ApacheKafka是一个分布式流平台，用于实时数据处理和流处理。在这篇博客中，我们将介绍Kafka的主要应用场景、架构及主要组件，并展示如何使用Go语言操作Kafka，包括Kafka生产者、消费者的示例代码，以及如何通过KafkaConnectRESTAPI配置连接器。Kafka的主要应用场景实时数据流处理：Kafka用于处理实时数据流，如用户行
excel模板生成sql server建表语句苏晓顺 java
因为需要进行大量的表创建所以才有此方法，需要的请copypackagecom.spf.sp.util;importcom.spf.eap.util.common.Toolkit;importorg.apache.poi.xssf.usermodel.XSSFRow;importorg.apache.poi.xssf.usermodel.XSSFSheet;importorg.apache.poi.
2025最新版易支付正版源码开源免授权搭建下载阿辉博客开源
搭建教程服务器环境推荐使用宝塔、AMH、XP等面板一键部署服务器环境。PHP版本：>=7.1，推荐7.4或8.0MySQL版本：5.6或5.7伪静态配置直接上传后访问即可完成安装！创建好网站之后，需要配置伪静态才能正常发起支付。以下分别是Nginx、Apache、IIS服务器的伪静态配置方法：Nginx如果是Nginx，伪静态规则在源码包根目录的nginx.txt文件里面。将nginx.txt里面
StarRocks x Demandbase ，助力北美 ABM 营销平台降本 90%！营销clickhouse
开源无国界，在“StarRocks全球用户精选案例”专栏中，我们将介绍北美营销平台Demandbase的用户案例。Demandbase于2007年创立于美国加州旧金山，专注于AI驱动的ABM平台，助力B2B营销人员实现业务突破。通过将ClickHouse替换为StarRocks，Demandbase解决了性能与灵活性问题。新架构基于ApacheIceberg和StarRocks，显著提升了数据处理
SpringBoot 整合 Avro 与 Kafka m0_74823408 面试学习路线阿里巴巴 spring boot kafka linq
优质博文：IT-BLOG-CN【需求】：生产者发送数据至kafka序列化使用Avro，消费者通过Avro进行反序列化，并将数据通过MyBatisPlus存入数据库。一、环境介绍【1】ApacheAvro1.8；【2】SpringKafka1.2；【3】SpringBoot1.5；【4】Maven3.5；4.0.0com.codenotfoundspring-kafka-avro0.0.1-SNAP
深度好文图解 RocketMQ 的系统架构橘野禾系统架构 kafka java 分布式后端
今天给大家分享一篇学习RocketMQ系统架构核心知识点的梳理和总结,在讲解时力求精简、通俗易懂，通过图解来给正在学习RocketMQ的小伙伴带来帮助。RocketMQ是阿里巴巴的分布式消息中间件，在2012年开源，在2017年成为Apache顶级项目。1集群架构RocketMQ的集群架构如下图：从上图可以看到，整个集群中有四个角色：NameServer集群、Broker主从集群、Producer
13.ansible-playbook批量部署mysql/apache和http报文状态码江小宝 mysql apache http
文章目录一、ansible-playbook实现MySQL的二进制部署二、Ansibleplaybook实现apache批量部署三、http的报文结构和状态码总结3.1报文结构3.2状态码一、ansible-playbook实现MySQL的二进制部署基于sshkey密钥登录准备相关文件，hosts,ansible.cfg(路径),my.cnf编写playbook文件[root@localhosta
后端开源库手册 Vic2334 JAVA 开源 java
Exceleasyexcel快速、简洁、解决大文件内存溢出的java处理Excel工具GitHub-alibaba/easyexcel:快速、简洁、解决大文件内存溢出的java处理Excel工具com.alibabaeasyexcel3.3.3POI老牌、内存占用稍大org.apache.poipoi3.17org.apache.poipoi-ooxml3.17BICBoard国内BI版本很多年不
Dubbo请求调用本地服务 Lorin 洛林 Java 后端经典面试题 dubbo
文章目录前言配置Dubbo本地调用方法一：application.yml中配置方法二：@DubboReference注解中指定注意个人简介前言在微服务架构中，ApacheDubbo作为一款高性能、轻量级的RPC框架，被广泛应用于分布式系统。通常，Dubbo服务是跨进程调用的，但在开发和测试过程中，有时需要在本地调用Dubbo服务，以方便调试和验证。配置Dubbo本地调用默认情况下，Dubbo通过注
Certbot实现SSL免费证书自动续签（CentOS 7版 + Docker部署的nginx）程序猿S先森丶 ssl centos docker
前置安装，可参考Certbot实现SSL免费证书自动续签（CentOS7+nginx/apache）如果是通过Docker运行Nginx，certbot无法直接检测到本地的Nginx配置。解决方案是使用standalone模式或挂载Webroot方式获取SSL证书，并手动配置Nginx。方案1：Standalone模式（临时关闭Nginx获取证书）如果你的服务器不支持Webroot（或Nginx配
什么是mybatis？十二.413 mybatis java 数据库
目录一、mybatis框架介绍二、mybatis配置三、mybatis逆向工程三、userMapper.xml配置一、mybatis框架介绍1.1mybatis本是apache的一个开源项目iBatis,2010年这个项目由apachesoftwareoundation迁移到了googlecode，并且改名为MyBatis。2013年11月迁移到Github。mybatis是一个基于Java的持久
hive 中优化性能的一些方法闯闯桑 hive hadoop 数据仓库
在ApacheHive中，性能优化是一个重要的课题，尤其是在处理大规模数据时。通过合理的优化方法，可以显著提升查询速度和资源利用率。以下是一些常见的Hive性能优化方法：1.数据存储优化1.1使用列式存储格式推荐格式:ORC和Parquet。优点:列式存储格式具有更高的压缩率和查询性能。支持谓词下推（PredicatePushdown）和列裁剪（ColumnPruning）。示例:CREATETA
Vue3使用ECharts入门示例牧小七 Vue echarts 前端 javascript
ApacheECharts介绍一个基于JavaScript的开源可视化图表库。官方网址使用示例第一步：NPM安装EChartsnpminstallecharts--save第二步：使用EChartsimport*asechartsfrom'echarts';constmain=ref()consttu=()=>{//基于准备好的dom，初始化echarts实例varmyChart=echarts.
Kafka 生产者与消费者的关系与应用场景分析白.夜 kafka json
在现代分布式系统中，ApacheKafka作为一个高性能的消息队列系统，在数据流转和处理方面扮演着至关重要的角色。Kafka采用了经典的生产者-消费者模式，极大地解耦了数据生成与数据消费的过程。本文将详细探讨Kafka中生产者与消费者的关系、常见问题以及Kafka在实际应用中的使用场景。1.Kafka中生产者与消费者的关系1.1生产者（Producer）生产者是Kafka系统中的一个客户端应用程序
宝塔面板建立新的网站无法访问解决办法易天法地 linux apache
1.进入apache配置修改，添加端口listen2.下滑添加ServerName如图设置，保存后重启apache即可
使用 Doris 和 Iceberg 向阳1218 大数据 doris
作为一种全新的开放式的数据管理架构，湖仓一体（DataLakehouse）融合了数据仓库的高性能、实时性以及数据湖的低成本、灵活性等优势，帮助用户更加便捷地满足各种数据处理分析的需求，在企业的大数据体系中已经得到越来越多的应用。在过去多个版本中，ApacheDoris持续加深与数据湖的融合，当前已演进出一套成熟的湖仓一体解决方案。自0.15版本起，ApacheDoris引入Hive和Iceberg
使用 Doris 和 LakeSoul 向阳1218 大数据 doris
作为一种全新的开放式的数据管理架构，湖仓一体（DataLakehouse）融合了数据仓库的高性能、实时性以及数据湖的低成本、灵活性等优势，帮助用户更加便捷地满足各种数据处理分析的需求，在企业的大数据体系中已经得到越来越多的应用。在过去多个版本中，ApacheDoris持续加深与数据湖的融合，当前已演进出一套成熟的湖仓一体解决方案。自0.15版本起，ApacheDoris引入Hive和Iceberg
Shiro反序列化漏洞原理与复现指南豪门土狗网络安全笔记 linux
0x01漏洞简介ApacheShiro是Java领域广泛使用的安全框架，用于身份认证、权限控制等场景。漏洞背景：Shiro在1.2.5及以下版本中，默认使用硬编码的AES加密密钥（kPH+bIxk5D2deZiIxcaaaA==），攻击者可通过构造恶意RememberMeCookie触发反序列化漏洞，导致远程代码执行（RCE）。影响版本：ApacheShiro≤1.2.5、≤1.5.2（部分版本需
漏洞预警 | Apache Tomcat 存在远程代码执行漏洞（CVE-2025-24813）盛邦安全 apache tomcat java
漏洞概述漏洞类型远程代码执行漏洞等级高危漏洞编号CVE-2025-24813漏洞评分无利用复杂度中影响版本11.0.0-M1至11.0.210.1.0-M1到10.1.349.0.0.M1到9.0.98利用方式远程POC/EXP已公开近日，ApacheTomcat发布更新修复漏洞（CVE-2025-24813）。为避免您的业务受影响，建议您及时开展安全风险自查。ApacheTomcat是一个Apa
Dinky × Jiron：打造高效智能的数据处理平台 jiron开源平台开发 flink 大数据 hive 数据仓库 kafka etl工程师 clickhouse
Dinky×Jiron：打造高效智能的数据处理平台JironGitHub地址https://github.com/642933588/jiron-cloudhttps://gitee.com/642933588/jiron-cloud将基于ApacheFlink的实时计算平台Dinky成功集成至Jiron数据开发平台，以进一步增强平台的数据处理能力，提升数据处理效率与灵活性，同时优化用户体验并降低
阿里云服务器使用教程：CentOS 7 安装JDK及Tomcat详细步骤（以jdk1.8、tomcat9.0.37为例）蓝多多的小仓库云服务器配置及使用服务器阿里云 java
目录1、下载JDK及Tomcat的安装包并上传至服务器2、安装JDK3、安装Tomcat4、Tomcat启动后无法打开Tomcat首页的原因1、下载JDK及Tomcat的安装包并上传至服务器（1）下载JDK1.8版本压缩包官网：JavaDownloads|Oracle（2）下载Tomcat9.0.37的安装包官网：ApacheTomcat®-Welcome!
数据分析大数据面试题大杂烩01 爱学习的菜鸟罢了大数据 flink 大数据面试 hive hadoop kafka
互联网:通过埋点实时计算用户浏览频次用优惠券等措施吸引用户,通过历史信息用非智能学习的title方式构造用户画像(抖音,京东)电信,银行统计营收和针对用户的个人画像:处理大量非实时数据政府:健康码,扫码之后确诊,找出与确诊对象有关联的人订单订单表(除商品以外所有信息),商品详情表,通过搜集用户title进行定制化推荐点击流数据通过埋点进行用户点击行为分析FLINK一般用来做实时SPARK一般用来做
Apache Tomcat 9.0.37 压缩免安装版松京焕Max
ApacheTomcat9.0.37压缩免安装版apache-tomcat-9.0.37-windows-x64.zip项目地址:https://gitcode.com/open-source-toolkit/94318简介本仓库提供了一个经过压缩的ApacheTomcat9.0.37免安装版本。该版本无需复杂的安装步骤，解压后即可直接使用，非常适合快速部署和开发环境使用。资源文件文件名:apac
海量数据查询加速：Presto、Trino、Apache Arrow 晴天彩虹雨 apache 大数据 hive 数据仓库
1.引言在大数据分析场景下，查询速度往往是影响业务决策效率的关键因素。随着数据量的增长，传统的行存储数据库难以满足低延迟的查询需求，因此，基于列式存储、向量化计算等技术的查询引擎应运而生。本篇文章将深入探讨Presto、Trino、ApacheArrow三种主流的查询优化工具，剖析其核心机制，并通过案例分析展示它们在实际业务中的应用。2.Presto：分布式SQL查询引擎2.1Presto介绍Pr
Apache OFBiz路径遍历漏洞(CVE-2024-36104) WuY1nSec 漏洞复现 apache
0x01漏洞描述ApacheOFBiz是美国阿帕奇（Apache）基金会的一套企业资源计划（ERP）系统。该系统提供了一整套基于Java的Web应用程序组件和工具。ApacheOFBiz18.12.14之前版本存在命令执行漏洞，该漏洞源于ControlFilter对路径限制不当导致用户能够访问ProgramExport导出功能执行Groovy代码。0x02影响版本ApacheOFBiz<18.12
Java通过Apache POI操作Excel IT__learning 数据分析 java apache excel
1、添加依赖org.apache.poipoi3.9org.apache.poipoi-ooxml3.9joda-timejoda-time2.10.12、读EXCELpublicstaticvoidread()throwsException{FileInputStreamstream=newFileInputStream("D:\\Test\\file.xlsx");//1.创建工作簿对象,并指
Different number of columns sunyaox flink flink异常
org.apache.flink.client.program.ProgramInvocationException:Themainmethodcausedanerror:Columntypesofqueryresultandsinkforregisteredtable‘photoTradeInfoHive.db_audit.ods_photo_trade’donotmatch.Cause:Dif
继之前的线程循环加到窗口中运行 3213213333332132 java thread JFrame JPanel
之前写了有关java线程的循环执行和结束，因为想制作成exe文件，想把执行的效果加到窗口上，所以就结合了JFrame和JPanel写了这个程序，这里直接贴出代码，在窗口上运行的效果下面有附图。 package thread; import java.awt.Graphics; import java.text.SimpleDateFormat; import java.util
linux 常用命令 BlueSkator linux 命令
1.grep 相信这个命令可以说是大家最常用的命令之一了。尤其是查询生产环境的日志，这个命令绝对是必不可少的。但之前总是习惯于使用（grep -n 关键字文件名）查出关键字以及该关键字所在的行数，然后再用（sed -n '100,200p' 文件名），去查出该关键字之后的日志内容。但其实还有更简便的办法，就是用（grep -B n、-A n、-C n 关键
php heredoc原文档和nowdoc语法 dcj3sjt126com PHP heredoc nowdoc
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body> <?
overflow的属性周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
《我所了解的Java》——总体目录 g21121 java
准备用一年左右时间写一个系列的文章《我所了解的Java》，目录及内容会不断完善及调整。在编写相关内容时难免出现笔误、代码无法执行、名词理解错误等，请大家及时指出，我会第一时间更正。 &n
[简单]docx4j常用方法小结 53873039oycg docx
本代码基于docx4j-3.2.0，在office word 2007上测试通过。代码如下: import java.io.File; import java.io.FileInputStream; import ja
Spring配置学习云端月影 spring配置
首先来看一个标准的Spring配置文件 applicationContext.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&q
Java新手入门的30个基本概念三 aijuans java 新手 java 入门
17.Java中的每一个类都是从Object类扩展而来的。　　18.object类中的equal和toString方法。　　equal用于测试一个对象是否同另一个对象相等。　　toString返回一个代表该对象的字符串,几乎每一个类都会重载该方法,以便返回当前状态的正确表示.(toString 方法是一个很重要的方法)　　 19.通用编程:任何类类型的所有值都可以同object类性的变量来代替。　
《2008 IBM Rational 软件开发高峰论坛会议》小记 antonyup_2006 软件测试敏捷开发项目管理 IBM 活动
我一直想写些总结,用于交流和备忘,然都没提笔,今以一篇参加活动的感受小记开个头,呵呵! 其实参加《2008 IBM Rational 软件开发高峰论坛会议》是9月4号,那天刚好调休.但接着项目颇为忙,所以今天在中秋佳节的假期里整理了下. 参加这次活动是一个朋友给的一个邀请书,才知道有这样的一个活动,虽然现在项目暂时没用到IBM的解决方案,但觉的参与这样一个活动可以拓宽下视野和相关知识.
PL/SQL的过程编程,异常,声明变量,PL/SQL块百合不是茶 PL/SQL的过程编程异常 PL/SQL块声明变量
PL/SQL; 过程; 符号; 变量; PL/SQL块; 输出; 异常; PL/SQL 是过程语言(Procedural Language)与结构化查询语言(SQL)结合而成的编程语言PL/SQL 是对 SQL 的扩展,sql的执行时每次都要写操作
Mockito(三)--完整功能介绍 bijian1013 持续集成 mockito 单元测试
mockito官网：http://code.google.com/p/mockito/，打开documentation可以看到官方最新的文档资料。一.使用mockito验证行为 //首先要import Mockito import static org.mockito.Mockito.*; //mo
精通Oracle10编程SQL(8)使用复合数据类型 bijian1013 oracle 数据库 plsql
/* *使用复合数据类型 */ --PL/SQL记录 --定义PL/SQL记录 --自定义PL/SQL记录 DECLARE TYPE emp_record_type IS RECORD( name emp.ename%TYPE, salary emp.sal%TYPE, dno emp.deptno%TYPE ); emp_
【Linux常用命令一】grep命令 bit1129 Linux常用命令
grep命令格式 grep [option] pattern [file-list] grep命令用于在指定的文件(一个或者多个,file-list)中查找包含模式串(pattern)的行,[option]用于控制grep命令的查找方式。 pattern可以是普通字符串，也可以是正则表达式，当查找的字符串包含正则表达式字符或者特
mybatis3入门学习笔记白糖_ sql ibatis qq jdbc 配置管理
MyBatis 的前身就是iBatis，是一个数据持久层(ORM)框架。 MyBatis 是支持普通 SQL 查询，存储过程和高级映射的优秀持久层框架。MyBatis对JDBC进行了一次很浅的封装。以前也学过iBatis，因为MyBatis是iBatis的升级版本，最初以为改动应该不大，实际结果是MyBatis对配置文件进行了一些大的改动，使整个框架更加方便人性化。
Linux 命令神器：lsof 入门 ronin47 lsof
lsof是系统管理/安全的尤伯工具。我大多数时候用它来从系统获得与网络连接相关的信息，但那只是这个强大而又鲜为人知的应用的第一步。将这个工具称之为lsof真实名副其实，因为它是指“列出打开文件（lists openfiles）”。而有一点要切记，在Unix中一切（包括网络套接口）都是文件。有趣的是，lsof也是有着最多
java实现两个大数相加，可能存在溢出。 bylijinnan java实现
import java.math.BigInteger; import java.util.regex.Matcher; import java.util.regex.Pattern; public class BigIntegerAddition { /** * 题目：java实现两个大数相加，可能存在溢出。 * 如123456789 + 987654321
Kettle学习资料分享，附大神用Kettle的一套流程完成对整个数据库迁移方法 Kai_Ge Kettle
Kettle学习资料分享 Kettle 3.2 使用说明书目录概述..........................................................................................................................................7 1.Kettle 资源库管
[货币与金融]钢之炼金术士 comsci 金融
自古以来,都有一些人在从事炼金术的工作.........但是很少有成功的那么随着人类在理论物理和工程物理上面取得的一些突破性进展...... 炼金术这个古老
Toast原来也可以多样化 dai_lm android toast
Style 1：默认 Toast def = Toast.makeText(this, "default", Toast.LENGTH_SHORT); def.show(); Style 2：顶部显示 Toast top = Toast.makeText(this, "top", Toast.LENGTH_SHORT); t
java数据计算的几种解决方法3 datamachine java hadoop ibatis r-langue r
4、iBatis 简单敏捷因此强大的数据计算层。和Hibernate不同，它鼓励写SQL，所以学习成本最低。同时它用最小的代价实现了计算脚本和JAVA代码的解耦，只用20%的代价就实现了hibernate 80%的功能,没实现的20%是计算脚本和数据库的解耦。复杂计算环境是它的弱项，比如：分布式计算、复杂计算、非数据
向网页中插入透明Flash的方法和技巧 dcj3sjt126com html Web Flash
将 Flash 作品插入网页的时候，我们有时候会需要将它设为透明，有时候我们需要在Flash的背面插入一些漂亮的图片，搭配出漂亮的效果……下面我们介绍一些将Flash插入网页中的一些透明的设置技巧。　　一、Swf透明、无坐标控制　　首先教大家最简单的插入Flash的代码，透明，无坐标控制：　　注意wmode="transparent"是控制Flash是否透明
ios UICollectionView的使用 dcj3sjt126com
UICollectionView的使用有两种方法，一种是继承UICollectionViewController，这个Controller会自带一个UICollectionView；另外一种是作为一个视图放在普通的UIViewController里面。个人更喜欢第二种。下面采用第二种方式简单介绍一下UICollectionView的使用。 1.UIViewController实现委托，代码如
Eos平台java公共逻辑蕃薯耀 Eos平台java公共逻辑 Eos平台 java公共逻辑
Eos平台java公共逻辑 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:20:4
SpringMVC4零配置--Web上下文配置【MvcConfig】 hanqunfeng springmvc4
与SpringSecurity的配置类似，spring同样为我们提供了一个实现类WebMvcConfigurationSupport和一个注解@EnableWebMvc以帮助我们减少bean的声明。 applicationContext-MvcConfig.xml  <
解决ie和其他浏览器poi下载excel文件名乱码 jackyrong Excel
使用poi,做传统的excel导出，然后想在浏览器中，让用户选择另存为，保存用户下载的xls文件，这个时候，可能的是在ie下出现乱码（ie,9,10,11),但在firefox,chrome下没乱码，因此必须综合判断，编写一个工具类： /** * * @Title: pro
挥洒泪水的青春 lampcy 编程生活程序员
2015年2月28日，我辞职了，离开了相处一年的触控，转过身--挥洒掉泪水，毅然来到了兄弟连，背负着许多的不解、质疑——”你一个零基础、脑子又不聪明的人，还敢跨行业，选择Unity3D？“，”真是不自量力••••••“，”真是初生牛犊不怕虎•••••“，••••••我只是淡淡一笑，拎着行李----坐上了通向挥洒泪水的青春之地——兄弟连！这就是我青春的分割线，不后悔，只会去用泪水浇灌——已经来到
稳增长之中国股市两点意见-----严控做空，建立涨跌停版停牌重组机制 nannan408
对于股市，我们国家的监管还是有点拼的，但始终拼不过飞流直下的恐慌，为什么呢？笔者首先支持股市的监管。对于股市越管越荡的现象，笔者认为首先是做空力量超过了股市自身的升力，并且对于跌停停牌重组的快速反应还没建立好，上市公司对于股价下跌没有很好的利好支撑。我们来看美国和香港是怎么应对股灾的。美国是靠禁止重要股票做空，在
动态设置iframe高度(iframe高度自适应) Rainbow702 JavaScript iframe contentDocument 高度自适应局部刷新
如果需要对画面中的部分区域作局部刷新，大家可能都会想到使用ajax。但有些情况下，须使用在页面中嵌入一个iframe来作局部刷新。对于使用iframe的情况，发现有一个问题，就是iframe中的页面的高度可能会很高，但是外面页面并不会被iframe内部页面给撑开，如下面的结构： <div id="content"> <div id=&quo
用Rapael做图表 tntxia rap
function drawReport(paper,attr,data){ var width = attr.width; var height = attr.height; var max = 0; &nbs
HTML5 bootstrap2网页兼容（支持IE10以下） xiaoluode html5 bootstrap
<!DOCTYPE html> <html> <head lang="zh-CN"> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge">