菠萝科技

Flink 在快手实时多维分析场景的应用

视频：Apache Flink在快手实时多维分析场景的应用 | 企业实践专场

6 人赞同了该文章

简介： 作为短视频分享跟直播的平台，快手有诸多业务场景应用了 Flink，包括短视频、直播的质量监控、用户增长分析、实时数据处理、直播 CDN 调度等。此次主要介绍在快手使用 Flink 在实时多维分析场景的应用与优化。

作者：董亭亭、徐明
摘要：作为短视频分享跟直播的平台，快手有诸多业务场景应用了 Flink，包括短视频、直播的质量监控、用户增长分析、实时数据处理、直播 CDN 调度等。此次主要介绍在快手使用 Flink 在实时多维分析场景的应用与优化。主要内容包括：

Flink 在快手应用场景及规模
快手实时多维分析平台
SlimBase-更省 IO、嵌入式共享 state 存储

Tips：点击下方链接可查看作者原版PPT及分享视频～
https://ververica.cn/developers/flink-forward-asia-2019/
Flink 在快手应用场景及规模
首先看 Flink 在快手的应用场景和规模。
1. 快手应用场景

快手计算链路是从 DB/Binlog 以及 WebService Log 实时入到 Kafka 中，然后接入 Flink 做实时计算，其中包括实时数仓、实时分析以及实时训练，最后的结果存到 Druid、Kudu、HBase 或者 ClickHouse 里面；同时 Kafka 数据实时 Dump 一份到 Hadoop 集群，然后通过 Hive、MapReduce 或者 Spark 来做离线计算；最终实时计算和离线计算的结果数据会用内部自研 BI 工具 KwaiBI 来展现出来。

Flink 在快手典型的应用场景主要分为三大类：

80% 统计监控：实时统计，包括各项数据的指标，监控项报警，用于辅助业务进行实时分析和监控；
15% 数据处理：对数据的清洗、拆分、Join 等逻辑处理，例如大 Topic 的数据拆分、清洗；
5% 数据处理：实时业务处理，针对特定业务逻辑的实时处理，例如实时调度。

Flink 在快手应用的典型场景案例包括：

快手是分享短视频跟直播的平台，快手短视频、直播的质量监控是通过 Flink 进行实时统计，比如直播观众端、主播端的播放量、卡顿率、开播失败率等跟直播质量相关的多种监控指标；
用户增长分析，实时统计各投放渠道拉新情况，根据效果实时调整各渠道的投放量；
实时数据处理，广告展现流、点击流实时 Join，客户端日志的拆分等；
直播 CDN 调度，实时监控各 CDN 厂商质量，通过 Flink 实时训练调整各个 CDN 厂商流量配比。

2. Flink 集群规模

快手目前集群规模有 1500 台左右，日处理条目数总共有3万亿，峰值处理条目数大约是 3亿/s 左右。集群部署都是 On Yarn 模式，实时集群和离线集群混合部署，通过 Yarn 标签进行物理隔离，实时集群是 Flink 专用集群，针对隔离性、稳定性要求极高的业务部署。注：本文所涉及数据仅代表嘉宾分享时的数据。
快手实时多维分析平台
此处重点和大家分享下快手的实时多维分析平台。
1. 快手实时多维分析场景

快手内部有这样的应用场景，每天的数据量在百亿级别，业务方需要在数据中任选五个以内的维度组合进行全维的建模进而计算累计的 PV ( Page View 访问量 )、UV ( Unique Visitor 独立访客 )、新增或者留存等这样的指标，然后指标的计算结果要实时进行图形化报表展示供给业务分析人员进行分析。
2. 方案选型

现在社区已经有一些 OLAP 实时分析的工具，像 Druid 和 ClickHouse；目前快手采用的是 Flink+Kudu 的方案，在前期调研阶段对这三种方案从计算能力、分组聚合能力、查询并发以及查询延迟四个方面结合实时多维查询业务场景进行对比分析：

计算能力方面：多维查询这种业务场景需要支持 Sum、Count 和 count distinct 等能力，而 Druid 社区版本不支持 count distinct，快手内部版本支持数值类型、但不支持字符类型的 count distinct；ClickHouse 本身全都支持这些计算能力；Flink 是一个实时计算引擎，这些能力也都具备。
分组聚合能力方面：Druid 的分组聚合能力一般，ClickHouse 和 Flink 都支持较强的分组聚合能力。
查询并发方面：ClickHouse 的索引比较弱，不能支持较高的查询并发，Druid 和 Flink 都支持较高的并发度，存储系统 Kudu，它也支持强索引以及很高的并发。
查询延迟方面：Druid 和 ClickHouse 都是在查询时进行现计算，而 Flink+Kudu 方案，通过 Flink 实时计算后将指标结果直接存储到 Kudu 中，查询直接从 Kudu 中查询结果而不需要进行计算，所以查询延迟比较低。

采用 Flink+Kudu 的方案主要思想是借鉴了 Kylin 的思路，Kylin 可以指定很多维度和指标进行离线的预计算然后将预计算结果存储到 Hbase 中；快手的方案是通过 Flink 实时计算指标，再实时地写到 Kudu 里面。
3. 方案设计

实时多维分析的整体的流程为：

用户在快手自研的 BI 分析工具 KwaiBI 上配置 Cube 数据立方体模型，指定维度列和指标列以及基于指标做什么样的计算；
配置过程中选择的数据表是经过处理过后存储在实时数仓平台中的数据表；
然后根据配置的计算规则通过 Flink 任务进行建模指标的预计算，结果存储到 Kudu 中；
最后 KwaiBI 从 Kudu 中查询数据进行实时看板展示。

接下来详细介绍一下实时多维分析的主要模块。
■ 数据预处理

KwaiBI 配置维度建模时选择的数据表，是经过提前预处理的：

首先内部有一个元信息系统，在元信息系统中提供统一的 schema 服务，所有的信息都被抽象为逻辑表；
例如 Kafka 的 topic、Redis、Hbase 表等元数据信息都抽取成 schema 存储起来；
快手 Kafka 的物理数据格式大部分是 Protobuf 和 Json 格式，schema 服务平台也支持将其映射为逻辑表；
用户只需要将逻辑表建好之后，就可以在实时数仓对数据进行清洗和过滤。

■ 建模计算指标

数据预处理完成后，最重要的步骤是进行建模指标计算，此处支持 Cube、GroupingSet 方式维度组合来计算小时或者天累计的 UV ( Unique Visitor )、新增和留存等指标，可以根据用户配置按固定时间间隔定期输出结果；维度聚合逻辑中，通过逐层降维计算的方式会让 DAG 作业图十分复杂，如上图右上角模型所示；因此快手设计了两层降维计算模型，分为全维度层和剩余维度层，这样既利用了全维度层的聚合结果又简化了 DAG 作业图。

以 UV 类指标计算举例，两个黄色虚线框分别对应两层计算模块：全维计算和降维计算。

全维计算分为两个步骤，为避免数据倾斜问题，首先是维度打散预聚合，将相同的维度值先哈希打散一下。因为 UV 指标需要做到精确去重，所以采用 Bitmap 进行去重操作，每分钟一个窗口计算出增量窗口内数据的 Bitmap 发送给第二步按维度全量聚合；在全量聚合中，将增量的 Bitmap 合并到全量 Bitmap 中最终得出准确的 UV 值。然而有人会有问题，针对用户 id 这种的数值类型的可以采用此种方案，但是对于 deviceid 这种字符类型的数据应该如何处理？实际上在源头，数据进行维度聚合之前，会通过字典服务将字符类型的变量转换为唯一的 Long 类型值，进而通过 Bitmap 进行去重计算 UV。
降维计算中，通过全维计算得出的结果进行预聚合然后进行全量聚合，最终将结果进行输出。

再重点介绍下，建模指标计算中的几个关键点。在建模指标计算中，为了避免维度数据倾斜问题，通过预聚合 ( 相同维度 hash 打散 ) 和全量聚合 ( 相同维度打散后聚合 ) 两种方式来解决。
为了解决 UV 精确去重问题，前文有提到，使用 Bitmap 进行精确去重，通过字典服务将 String 类型数据转换成 Long 类型数据进而便于存储到 Bitmap 中，因为统计 UV 要统计历史的数据，比如说按天累计，随着时间的推移，Bitmap 会越来越大，在 Rocksdb 状态存储下，读写过大的 KV 会比较耗性能，所以内部自定义了一个 BitmapState，将 Bitmap 进行分块存储，一个 blockid 对应一个局部的 bitmap，这样在 RocksDB 中存储时，一个 KV 会比较小，更新的时候也只需要根据 blockid 更新局部的 bitmap 就可以而不需要全量更新。

接下来，看新增类的指标计算，和刚刚 UV 的不同点是需要判断是否为新增用户，通过异步地访问外部的历史用户服务进行新增用户判断，再根据新增用户流计算新增 UV，这块计算逻辑和 UV 计算一致。

然后，再来看留存类指标计算，与 UV 计算不同的时候，不仅需要当天的数据还需要前一天的历史数据，这样才能计算出留存率，内部实现的时候是采用双 buffer state 存储，在计算的时候将双 buffer 数据相除就可以计算出留存率。
■ Kudu 存储

最后经过上面的计算逻辑后，会将结果存储到 Kudu 里面，其本身具有低延迟随机读写以及快速列扫描等特点，很适合实时交互分析场景；在存储方式上，首先对维度进行编码，然后按时间+维度组合+维度值组合作为主键，最终按维度组合、维度值组合、时间进行分区，这样有利于提高查询的效率快速获取到数据。
4. KwaiBI 展示

界面为配置 Cube 模型的截图，配置一些列并指定类型，再通过一个 SQL 语句来描述指标计算的逻辑，最终结果也会通过 KwaiBI 展示出来。
SlimBase-更省 IO、嵌入式共享 state 存储
接下来介绍一种比 RocksDB 更省 IO、嵌入式的共享 state 存储引擎：SlimBase。
1. 面临的挑战

首先看一下 Flink 使用 RocksDB 遇到的问题，先阐述一下快手的应用场景、广告展现点击流实时 Join 场景：打开快手 App 可能会收到广告服务推荐的广告视频，用户可能会点击展现的广告视频。
这样的行为在后端会形成两份数据流，一份是广告展现日志，一份是客户端点击日志。这两份数据进行实时 Join，并将 Join 结果作为样本数据用于模型训练，训练出的模型会被推送到线上的广告服务。
该场景下展现以后20分钟的点击被认为是有效点击，实时 Join 逻辑则是点击数据 Join 过去20分钟内的展现。其中，展现流的数据量相对比较大，20分钟数据在 1TB 以上。检查点设置为五分钟，Backend 选择 RocksDB。

在这样的场景下，面临着磁盘 IO 开销70%，其中50%开销来自于 Compaction；在 Checkpoint 期间，磁盘 IO 开销达到了100%，耗时在1~5分钟，甚至会长于 Checkpoint 间隔，业务能明显感觉到反压。经过分析找出问题：

首先，在 Checkpoint 期间会产生四倍的大规模数据拷贝，即：从 RocksDB 中全量读取出来然后以三副本形式写入到 HDFS 中；
其次，对于大规模数据写入，RocksDB 的默认 Level Compaction 会有严重的 IO 放大开销。

2. 解决方案

由于出现上文阐述的问题，开始寻找解决方案，整体思路是在数据写入时直接落地到共享存储中，避免 Checkpoint 带来的数据拷贝问题。手段是尝试使用更省 IO 的 Compaction，例如使用 SizeTieredCompation 方式，或者利用时序数据的特点使用并改造 FIFOCompaction。综合比较共享存储、SizeTieredCompation、基于事件时间的 FIFOCompaction 以及技术栈四个方面得出共识：HBase 代替 RocksDB 方案。

共享存储方面，HBase 支持， RocksDB 不支持
SizeTieredCompation 方面，RocksDB 默认不支持，HBase 默认支持
基于事件时间下推的 FIFOCompaction 方面，RocksDB 不支持，但 HBase 开发起来比较简单
技术栈方面，RocksDB 使用 C++，HBase 使用 java，HBase 改造起来更方便

但是 HBase 有些方面相比 RocksDB 较差：

HBase 是一个依赖 zookeeper、包含 Master 和 RegionServer 的重量级分布式系统；而 RocksDB 仅是一个嵌入式的 Lib 库，很轻量级。
在资源隔离方面，HBase 比较困难，内存和 cpu 被多个 Container 共享；而 RocksDB 比较容易，内存和 cpu 伴随 Container 天生隔离。
网络开销方面，因为 HBase 是分布式的，所有比嵌入式的 RocksDB 开销要大很多。

综合上面几点原因，快手达成了第二个共识，将 HBase 瘦身，改造为嵌入式共享存储系统。
3. 实现方案

接下来介绍一下将 HBase 改造成 SlimBase 的实现方案，主要是分为两层：

一层是 SlimBase 本身，包含三层结构：Slim HBase、适配器以及接口层；
另一层是 SlimBaseStateBackend，主要包含 ListState、MapState、ValueState 和 ReduceState。

后面将从 HBase 瘦身、适配并实现操作接口以及实现 SlimBaseStateBackend 三个步骤分别进行详细介绍。
■ HBase 瘦身

先讲 HBase 瘦身，主要从减肥和增瘦两个步骤，在减肥方面：

先对 HBase 进行减裁，去除 client、zookeeper 和 master，仅保留 RegionServer
再对 RegionServer 进行剪裁，去除 ZK Listener、Master Tracker、Rpc、WAL 和 MetaTable
仅保留 RegionServer 中的 Cache、Memstore、Compaction、Fluster 和 Fs

在增瘦方面：

将原来 Master 上用于清理 Hfile 的 HFileCleaner 迁移到 RegionServer 上
RocksDB 支持读放大写的 merge 接口，但是 SlimBase 是不支持的，所以要实现 merge 的接口

接口层主要有以下三点实现：

仿照 RocksDB，逻辑视图分为两级：DB 和 ColumnFamily
支持一些基本的接口：put/get/delete/merge 和 snapshot
额外支持了 restore 接口，用于从 snapshot 中恢复

适配层主要有以下两个概念：

一个 SlimBase 适配为 Hbase 的 namespace
一个 SlimBase 的 ColumnFamily 适配为 HBase 的 table

SlimBaseStateBackend 实现上主要体现在两个方面：

一是多种 States 实现，支持多种数据结构，ListState、MapState、ValueState 和 ReduceState
二是改造 Snapshot 和 Restore 的流程，从下面的两幅图可以看出，SlimBase 在磁盘 IO 上节省了大量的资源，避免了多次的 IO 的问题。

4. 测试结论

上线对比测试后，得出测试结论：

Checkpoint 和 Restore 的时延从分钟级别降到秒级。
磁盘 IO 下降了66%
磁盘写吞吐下降50%
CPU 开销下降了33%

5. 后期优化

目前用的 Compaction 策略是 SizeTieredCompaction，后期要实现基于 OldestUnexpiredTime 的 FiFOCompaction 策略，目标是做到无磁盘 IO 开销。
FiFOCompaction 是一种基于 TTL 的无 IO 的 Compaction 策略；OldestUnexpiredTime 是指例如设置 OldestUnexpiredTime=t2，表示 t2 时刻前的数据全部过期，可以被 Compaction 清理，基于时间点的 FIFOCompaction 理论上可以做到无磁盘 IO 开销。

后续还有四点优化，前三点是基于 HBase 的优化，最后是针对 HDFS 做的优化：

SlimBase 使用 InMemoryCompaction，降低内存 Flush 和 Compaction 开销
SlimBase 支持 prefixBloomFilter，提高 Scan 性能
SlimBase 支持短路读
HDFS 副本落盘改造：非本地副本使用 DirectIO 直接落盘，提高本地读 pagecache 命中率；此条主要是在测试使用时发现单副本比多副本读写效率高这一问题

6. 未来规划

从语言、存储、压缩策略、事件事件下推、垃圾回收、检查点时间、重加载时间七个方面来看，SlimBase 都比 RocksDB 更适合快手实时计算任务的开发，未来的规划是对 Slimbase 的性能做进一步优化，愿景是将快手 Flink 上的所有业务场景全部用 SlimBase 替代掉 RocksDB。
作者介绍：
董亭亭，快手大数据架构团队，实时计算引擎团队负责人。目前负责 Flink 引擎在快手公司内的研发和应用实践。2013 年毕业于大连理工大学，曾就职于奇虎360，58集团，接触过的领域包括：分布式计算、调度、分布式存储等。
徐明，快手大数据架构研发工程师。毕业于南开大学，目前在快手数据架构团队，负责 HBase 引擎及周边生态维护和研发。

存储消息中间件监控 druid 分布式数据库数据处理调度流计算 CDN Hbase

Flink 在快手实时多维分析场景的应用 - Flink 中文社区的文章 - 知乎 https://zhuanlan.zhihu.com/p/149152230

GBase 数据库在大数据环境下的应用与优势 big crab 数据库大数据
引言随着大数据技术的发展，传统数据库面临着越来越多的挑战。尤其是在处理海量数据时，如何在保证高性能的同时，确保系统的可扩展性、容错性和高可用性，成为许多企业关心的问题。GBase数据库系列，特别是GBase8a、GBase8s和GBase8c，提供了一种新型的解决方案，它们能够在大数据环境下提供卓越的性能和可靠性。本文将深入探讨GBase数据库在大数据环境中的应用及其优势。一、GBase数据库系列
GBase 数据库的性能调优与故障排查 big crab 数据库
一、引言在现代企业的数据驱动运营中，数据库的性能是核心问题之一。GBase数据库作为高性能、高可用的数据库解决方案，被广泛应用于大数据、高并发的场景中。为了最大化GBase数据库的性能，了解如何调优数据库的配置、查询执行计划和硬件资源使用至关重要。本文将深入探讨GBase数据库的性能调优策略、常见故障排查方法，并结合SQL示例和调优技巧，帮助开发者和数据库管理员提升GBase数据库的整体效率。二、
GBase数据库在大数据环境下的存储和查询优化策略 big crab 数据库大数据
一、引言随着大数据时代的到来，数据量的激增给数据库管理和查询性能带来了巨大的挑战。尤其是对于关系型数据库，如何在海量数据的存储和查询中保持高效的性能，已经成为企业IT架构设计中的关键问题。GBase数据库，作为一款高性能的关系型数据库，凭借其强大的数据处理能力和高可用性，在大数据领域得到了广泛应用。本文将深入探讨GBase数据库在大数据环境下的存储与查询优化策略，结合GBase8a、GBase8s
用Java发送Email就这么简单五行星辰业务系统应用技术 java 前端
咱程序员在开发过程中，时常会遇到需要发送邮件的场景，好比通知用户注册成功、提醒密码找回啥的。这时候，Java就派上大用场啦，今儿个咱就唠唠咋用Java发送Email。一、准备工作要实现Java发送邮件，咱得先引入相关的依赖。要是用Maven构建项目，在pom.xml文件里加上这几行代码：javax.mailmail1.4.7javax.activationactivation1.1.1这就好比给你
用 Java 发送 HTML 内容并带附件的电子邮件五行星辰业务系统应用技术 java html
实现思路首先，设置邮件服务器的相关属性，包括是否需要认证、使用的邮件协议、服务器地址、端口等。创建一个会话对象，使用Session.getInstance方法，并提供邮件服务器的属性和认证信息。创建一个MimeMessage对象作为邮件消息，设置发件人、收件人、邮件主题等信息。为了发送HTML内容，使用setContent方法并指定内容类型为text/html。对于附件，创建一个MimeMulti
搭建vue项目 LYy0 vue.js 前端 javascript
一、VueVue是一款用于构建用户界面的JavaScript框架。它基于标准HTML、CSS和JavaScript构建，并提供了一套声明式的、组件化的编程模型，帮助你高效地开发用户界面。无论是简单还是复杂的界面，Vue都可以胜任。二、环境1.nodejs环境:下载地址三、创建Vue应用创建的项目将使用基于Vite的构建设置，并允许我们使用Vue的单文件组件(SFC)。$npmcreatevue@l
AI时代，需要怎样的架构师？腾讯云架构师峰会来了！架构
引言架构设计对应用有关键性的影响，不仅决定应用的整体品质，还直接影响开发、维护和扩展的难易度。卓越的架构设计不仅能够确保系统的稳定性、高效性和可扩展性，还能大幅提升研发效能，同时显著降低维护成本。在快速变化的技术环境中，架构师们面临业务需求快速迭代、数据量急剧膨胀以及系统复杂性不断提升等挑战。随着云计算、大数据、人工智能等前沿技术的蓬勃发展，一系列创新解决方案如微服务架构、AI大模型、自动化运维工
Spring Boot中使用MapStruct进行对象映射后端springboot
SpringBoot中使用MapStruct进行对象映射大家好，我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编，也是冬天不穿秋裤，天冷也要风度的程序猿！在现代的Java应用开发中，对象之间的转换是一个常见但不可避免的任务。MapStruct作为一个强大的对象映射框架，可以帮助开发者轻松地进行复杂对象之间的映射转换。本文将深入探讨如何在SpringBoot项目中使用MapStruc
java fx如何安装,JavaFX环境配置详细步骤运营小巴
为了运行JavaFX应用程序,我们必须在系统上设置JavaFX环境。JDK1.8之后的所有Java版本都支持JavaFX,因此我们必须在系统上安装JDK1.8或更高版本。有各种IDE,例如Net-beans或Eclipse,也支持JavaFX库。在本章中,我们将讨论执行JavaFX应用程序的各种方法。安装Java步骤1：验证是否已安装检查系统上是否已经安装了Java。就我而言,它尚未安装,因此我需
Java单例模式详解--七种单例模式实现+单例安全+实际应用场景飞天葫芦侠面向对象设计模式单例模式 java 安全设计模式
单例模式保证了一个类只有一个实例，并且提供了一个全局访问点。单例模式的主要作用是节省公共资源，方便控制，避免多个实例造成的问题。实现单例模式的三点：私有构造函数私有静态变量维护对象实例公有静态方法提供获取实例对象七种单例模式实现1.静态类：第一次运行初始化，全局使用2.懒汉模式（线程不安全）：懒汉模式是指在第一次获取实例时才创建对象，实现了延迟加载，构造函数返回当前对象实例，但多个访问者同时获取对
VS Code中JavaFX 项目环境配置「已注销」 java vscode ui
1.获取JavaFX1.1JavaFX下载JavaFX网站打开后应如图1.1.1所示：图1.1.1单击左下角Download按钮，进入如图1.1.2所示页面：图1.1.2JavaFXversion：选择你要使用的JavaFX版本，通常建议使用最新版本。为了稳定性考虑，不建议选择测试版，即后缀有[EarlyAccess]的版本。OperatingSystem：选择你用来进行JavaFX开发时所使用的
JavaFx-桌面应用开发利器（三）FXML和Scene Builder web18224617243 面试学习路线阿里巴巴 android 前端后端
本文接上文JavaFx-桌面应用开发利器（二）基础架构篇，在熟悉了JavaFx的基础框架后，通过基础的学习示例。相信你对基础的Stage和Scene对象等都有了一定的基础认识。在学习的时候，建议各位都能亲自动手进行编码，更有利于掌握相关知识。本文主要讲解JavaFx里面的FXML进行UI可视化开发，同时结合SceneBuilder，说明如何加速开发速度。一、首先介绍下简单介绍下FXML。FXML并
360智算中心万卡GPU集群架构分析科技互联人生科技数码人工智能硬件架构系统架构人工智能
360智算中心：万卡GPU集群落地实践 360智算中心是一个融合了人工智能、异构计算、大数据、高性能网络、AI平台等多种技术的综合计算设施，旨在为各类复杂的AI计算任务提供高效、智能化的算力支持。360智算中心不仅具备强大的计算和数据处理能力，还结合了AI开发平台，使得计算资源的使用更加高效和智能化。360内部对于智算中心的核心诉求是性能和稳定性，本文将深入探讨3
4.Java设计模式-创建型模式-单例模式-懒汉式-“synchronized加锁“实现 Bigger K Java设计模式-创建型模式 java 设计模式单例模式
文章目录1.懒汉式2.懒汉式-"synchronized加锁"实现3.代码测试4.总结1.懒汉式懒汉式：跟饿汉式在类加载时创建不一样，懒汉式是在我们第一次使用时才创建懒汉式，顾名思义，比较懒，没事儿就不会创建2.懒汉式-"synchronized加锁"实现publicclassSingleton{privatestaticSingletonINSTANCE;privateSingleton(){}
JavaScript高级学习：ES6新特性07——数组在ES6中的使用北凉冬 JavaScript javascript es6
提示：本文为JavaScript栏目：JavaScript高级系列——ES6新特性章节第七章JavaScript高级学习：ES6新特性07——数组在ES6中的使用前言数组在ES6中的使用求数组的最大值ES5的方式求数组最大值ES6的方式使用数组扩展运算符求最大值ES6扩展运算符的使用扩展运算符传参扩展运算符操作伪数组复制数组传统复制数组ES6中使用扩展运算符复制数组ES5中复制数组合并数组ES6方
多级缓存 JVM进程缓存 Rverdoser 缓存 jvm
在Java虚拟机（JVM）中，多级缓存通常指的是JVM内部的多层缓存机制，包括指令缓存、数据缓存等，这些缓存都是为了提高程序运行效率。在Java中，JVM的多级缓存是自动管理的，不需要程序员手动干预。但是，如果你想要监控或调试这些缓存的行为，可以使用一些JVM提供的工具和选项，如JMC（JavaMissionControl）、JVisualVM、JFR（JavaFlightRecorder）等。如
SpringBoot编程基础教程：Spring Boot Test AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术1.背景介绍SpringBootTest简介测试是一个软件开发过程中的重要环节，它可以帮助我们检测出软件代码中存在的问题、错误或漏洞，提高软件质量，确保软件的可靠性和可用性。在Java开发领域，Java自带的单元测试框架（JUnit）已经成为事实上的标准，但是随着项目越来越复杂，系统越来越庞大，单元测试用例的数量也越来越多，执行时间也越来vron长。此时，我们就需要自动
使用Spring Actuator + Micrometer + Prometheus + Grafana监控Spring Boot应用程序帅过驴的袋鼠 java docker
前言读取本文需要的知识：Java,Docker基本命令当某个应用在生产环境中运行时,监控其运行状态是必要的和明智的。通过实时了解应用程序的运行状况,你能在问题出现之前得到警告,也可以在客户端注意到问题之前解决问题。最终的效果图模块简单介绍SpringActuator:在应用程序离提供众多Web接口,通过它们了解应用运行时的内部状况。Micrometer:为Java平台上的性能数据收集提供了一个通用
Spring Boot & MyBatis Plus 版本兼容问题（记录） michael.csdn spring boot mybatis plus 后端
SpringBoot&MyBatisPlus版本兼容问题（Invalidvaluetypeforattribute'factoryBeanObjectType':java.lang.String）问题描述问题排查1.检查`@MapperScan`的路径2.项目中没有配置`FactoryBean`3.检查`Spring`和`MyBatisPlus`版本兼容性解决方法问题描述当使用spring-boo
【AI日志分析】基于机器学习的异常检测：告别传统规则的智能进阶网罗开发 AI 大模型人工智能机器学习
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
Element-plus封装表格Validate 努力搬砖的宣 vue.js 前端 javascript elementui
Element-plus实现表格内的表单验证：useAttrValidateHook在Vue.js项目中，表单验证是一个常见的需求，尤其在处理复杂表格编辑场景时。本文将详细介绍一个基于Vue3的自定义Hook——useAttrValidate，它提供了一种便捷的方式来处理表格组件中的字段校验。效果如下：1.导入与初始化Javascriptimport{reactive,nextTick}from"
Spring Boot快速接入Prometheus监控|写给Java开发运维 ikyrxbxfas Spring Java Java编程 java spring boot 运维 mysql 分布式
不想听我废话的，直接看代码就行：https://github.com/strictnerd/spring-petclinic-compose最近跟几个粉丝聊天吹水，说最近公司裁员严重，不仅裁掉了大部分的人，也裁掉了大部分的业务；之前公司有钱赚，什么产品都愿意做，无论行不行都会试一试，一堆没有什么流量的系统都在线上跑着，但是没有上级发话，一个也不敢停掉。站着资源不说，关键还得保证活着，基本就是运维人
代码工艺：Spring Boot 防御式编程实践 rongqing2019 代码工艺 spring boot 后端
防御式编程是一种编程实践，其核心理念是编写代码时要假设可能会发生错误、异常或非法输入，并通过各种手段防止这些问题引发系统崩溃、错误行为或安全漏洞。该编程方法的目的是让程序在面对不可预测的情况（如输入数据异常、硬件故障、意外的用户行为等）时仍然能够安全、稳定地运行。防御式编程特别强调在开发阶段尽可能地考虑各种边界情况、异常处理和系统的健壮性。在使用SpringBoot开发Java后端时，结合《代码大
Java网络编程逆风局？ java 网络服务器
基本的通信架构1.CS架构（Client客户端/Server服务端）Client客户端：需要程序员开发客户端软件需要用户下载安装客户端软件Server服务端：需要程序员开发服务端程序BS架构（Browser浏览器/Server服务端）。Browser浏览器不需要程序员开发需要用户下载安装浏览器Server服务端需要程序员开发服务端程序网络通信三要素IP地址设备在网络中的地址，是设备在网络中的唯一标
掌握 JavaScript：从基础到高级，全面提升编程技能跟着小郑学前端 javascript 开发语言 ecmascript
JavaScript是一种广泛应用于网页开发的编程语言，它使网页具有动态交互的能力。作为Web开发的核心技术之一，掌握JavaScript基础是每位开发者的必备技能。本文将介绍JavaScript的基础知识，包括数据类型、运算符、控制结构、函数等内容，并通过代码示例帮助大家理解。1.JavaScript数据类型JavaScript主要有以下几种数据类型：数据类型描述示例String字符串类型，用于
使用 JUnit 和 SuiteRunner 测试私有方法肉三 Java junit log4j java
我第一次使用JUnit是为了为ServiceUIAPI构建一个一致性测试工具包[1]。一致性测试工具包的目的是帮助确保同一API的替代实现与API的规范兼容。由于API规范仅定义API的公共接口，而不是API的实现，因此一致性测试仅测试公共接口。换句话说，一致性测试是一种“黑盒”测试。它将测试中的API视为黑盒，可以看到其外部接口，但看不到其内部实现。因此，JavaAPI的一致性测试只需要访问测试
Spring Boot 使用 Micrometer 集成 Prometheus 监控 Java 应用性能 liuyunshengsir 性能监控 java spring boot prometheus
在SpringBoot中使用Micrometer集成Prometheus来监控Java应用性能是一种常见的做法。一、Micrometer简介Micrometer是一个开源的Java项目，主要用于为JVM应用程序提供监控和度量功能。以下是对Micrometer的详细介绍：定义与功能Micrometer是一个针对基于JVM的应用程序的Metrics标准检测库。它提供了一个简单的仪表客户端外观，使得开发
sql：字符集（ASCII、GB2312、GBK、Unicode和UTF）、Mysql字符集（查看默认字符集和支持的字符集、层次级别、连接字符集、JDBC对连接字符集的影响） shanshandeisu sql mysql 数据库
仅为个人学习所用。请支持javaGuide原文。1.字符集1.1.ASCIIASCII字符集是一套现代美国英语适用的字符集，至今为止共定义了128个字符，其中有33个控制字符（比如回车、删除）无法显示。一个ASCII码长度是一个字节也就是8个bit。不过最高位是0仅仅作为校验位，其余7位使用0和1进行组合，所以，ASCII字符集可以定义128（2^7）个字符。1.2.GB2312GB2312字符集
金融行业数据安全指南，大数据时代不容忽视的底线！后端
金融数据：数字时代的“新石油”在大数据时代，金融行业正经历着一场深刻的变革。随着信息技术的飞速发展，金融数据量呈爆炸式增长，这些数据涵盖了客户信息、交易记录、市场行情等各个方面，成为了金融机构的关键资产，也被称为数字时代的“新石油”。以银行业为例，一家中等规模的商业银行每天产生的交易数据就可达数百万条，内容包括客户的存取款、转账汇款、消费支付等。这些数据不仅记录了客户的资金流动情况，还反映了客户的
Java Lambda 表达式详解及其用法 —— 含集合操作示例情书 java
JavaLambda表达式详解及其用法——含集合操作示例Lambda表达式自Java8引入以来，大大简化了代码的书写，特别是在集合操作和流处理（StreamAPI）方面。本文将详细介绍Lambda表达式的概念、使用方法及其在集合中的应用，并结合示例说明如何使用Lambda表达式进行集合的转换和处理。1.什么是Lambda表达式？Lambda表达式是一种可以把函数作为参数的简洁表达方式，主要用于替代
html页面js获取参数值 0624chenhong html
1.js获取参数值js function GetQueryString(name) { var reg = new RegExp("(^|&)"+ name +"=([^&]*)(&|$)"); var r = windo
MongoDB 在多线程高并发下的问题 BigCat2013 mongodb DB 高并发重复数据
最近项目用到 MongoDB , 主要是一些读取数据及改状态位的操作. 因为是结合了最近流行的 Storm进行大数据的分析处理，并将分析结果插入Vertica数据库，所以在多线程高并发的情境下, 会发现 Vertica 数据库中有部分重复的数据. 这到底是什么原因导致的呢？笔者开始也是一筹莫展，重复去看 MongoDB 的 API , 终于有了新发现： com.mongodb.DB 这个类有
c++ 用类模版实现链表(c++语言程序设计第四版示例代码) CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T> class Node { private: Node<T> * next; public: T data;
最近情况麦田的设计者感慨考试生活
在五月黄梅天的岁月里，一年两次的软考又要开始了。到目前为止，我已经考了多达三次的软考，最后的结果就是通过了初级考试（程序员）。人啊，就是不满足，考了初级就希望考中级，于是，这学期我就报考了中级，明天就要考试。感觉机会不大，期待奇迹发生吧。这个学期忙于练车，写项目，反正最后是一团糟。后天还要考试科目二。这个星期真的是很艰难的一周，希望能快点度过。
linux系统中用pkill踢出在线登录用户被触发 linux
由于linux服务器允许多用户登录，公司很多人知道密码，工作造成一定的障碍所以需要有时踢出指定的用户 1/#who 查出当前有那些终端登录（用 w 命令更详细） # who root pts/0 2010-10-28 09:36 (192
仿QQ聊天第二版肆无忌惮_ qq
在第一版之上的改进内容: 第一版链接: http://479001499.iteye.com/admin/blogs/2100893 用map存起来号码对应的聊天窗口对象,解决私聊的时候所有消息发到一个窗口的问题. 增加ViewInfo类,这个是信息预览的窗口,如果是自己的信息,则可以进行编辑. 信息修改后上传至服务器再告诉所有用户,自己的窗口
java读取配置文件知了ing
1，java读取.properties配置文件 InputStream in; try { in = test.class.getClassLoader().getResourceAsStream("config/ipnetOracle.properties");//配置文件的路径 Properties p = new Properties()
__attribute__ 你知多少？矮蛋蛋 C++gcc
原文地址: http://www.cnblogs.com/astwish/p/3460618.html GNU C 的一大特色就是__attribute__ 机制。__attribute__ 可以设置函数属性（Function Attribute ）、变量属性（Variable Attribute ）和类型属性（Type Attribute ）。 __attribute__ 书写特征是：
jsoup使用笔记 alleni123 java 爬虫 JSoup
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7.3</version> </dependency> 2014/08/28 今天遇到这种形式，
JAVA中的集合 Collectio 和Map的简单使用及方法百合不是茶 list map set
List ,set ,map的使用方法和区别 java容器类类库的用途是保存对象，并将其分为两个概念： Collection集合：一个独立的序列，这些序列都服从一条或多条规则;List必须按顺序保存元素，set不能重复元素；Queue按照排队规则来确定对象产生的顺序（通常与他们被插入的
杀LINUX的JOB进程 bijian1013 linux unix
今天发现数据库一个JOB一直在执行，都执行了好几个小时还在执行，所以想办法给删除掉系统环境： ORACLE 10G Linux操作系统操作步骤如下：第一步.查询出来那个job在运行，找个对应的SID字段 select * from dba_jobs_running--找到job对应的sid &n
Spring AOP详解 bijian1013 java spring AOP
最近项目中遇到了以下几点需求，仔细思考之后，觉得采用AOP来解决。一方面是为了以更加灵活的方式来解决问题，另一方面是借此机会深入学习Spring AOP相关的内容。例如，以下需求不用AOP肯定也能解决，至于是否牵强附会，仁者见仁智者见智。 1.对部分函数的调用进行日志记录，用于观察特定问题在运行过程中的函数调用
[Gson六]Gson类型适配器(TypeAdapter) bit1129 Adapter
TypeAdapter的使用动机 Gson在序列化和反序列化时，默认情况下，是按照POJO类的字段属性名和JSON串键进行一一映射匹配，然后把JSON串的键对应的值转换成POJO相同字段对应的值，反之亦然，在这个过程中有一个JSON串Key对应的Value和对象之间如何转换(序列化/反序列化)的问题。以Date为例，在序列化和反序列化时，Gson默认使用java.
【spark八十七】给定Driver Program，如何判断哪些代码在Driver运行，哪些代码在Worker上执行 bit1129 driver
Driver Program是用户编写的提交给Spark集群执行的application，它包含两部分作为驱动： Driver与Master、Worker协作完成application进程的启动、DAG划分、计算任务封装、计算任务分发到各个计算节点(Worker)、计算资源的分配等。计算逻辑本身，当计算任务在Worker执行时，执行计算逻辑完成application的计算任务
nginx 经验总结 ronin47 nginx 总结
　　　深感nginx的强大，只学了皮毛，把学下的记录。　　　获取Header 信息，一般是以$http_XX（ＸＸ是小写）获取body,通过接口，再展开，根据Ｋ取Ｖ　　　获取uri,以$arg_XX &n
轩辕互动-1.求三个整数中第二大的数2.整型数组的平衡点 bylijinnan 数组
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class ExoWeb { public static void main(String[] args) { ExoWeb ew=new ExoWeb(); System.out.pri
Netty源码学习-Java-NIO-Reactor bylijinnan java 多线程 netty
Netty里面采用了NIO-based Reactor Pattern 了解这个模式对学习Netty非常有帮助参考以下两篇文章： http://jeewanthad.blogspot.com/2013/02/reactor-pattern-explained-part-1.html http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
AOP通俗理解 cngolon spring AOP
1.我所知道的aop 初看aop,上来就是一大堆术语，而且还有个拉风的名字，面向切面编程，都说是OOP的一种有益补充等等。一下子让你不知所措，心想着：怪不得很多人都和我说aop多难多难。当我看进去以后，我才发现：它就是一些java基础上的朴实无华的应用，包括ioc，包括许许多多这样的名词，都是万变不离其宗而已。 2.为什么用aop&nb
cursor variable 实例 ctrain variable
create or replace procedure proc_test01 as type emp_row is record( empno emp.empno%type, ename emp.ename%type, job emp.job%type, mgr emp.mgr%type, hiberdate emp.hiredate%type, sal emp.sal%t
shell报bash: service: command not found解决方法 daizj linux shell service jps
今天在执行一个脚本时，本来是想在脚本中启动hdfs和hive等程序，可以在执行到service hive-server start等启动服务的命令时会报错，最终解决方法记录一下：脚本报错如下： ./olap_quick_intall.sh: line 57: service: command not found ./olap_quick_intall.sh: line 59
40个迹象表明你还是PHP菜鸟 dcj3sjt126com 设计模式 PHP 正则表达式 oop
你是PHP菜鸟，如果你：1. 不会利用如phpDoc 这样的工具来恰当地注释你的代码2. 对优秀的集成开发环境如Zend Studio 或Eclipse PDT 视而不见3. 从未用过任何形式的版本控制系统，如Subclipse4. 不采用某种编码与命名标准，以及通用约定，不能在项目开发周期里贯彻落实5. 不使用统一开发方式6. 不转换（或）也不验证某些输入或SQL查询串（译注：参考PHP相关函
Android逐帧动画的实现 dcj3sjt126com android
一、代码实现： private ImageView iv; private AnimationDrawable ad; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout
java远程调用linux的命令或者脚本 eksliang linux ganymed-ssh2
转载请出自出处： http://eksliang.iteye.com/blog/2105862 Java通过SSH2协议执行远程Shell脚本(ganymed-ssh2-build210.jar) 使用步骤如下： 1.导包官网下载: http://www.ganymed.ethz.ch/ssh2/ ma
adb端口被占用问题 gqdy365 adb
最近重新安装的电脑，配置了新环境，老是出现： adb server is out of date. killing... ADB server didn't ACK * failed to start daemon * 百度了一下，说是端口被占用，我开个eclipse，然后打开cmd，就提示这个，很烦人。一个比较彻底的解决办法就是修改
ASP.NET使用FileUpload上传文件 hvt .net C#hovertree asp.net webform
前台代码： <asp:FileUpload ID="fuKeleyi" runat="server" /> <asp:Button ID="BtnUp" runat="server" onclick="BtnUp_Click" Text="上传" />
代码之谜（四）- 浮点数（从惊讶到思考） justjavac 浮点数精度代码之谜 IEEE
在『代码之谜』系列的前几篇文章中，很多次出现了浮点数。浮点数在很多编程语言中被称为简单数据类型，其实，浮点数比起那些复杂数据类型（比如字符串）来说，一点都不简单。单单是说明 IEEE浮点数就可以写一本书了，我将用几篇博文来简单的说说我所理解的浮点数，算是抛砖引玉吧。一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试，多年以后，他已经称为了一名很出色的
数据结构随记_1 lx.asymmetric 数据结构笔记
第一章 1.数据结构包括数据的逻辑结构、数据的物理/存储结构和数据的逻辑关系这三个方面的内容。 2.数据的存储结构可用四种基本的存储方法表示，它们分别是顺序存储、链式存储、索引存储和散列存储。 3.数据运算最常用的有五种，分别是查找/检索、排序、插入、删除、修改。 4.算法主要有以下五个特性：输入、输出、可行性、确定性和有穷性。 5.算法分析的
linux的会话和进程组网络接口 linux
会话：一个或多个进程组。起于用户登录，终止于用户退出。此期间所有进程都属于这个会话期。会话首进程：调用setsid创建会话的进程1.规定组长进程不能调用setsid，因为调用setsid后，调用进程会成为新的进程组的组长进程.如何保证？先调用fork，然后终止父进程，此时由于子进程的进程组ID为父进程的进程组ID，而子进程的ID是重新分配的，所以保证子进程不会是进程组长，从而子进程可以调用se
二维数组元素的连续求解 1140566087 二维数组 ACM
import java.util.HashMap; public class Title { public static void main(String[] args){ f(); } // 二位数组的应用 //12、二维数组中，哪一行或哪一列的连续存放的0的个数最多，是几个0。注意，是“连续”。 public static void f(){
也谈什么时候Java比C++快 windshome java C++
刚打开iteye就看到这个标题“Java什么时候比C++快”，觉得很好笑。你要比，就比同等水平的基础上的相比，笨蛋写得C代码和C++代码，去和高手写的Java代码比效率，有什么意义呢？我是写密码算法的，深刻知道算法C和C++实现和Java实现之间的效率差，甚至也比对过C代码和汇编代码的效率差，计算机是个死的东西，再怎么优化，Java也就是和C

Flink 在快手实时多维分析场景的应用

你可能感兴趣的:(java·未分类,flink,大数据)