weixin_39805851

hive增量表和全量表_基于 Flink+Hive 构建流批一体准实时数仓

基于 Hive 的离线数仓往往是企业大数据生产系统中不可缺少的一环。Hive 数仓有很高的成熟度和稳定性，但由于它是离线的，延时很大。在一些对延时要求比较高的场景，需要另外搭建基于 Flink 的实时数仓，将链路延时降低到秒级。但是一套离线数仓加一套实时数仓的架构会带来超过两倍的资源消耗，甚至导致重复开发。

想要搭建流式链路就必须得抛弃现有的 Hive 数仓吗？并不是，借助 Flink 可以实现已有的 Hive 离线数仓准实时化。本文整理自 Apache Flink Committer、阿里巴巴技术专家李劲松在 InfoQ 技术公开课的分享，文章将分析当前离线数仓实时化的难点，详解 Flink 如何解决 Hive 流批一体准实时数仓的难题，实现更高效、合理的资源配置。文章大纲如下：

离线数仓实时化的难点
Flink 在流批一体的探索
构建流批一体准实时数仓应用实践

离线数仓实时化的难点

离线数仓

hive增量表和全量表_基于 Flink+Hive 构建流批一体准实时数仓_第1张图片

上图是一个典型的离线数仓，假设现在公司有一个需求，目前公司的数据量很大，需要每天出一个报表且输出到业务数据库中。首先是刚入库的业务数据，大致分为两种，一种是 MySQL 的 binlog，另外一种是业务系统中的业务打点，这个日志打点信息可以通过 Flume 等工具去采集，再离线入库到数仓中。然后随着业务越来越多，业务中的各个表可以做一些抽象，抽象的好处是更好的管理和更高效的数据复用和计算复用。所以数仓就分成了多层 (明细层、中间层、服务层等等)，每一层存的是数据表，数据表之间通过 HiveSQL 的计算来实现 ETL 转换。

不止是 HiveSQL ，Hive 只是静态的批计算，而业务每天都要出报表，这意味着每天都要进行计算，这种情况下会依赖于调度工具和血缘管理：

调度工具：按照某个策略把批计算调度起来。
血缘管理：一个任务是由许多个作业组合而成，可能有非常复杂的表结构层次，整个计算是一个非常复杂的拓扑，作业间的依赖关系非常复杂 (减少冗余存储和计算，也可以有较好的容错)，只有当一级结束后才能进行下一级的计算。

当任务十分庞大的时候，我们得出结果往往需要很长的一段时间，也就是我们常说的 T+1，H+1 ，这就是离线数仓的问题。

第三方工具

hive增量表和全量表_基于 Flink+Hive 构建流批一体准实时数仓_第2张图片

上面说过，离线数仓不仅仅是简单的 Hive 计算，它还依赖了其它的第三方工具，比如：

使用 Flume 来入库，但存在一定的问题，首先，它的容错可能无法保证 Exactly-Once 效果，需要下游再次进行去重操作。其次，自定义逻辑需要通过一些手段，比如脚本来控制。第三，离线数仓并不具备良好的扩展能力，当数据剧增时，增加原本的并发数就比较困难了。
基于调度工具的作业调度会带来级联的计算延迟，比如凌晨 1 点开始计算昨天的数据，可能需要到早上 6、7 点才能做完，并且无法保证在设置的调度时间内数据可以完全 ready 。此外，级联的计算还会带来复杂的血缘管理问题，大任务的 Batch 计算可能会突然打满集群的资源，所以也要求我们对于负载管理进行考量，这些都会给业务增加负担。

无论是离线数仓还是第三方工具，其实主要的问题还是“慢”，如何解决慢的问题，此时就该实时数仓出场了。

实时数仓

实时数仓其实是从 Hive+HDFS 的组合换成了 Kafka，ETL 的功能通过 Flink 的流式处理解决。此时就不存在调度和血缘管理的问题了，通过实时不断的增量更新，最终输出到业务的 DB 中。

虽然延时降低了，但此时我们会面临另外一些问题：

历史数据丢失，因为 Kafka 只是临时的存储介质，数据会有一个超时的时间 (比如只保存 7 天的数据)，这会导致我们的历史数据丢失。
成本相对较高，实时计算的成本要大于离线计算。

Lambda 架构

hive增量表和全量表_基于 Flink+Hive 构建流批一体准实时数仓_第4张图片

所以此时很多人就会选择一套实时一套离线的做法，互不干扰，根据任务是否需要走实时的需求来对需求进行分离。

这套架构看似解决了所有问题，但实际带来的问题也是非常多。首先，Lambda 架构造成了离线和实时的割裂问题，它们解决的业务问题都是一样的，但是两套方案让同样的数据源产生了不同的计算结果。不同层级的表结构可能不一致，并且当数据产生不一致的问题时，还需要去进行比对排查。

随着这套 Lambda 架构越走越远，开发团队、表结构表依赖、计算模型等都可能会被割裂开，越到后面越会发现，成本越来越高，而统一的代价越来越大。

hive增量表和全量表_基于 Flink+Hive 构建流批一体准实时数仓_第5张图片

那么问题来了，实时数仓会耗费如此大的资源，且还不能保留历史数据，Lambda 架构存在如此多的问题，有什么方案可以解决呢？

数据湖

hive增量表和全量表_基于 Flink+Hive 构建流批一体准实时数仓_第6张图片

数据湖拥有不少的优点，原子性可以让我们做到准实时的批流一体，并且支持已有数据的修改操作。但是毕竟数据湖是新一代数仓存储架构，各方面都还不是很完美，目前已有的数据湖都强依赖于 Spark(当然 Flink 也正在拥抱数据湖)，将数据迁移到数据湖需要团队对迁移成本和人员学习成本进行考量。

如果没有这么大的决心迁移数据湖，那有没有一个稍微缓和一些的方案加速已有的离线数仓呢？

Flink 在批流一体上的探索

统一元数据

hive增量表和全量表_基于 Flink+Hive 构建流批一体准实时数仓_第7张图片

Flink 一直持续致力于离线和实时的统一，首先是统一元数据。简单来说就是把 Kafka 表的元数据信息存储到 HiveMetaStore 中，做到离线和实时的表 Meta 的统一。

(目前开源的实时计算并没有一个较为完善的持久化 MetaStore，Hive MetaStore 不仅能保存离线表，也可以承担实时计算的 MetaStore 能力)。

统一计算引擎

hive增量表和全量表_基于 Flink+Hive 构建流批一体准实时数仓_第8张图片

同样的元数据之后，实时和离线的表结构和层次可以设计成一样，接下来就是可以共用：

同一套 SQL，Flink 自身提供批流一体的 ANSI-SQL 语法，可以大大减小用户 SQL 开发者和运维者的负担，让用户专注于业务逻辑。
同一个引擎，Flink 的流和批复用一套优化和 Runtime 框架，现阶段的大数据引擎还远远达不到完全稳定的情况，所以仍然有很多时候需要我们去深入的分析和优化，一套引擎可以让开发者专注单个技术栈，避免需要接触多个技术栈，而只有技术广度，没有技术深度。

统一数据

hive增量表和全量表_基于 Flink+Hive 构建流批一体准实时数仓_第9张图片

分析了元数据和计算引擎的统一，更进一步，是否能统一实时和离线的数据，避免数据的不一致，避免数据的重复存储和重复计算。ETL 计算是否能统一呢？既然实时表设计上可以和离线表一模一样，是否可以干脆只有实时表的 ETL 计算，离线表从实时表里获取数据？

并且，通过实时链路可以加速离线链路的数据准备，批计算可以把调度换成流输入。

hive增量表和全量表_基于 Flink+Hive 构建流批一体准实时数仓_第10张图片

Flink Hive/File Streaming Sink 即为解决这个问题，实时 Kafka 表可以实时的同步到对于的离线表中：

离线表作为实时的历史数据，填补了实时数仓不存在历史数据的空缺。
数据批量准实时摄入为 Ad-hoc 查询离线表提供了准实时输入。

此时离线的批计算也可以交由实时调度，在实时任务处理中某个契机 (Partition Commit 见后续) 自行调度离线那块的任务进行数据同步操作。

此时实时和离线的表已经基本统一，那么问题来了，Kafka 中的表和 Hive 中的表能否就共用一张表呢？我的想法是之后可能会出现以下情况，在数仓中定义一张表，分别对应着 Kafka 和 Hive+HDFS 两种物理存储：

用户在进行 insert 操作时，就自然插入到了 Kafka 的实时 table 当中，同时生成另外一条链路，自动同步到 Hive Table 当中。这样这一张表就非常的完整，不仅满足实时的需求，而且拥有历史的数据。
一个 SQL 读取这样的一个 Hybrid Source ，根据你的查询语句后面的 where 条件，自动路由到 Hive 的历史数据，或者是 Kafka 的实时数据。根据一定的规则先读 Hive 历史数据，再读 Kafka 实时数据，当然这里有一个问题，它们之间通过什么标识来切换呢？一个想法是数据中或者 Kafka 的 Timestamp。

Hive Streaming Sink 的实现

hive增量表和全量表_基于 Flink+Hive 构建流批一体准实时数仓_第11张图片

Flink 1.11 前已经有了 StreamingFileSink，在 1.11 中不但把它集成到 SQL 中，让这个 Hive Streaming Sink 可以像离线的 Hive SQL 那样，所有的业务逻辑都由 SQL 去处理，而且带来了进一步的增量。

接下来介绍下 Hive/File Streaming Sink，分为两个组件，FileWriter 和 PartitionCommitter：

FileWriter 组件可以做到分区感知，通过 checkpoint 机制可以保证 Exactly-Once(分布式场景是不可靠的，需要通过两阶段提交 + 文件 Rename 的幂等性)，FileWriter 也提供了 Rolling 相关的参数，这个 Rolling 指的是我们的流式处理过程，它可以通过两个参数来控制执行频率，file-size 就是每个数据流的大小，rollover-interval 就是时长间隔。但是需要注意，checkpoint 不宜设置太频繁，以免产生过多的小文件。
Partition Committer，通过一系列的业务逻辑处理后得到的 Finished Flies 就直接可用了吗？因为我们典型的 Hive 表都是分区表，当一个分区就绪后，还需要通知下游，Partition 已经处理完成，可以同步到 Hive metastore 中了。我们需要在合适的时机来有效的 trigger 特定的 Partition commit。Partition committer 总的来说，就是完成了 Hive 分区表的数据及元数据的写入，甚至可以完成通知调度系统开始执行之后的 Batch 作业。

hive增量表和全量表_基于 Flink+Hive 构建流批一体准实时数仓_第12张图片

因为流式作业是不间断的在运行的，如何设置分区提交的时间，某个分区什么时候提交它呢？

第一种是默认策略 Process time ，也就是我们所说的事件被处理时的当前系统时间，但是缺点也比较明显，可能出现各种各样的数据不完整。
推荐策略就是 partition-time，这种策略可以做到提交时的语义明确且数据完整，partition 字段就是由 event time ，也就是事件产生的时间所得到的。

如果当前时间 Current time > 分区产生的时间 + commitDelay 延时，即是可以开始进行分区提交的时间。一个简单的例子是小时分区，比如当前已经 12 点过 1 分了，已经过了 11 点的分区 + 一个小时，所以我们可以说不会再有 11 点分区的数据过来了，就可以提交 11 点的分区。(要是有 LateEvent 怎么办？所以也要求分区的提交是幂等的。)

hive增量表和全量表_基于 Flink+Hive 构建流批一体准实时数仓_第13张图片

接下来介绍分区的提交具体作用，最直接的就是写 SuccessFile 和 Add partition 到 Hive metastore。

Flink 内置支持了 Hive-MetaStore 和 SuccessFile，只要配置"sink.partition-commit.policy.kind" 为 “metastore,success-file”，即可做到在 commit 分区的时候自动 add 分区到 Hive 中，而且写 SuccessFile，当 add 操作完成的时候，这个 partition 才真正的对 Hive 可见。

Custom 机制允许自定义一个 Partition Commit Policy 的类，实现这个类可以做到在这个分区的任务处理完成后：比如触发下游的调度、Statistic Analysis、又或者触发 Hive 的小文件合并。(当然触发 Hive 的小文件合并不但需要启动另一个作业，而且做不到一致性保证，后续 Flink 也会有进一步的探索，在 Flink 作业中，主动完成小文件的合并)。

实时消费

hive增量表和全量表_基于 Flink+Hive 构建流批一体准实时数仓_第14张图片

不止是准实时的数据摄入，Flink 也带来了维表关联 Hive 表和流实时消费 Hive 表。

我们知道 Flink 是支持维表关联查询 MySQL 和 HBase 的，在计算中维护一个 LRU 的缓存，未命中查询 MySQL 或 HBase。但是没有 Lookup 的能力怎么办呢？数据一般是放在离线数仓中的，所以业务上我们一般采用 Hive Table 定期同步到 HBase 或者 MySQL。Flink 也可以允许直接维表关联 Hive 表，目前的实现很简单，需要在每个并发中全量 Load Hive 表的所有数据，只能针对小表的关联。

传统的 Hive Table 只支持按照批的方式进行读取计算，但是我们现在可以使用流的方式来监控 Hive 里面的分区 / 文件生成，也就是每一条数据过来，都可以实时的进行消费计算，它也是完全复用 Flink Streaming SQL 的方式，可以和 HBase、MySQL、Hive Table 进行 Join 操作，最后再通过 FileWriter 实时写入到 Hive Table 中。

构建流批一体准实时数仓应用实践

hive增量表和全量表_基于 Flink+Hive 构建流批一体准实时数仓_第15张图片

案例如下：通过 Flume 采集日志打点 Logs，计算各年龄层的 PV，此时我们存在两条链路：

一条是实时链路，通过输入访问日志，关联 Hive 的 User 表来计算出所需要的结果到业务 DB 中。
而另一条则是离线链路，我们需要 Hive 提供小时分区表，来实现对历史数据的 Ad-hoc 查询。

hive增量表和全量表_基于 Flink+Hive 构建流批一体准实时数仓_第16张图片

这里就是我们刚刚提到的，虽然是对应两个 database：realtime_db 和 offline_db，但是它们共用一份元数据。

对于 Hive 表我们可以通过 Flink SQL 提供的 Hive dialect 语法，然后通过 Hive 的 DDL 语法来在 Flink 中创建 Hive 表，这里设置 PARTITION BY 天和小时，是与实时链路的不同之处，因为实时链路是没有分区概念的。

如何在表结构里避免分区引起的 Schema 差异？一个可以解决的方案是考虑引入 Hidden Partition 的定义，Partition 的字段可以是某个字段的 Computed Column，这也可以与实际常见的情况做对比，如天或小时是由时间字段计算出的，之后是下面的三个参数：

sink.partition-commit.trigger，指定什么时候进行 partition 的 commit，这里设置了 partition-time，用于保证 exactly-once；
partition.time-extractor.timestamp-pattern，怎样从 partition 中提取时间，相当于设置了一个提取格式；
sink.partition-commit.policy.kind，既 partition commit 所要进行的操作，也就是刚刚提到的 metastore，success-file。

之后设置回默认的 Flink dialect，创建 Kafka 的实时表，通过 insert into 将 Kafka 中的数据同步到 Hive 之中。

hive增量表和全量表_基于 Flink+Hive 构建流批一体准实时数仓_第17张图片

这部分是关于 Kafka 中的表如何通过 Dim join 的方式，拿到 User 表的年龄字段。图中需要关心的是 lookup.join.cache.ttl 这个参数，我们会将 user 这张表用类似于 broadcast 的方式，广播到每一个 task 中，但是这个过程中可能出现 Hive 中的 table 存在更新操作，这里的 1h 就说明，数据有效期仅为 1 小时。创建 view 的目的是将 Dim join 所需要的 process time 加上(Dim Join 需要定义 Process time 是个不太自然的过程，后续也在考虑如何在不破坏 SQL 语义的同时，简化 DimJoin 的语法。)

hive增量表和全量表_基于 Flink+Hive 构建流批一体准实时数仓_第18张图片

通过实时 Pipeline 的手段消费 Hive Table，而不是通过调度或者以往手动触发的 batch 作业，第一个参数 streaming-source.enable，打开流处理机制，然后使用 start-offset 参数指定从哪个分区 / 文件开始消费。此时，整个流批一体准实时数仓应用基本算是完成啦。

未来规划

Hive 作为分区级别管理的 Table Format 在一些方便有比较大的限制，如果是新型的 Table Format 比如 Iceberg 会有更好的支持，未来 Flink 会在下面几个方面加强：

Flink Hive/File Streaming Sink 的 Auto Compaction(Merging) 能力，小文件是实时的最大阻碍之一。
Flink 拥抱 Iceberg，目前在社区中已经开发完毕 Iceberg Sink，Iceberg Source 正在推进中，可以看见在不远的将来，可以直接将 Iceberg 当做一个消息队列，且，它保存了所有的历史数据，达到真正的流批统一。
增强 Flink Batch 的 Shuffle，目前完全的 Hash Shuffle 带来了很多问题，比如小文件、随机 IO、Buffer 管理带来的 OOM，后续开源 Flink (1.12) 会加强力量引入 SortedShuffle 以及 ShuffleService。
Flink Batch BoundedStream 支持，旧的 Dataset API 已经不能满足流批统一的架构，社区 (1.12) 会在 DataStream 上提供 Batch 计算的能力。

更多细节，可以查看 InfoQ 公开课的完整视频回放：

直播回放：基于Flink+Hive构建流批一体准实时数仓 | InfoQ

讲师介绍：

李劲松，花名之信，阿里巴巴技术专家，Apache Flink Committer。2014 年起专注于阿里内部 Galaxy 流计算框架；2017 年起开始 Flink 研发，主要专注于 Batch 计算、数据结构与类型。

关注我并转发此篇文章，私信我“领取资料”，即可免费获得InfoQ价值4999元迷你书，点击文末「了解更多」，即可移步InfoQ官网，获取最新资讯～

初恋的一些回忆八戒的小屋
昨天晚上10点，初恋和我微信说她考上南开了，突然想写一篇和她相关的一些小事儿。（一）她能考上南开，很让人激动。这已经是她第二次考研了，第一次没有考上，第二次不得不再回到学校准备这一年的考试。其实我不单单是佩服她，还佩服所有准备二战的人。我难以想象他们顶着什么样的压力在身边的朋友、同学都开始工作或者是已经读上研究生的情况下，依然能够坚持考自己想去的大学。但和有些人聊天儿，感觉又有些遗憾。很多人即使是
彻底拆解 Vue scoped 指令：从编译原理到工程实践的全链路解析是罐装可乐 vue.js 前端 javascript
引言我们在开发Vue项目时，经常会给标签加上scoped特性来实现组件的样式隔离。但它究竟是如何做到这一点的呢？作为开发者，我们不仅要会用这个特性，更要深入了解其底层原理。只有这样，在实际开发中才能避开各种潜在的陷阱，提升解决问题的效率。接下来，我们就来彻底剖析一下Vue的scoped指令，看看它到底是如何实现样式隔离的。css编译当标签带有scoped属性时，其CSS样式仅作用于当前组件内的元素
淘宝商品优惠券如何设置？揭秘优惠策略的制定与实施氧惠好项目
淘宝卖家们为了吸引消费者、提升销量，常常会选择发放商品优惠券。那么，淘宝商品优惠券如何设置呢？本文将详细探讨优惠券的设置步骤、策略以及注意事项，帮助卖家们更好地制定和实施优惠策略。公司裁员,老公失业找不到工作,最后当了小区保安,工资5000,月休4天,突然有一天说不想干了,30多岁的职场人找工作心里不好受!月正财超旺，5月横财发，6月鸿运当头，2024年财运满满的三大星座杨绛先生说：有些伤痛，何可
河池可以做亲子鉴定正规医院(附河池11家亲子鉴定中心最新名单) 中正DNA鉴定中心
DNA亲子鉴定是科学、准确的确定是否有血缘关系、家庭纠纷的重要方法。对于很多家长咨询河池可以做亲子鉴定正规医院办理流程，地址等话题。请务必核实机构的资质和业务范围，以确保自己的权益得到保障。下文也附河池11家亲子鉴定中心最新名单，中正小编提供一些参考和帮助，希望顺利完成鉴定。一、河池哪家医院可以做亲子鉴定?河池市人民医院，河池市第一人民医院，河池市妇幼保健院，河池市中医医院，河池市第三人民医院等三
重塑未来：AI如何重新定义全栈开发熊猫钓鱼>_> 人工智能
在传统认知中，全栈开发者被誉为技术界的“全能选手”。——他们需要精通前端界面构建（HTML/CSS/JavaScript）、后端业务逻辑实现（Python/Java/Node.js）、数据库设计优化（MySQL/MongoDB）以及服务器部署运维（Linux/Docker）。这种“一人包打天下”的能力模型长期被视为高效开发的黄金标准，尤其受到创业公司和小型团队的青睐，因为它能大幅减少沟通成本，加速
2023-08-11 如飞的时间春雪ChunXue
一位八旬的老者告诉我说：从五十多到八十多是很快的事儿，一晃便到了。我也相信他的说法。感觉时间越过越快，当下的一分一秒都比年少时的时间流逝得快速。那个时候盼望着长大，盼望着过年，每每都会生出时间过得缓慢的感慨。我不相信时光流逝的速度都是一样，我觉得它就像一个飞速转动的陀螺，越转越快，越转越快……如飞的时间让我惊惧，有一种来不及年轻，也来不及年老的感觉。在时间面前，我不知所措了……也许人生的最后也和人
傅继英艺术馆书法“上善若水”分享傅继英艺术馆
傅继英书法作品：上善若水。你高，我便褪去，绝不淹没你的优点;你低，我便涌来，绝不暴露你的缺陷;你动，我便随行，绝不撇下你的孤独;你静，我便常守，绝不打扰你的安宁...“上善若水”告诉我们，最高的善行就像水一样柔性和顺应。水是一种柔软的物质，能够适应各种形状和环境，不会因为环境的变化而改变自己的本质。同样，最高的善行也应该是柔性的，能够顺应环境和情况，保持自己的本质和原则。在人际交往和生活中，我们也
读书和环保吴广泽
今天早上，妈妈带我去凤凰公园东南角参加换书活动。我们围成了一个圈。尚老师让我们背1-9乘法，为什么背乘法口诀呢，因为今天没头脑和不高兴里的内容与乘法口诀有关。今天讲的题目是小妖精的咒语。老师先讲第一自然段，讲完后又讲第二自然段，尚老师提问题，我们回答问题，就这样我们读到了最后一个自然段。然后我们和爸爸妈妈都戴着红帽，拿着塑料袋，带着一只手套，一起捡垃圾。我们都努力的找垃圾，我们分两组，有的去广场找
ChatGPT 之后的下一步是什么？四个迫在眉睫的进步 iCloudEnd
OpenAI的文本生成器ChatGPT进入公共领域已经两个半月了，该机器人令人印象深刻且深思熟虑的答案已经引起了1300万日常用户的注意，他们已经将其用于一般问题、开发想法和写作全长文章。尽管ChatGPT存在重大缺陷（例如一些事实不准确），但许多人担心这可能对劳动力、学校、新闻业等产生影响。然而，我们可能正处于一场巨大的人工智能革命的开端。OpenAI总裁兼联合创始人GregBrockman于1
在华为OD的程序员经验分享不秃头de程序猿华为经验分享 android
华为是一家100%由员工持有的民营企业。华为员工级别分为13-22级，从13-18级，每个级别分ABC三小级别，大部分员工在18级内，15级以上薪资涨幅变慢。通常华为工作十年的普通员工大概在16-17级左右，薪酬约为60万-70万。这也是很多人想进华为的原因。华为OD与华为区别华为od岗od假期和年假都会少于hw员工，而且od主动离职没有n＋1的补偿。od没有明确的调薪制度，转后还会不会直接发加班
青春的花朵感恩遇见0331
青春，是一首永恒的旋律，青春，是含苞待放的花蕾，清纯高雅，芳香醉人。豆蔻年华的孩子们心里充满了对青春的好奇和向往，只是少不经事的他们有必要在他们青春的花朵绽放之前知道一些常识，做好一些心理防护，才会让青春的花朵绽放的格外美丽动人。本周是学校的心理健康宣传周，下午所有的心育老师为初二级部10个班的学生们上了一堂心育健康课——《青春的花朵》。1.约定上课之前我先和孩子们做了一个约定，我诚挚的邀请他们，
重生后，黑蛇前夫向我姐姐求婚：凤初地瓜读物
主角配角：凤初小说别名：重生后，黑蛇前夫向我姐姐求婚简介：父亲为了帮助姐姐修行，又将无理取闹的帽子扣在我头上，命令我放弃姻缘。“好。”你想要，那就给你。看见我不争不闹，这么爽快的答应，父亲和黑蛇都有些诧异。—————————精彩内容试读—————————我是凤族的二公主。却爱上了一条低贱的黑蛇。前世。为了能和黑蛇在一起，在凤族挑选伴生兽时，我特意选了黑蛇。我们夜夜做伴。我更是不顾凤族所有人反对，执
《永夜长明》电视剧全30集【1080p超清】百度/云资源[网盘免费高清链接下载迅雷夸克阿里]多少集剧情在哪里看1080p超清地址平台优惠攻略官
电视剧《永夜长明》是一部古装爱情剧，改编自番茄小说《被疯批国师强取豪夺后》，由吴承峰导演，何宣林、李菲、王星玮等主演。剧情主要讲述了谢家贵女谢挽音（何宣林饰）与国师东方醉（李菲饰）之间错综复杂的情感纠葛和权谋斗争。谢挽音原本与太子有婚约，却因东方醉的介入而被迫成为国师夫人。东方醉外表清雅，实则内心疯狂，谢挽音在与他斗智斗勇的过程中，逐渐发现了他与自己幼年故人的相似之处，以及背后更大的阴谋永夜长明资
6.27 阿庆仔
昨天休息了一天、今天状态还是要好一些了，看了天气以为是个凉快天气、没曾想还是热到爆炸.......今天任务完成倒数第一️、晚上做了俯卧撑，脸上还是挂不住，馆里面的女生些，都不是女生，都是女汉子，感觉都是铁打的，体力都赶不上她们，我反思了一下，主要还是跟客户聊天不够坚持，或许再多坚持一会，小姐姐就会加我的微信了，只是有时脑袋一哈就断片了、不晓得继续和客户摆些啥子.....下午梦蝶节问我在银海湾门口加
IDC权威认可：瑞数信息双项入选《中国大模型安全保护市场概览》科技云报道安全
近日，国际数据公司IDC正式发布了《中国大模型安全保护市场概览，2025：全方位安全检测与防护构建可信AI》报告。本次报告中IDC结合全球统一定义以及中国市场特色，将中国大模型安全保护市场划分为7个细分领域，并通过对中国大模型安全保护市场的广泛和深入的调研，对各细分领域的代表厂商进行了全面梳理。瑞数信息凭借在AI领域的深厚技术积累与前瞻布局，入选中国大模型安全保护市场“保护大模型接口”与“保护大模
深入理解设计模式：策略模式的艺术与实践 vvilkin的学习备忘设计模式设计模式策略模式
在软件开发中，我们经常会遇到需要根据不同情况选择不同算法或行为的场景。传统的做法可能是使用大量的条件语句（if-else或switch-case），但随着需求的增加和变化，这种硬编码的方式会导致代码难以维护和扩展。策略模式（StrategyPattern）正是为了解决这类问题而诞生的一种优雅的设计模式。策略模式属于行为型设计模式，它定义了一系列算法，并将每个算法封装起来，使它们可以相互替换。这种模
我没有凤凰涅槃，但我已经变成了一颗小树茗语海澜
图片发自App我是一名大二学生，我的日常是这样的：早上六点闹钟响起，我如你猜想的利索地把闹钟关掉，躺进被窝里睡觉，八九点钟，姗姗醒来，感觉没睡够，非要指针正好指到9和12的位置才起床，然后就是慢悠悠地收拾、慢悠悠地去上课，早饭呢?哦，那是不存在的。其他不上课不写作业的时间我在干嘛呢?手里拿着手机，像一个蘑菇坐在椅子上，屏幕上不是匆匆扫过的公众号，就是言情小说。在花了9元钱之后，我的日常是这样的：早
芒市全市12家正规司法亲子鉴定中心合集（附2024年汇总鉴定汇总）鼎律基因刘主任
亲子鉴定的程序和流程一般包括如下几个步骤：家长预约，采集样本，送样快递，检测分析和出具鉴定报告。首先，家长需要提前与鉴定机构预约时间，确认相关事宜。然后，在指定的时间和地点采集DNA样本，一般采用唾液或者血液样本。采集完成后，家长将样本交给机构，由专业人员进行检测和分析。最后，机构将根据检测结果出具亲子鉴定报告，交付给家长。亲子鉴定对于家庭关系和法律诉讼具有重要意义和应用价值。首先，亲子鉴定可以帮
磁盘I/O性能测试详解：监控与优化的全景指南测试不打烊性能测试服务器 linux 压力测试
磁盘I/O（Input/Output）性能是衡量系统存储设备读取和写入数据效率的关键指标之一。磁盘I/O性能问题会影响整体系统响应时间、吞吐量等关键性能指标。在性能测试中，监控磁盘I/O至关重要，以下将从监控方式、命令使用方法、输出示例、参数分析以及如何通过监控结果发现性能异常来做详细说明。磁盘I/O监控：为什么它如此重要？磁盘I/O监控是确保系统性能的关键。通过监控，我们可以实时了解磁盘的读写速
模型优化-------模型压缩 AI扶我青云志人工智能模型优化
模型压缩是一种优化技术，目标是在尽量保留模型性能的前提下，减少模型的体积、计算成本和内存占用。特别适合模型部署在边缘设备、移动端、嵌入式系统等资源受限环境中。其中，“剪枝（Pruning）、量化（Quantization）和知识蒸馏（KnowledgeDistillation）”是最常用且研究最深入的三种方法。一、剪枝（Pruning）原理：剪枝的核心思想是去掉对模型输出影响较小的参数或结构，使得
函数调用栈回溯机制详解硬核科技嵌入式单片机开发实战嵌入式嵌入式硬件软件单片机
函数调用回溯Backtrace是现代软件系统调试中的关键技术之一，尤其在嵌入式开发和Linux平台调试中更显重要。它提供了程序在运行或崩溃时的函数调用路径，有助于快速定位错误源。一、函数调用栈与Backtrace的理论基础1.1什么是函数调用栈？函数调用栈（CallStack）是一种由编译器和运行时系统共同维护的后进先出（LIFO）数据结构。每次函数调用时，当前函数的返回地址、局部变量、保存的寄存
Node-RED低代码流式编程工具使用简介 handsomestWei 后端低代码 Node-RED 物联网IOT
Node-RED低代码流式编程工具使用简介全文链接:低代码流式编程工具node-red使用简介工具概述Node-RED是一个基于流的编程工具，专门用于连接物联网设备、API和在线服务。它提供了基于浏览器的可视化编辑器，用户可以通过拖拽节点的方式创建复杂的逻辑流程，无需编写大量代码。核心特点可视化编程通过拖拽节点和连线构建应用程序无需深入了解底层函数逻辑实时调试和数据流监控大幅降低开发门槛丰富的生态
华为服务器磁盘IO性能查看,磁盘io性能忘記痛苦华为服务器磁盘IO性能查看
磁盘io性能内容精选换一换对于不同业务场景，通过在调整数据库的参数配置，可以有效提升服务器性能。使用如下配置文件参数启动数据库，默认配置文件路径为/etc/my.cnf，其中MariaDB软件安装以及数据存放路径根据实际情况修改。根据是否支持挂载至多台云服务器可以将磁盘分为非共享磁盘和共享磁盘。一个非共享磁盘只能挂载至一台云服务器，而一个共享磁盘可以同时挂载至多台云服务器。共享磁盘是一种支持多个云
小说完整版婚礼当天，我将女友还给她的竹马许瑶程哲_ 婚礼当天，我将女友还给她的竹马(许瑶程哲)全文免费小说多多文馆
《婚礼当天，我将女友还给她的竹马》主角：许瑶程哲简介：我和许瑶恋爱八年。在婚期前三天，却发现她电脑里存了上万张同一个男生的照片。我偷偷订下婚礼当天出国的机票。静静看着她若无其事地表演。婚礼当天新郎逃婚，她却疯了。许瑶的闺蜜没想到我来的这么快，急忙伸手将她从江城身上拉开。可惜许瑶似乎喝了不少，根本无动于衷。嘴里模糊不清地骂着：“让开！少碰我！”我还是第一次见她醉成这样。她闺蜜凑在她耳边开口：“程哲来
List和Map的区别雪碧聊技术 Java八股文 list 数据结构
欢迎来到我的Java八股文专栏！各位程序员小伙伴们好呀~我是雪碧聊技术，很高兴能在CSDN与大家相遇！✨专栏介绍这个专栏将专注于分享Java面试中的经典"八股文"知识点，内容涵盖：Java基础核心概念JVM原理与性能调优多线程与并发编程️设计模式实战️常用框架源码解析⚙️系统架构设计思想为什么选择这个专栏？精准定位：直击大厂Java面试高频考点系统全面：从基础到进阶，构建完整知识体系实战导向：理论
加班，加油，加速令村
加班，加油，加速这段日子，每天都是在加班，任务急而且多，得到的效果又不尽如人意，不得不内心暗自懊悔,为什么事情总是这么多，又令人烦心呢？温习《吃掉那只青蛙》这本书里面的要点:1、准备就绪：确定自己究竟想要什么。清晰明确的目标对事业和人生都至关重要；开始工作前，先将你的目标和理想全部写下来。2、精心计划每一天：把所有的想法都付诸笔端。你在计划上花费的每一分钟，都能为你在执行上节省5~10分钟。3、随
充满能量的一天演讲教练姚桦
每天的能量晨读给自己赋能，满满的正能量，满满的好心情带着满满的精神状态度过美好的一天，犹如一束阳光走到哪里哪里亮，照亮自己也照亮别人。今天能量晨读是我健康，我快乐，我富足，我是因，世界才是果。有因必有果，你所遇到的一切发生都是有原因的。在你终将的某一天都会出现一个结果给你。早饭之后带着好心情，和同事们一一打招呼，给他们分享了早晨练习声音的hei，ha的声音，声音吸引来了更多的同事一起练起来，笑的稀
UCOS-II 在单片机中的应用 woainizhongguo. 51/STM32单片机单片机嵌入式硬件 stm32 系统架构
引言在快速发展的嵌入式系统领域，实时操作系统（RTOS）的作用日益凸显，成为推动高效、可靠系统开发的关键组成部分。作为RTOS的杰出代表之一，μC/OS-II因其强大的功能和灵活的配置，已成为许多嵌入式项目的首选。不仅因为它能够提供丰富的多任务处理能力，还因为它在资源管理、任务调度和时间管理等方面的卓越性能。μC/OS-II是一款免费的、可裁剪的、抢占式的实时操作系统内核。它设计用于多任务环境，特
解决幽默【VmmenWSA】占用系统资源过高且无法直接结束进程办法鱼圆食不食 windows
起因今天打开任务管理器时，偶然发现一个名为VmmemWSA的进程占用了大量内存。经过询问，得知它与Windows虚拟化有关，但目前电脑上并没有运行任何虚拟化工具（如WSL）。尝试使用管理员权限和命令行工具（CLI）等方法都无法关闭该进程。经过多次尝试，终于找到了解决办法，接下来分享给大家。出现原因VmmemWSA是与WindowsSubsystemforAndroid(WSA)相关的进程。当尝试关
微信群里那些优惠券信息哪里来的，怎么挣钱的？直返APP淘客项目
解锁优惠券群背后的秘密：直返APP助你轻松赚钱在这个数字化时代，微信群和QQ群中的优惠券分享如雨后春笋般涌现，吸引着无数追求性价比的消费者。你是否也曾好奇，这些看似诱人的优惠从何而来？群主们又是如何在这股潮流中分得一杯羹的呢？更重要的是，你是否也梦想着能像他们一样，在享受购物乐趣的同时，还能赚取一份可观的收入？今天，就让我带你揭开这一切的神秘面纱，并向你介绍一个更加高效、便捷的赚钱利器——直返AP
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt

hive增量表和全量表_基于 Flink+Hive 构建流批一体准实时数仓

离线数仓实时化的难点

Flink 在批流一体上的探索

构建流批一体准实时数仓应用实践

未来规划

你可能感兴趣的:(hive增量表和全量表)