阿里技术官方号

技术解析：阿里云 AnalyticDB 如何实现全球性能第一

简介：北京时间 2020 年 5 月 4 日，TPC 官网正式公布，阿里云自研云原生数据仓库 AnalyticDB 通过严苛的 TPC-DS 全流程测试，性能较前世界纪录提升 29%，单位成本仅为其 1/3，再次成为全球性能领先的数据仓库。本文将对 AnalyticDB 进行全面解析，详细阐述其技术架构及存储和查询技术，并对 AnalyticDB 的下一步发展做出展望。

前言

随着云时代全面到来，企业数据需求不断变化，从传统的 Big Data 逐渐向 Fast Data 演进，主要表现在如下 4 个方面（部分数据参考 Gartner、IDC）：

数据规模爆炸性增长，到 2020 年全球数据预计会到 40ZB，而到 2025 年还会继续增长 4 倍以上。
企业上云速度明显加快，预计到 2025 年企业 50% 的数据都是云存储，而企业 75% 的数据库都运行在云上。
数据的实时化需求强烈，预计 2025 年全球数据处理中会有 30% 是实时数据处理。
数据智能化趋势明显，随着 AI 和 5G 技术的发展，非结构化数据快速增长，到 2025 年预计 80% 的数据都是非结构化数据。

在数据爆炸性增长、企业全面上云的大背景下，海量数据的存储、处理的性能及性价比是云原生数仓面向未来最核心的关键技术指标之一，TPC 官方推出的 TPC-DS 基准测试是对一个数据仓库从数据导入、查询性能（单并发、多并发）、查询复杂度（覆盖星型模型/雪花模型、复杂 Window function 支持）、可用性（数据一致、坏盘容错处理等）全方面的严格考核，并需要进行全面严苛的审计，是目前全球衡量一个数据仓库成熟度、竞争力的核心基准测试。

AnalyticDB 作为云时代的云原生数据仓库，参与 TPC-DS 基准测试是我们提升自研产品产品化能力、核心技术突破验证的重要过程，也是我们技术走向全球领先的必经之路，这个过程中的核心技术突破正在帮我们的客户提升性能进一步提升实时化进程、大幅降低成本，一起进入数据库与大数据一体化、业务在线化的新时代。

TPC-DS 榜单

一 AnalyticDB 介绍

AnalyticDB（简称 ADB，原 ADS）是阿里巴巴自主研发、唯一经过超大规模以及核心业务验证的 PB 级实时数据仓库，自 2012 年第一次在集团发布上线以来，至今已累计迭代发布近百个版本，支撑起集团内的电商、广告、物流、文娱、旅游、风控等众多在线分析业务。AnalyticDB 于 2014 年在阿里云开始正式对外输出，支撑行业既包括传统的大中型企业和政府机构，也包括众多的互联网公司，覆盖外部十几个行业。

AnalyticDB MySQL 3.0 （简称 ADB 3.0）是在过去 8 年沉淀的基础上，基于数据库大数据一体化的理念及趋势以及工程上深度打磨出的云原生数仓升级版本。在本次 TPC-DS 基准测试中，AnalyticDB MySQL 3.0 充分展现了出色的云原生技术优势，对比友商有近 10 倍的巨大优势！

二 TPC-DS 性能基准介绍

TPC (Transaction Processing Performance Council) 是事务性能管理委员会的简称，是最知名的非盈利的数据管理系统评测基准标准化组织，它制定商务应用基准程序（Benchmark）的标准规范、性能和价格度量，并管理测试结果的发布，而 TPC Benchmark 测试结果是衡量一个数据管理系统性能及性价比的最核心指标之一。

TPC-DS 基准测试模拟了一个典型的零售行业数据仓库的评测决策支持系统（Decision Support），是数据库界最具挑战的一个测试基准，是 TPC-H 的升级版，它采用星型、雪花等多维数据模式，测试集包含对大数据集的统计、报表生成、联机查询、数据挖掘等复杂应用，与真实场景非常接近。

TPC-DS 的难点和挑战主要有：

数据集规模大，例如事实表 store_sales，单表超过 280 亿行。
面向真实零售决策场景，SQL 非常复杂：覆盖 SQL 99 和 2003 的核心部分以及 OLAP 标准；既包含报表类 ad-hoc 低延时查询，又包含海量数据挖掘高吞吐分析查询。
测试项多且维度广：既要高性能、高可靠、高可用、高性价比，又要 ETL 和数据更新的 ACID 能力。

TPC-DS 测试流程及数据模型：

三 AnalyticDB MySQL 3.0 技术架构

AnalyticDB MySQL 3.0 采用云原生架构，计算存储分离、冷热数据分离，支持高吞吐实时写入和数据强一致，兼顾高并发查询和大吞吐批处理的混合负载。

第一层是接入层，由 Mulit-Master 可线性扩展的协调节点构成，主要负责协议层接入、SQL 解析和优化、实时写入 Sharding、数据调度和查询调度。

第二层是计算引擎，具备分布式 MPP + DAG 融合执行能力，结合智能优化器，可支持高并发和复杂 SQL 混合负载，同时借助于云原生基础设施，计算节点实现了弹性调度，可根据业务需求做到分钟级甚至秒级扩展，达到了资源的有效利用。

第三层是存储引擎，基于 Raft 协议实现的分布式实时强一致高可用存储引擎，通过数据分片和 Multi-Raft 实现并行，利用分层存储实现冷热分离降低成本，通过行列存储和智能索引达到极致性能。

四 AnalyticDB 存储技术

1 分布式强一致存储

AnalyticDB MySQL 3.0 存储完全自主研发，基于 Raft 协议构建了一套分布式强一致高可靠的轻量级存储架构，可实现高吞吐实时写入，适合极致分析性能场景。AnalyticDB MySQL 3.0 存储相比开源 HBase、Kudu 等在 SQL 分析性能上有较大优势，并且在实时写入强一致可见、支持 ACID 方面也是开源 ElasticSearch、ClickHouse 等所不具备的能力。

AnalyticDB 存储整体架构如下：

AnalyticDB MySQL 3.0 是基于数据库的并行数据模型，存储建模亲和 MPP 计算模型，内部实现为多层并行的架构：

第一级是集群实例级并行，用户实例被划分为多个存储节点组（Worker Group），每个 Worker Group 由 N（通常是 3，也可以是其他基数）个 Worker 构成。Worker 相当于用户数据节点容器，分组的目标是保证系统大规模扩展时不会出现通信膨胀、也方便系统并行升级和运维。

第二级是 DB 并行，用户数据库被切分为 N 个物理分库（ Shard，也叫数据分片），每个 Shard 是独立的 Raft Group 以保证数据强一致，多个 Shard 就形成了 multi-raft 的并行。Shard 是可以是 Hash 或者 Range 分区，通常 Hash 分区可以做数据对齐以避免数据大表 JOIN 的数据 Shuffle；Shard 可以在需要的时候在不同 Worker Group 之间均衡或者迁移，Shard 本身也会支持动态分裂和合并。

第三是表内并行，对于数仓场景的历史数据存储通常有数据分区的概念，例如 TPC-DS 中 store sales 就可以根据时间周期分区，数据分区除方便数据生命周期管理外还可以支持查询分区裁剪和 DFP，有助于大幅缩小数据计算范围。

在 TPC-DS 基准测试中，通过分布式并行存储架构以及感知存储分布的查询优化和执行引擎紧密配合，整体性能优异。

2 高性能批量导入

数据导入速度是云数仓的基础能力，在 TPC-DS 中对导入有着极致的性能要求，我们的第一个优化思路是轻量级 build（把实时数据转换为全量分区数据称之为 build），AnalyticDB MySQL 3.0 实现了轻量化的全内存单副本 local build，相比之前版本的类 MR 作业的全量 build 大幅减少了读写 DFS 和落盘开销，并且可以充分通过本地化向量指令有效利用 CPU 提升性能。

第二个思路是 IO 和网络优化，在导入链路上，我们采用 DirectIO、Binary 化、全流式、异步化、零拷贝等技术大幅提升导入性能。

第三个思路是减少数据量，通过 Raft 2+1 技术（2 份数据 + 1 份日志）在保证数据高可靠的前提下将数据量减少 1/3, 再通过高性能 lz4 压缩算法将数据进一步压缩，整体下来数据的读写 IO 和网络传输开销都得到大幅优化。

最终，在 TPC-DS 18 个节点上可以实现超过 5000 万/秒的导入性能。

3 高吞吐实时更新 DML

AnalyticDB MySQL 3.0 基于 Raft 实现了高吞吐实时数据更新能力，写入链路通过全异步化、零拷贝、高效编码压缩等实现了出色的性能，在 TPC-DS DML 测试中，AnalyticDB 十几个节点可以做到千万级 TPS 实时写入更新，并且能够保证线性一致性（写入后立即可查）。在实际生产中，用户写入性能完全可扩展，可以轻松实现亿级 TPS 的实时写入更新。

在 TPC-DS 中，需要验证数据仓库的数据修改和 ACID 能力，AnalyticDB MySQL 3.0 支持 ETL 事务，具备 ACID 能力（可以完整跑 TPC-C 事务功能测试），在 TPC-DS 的 DML 测试中，存储引擎 MVCC 能力发挥了巨大的作用：存储引擎通过切分为实时数据（Delta）和分区数据（Main）+ 异步的数据转换（Build）实现了类 LSM 写优化架构。AnalyticDB 实现了 Block-level MVCC + 快照隔离，可以保证 ETL 和数据更新过程中数据的隔离性（可见性）、在坏盘出错时可以保证数据更新原子性。

4 行列混存和智能索引

AnalyticDB MySQL 3.0 通过自研的行列混存格式，能够兼顾高筛选率和大吞吐扫描两种场景，相比开源 ORCFile 的纯列存格式在明细点查上更有优势，而相比 Parquet，AnalyticDB MySQL 存储格式具有更出色的随机读性能，同时对比业界行存表 + 列存表两份数据冗余的模式成本更低。在 AnalyticDB MySQL 中，每个 Table 都有一个行列存储格式文件，数据被切分成不同的 RowGroup，在 RowGroup 内由列的 Block 构成，Block 内对定长、非定长（Toast）数据的进行有效的编码和压缩，并且支持高效的随机读和顺序读。

在 TPC-DS 测试中，通过配置合理的存储 Block 大小（4KB 对齐）、数据块预取、源头算子向量读等大幅优化了存储扫描性能；同时，存储上精确的统计信息(min/max/sum/cnt 等)一方面可以加速数据过滤（Smart Scan），另一方面还能够为查询优化器提供丰富的 Statistics 以帮助制定出最优的执行计划。

AnalyticDB MySQL 的特色之一是自研智能索引框架，支持五种索引类型：字符串类的 Invert 索引、bitmap 索引、数值类的 KDTree 索引、JSON 索引和向量索引；不同类型的索引可以实现列级索引多种条件（交、并、差）任意组合；相比较传统数据的优势是，无需建组合索引（不会引起空间膨胀）、且支持 OR/NOT 等更多条件的索引下推。为了降低用户使用门槛，AnalyticDB 在建表时可以开启一键自动全列索引，查询时通过 Index CBO 智能动态筛选索引下推，确定下推的索引链会通过谓词计算层进行流式渐进多路归并输出。

五 AnalyticDB 查询技术

AnalyticDB MySQL 3.0 的查询引擎，由自研的查询优化器和查询执行器两个模块组成。它是 AnalyticDB MySQL 提供高并发、高吞吐数仓分析能力的重要一环。感知数据特征，深度结合存储引擎的架构，同时支持 Reporting、Ad-hoc、ETL 数仓分析场景，是其相较于单一计算引擎的核心优势。

作为一款分布式云原生实时数仓产品，AnalyticDB MySQL 的优化器不仅仅要面临传统优化器所涉及的挑战，例如复杂 Join Reorder 的 NP-hard 问题，代价估算的不确定性问题，还面临在分布式环境下分布式并行计划的新问题。CBO 做为 AnalyticDB MySQL 3.0 版本最新成果，在 TPC-DS 战役中首次开启使用，对于整体计划的调优，起到了非常重要的作用。

ADB 查询执行引擎，以统一的内存池化和查询的混合负载管理能力为基础，使用动态代码生成技术，创新性的混合执行模型，利用 SIMD 指令集的向量化算法，以及自适应的面向行、列混合存储的查询执行等技术，是 AnalyticDB MySQL 持续的在 TPC-DS 查询性能上领先的关键因素。

1 CBO 查询优化框架

基于代价的优化器本质上是一个复杂的搜索问题，想要解决好这个问题，需要从四个方面入手：

搜索框架

从数据库的发展历程来看，基于 Cascades 的搜索框架已经成为了业界标准，包括商业数据库 SQL Server 以及开源数据库 GP/ORCA 都采用 Cascades 实现。AnalyticDB MySQL 优化器 CBO 也是基于 Cascades 论文实现的。搜索框架面临的一个核心问题是搜索空间会急速膨胀，但是搜索时间需要维持毫秒级响应，因此需要有高效的数据结构存储搜索空间、高效的优化规则生成搜索空间、高效的搜索算法遍历搜索空间，高效的剪枝策略裁剪搜索空间。

分布式并行计划

相对于传统的单机版数据库来说，分布式 MPP 数据库给优化器带来了新的挑战。在分布式 MPP 数据库中，数据的分布属性变得十分的重要，它会直接影响到数据的正确性。为了满足不同算子对数据分布的要求，数据重分布不可避免，然而数据的重分布即数据 shuffle 的代价非常昂贵，因此，在保证数据正确性的前提下，尽可能的减少数据 shuffle。作为分布式 MPP 数据库优化器来说，需要把数据的 Partitioning 属性，以及 Sorting、Grouping 属性，也纳入到搜索空间来综合考虑，基于代价选择最优的分布式并行执行计划。

代价估算

代价估算是优化器能否寻找到最优计划的关键因素。代价估算涉及到统计信息的推导和代价模型。统计信息的推导依赖于：原始表的统计信息、中间算子的推导算法、对数据的各种假设（均匀性假设、独立性假设、包括性假设、包含性假设）以及在一些极端情况下的猜测。因此统计信息的推导存在大量的不确定性，也正是因为这些不确定性，极大的加剧了优化器寻找最优解的难度。本质上来说，只有打破对数据属性的假设，才有可能使得统计信息的估算做到知其然知其所以然，然而打破这些假设，也要付出更多的代价。

统计信息收集

收集必要的统计信息是 CBO 工作的前提，统计信息需要做到：基本信息能够自动化收集，自动化更新，高级统计信息可以手动收集，为 CBO 提供可靠的、多纬度的统计信息。在实际的情况下，可能存在统计信息丢失或者没有及时收集，在这种情况下，为了避免生成灾难性的计划，可以在运行时动态采样来获取必要的统计信息。

2 混合查询执行框架

传统的火山执行模型不能满足分析场景高吞吐的性能需求已经成为业界的共识。随着各个系统的不断发展，目前业界计算引擎有 2 种演化后的执行框架实现：

Just-in-time (JIT) compilation
Vectorization

JIT编译方式以数据为中心，一条数据经过上一个算子处理后，还在 CPU 缓存中便直接进行下一个算子的计算，对 CPU 缓存友好，适合计算密集型任务。Vectorization 中每个算子处理一批数据后，将一批结果再交给下一个算子计算。适合内存密集型任务以及向量计算，用中间结果物化的开销换取算子的计算高内聚。

JIT 编译方式和 Vectorization 各有所长，如上图所示，红色表示 JIT 编译方式，绿色表示 Vectorization 方式。目前 AnalyticDB MySQL 是唯一的同时支持这两种查询模式的自研分析引擎。混合执行框架，在 Vectorization 执行模式的基础上，自适应的把多个计算密集特征的算子融合成一个驱动执行。实现了一个查询执行引擎同时具备 Compilation 和 Vectorization 的优点。

3 统一内存管理

在内存方面，高效的内存管理是计算优化的基石。面向类型的内存模型，特指针对不同的数据类型使用不同的基础类型存储。这导致不同的类型无法存储在连续的内存地址中，仅能通过按列的方式进行存储，减少多个内存对象带来的额外代价。另外一方面，不同内存类型间的内存无法复用，这会造成额外的内存管理代价。

ADB 的查询执行引擎，通过统一内存管理来解决上面的几个问题：

内存 binary 化：统一内存类型，不同类型均使用相同的数据类型（byte）来存储，同时这也是查询执行面向行存，缓存友好算法优化的基石。
规范化的内存管理规格：统一内存规格，降低内存碎片带来的额外代价，并且降低复用内存的难度。
分层的内存管理：统一内存管理，根据计算特点对应内存的生命周期，针对内存使用特点，实现 MemoryCache， MemoryPool，并且支持内存泄漏检测，实现面向常驻服务的主动内存管理。

4 DFP 和 CTE 技术

在数据仓库中，事实表和维度表 Join 是典型场景，他们之间的数据量的差异可以达到千万倍级别，这个时候，Join 的计算成本更多的在于数据的扫描成本，因此我们会采用 DynamicFilterPushDown 的方式，来极大的减少左表的数据量。另外数据仓库中会出现大量的 WITH 语句以及隐式的共享语句，这些都可以通过 Common Table Expression 的共享来避免重复计算。

DFP（DynamicFilterPushDown）对于筛选率高的 Join （命中率低）、Probe 端的数据从存储中被读上来之后，大部分数据会被丢弃掉。因此如果评估出来 build 的数据维持在一个比较小范围的阈值，那么我们就可以把 build 端结果值，作为左表的过滤条件，也就是 Dynamic Filter，直接下推存储，减少扫描量。对于优化器来说，最主要的工作就是要合理评估 build 端命中 Join 条件的 NDV 值。

不同的 Join Order 直接影响可做 Dynamic Filter 的范围和粒度，能够进行该优化的 Join 其 Cost 与真正的 Hash Join 有巨大的差异反过来也影响了 Join Order。基于 ADB 完善且扩展性较好的 CBO 框架，我们做到了从全局考虑，基于 Cost 选择最优的 Dynamic Filter 方案。

在执行层面，我们通过如下三个关键点实行有高效的 DFP：

高效动态谓词构建，通过进程内 in-place 构建动态谓词，降低动态文词构建代价。
多层过滤执行优化，结合 bloomfilter，分区裁剪，感知存储索引等方式，加速过滤效果。
异构数据源的下推，统一数据源接口层抽象实现，扩展异构数据源的支持。

CTE（Common table expression），TPC-DS 30%+ 的 sql 中包含 with as 用法，通过 with as 子查询，在主查询中多次引用，每一次引用带来了额外的重复计算，导致资源浪费。基础的 CTE 优化，通过复用 with 子句的结果给多个引用方，来减少重复计算的代价。但是对于部分场景，与主查询的关系推导可以进一步减少 with 子查询中的计算量，这时直接 share 完整 with 子句会导致额外的性能回退。那么通过 inline 后的最优计划，进行 common sub tree 的识别，进一步减少重复计算量，达到无 bad case 的效果。执行器实现中，我们引入了死锁检测，通过分析 common sub tree 的多个 consumer 之间的依赖关系，解决死锁问题。

六总结和展望

AnalyticDB 经过数据库领域最顶级会议 VLDB 论文（AnalyticDB: Realtime OLAP Database System at Alibaba Cloud）的理论验证（中国极其少有的大规模商用系统介绍论文，类似有 Google F1 [VLDB'2013]、AWS Aurora [SIGMOD'2017] 等）、TPC-DS 全球领先的工程验证（TPC-DS 全球性价比、性能双双领先）、覆盖核心部委以及大型泛互联网客户的客户验证、阿里集团多年的超大规模验证形成了多方面优势，基于云计算的高效资源效率、数据库与大数据一体化发展趋势，正式完成重大品牌升级，由“分析型数据库”升级为“云原生数据仓库”。

未来已来，大数据与数据库一体化 + 云原生将会重新定义云计算时代的数据仓库，TPC-DS 破世界纪录只是起点，AnalyticDB 将会持续投入致力于成为企业数字化转型升级、数据价值在线化的基础设施！

AnalyticDB 2019 大盘点：点击这里

分页优化之——游标分页 PhilipJ0303 Java面试 java 数据库优化游标分页分页查询
游标分页（Cursor-basedPagination）是一种高效的分页方式，特别适用于大数据集和无限滚动的场景。与传统的基于页码的分页（如page=1&size=10）不同，游标分页通过一个唯一的游标（通常是时间戳或唯一ID）来标记分页的位置，避免了传统分页在数据变动时的重复或遗漏问题。以下是游标分页在前后端的实现方式：1.游标分页的核心概念游标（Cursor）：游标是一个唯一标识符，通常是数据
使用 Argilla 进行大语言模型数据管理与监控 qahaj 语言模型 python 人工智能
技术背景介绍Argilla是一个开源的数据管理平台，专为大语言模型（LLMs）设计。它旨在通过快速的数据管理以及结合人类和机器的反馈，帮助开发者构建更强大的语言模型。同时，Argilla支持整个MLOps周期的每个步骤，从数据标注到模型监控。核心原理解析Argilla的核心优势在于其灵活的数据管理流程和强大的反馈机制。通过Argilla，开发者可以实时监控模型性能，并根据需要调整数据标注策略。这种
JAVA代码实现ElasticSearch搜索（入门-进阶）(一):搜索方法、多字段查询、高亮展示 majunssz elasticsearch elasticsearch
一、搜索方法对比首先存入一条数据count="ilikeeatingandkuing"默认分词器应该将内容分为“i”“like”“eating”“and”“kuing”1.QueryBuilders.matchQuery("count",count);会将搜索词分词，再与目标查询字段进行匹配，若分词中的任意一个词与目标字段匹配上，则可查询到。count="i"可查出count="ili"可查出co
轻松入门Apache SeaTunnel：数据集成利器窝窝和牛牛 SeaTunnel ETL 数据集成
文章目录轻松入门ApacheSeaTunnel：数据集成利器什么是SeaTunnel基本原理运行流程SeaTunnelvsDataX：两大数据集成工具对比实战场景：MySQL数据同步至ElasticsearchSeaTunnel实现方案DataX实现方案实现原理对比底层依赖环境方案优缺点分析快速上手环境准备简单示例总结轻松入门ApacheSeaTunnel：数据集成利器什么是SeaTunnelAp
Angular-Slickgrid中的数据更新与聚合计算 t0_54program 编程问题解决手册 angular.js javascript 前端个人开发
在使用Angular-Slickgrid进行数据展示时，经常会遇到数据的实时更新和聚合计算的问题。本文将结合实例，详细介绍如何在Angular-Slickgrid中处理数据的编辑后更新聚合计算结果。背景介绍Angular-Slickgrid是一款强大而灵活的网格组件，支持复杂的数据操作，包括分组、排序和聚合计算。假设我们有一个数据表，包含用户的性别（Gender）、费用（Cost）和时长（Dura
【自学笔记】Linux基础知识点总览-持续更新 Long_poem 笔记 linux 运维
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录Linux基础知识点总览目录Linux简介文件和目录结构常用命令文件操作目录操作权限管理文本处理Shell脚本基础进程管理用户和组管理网络配置总结Linux基础知识点总览目录Linux简介文件和目录结构常用命令文件操作目录操作权限管理文本处理Shell脚本基础进程管理用户和组管理网络配置Linux简介Linux是一个基于Uni
通用AI Agent的进化图谱：架构革新与安全可控的双重突破——以Manus为范本的启示我也秃了人工智能架构安全
通用AIAgent的进化路径：架构创新与安全管控的双重突破引言近年来，AI智能体正经历前所未有的变革。2025年3月，中国团队Monica推出的全球首款通用AIAgent——Manus，以“全链路自主执行”为核心，通过多签名系统架构和渐进式任务执行引擎，实现了从“生成建议”到“自主闭环交付任务”的范式跃迁。具体而言，Manus通过规划（Planner）-执行（Executor）-验证（Verifi
Spring Boot 集成 Azure Key Vault dan炒饭 spring boot azure 后端
之前做了集成AzureKeyVault的工作，发现微软的文档还是挺分散的，所以在这里总结下。这是官方的集成文档，可以自己改url换成中英文，英文阅读误解可能会更小点。这个教程的主要问题是需要用到AzureCLI来进行所有的配置。因为在一个组织中严格的软件限制可能会让你没法安装AzureCLI，本文主要阐述如何在portal.azure.com来进行配置。逐个说一下上述官方文档的几个重要步骤和概念。
java将动态图转换成静态图_如何用最简单的方法把静态图变成动图？ PEI Lobster java将动态图转换成静态图
在今日头条浏览文章时，我们经常会看到有些作者在文章中插入了一些动态图片，不但美化了页面，而且起到了简明扼要的说明作用，让读者对文章内容加深了理解，也提高了文章的阅读量和点击量。这样的动态效果是如何制作的呢？主要有两个步骤：首先要制作出图片动态效果的视频，一般是MP4格式，第二步用格式工厂等文件格式转换软件，把MP4转换为gif动画格式，然后就可以把它插入到网页中。这其中的难点和重点就在于制作图片的
记录:(error) NOAUTH Authentication required...【解决方案】 bug菌¹ 全栈Bug调优(实战版)#CSDN问答解惑(全栈版)redis连接报错 Authentication
‍作者：bug菌✏️博客：CSDN、掘金等公众号：猿圈奇妙屋特别声明：原创不易，转载请附上原文出处链接和本文声明，谢谢配合。版权声明：文章里可能部分文字或者图片来源于互联网或者百度百科，如有侵权请联系bug菌处理。一、前言环境版本：centos7.6+redis6.2.6+xshell5二、排错通过xshell5远程连接阿里云服务器，内核是cent
Azure Delta Lake、Databricks和Event Hubs实现实时欺诈检测 weixin_30777913 azure 云计算
设计Azure云架构方案实现AzureDeltaLake和AzureDatabricks，结合AzureEventHubs/Kafka摄入实时数据，通过DeltaLake实现Exactly-Once语义，实时欺诈检测（流数据写入DeltaLake，批处理模型实时更新），以及具体实现的详细步骤和关键PySpark代码。完整实现代码需要根据具体数据格式和业务规则进行调整，建议通过DatabricksR
Bug:eventlet ImportError cannot import name ‘ALREADY HANDLED uncle_ll Bug合集
问题测试gunicorn不同work下的性能时候，在eventlet方式下报错误Error:classuri'eventlet'invalidornotfound:[Traceback(mostrecentcalllast):File"/app/venv/lib64/python3.6/site-packages/gunicorn/util.py",line99,inload_classmod=i
使用Dall-E生成图像：文本到图像的魔力 shuoac 计算机视觉人工智能 python
使用Dall-E生成图像：文本到图像的魔力技术背景介绍Dall-E是OpenAI开发的一个强大的文本到图像生成模型，它能够根据自然语言描述创造出全新的数字图像。这一技术基于深度学习的方法，使得创意与AI图像生成的结合更具可能性。本文将介绍如何调用Dall-EAPI来生成图像，从而使开发者能够将这一技术应用到自己的项目中。核心原理解析Dall-E利用大型语言模型（LLM）从用户提供的文本描述中提取详
【华为OD】游戏里面，队伍通过匹配实力相近的对手进行对战。但是如果匹配的队伍实力相差太大，对于双方游戏体验都不会太好。测试_老姜华为od python
游戏里面，队伍通过匹配实力相近的对手进行对战。但是如果匹配的队伍实力相差太大，对于双方游戏体验都不会太好。给定n个队伍的实力值，对其进行两两实力匹配，两支队伍实例差距在允许的最大差距d内，则可以匹配。要求在匹配队伍最多的情况下匹配出的各组实力差距的总和最小。输入描述第一行两个整数，n，d。队伍个数n。允许的最大实力差距d。2<=n<=500<=d<=100第二行，n个整数，表示队伍的实力值，以空格
JVM常用概念之编译器黑洞剑海风云 JDK（Java Development Kit）jvm 编译器编译器黑洞
问题JMH如何避免微小基准测试中的不会运行的代码的消除工作？是否有隐式或显式编译器支持？基础知识优化编译器擅长优化简单的东西。例如，如果存在任何人都无法观察到的计算，则可以将其视为“不会运行的代码”并将其删除。这通常是一件好事，直到你运行基准测试。在那里，你想要计算，但你不需要结果。本质上，你观察基准测试所占用的“资源”，但没有简单的方法可以与编译器争论这一点。比如下面的测试用例，该方法中只涉及到
Angular 编译前的脚本执行 t0_54manong 编程问题解决手册 angular.js 前端 javascript 个人开发
在使用Angular开发项目时，有时候我们需要在每次编译之前执行特定的脚本或JavaScript函数。这在开发环境中非常有用，比如运行某些预处理、清理或其他自定义逻辑。今天我们将探讨如何在Angularv17结合esbuild实现这个功能。问题背景假设你正在使用Angularv17进行开发，并且已经配置了esbuild作为构建工具。现在你需要在每次Angular编译之前（特别是使用ngwatch时
深入了解盘古大模型：技术、应用与未来 Hardess-god Literature review 人工智能
随着人工智能技术的迅猛发展，预训练大模型已成为AI领域最前沿、最热门的研究方向之一。近年来，中国自主研发的大模型之一——盘古模型（PanGuModel）逐渐进入公众视野，凭借其强大的性能和广泛的应用前景，引发了行业内外的广泛关注。什么是盘古大模型？盘古大模型是华为公司联合多家科研机构共同研发的超大规模预训练语言模型。该模型以中文数据为主进行训练，旨在推动中文自然语言处理（NLP）以及跨模态应用的技
华为OD机试 - 最佳对手（ Python） AsiaFT. Py 华为OD机试AB卷 python od
题目描述游戏里面，队伍通过匹配实力相近的对手进行对战。但是如果匹配的队伍实力相差太大，对于双方游戏体验都不会太好。给定n个队伍的实力值，对其进行两两实力匹配，两支队伍实例差距在允许的最大差距d内，则可以匹配。要求在匹配队伍最多的情况下匹配出的各组实力差距的总和最小。输入描述第一行，n，d。队伍个数n。允许的最大实力差距d。2<=n<=500<=d<=100第二行，n个队伍的实力值空格分割。0<=各
2023华为OD机试真题-最佳对手(JAVA、Python、C++) huaweiod123 华为OD机试真题2023 java c++算法华为 python
题目描述：游戏里面，队伍通过匹配实力相近的对手进行对战。但是如果匹配的队伍实例相差太大，对于双方游戏体验都不会太好。给定n个队伍的实力值，对其进行两两实力匹配，两支队伍实例差距在允许的最大差距d内，则可以匹配。要求在匹配队伍最多的情况下，匹配出的各组实力差距的总和最小。输入描述：第一行，n，d。队伍个数n。允许的最大实力差距d。(2<=n<=50,0<=d<=100)。第二行，n个队伍的实力值，空
使用PyInstaller打包Python程序时，如何避免生成的可执行文件（exe）过大的解决方法 ta叫我小白 python python 开发语言 pyinstaller 可执行文件
使用PyInstaller打包出来的exe等可执行文件过大（比如我的一个小项目，打包之后超过了600M），大概率是使用的python解释器（PythonInterpreter）中安装了许多当前项目没有使用的库。解决方法：打包时，最好为这个项目创建一个独立的虚拟解释器环境，如下图：指定了新的虚拟环境之后，你需要在新环境中安装你所需要的依赖库。在py文件中选择安装即可，此时依赖库会安装到新的环境中。切
华为OD机试E卷 - 最佳对手 / 实力差距最小总和（Java & Python& JS & C++ & C ）算法大师 java python javascript c++
题目描述游戏里面，队伍通过匹配实力相近的对手进行对战。但是如果匹配的队伍实力相差太大，对于双方游戏体验都不会太好。给定n个队伍的实力值，对其进行两两实力匹配，两支队伍实例差距在允许的最大差距d内，则可以匹配。要求在匹配队伍最多的情况下匹配出的各组实力差距的总和最小。输入描述第一行，n，d。队伍个数n。允许的最大实力差距d。2<=n<=500<=d<=100第二行，n个队伍的实力值空格分割。0<=各
人工智能 - 通用 AI Agent 之 LangManus、Manus、OpenManus 和 OWL 技术选型天机️灵韵具身智能人工智能人工智能具身智能智能体
一、核心项目概览1.Manus（闭源通用AIAgent）定位：全球首个全流程自动化通用AIAgent，GAIA基准测试SOTA水平。核心能力：全流程自动化：从任务规划（如撰写报告）到执行（代码生成、表格制作）的端到端处理。智能纠错机制：基于沙箱环境的实时错误反思与调整（类似CodeAct技术）。云端依赖：需联网运行，集成浏览器操作、信息检索等工具。局限性：闭源且采用邀请制，二手市场邀请码溢价至数万
Multisim在射频电路仿真与实验教学中的应用探究 She Ran 546 课程设计
摘要本文深入探究Multisim在射频电路仿真与实验教学中的应用。阐述Multisim软件在射频领域的功能特点，通过具体射频电路实验案例，详细说明如何运用Multisim进行电路搭建、参数设置与仿真分析。探讨其在实验教学中对学生理解射频电路原理、提升实践能力的积极作用，以及在丰富教学手段、提高教学质量方面的显著优势，为射频电路实验教学改革提供新思路与方法。关键词Multisim；射频电路；仿真；实
利用HFSS软件对射频电路电磁兼容性的深入研究 DidYour 课程设计
摘要本文旨在借助HFSS（HighFrequencyStructureSimulator）软件深入研究射频电路的电磁兼容性（EMC）。通过对射频电路中电磁干扰产生机制的剖析，阐述如何运用HFSS软件建立精确的射频电路模型，进行电磁兼容性仿真分析，包括近场和远场分析、信号完整性分析等。结合实际案例，探讨不同因素对射频电路EMC性能的影响，提出基于HFSS仿真结果的优化设计策略，为提升射频电路电磁兼容
【蓝桥杯】真题 2386染色时间（优先队列BFS）遥感小萌新蓝桥杯蓝桥杯宽度优先职场和发展
思路这里每一个格子染色多了时间这一层限制，相当于图的每一边有了权重的限制，那么我们就不能直接用双向队列求最短路。而是使用优先队列。规则是这样的：每一个节点可以多次入队，但是只有第一次出队有效。所以这次我们不会在加入队列时更改标签vis，而是在出队时更改标签。如果在出队时发现vis已经更改，这说明这个元素以前出过队列（不是第一次出队），则直接continuecode我们额外设置两个数组，vis标签数
L1-7 撒狗粮（一分钟讲清差分）小竹子14 算法
网络上称一对情侣秀恩爱为“撒狗粮”，因为单身人士统称为“单身狗”。在一个大型聚会上，所有宾客被安排坐在一张长条宴会桌边。如果一对情侣坐在一起，那么他们两人身边的单身狗就会被撒一脸狗粮；如果他们没有坐在一起，那么所有被夹在他们两人之间的单身狗都会被撒一脸狗粮。本题就请你找出被撒狗粮最多（以“脸”为单位）的那位单身人士。输入格式：输入第一行给出一个正整数N（≤50000），是已知情侣的对数；随后N行，
《自动化开发之路：使用 Jenkins、GitLab CI 与 GitHub Actions 构建高效 CI/CD 流水线》清水白石008 python Python题库自动化 jenkins gitlab
《自动化开发之路：使用Jenkins、GitLabCI与GitHubActions构建高效CI/CD流水线》前言在现代软件开发中，持续集成（CI）与持续部署/交付（CD）已成为必不可少的实践。构建自动化流水线不仅可以加快开发迭代速度，还能显著提升代码质量，降低手工操作所带来的风险。在这篇文章中，我们将探讨如何利用三种主流工具——Jenkins、GitLabCI以及GitHubActions，实现从
python字符级差异分析并生成 Word 报告 myzzb word python 文字识别算法文本差异
importdifflibfromdocximportDocumentfromdocx.sharedimportRGBColordefanalyze_char_differences(text_a,text_b):"""分析两个文本的字符级差异:paramtext_a:第一个文本:paramtext_b:第二个文本"""matcher=difflib.SequenceMatcher(None,te
SOFABoot-01-蚂蚁金服开源的 sofaboot 是什么黑科技？后端java
前言大家好，我是老马。sofastack其实出来很久了，第一次应该是在2022年左右开始关注，但是一直没有深入研究。最近想学习一下SOFA对于生态的设计和思考。sofaboot系列SOFABoot-00-sofaboot概览SOFABoot-01-蚂蚁金服开源的sofaboot是什么黑科技？SOFABoot-02-模块化隔离方案SOFABoot-03-sofaboot介绍SOFABoot-04-快
SOFABoot-00-sofaboot 概览后端java
sofaboot前言大家好，我是老马。sofastack其实出来很久了，第一次应该是在2022年左右开始关注，但是一直没有深入研究。最近想学习一下SOFA对于生态的设计和思考。sofaboot系列SOFABoot-00-sofaboot概览SOFABoot-01-蚂蚁金服开源的sofaboot是什么黑科技？SOFABoot-02-模块化隔离方案SOFABoot-03-sofaboot介绍SOFAB
mysql主从数据同步林鹤霄 mysql主从数据同步
配置mysql5.5主从服务器(转) 教程开始：一、安装MySQL 说明：在两台MySQL服务器192.168.21.169和192.168.21.168上分别进行如下操作，安装MySQL 5.5.22 二、配置MySQL主服务器（192.168.21.169）mysql -uroot -p &nb
oracle学习笔记 caoyong oracle
1、ORACLE的安装 a>、ORACLE的版本 8i,9i : i是internet 10g,11g : grid (网格) 12c : cloud (云计算) b>、10g不支持win7 &
数据库，SQL零基础入门天子之骄 sql 数据库入门基本术语
数据库，SQL零基础入门做网站肯定离不开数据库，本人之前没怎么具体接触SQL，这几天起早贪黑得各种入门，恶补脑洞。一些具体的知识点，可以让小白不再迷茫的术语，拿来与大家分享。数据库，永久数据的一个或多个大型结构化集合，通常与更新和查询数据的软件相关
pom.xml 一炮送你回车库 pom.xml
1、一级元素dependencies是可以被子项目继承的 2、一级元素dependencyManagement是定义该项目群里jar包版本号的，通常和一级元素properties一起使用，既然有继承，也肯定有一级元素modules来定义子元素 3、父项目里的一级元素<modules> <module>lcas-admin-war</module> <
sql查地区省市县 3213213333332132 sql mysql
-- db_yhm_city SELECT * FROM db_yhm_city WHERE class_parent_id = 1 -- 海南 class_id = 9 港、奥、台 class_id = 33、34、35 SELECT * FROM db_yhm_city WHERE class_parent_id =169 SELECT d1.cla
关于监听器那些让人头疼的事宝剑锋梅花香画图板监听器鼠标监听器
本人初学JAVA，对于界面开发我只能说有点蛋疼，用JAVA来做界面的话确实需要一定的耐心（不使用插件，就算使用插件的话也没好多少）既然Java提供了界面开发，老师又要求做，只能硬着头皮上啦。但是监听器还真是个难懂的地方，我是上了几次课才略微搞懂了些。
JAVA的遍历MAP darkranger map
Java Map遍历方式的选择 1. 阐述　　对于Java中Map的遍历方式，很多文章都推荐使用entrySet，认为其比keySet的效率高很多。理由是：entrySet方法一次拿到所有key和value的集合；而keySet拿到的只是key的集合，针对每个key，都要去Map中额外查找一次value，从而降低了总体效率。那么实际情况如何呢？　　为了解遍历性能的真实差距，包括在遍历ke
POJ 2312 Battle City 优先多列+bfs aijuans 搜索
来源：http://poj.org/problem?id=2312 题意：题目背景就是小时候玩的坦克大战，求从起点到终点最少需要多少步。已知S和R是不能走得，E是空的，可以走，B是砖，只有打掉后才可以通过。思路：很容易看出来这是一道广搜的题目，但是因为走E和走B所需要的时间不一样，因此不能用普通的队列存点。因为对于走B来说，要先打掉砖才能通过，所以我们可以理解为走B需要两步，而走E是指需要1
Hibernate与Jpa的关系，终于弄懂 avords java Hibernate 数据库 jpa
我知道Jpa是一种规范，而Hibernate是它的一种实现。除了Hibernate，还有EclipseLink(曾经的toplink)，OpenJPA等可供选择，所以使用Jpa的一个好处是，可以更换实现而不必改动太多代码。在play中定义Model时，使用的是jpa的annotations，比如javax.persistence.Entity, Table, Column, OneToMany
酸爽的console.log bee1314 console
在前端的开发中，console.log那是开发必备啊，简直直观。通过写小函数，组合大功能。更容易测试。但是在打版本时，就要删除console.log，打完版本进入开发状态又要添加，真不够爽。重复劳动太多。所以可以做些简单地封装，方便开发和上线。 /** * log.js hufeng * The safe wrapper for `console.xxx` functions *
哈佛教授：穷人和过于忙碌的人有一个共同思维特质 bijian1013 时间管理励志人生穷人过于忙碌
一个跨学科团队今年完成了一项对资源稀缺状况下人的思维方式的研究，结论是：穷人和过于忙碌的人有一个共同思维特质，即注意力被稀缺资源过分占据，引起认知和判断力的全面下降。这项研究是心理学、行为经济学和政策研究学者协作的典范。　　这个研究源于穆来纳森对自己拖延症的憎恨。他7岁从印度移民美国，很快就如鱼得水，哈佛毕业
other operate 征客丶 OS osx
一、Mac Finder 设置排序方式，预览栏在显示－》查看显示选项中二、有时预览显示时，卡死在那，有可能是一些临时文件夹被删除了，如：/private/tmp[有待验证] -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一
【Scala五】分析Spark源代码总结的Scala语法三 bit1129 scala
1. If语句作为表达式 val properties = if (jobIdToActiveJob.contains(jobId)) { jobIdToActiveJob(stage.jobId).properties } else { // this stage will be assigned to "default" po
ZooKeeper 入门 BlueSkator 中间件 zk
ZooKeeper是一个高可用的分布式数据管理与系统协调框架。基于对Paxos算法的实现，使该框架保证了分布式环境中数据的强一致性，也正是基于这样的特性，使得ZooKeeper解决很多分布式问题。网上对ZK的应用场景也有不少介绍，本文将结合作者身边的项目例子，系统地对ZK的应用场景进行一个分门归类的介绍。值得注意的是，ZK并非天生就是为这些应用场景设计的，都是后来众多开发者根据其框架的特性，利
MySQL取得当前时间的函数是什么格式化日期的函数是什么 BreakingBad mysql Date
取得当前时间用 now() 就行。在数据库中格式化时间用DATE_FORMA T(date, format) . 根据格式串format 格式化日期或日期和时间值date，返回结果串。可用DATE_FORMAT( ) 来格式化DATE 或DATETIME 值，以便得到所希望的格式。根据format字符串格式化date值: %S, %s 两位数字形式的秒（ 00,01,
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
4_JAVA+Oracle面试题(有答案) chenke oracle
基础测试题卷面上不能出现任何的涂写文字，所有的答案要求写在答题纸上，考卷不得带走。选择题 1、 What will happen when you attempt to compile and run the following code? （3） public class Static { static { int x = 5; // 在static内有效 } st
新一代工作流系统设计目标 comsci 工作算法脚本
用户只需要给工作流系统制定若干个需求，流程系统根据需求，并结合事先输入的组织机构和权限结构，调用若干算法，在流程展示版面上面显示出系统自动生成的流程图，然后由用户根据实际情况对该流程图进行微调，直到满意为止，流程在运行过程中，系统和用户可以根据情况对流程进行实时的调整，包括拓扑结构的调整，权限的调整，内置脚本的调整。。。。。在这个设计中，最难的地方是系统根据什么来生成流
oracle 行链接与行迁移 daizj oracle 行迁移
表里的一行对于一个数据块太大的情况有二种(一行在一个数据块里放不下) 第一种情况: INSERT的时候，INSERT时候行的大小就超一个块的大小。Oracle把这行的数据存储在一连串的数据块里(Oracle Stores the data for the row in a chain of data blocks)，这种情况称为行链接(Row Chain)，一般不可避免(除非使用更大的数据
[JShop]开源电子商务系统jshop的系统缓存实现 dinguangx jshop 电子商务
前言 jeeshop中通过SystemManager管理了大量的缓存数据，来提升系统的性能，但这些缓存数据全部都是存放于内存中的，无法满足特定场景的数据更新（如集群环境）。JShop对jeeshop的缓存机制进行了扩展，提供CacheProvider来辅助SystemManager管理这些缓存数据，通过CacheProvider,可以把缓存存放在内存,ehcache,redis，memcache
初三全学年难记忆单词 dcj3sjt126com english word
several 儿子；若干 shelf 架子 knowledge 知识；学问 librarian 图书管理员 abroad 到国外，在国外 surf 冲浪 wave 浪；波浪 twice 两次；两倍 describe 描写；叙述 especially 特别；尤其 attract 吸引 prize 奖品；奖赏 competition 比赛；竞争 event 大事；事件 O
sphinx实践 dcj3sjt126com sphinx
安装参考地址:http://briansnelson.com/How_to_install_Sphinx_on_Centos_Server yum install sphinx 如果失败的话使用下面的方式安装 wget http://sphinxsearch.com/files/sphinx-2.2.9-1.rhel6.x86_64.rpm yum loca
JPA之JPQL（三） frank1234 orm jpa JPQL
1 什么是JPQL JPQL是Java Persistence Query Language的简称，可以看成是JPA中的HQL， JPQL支持各种复杂查询。 2 检索单个对象 @Test public void querySingleObject1() { Query query = em.createQuery("sele
Remove Duplicates from Sorted Array II hcx2013 remove
Follow up for "Remove Duplicates":What if duplicates are allowed at most twice? For example,Given sorted array nums = [1,1,1,2,2,3], Your function should return length
Spring4新特性——Groovy Bean定义DSL jinnianshilongnian spring 4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装Mysql5.5 liuxingguome centos
CentOS下以RPM方式安装MySQL5.5 首先卸载系统自带Mysql： yum remove mysql mysql-server mysql-libs compat-mysql51 rm -rf /var/lib/mysql rm /etc/my.cnf 查看是否还有mysql软件： rpm -qa|grep mysql 去http://dev.mysql.c
第14章工具函数（下） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
POJ 1050 SaraWon 二维数组子矩阵最大和
POJ ACM第1050题的详细描述，请参照 http://acm.pku.edu.cn/JudgeOnline/problem?id=1050 题目意思：给定包含有正负整型的二维数组，找出所有子矩阵的和的最大值。如二维数组 0 -2 -7 0 9 2 -6 2 -4 1 -4 1 -1 8 0 -2 中和最大的子矩阵是 9 2 -4 1 -1 8 且最大和是15
Java8全新打造，英语学习supertool yangshangchuan java superword 闭包 java8 函数式编程
superword是一个Java实现的英文单词分析软件，主要研究英语单词音近形似转化规律、前缀后缀规律、词之间的相似性规律等等。Clean code、Fluent style、Java8 feature: Lambdas, Streams and Functional-style Programming。升学考试、工作求职、充电提高，都少不了英语的身影，英语对我们来说实在太重要