SelectDB技术团队

从 Clickhouse 到 Apache Doris：有赞业务场景下性能测试与迁移验证

本文导读：

当前，电商运营的主要痛点不仅来自多变的市场和客户需求，也受困于碎片化用户触达等带来的竞争与挑战。为了深度挖掘用户价值、培养用户忠诚度、实现业绩增长，有赞为商家搭建了全方位 OLAP 分析系统，提供实时与离线分析报表、智能营销与人群圈选等 SaaS 服务。本文将详细介绍有赞从 Clickhouse 至 Apache Doris 的迁移规划和性能对比测试实践，分享如何基于 Apache Doris 统一 OLAP 技术栈，并满足庞大数据体量下的实时分析与极速查询，最终有赞在多个场景下实现查询平均提速 200% 。

作者：李闯有赞基础平台数据研发工程师

有赞是国内领先的电商 SaaS 服务商，目前拥有社交电商、新零售、美业、教育及有赞国际化五大业务体系，通过旗下的社交电商、门店管理、解决方案以及其他新零售 SaaS 软件产品，全面帮助商家解决在移动互联网时代遇到的推广获客、成交转化、客户留存、复购增长、分享裂变等问题，帮助每一位重视产品和服务的商家实现顾客资产私有化、互联网客群拓展、经营效率提升，最终助力商家成功。

在面对商家与开发者的定制化服务需求的同时，为了能够更好地支持商家有效解决引流获客、分销体系等难题，有赞为商家搭建了 OLAP 分析系统，提供以下 SaaS 服务场景：

商家离线后台报表： 面向 B 端为商家提供 T+1 报表查询，对计算精度、查询性能及稳定性要求较高，同时会面临复杂查询场景。
人群圈选与智能营销： 从私域触点、线下触点获取用户数据，结合常用社交平台中接入的用户数据，根据业务需求在客户数据平台（Customer Data Platform - 以下简称 CDP）、数据管理平台（ Data Management Platform -以下简称 DMP）、客户关系管理系统（Customer Relationship Management- 以下简称 CRM）进行不同消费者的全方位画像分析。该场景会面临大量高频的数据实时更新，同时查询体量较大、QPS 较高，时常出现复杂 SQL 查询场景。
商家实时分析报表： 面向 B 端为商家提供相关实时报表分析查询，该场景特点是 QPS 比较高，商家可以选择不同的维度组合进行查询，对实时性和稳定性要求高。
天网日志分析系统： 为所有业务系统提供日志采集、消费、分析、存储、索引和查询的一站式日志服务。该场景写入吞吐高，需要达到每秒百万级别的数据写入；且查询频率低，涉及天网 TopN 日志查询，因此系统要求具备实时聚合以及模糊搜索能力。

随着业务数据体量逐渐庞大，业务对于时效性、联邦查询分析的需求也愈加迫切，现有组件在使用过程中对业务人员开发、运维人员维护都存在一定痛点，因此决定升级数据架构并基于 Apache Doris 来统一 OLAP 技术栈。本文将详细介绍早期架构的组成、 OLAP 系统运转流程、以及实际应用痛点，分享系统架构在迁移过程中的技术与调优经验。

早期架构痛点

早期架构如图所示，数据主要来源于业务数据库 Binlog 与用户日志等原始数据，通过实时与离线两条链路分别对数据进行处理。其中原始数据首先导入至 Apache Kafka 与 NSQ 消息中间件，一部分会通过 Apache Flink 进行流处理计算并与存储在 HBase 中的维度明细表进行关联，另一部分数据会存储于 Apache Hive 与 HDFS 中作为离线数据，通过 Apache Spark 计算写入至 OLAP 引擎中。

有赞数据架构主要使用了以下三种 OLAP 引擎，各个组件根据业务场景的特点与需求为上游应用提供不同场景的查询与分析：

Apache Kylin： 基于 Apache Kylin 搭建商家离线报表后台，为商家提供 T+1 报表查询。目前后台已经具有超 500 万家的商家数量，对于部分体量较大的商家，其单点会员数能够达到千万级别、商品 SKU 达到数十万、平台构建 Cube 数量达 400+。
Clickhouse： 基于 Clickhouse 进行人群圈选与 TopN 日志查询业务，其中人群圈选主要通过实时的明细查询来辅助用户行为数据分析。
Apache Druid： 针对 B 端商家实时分析报表场景，基于 Druid 构建维度查询系统，为商家提供实时指标查询服务。

然而由于该架构组件过多、架构冗余等问题导致维养、开发、业务应用等方面带来了一系列的挑战，具体如下：

01 Clickhouse ：查询性能不足

针对部份 SaaS 场景的高并发高 QPS 查询场景，Clickhouse 的查询能力表现不够理想。由于 Clickhouse 组件本身设计的问题，无法支持多表或大表 Join 的查询场景，这就导致一旦出现关联查询场景，业务方需要重新寻找解决方案，使整体查询效率低下。

02 Apache Druid ：数据修复处理难度大

数据修复难度大： 当出现 Apache Flink 自身容错导致数据重复的情况，Druid 完全依赖写入侧进行幂等操作，由于自身不支持数据更新或删除，只能对数据进行全量替换，导致数据准确性低、修复难度大。
数据一致性问题： 对于 Druid 而言，导入数据后需要构建完 Segment 才能响应查询结果。一旦上游 Flink 写入 Kafka 的过程中出现数据延迟，则无法按照预期时间写入 Druid 中，指标数据就会出现较大波动，数据一致性无法得到保障。
数据修复链路过长、成本过高：为了解决部份临时数据修复问题，我们首先需要花费小时级时间将 Apache Kafka 数据备份至 HDFS上，在备份完成后还需要将数据重新导入 Druid 之后进行修复，整体修复的链路过长，投入的时间与研发成本会随之升高。

03 Apache Kylin : T+1 时效性低

Apache Kylin 在数据处理过程中采用了预计算的方式，通过在多维 Cube 构建过程中完成聚合计算，并生成 T+1 数据报表。对部分在夜间经营的商家而言，他们需要等待一天时间才能查看前一天的报表数据，这无法满足用户对于时效性的需求。

04 整体架构：运维成本高、研发效能低、架构灵活度差

研发成本高： 业务方需要学习每种组件（Clickhouse、Druid、Apache Kylin)的使用方式、并且查询 SQL 标准各异，这会使学习成本加大，并且在后期进行研发、监控、运维、周边生态工具等开发工作过程中，需要投入大量的人力与开发接入成本，降低开发效率。
运维瓶颈： 在扩缩容期间业务方需要停写进行集群调整，且单次扩容需要将所有的库表都进行迁移，不仅无法保证运维时间成本，还会增加过高的人力成本。而目前有赞存在大量的扩容需求，现有架构的运维成本则成为系统的一大痛点。
架构灵活度差： Apache Kylin 仅在维度和指标提前设定、表结构固定的场景下能够正常运行，一旦增加维度和指标则需要新建 Cube 并重刷历史数据；Clickhouse 在宽表补数时会出现需要重新全量导入数据，这些架构缺陷在业务运行过程中都会引发资源使用增加、运维成本增加、研发效能较低的问题。

技术调研与收益成本评估

基于上述架构痛点，我们对市面上的架构进行了调研与选型，希望选择一款能够简化当前复杂架构、统一 OLAP 技术栈的引擎。我们除了分析 OLAP 性能本身对于业务的帮助，还需要评估架构改造所带来的收益成本比，思考架构进行迁移和重构之后所带来的 ROI 是否符合预期。

对于收益而言，我们需要评估新架构引入后的性能是否如预期提升，将 Apache Doris 分别与 Clickhouse、Druid、Kylin 进行对比评估。

对于成本而言，我们首先会考虑在替换过程中，周边工具开发的成本，其中涉及监控、告警、上下游依赖平台等一系列工具的构建与研发；其次业务的迁移会涉及大量业务改造与协调，如何催动业务方进行改造、提供更丰富的改造工具、尽可能降低投入成本也是我们主要考虑的问题。

经过一系列评估后，我们发现基于 Apache Doris 进行架构迭代，其不论是在业务赋能还是成本方面，都能够有效解决当前架构的痛点，极大程度地实现降本增效的目标，整体迭代的预期收益明显高于改造代价，因此我们决定基于 Apache Doris 构建统一实时数仓，具体评估分析如下：

查询性能优异： 解决了 Clickhouse 在高 QPS 查询与大表关联查询场景下的弊端，提供了优秀的并发查询能力。此外，在 Apache Doris 2.0 发布后，倒排索引功能支持任意维度快速检索、文本分词全文检索，在日志场景下的查询性能提升尤为明显。
高效的数据更新： Apache Doris 的 Unique Key 支持大批量数据更新、小批量数据实时写入，覆盖我们 90 % 业务场景，其 Duplicate Key 与 Aggregate Key 模型还能够支持部分列更新，整体数据模型丰富，帮助提升写入与查询效率。
保证数据正确性： Apache Doris 支持事务导入，Bitmap 功能支持精准去重，保证数据不丢不重；同时支持精准写入，保证数据基表与物化视图强一致性、副本数据强一致性。
简单易用、开发成本低： Apache Doris 高度兼容 MySQL，使开发简单使用门槛降低，且 Doris 的迁移与扩缩容成本较低，在横向扩容等运维操作方面特别简单。其周边组件的接入与监控的接入皆相对简单，Doris 社区提供 Flink & Doris Connector、Spark & Doris Connector 等接入工具，并且监控模版能够直接取用，无需再开发。
社区活跃度高： 在过往加入的开源社区中，Apache Doris 社区活跃度非常高，社区开发者多、迭代更新快，对于社区内的问题解答也十分积极，在开发过程给予了非常多的帮助。

基于 Apache Doris 构建统一实时数仓

如上图所示，新架构将基于 Apache Doris 搭建统一实时数仓，替换原架构中的三个 OLAP 组件，解决由组件过多引起的接入成本高、资源使用增加、数据链路过长等问题，最终能够减轻业务方的负担、减少整体框架的硬件成本、实现引擎与技术栈统一等目标。

在有赞绝大多数应用场景中，原架构都存在数据重复、数据延迟需要修复的情况，引入 Apache Doris 之后，我们将利用其 Unique Key、Duplicate Key、Aggregate Key 模型功能实现高效的数据更新，保证写入效率，并且 Doris 架构具备弹性伸缩的能力，引入后能够极大程度地降低故障发生的概率以及出现故障时数据恢复的效率。

此外我们还将引入 Apache Doris 以下功能：

倒排索引： Apache Doris 2.0 版本的倒排索引功能优化天网日志分析系统，实现多维度快速检索，加速日志场景的查询分析性能。
主键模型写时合并（Merge-on-Write）： Apache Doris 提供丰富的导入方式，可以将小批量数据实时导入 Doris 中，为后续上架门店业务提供实时报表查询，与原价构使用对比，Doris 能够极大程度提升导入时效性。

从 Clickhouse 到 Apache Doris 的迁移经验

在确定架构迁移之后，我们首先选择用 Apache Doris 来替换 Clickhouse 组件，主要由于在业务增长时 Clickhouse 查询性能瓶颈较大、集群扩缩容操作过于复杂等痛点使运维团队的工作量大幅增加，加之大表 Join 能力差、高 QPS 查询性能差等一系列问题无法满足业务方诉求，且 Clickhouse 功能与 Apache Doris 相似，业务方更便于迁移，因此我们优先替换 Clickhouse 组件。

接下来，我们将分享 Doris 替换 Clickhouse 的迁移方案，架构迭代的整体节奏分为 SQL 语句改写实现自动导入（包含建表语句与查询语句的改写）、查询性能测试、稳定性测试、导入性能测试与优化，在结束一系列测试后最终进行整体业务数据的迁移。

01 SQL 建表语句与查询语句改写

目前，我们针对 Unique Key 模型与 Duplicate Key 模型制作了 SQL 建表语句改写工具，如上图所示，支持通过配置参数自动将 Clickhouse 建表语句转为 Doris 建表语句，该工具的主要功能具体如下：

字段类型映射： 由于 Doris 与 Clickhouse 字段不一致，存在一些特殊要求的转换，例如 Key 值类型 String 需要转为 Varchar 以及设置对应长度、分区字段 String 需要转为 Date V2 等；
动态分区表的历史分区数确定： 因为部份表存在历史分区，需要在建表时指定分区数量，否则插入数据会出现 No Partition 异常；
Buckets 数量确定： 虽然历史分区表可以进行统一配置，但是往往历史分区数据量不完全一致，因此我们根据历史分区的实际数据量推算出历史分区的分桶数，同时对于非分区表可以根据历史数据量设置 Properties 进行自动分桶配置；
TTL 周期确定： 可以设定动态分区表的转换周期，设定保留时间后再转换；
Unique 模型的 Sequence 设置： 在导入时可以指定 Sequence 列导入顺序，解决了导入顺序无法确定的问题，有效保证数据导入过程中的有序性。

与建表语句改写工具类似，SQL 查询语句改写能够自动将 Clickhouse 查询语句转成 Doris 查询语句，主要为了双跑进行数据准确性和稳定性验证。在改写过程中，我们梳理了以下注意事项：

查询表名转换： 在 Clickhouse 与 Doris 建表过程中存在一定的映射规则，在进行双跑测试的过程中，我们可以直接根据映射规则直接进行转换。
函数转换： 由于 Clickhouse 与 Doris 使用函数差异较大，需要根据 Doris 和 Clickhouse 的函数映射关系进行函数映射转换。其中我们遇到一些比较特殊的函数转换需要进行特别处理，例如 Clickhouse 中的 COUNTIF() 需要转换为 SUM（CASE WHEN _ THEN 1 ELSE 0) 以达到相同的效果， ORDER BY 与 GROUP BY 需要利用 Doris 开窗函数进行转化，此外 Clickhouse 利用 Array Join 进行列传行，对应 Doris 则需要利用 Explode 、 Lateral View 来展开；
语法层面的不兼容： 由于 Clickhouse 不兼容 MySQL 协议而 Doris 高度兼容，因此在子查询中需要进行别名设置。特别是在人群圈选的业务场景中存在多个子查询，因此在售后转换的时候需要把对应子查询利用 sqlparse 进行递归，检查出所有的子查询进行设置。

02 Apache Doris 与 Clickhouse 性能压测

查询性能测试主要通过 Apache Doris 与原架构 Clickhouse 组件在三个核心业务场景（CDP、DMP、CRM）下的对比表现。我们选用了线上等比的集群规模，通过查询 SQL 性能对比、大表 Join 性能两方面进行对比压测，同时检测 Doris 在查询期间的 CPU 以及内存损耗。接下来我们将详细介绍压测过程与具体性能数据对比。测试集群规模3 FE + 16 BE，BE单节点配置为（ 32C 128 G 7T SSD）。

核心场景下查询 SQL 性能对比

在进行查询 SQL 性能测试中，我们主要基于当前实际应用场景最多的三大系统进行查询，分别是 CDP、DMP、CRM 场景的对比。最终有效查询 SQL 16 条，线上场景下查询 SQL 的具体特点如下：

如表格所示，我们将 Doris 与 Clickhouse 16 条 SQL 查询时间对比，其中有 10 条 SQL Doris 查询性能优于 Clickhouse。 此外我们将 Doris 与 Clickhouse 查询时间总和进一步对比，在对 Doris 表结构设计优化后，Doris 整体查询速度相比 Clickhouse 快 2-3 倍。

大表 Join 查询性能测试

在关联查询测试中，以 CDP 场景下的相关数据表为基础，我们选用了不同数据量级的主表与维表数据，主表测试数据量分别为 40 亿的用户行为表、250 亿的用户额外属性表、960 亿的用户额外属性表；维表以 kdt_id + user_id 为基础，测试量级分别为 100 万、1000 万、5000 万、1 亿、5 亿、10 亿及 25 亿维表数据量。为了测试更加全面，关联查询测试分为完全关联与过滤关联两种测试，完全关联是将主表与维度表直接进行 Join，过滤关联是在相同主表量级关联中，增加了 WHERE 条件对指定的两个店铺 ID 进行过滤。

具体的查询测试表现如下：

全关联 40 亿： 在 40 亿主表完全关联查询中，Doris 查询性能均优于 Clickhouse，且随着维表数据量级增大，Doris 与 Clickhouse 查询耗时差距越大，其中 Doris 最高能够达到 5 倍性能提升；
过滤指定店铺关联 40 亿： 在过滤条件关联查询中，主表按照 WHERE 条件过滤后的数据为 4100 万，相较于 Clickhouse，Doris 在维表数据量小的情况下能够达到 2-3 倍的性能提升，在维表数据量大的情况达到 10 倍以上的性能提升，其中当维度数据表超过 1 亿后，Doris 依旧可以稳定查询，而 Clickhouse 由于 OOM 情况导致查询失败。
全关联 250 亿： 在 250 亿 50 字段宽表作为主表完全关联时，Doris 查询性能依旧优于 Clickhouse，Doris 在所有维表量级中均能跑出，而 Clickhouse 在超过 5000 万后出现 OOM 情况；
与过滤指定店铺关联 250 亿： 在条件关联查询中，主表按照店铺 ID 过滤数据为 5.7 亿，Doris 的查询响应时间均达到了秒级，而 Clickhouse 最快响应时间也需要分钟级耗时，在数据量大的情况下更是无法跑出。
全关联与过滤指定店铺关联 960 亿： 不论是主表关联查询还是条件关联查询，Doris 均可跑出且响应速度较快，Clickhouse 则在所有维表量级中无法跑出。

除响应性能外，我们还对于 Doris 的 CPU 与内存损耗进行检测，发现 Doris 在数百亿计大表关联查询的情况下集群负载依旧稳定。综上，Apache Doris 在绝大部份场景查询响应速度快于 Clickhosue ，特别是在大表 Join 场景下，Apache Doris 性能表现完全优于 Clickhouse。

03 Clickhouse 线上流量回放稳定性测试

在查询压测完成后，我们开始将 Doris 与 Clickhouse 线上双跑以进一步验证 Doris 的稳定性。具体步骤如下：

通过定时采集 Clickhouse 最近 1 分钟的查询状态为 QueryFinish 的有效查询信息。
将查询信息上报至 Kafka，接着通过 Flink 消费 Kafka Topic 获取 Clickhouse 查询 SQL 并统计结果。
在 Flink 中实现 UDF 将 Clickhouse 查询 SQL 转化为 Doris 查询 SQL，并由 JDBC 执行。
获取执行结果与统计结果，与 Clcikhouse 执行信息进行对比最终存放至 RDS。
最终通过对线上 Clickhouse 查询流量回放的统计，分析 Doris 查询性能与查询数据准确性。

04 Apache Doris 数据导入性能测试与优化

数据导入性能测试是我们重要关注的环节之一，Apache Doris 本身对于实时数据和离线数据的导入提供了比较丰富的导入方式，实时数据的导入方式主要是通过 Apache Flink 将 NSQ 和 Apache Kafka 的数据实时通过 Stream Load 方式写入 Apache Doris 中。在离线数据中，Doris 提供了多种导入方式：

支持通过 Spark SQL 读取外部数据，通过 Stream Load 方式写入 Apache Doris；
支持通过 Spark Load 方式，利用 Spark 集群资源将数据排序操作在 HDFS 中完成，再通过 Broker Load 将数据写入 Doris；
支持 Doris Multi-Catalog 功能直接读取外部数据源并通过 Insert Into 方式写入 Doris。

由于离线数据量较大，针对这类数据我们将几种数据导入方式进行了性能测试对比，通过明细数据的各个数据量级对比测试导入时间。测试集群规模 3 FE + 16 BE，BE 单节点配置为（ 32C 128 G 7T SSD）测试结果：

Spark Doris Connector 格式导入的并行度为 80，单批为 100 万，集群的负载情况如下：

根据上方测试结果，我们进一步分析各种导入方式的优势与后续调优方案，希望以下的调优实践能够帮助到有类似需求的开发者们：

Doris Insert Into

Insert Into 方式能够提供快速导数性能，在用法上也相对简单，目前该方式的导入性能已经足够支持我们的业务需求。

Spark Doris Connector 支持阻塞写入

Spark Doris Connector 导入方式更具有通用性，能够解决大量数据导入的问题，导入性能相对稳定，在导入过程我们需要合理控制导入速率与导入并行度。考虑到我们的业务场景每天会涉及千亿级别的数据量并花费 5-6 个小时进行导入，对于这类大表数据的导入如果因为 BE 写入被拒绝导致失败，会造成下游数据产出延迟等问题。此外，在 2.0 版本中，类似 -235，-238 错误已经在 Apache Doris 内核层面解决，无需用户再手动处理此类问题。

我们主要从控制写入速度入手，整体改造原理是通过指数退避写入的方式延迟阻塞，利用配置参数使大数据量出现导入异常时可以等待重试，不让任务失败。通过最大阻塞次数、单次最大阻塞时间、需要阻塞异常捕获关键词这三个参数来捕获阻塞异常情况，实现阻塞退避功能。最终在该设置下，我们的大表导入数据成功率达 95%以上。

[1] 相关 PR： https://github.com/apache/doris-spark-connector/pull/117

Spark Doris Connector 支持 Bitmap 数据导入

在阅读 Apache Doris 官方文档时，我们发现 Spark Load 的方式可以对 Bitmap 数据进行导入，同时能够将 Bitmap 数据计算放在 Spark 集群中进行计算。在业务实践中，我们使用 Spark Doris Connector 更为常用，于是开始探索通过 Spark Doris Connector 的方式实现 Bitmap 数据导入。

如上图所示，Bitmap 建表语句主要分为三个字段，其中最后一个字段是将 CASE_ID 进行 Bitmap 计算。在与社区成员沟通之后，提供一种设置 Doris Read Field 选项，写除 Bitmap 列外的其他列，同时在 Doris Write Field 中做映射处理。最终实现如上图所示方式通过 Spark Doris Connect 直接将 Apache Hive 明细数据导入 Apache Doris 的 Bitmap 数据中。

Spark Doris Connector CSV 格式导入优化

在我们的导入流程中，无论是 Spark Doris Connector 还是 Flink Doris Connector，最终都是利用 Stream Load 的方式进行导入，其导入文件 CSV 与 JSON 有两种导入格式且对于不同格式的选择，导入性能的损耗与速率也是不同的。

在优化前，我们进行了测试，以数十亿数据规模、26 个字段的业务表进行导入性能测试，发现 CSV 格式比 JSON 的导入速度快近 40% 且其内存消耗是更低的，这也是为什么 Apache Doris 官方推荐使用 CSV 格式。

其中值得注意的是使用 CSV 格式进行导入时，设置合理的字段分隔符和换行符对于 CSV Reader 识别效率是至关重要的，如果 BE 的 CSV Reader 对于字段中最后一个字符和分隔符的首字符相同时，则无法识别分隔符。

通过官方文档的提示，我们发现 Stream Load 中能够支持参数配置去除字段最外层的双引号，基于此我们决定在 Spark Doris Connector 写入阶段添加用户设置配置，在字段外层拼接双引号，保证不用选定特殊字符依然能够有效分隔，同时在 Stream Load 写入阶段添加去除最外层双引号的配置。通过两端配置，能够保证即使业务数据很复杂的情况下，也无需为字段符号的识别而烦恼，有效保证字段能够正常分割。

[2] 相关 PR: https://github.com/apache/doris-spark-connector/pull/119

Spark Load

Spark Load 导入方式的特点是基于 Spark 资源进行 Shuffle、排序等工作将文件输出在 HDFS 中，之后 BE 节点能够直接读取 HDFS 上的文件并按照 Doris 格式写入。基于这种方式，在测试过程中我们发现当数据量越大时导入速度越快、越能够节省 Doris 的集群资源，不会带来较大性能损耗。

由于 Spark Load 在临时修复数据场景中使用频繁，我们也基于测试进一步优化。通过官网文档与社区帮助下我们发现，Spark Load 阶段的导入速率主要由单次导入并发度和单次 BE 导入数据处理量两方面参数影响，且两个参数都与源文件大小、BE 节点密切相关。当控制其他变量的情况下，源文件越小，导入速度越慢，因此我们认为在 ETL 阶段充分利用 Spark 经营资源并且合理设置 Bucket 数量能够有效加速导入速率。

未来规划与展望

在整体测试环节中，基于 Apache Doris 2.0 正式版本的性能测试已经完成，我们对于 Doris 的查询性能表现是十分满意的。此外，对于导入性能，我们在测试时首先采用的是 Doris 2.0-Alpha 版本，发现在导入过程中存在偶发性 CPU 瓶颈的问题，例如当通过 Spark Doris Connector 的方式，Spark 使用资源和 Doris 导入数据 CPU 存在一定的瓶颈。同时，我们也将问题反馈给社区，在经过社区优化与 2.0-Beta 版本发布后，稳定性得到了改善。

目前，我们正在与 Clickhouse 线上双跑对 Doris 的稳定性进一步验证，同时我们正在对 Spark Doris Connector 导入方式的的进行性能优化、开发导入周边工具以完成组件替换等落地工作。后续在逐步完成 Clickhouse 的业务迁移后，基于 Clickhouse 的迁移经验，对未迁移的存量业务逐步完成 Druid、Kylin 两个组件的迁移，最终基于 Apache Doris 构建极速分析、实时统一的数据仓库。

在此非常感谢 SelectDB 技术团队的积极响应与专业解答，加速有赞业务的迁移进程，也希望通过这篇文章为准备进行架构迁移的企业提供相关实践经验和 OLAP 选型参考。最后，我们也会持续参与社区活动，将相关成果贡献回馈社区，希望 Apache Doris 飞速发展，越来越好！

参考 GitHub PR：

[1] Spark Doris Connector 支持阻塞写入

https://github.com/apache/doris-spark-connector/pull/117

[2] Spark Doris Connector CSV 格式导入优化

https://github.com/apache/doris-spark-connector/pull/119

[3] Spark Load 创建 Hive 外表支持 Hive 版本设置

https://github.com/apache/doris/pull/20622

[4] Spark Load 系统环境变量获取优化

https://github.com/apache/doris/pull/21837

[5] HIve 外表属性在 Spark Load 不生效优化

https://github.com/apache/doris/pull/21881

你可能感兴趣的:(apache,数据库,大数据,数据分析)

Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
Java：爬虫框架 dingcho Java java 爬虫
一、ApacheNutch2【参考地址】Nutch是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。Nutch致力于让每个人能很容易,同时花费很少就可以配置世界一流的Web搜索引擎.为了完成这一宏伟的目标,Nutch必须能够做到:每个月取几十亿网页为这些网页维护一个索引对索引文件进行每秒上千次的搜索提供高质量的搜索结果简单来说Nutch支持分
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
Mongodb Error: queryTxt ETIMEOUT xxxx.wwwdz.mongodb.net 佛一脚 error react mongodb 数据库
背景每天都能遇到奇怪的问题，做个记录，以便有缘人能得到帮助！换了一台电脑开发nextjs程序。需要连接mongodb数据，对数据进行增删改查。上一台电脑好好的程序，新电脑死活连不上mongodb数据库。同一套代码，没任何修改，搞得我怀疑人生了，打开浏览器进入mongodb官网毫无问题，也能进入线上系统查看数据，网络应该是没问题。于是我尝试了一下手机热点，这次代码能正常跑起来，连接数据库了！！！是不
入门MySQL——查询语法练习 K_un
前言：前面几篇文章为大家介绍了DML以及DDL语句的使用方法，本篇文章将主要讲述常用的查询语法。其实MySQL官网给出了多个示例数据库供大家实用查询，下面我们以最常用的员工示例数据库为准，详细介绍各自常用的查询语法。1.员工示例数据库导入官方文档员工示例数据库介绍及下载链接：https://dev.mysql.com/doc/employee/en/employees-installation.h
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
ubuntu安装wordpress lissettecarlr
1安装nginx网上安装方式很多，这就就直接用apt-get了apt-getinstallnginx不用启动啥，然后直接在浏览器里面输入IP:80就能看到nginx的主页了。如果修改了一些配置可以使用下列命令重启一下systemctlrestartnginx.service2安装mysql输入安装前也可以更新一下软件源，在安装过程中将会让你输入数据库的密码。sudoapt-getinstallmy
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
计算机毕业设计PHP仓储综合管理系统（源码+程序+VUE+lw+部署） java毕设程序源码王哥 php 课程设计 vue.js
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置：phpStudy+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue+Express。项目技术：原生PHP++Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是小皮phpstudy最新版，我们在这个版本上开发的。其他版本理论上也可以。2.开发
最简单将静态网页挂载到服务器上(不用nginx) 全能全知者服务器 nginx 运维前端 html 笔记
最简单将静态网页挂载到服务器上(不用nginx)如果随便弄个静态网页挂在服务器都要用nignx就太麻烦了，所以直接使用Apache来搭建一些简单前端静态网页会相对方便很多检查Web服务器服务状态：sudosystemctlstatushttpd#ApacheWeb服务器如果发现没有安装web服务器：安装Apache：sudoyuminstallhttpd启动Apache：sudosystemctl
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
基本数据类型和引用类型的初始值 3213213333332132 java基础
package com.array; /** * @Description 测试初始值 * @author FuJianyong * 2015-1-22上午10:31:53 */ public class ArrayTest { ArrayTest at; String str; byte bt; short s; int i; long
摘抄笔记--《编写高质量代码：改善Java程序的151个建议》白糖_ 高质量代码
记得3年前刚到公司，同桌同事见我无事可做就借我看《编写高质量代码：改善Java程序的151个建议》这本书，当时看了几页没上心就没研究了。到上个月在公司偶然看到，于是乎又找来看看，我的天，真是非常多的干货，对于我这种静不下心的人真是帮助莫大呀。看完整本书，也记了不少笔记
【备忘】Django 常用命令及最佳实践 dongwei_6688 django
注意：本文基于 Django 1.8.2 版本生成数据库迁移脚本（python 脚本） python manage.py makemigrations polls 说明：polls 是你的应用名字，运行该命令时需要根据你的应用名字进行调整查看该次迁移需要执行的 SQL 语句（只查看语句，并不应用到数据库上）： python manage.p
阶乘算法之一N! 末尾有多少个零周凡杨 java 算法阶乘面试效率
&n
spring注入servlet g21121 Spring注入
传统的配置方法是无法将bean或属性直接注入到servlet中的，配置代理servlet亦比较麻烦，这里其实有比较简单的方法，其实就是在servlet的init()方法中加入要注入的内容： ServletContext application = getServletContext(); WebApplicationContext wac = WebApplicationContextUtil
Jenkins 命令行操作说明文档 510888780 centos
假设Jenkins的URL为http://22.11.140.38:9080/jenkins/ 基本的格式为 java 基本的格式为 java -jar jenkins-cli.jar [-s JENKINS_URL] command [options][args] 下面具体介绍各个命令的作用及基本使用方法 1. &nb
UnicodeBlock检测中文用法布衣凌宇 UnicodeBlock
/** * 判断输入的是汉字 */ public static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
java下实现调用oracle的存储过程和函数 aijuans java orale
1.创建表：STOCK_PRICES 2.插入测试数据： 3.建立一个返回游标： PKG_PUB_UTILS 4.创建和存储过程：P_GET_PRICE 5.创建函数： 6.JAVA调用存储过程返回结果集 JDBCoracle10G_INVO
Velocity Toolbox antlove 模板 tool box velocity
velocity.VelocityUtil package velocity; import org.apache.velocity.Template; import org.apache.velocity.app.Velocity; import org.apache.velocity.app.VelocityEngine; import org.apache.velocity.c
JAVA正则表达式匹配基础百合不是茶 java 正则表达式的匹配
正则表达式;提高程序的性能,简化代码,提高代码的可读性,简化对字符串的操作正则表达式的用途; 字符串的匹配字符串的分割字符串的查找字符串的替换正则表达式的验证语法 [a] //[]表示这个字符只出现一次 ,[a] 表示a只出现一
是否使用EL表达式的配置 bijian1013 jsp web.xml EL EasyTemplate
今天在开发过程中发现一个细节问题，由于前端采用EasyTemplate模板方法实现数据展示，但老是不能正常显示出来。后来发现竟是EL将我的EasyTemplate的${...}解释执行了，导致我的模板不能正常展示后台数据。网
精通Oracle10编程SQL(1-3)PLSQL基础 bijian1013 oracle 数据库 plsql
--只包含执行部分的PL/SQL块 --set serveroutput off begin dbms_output.put_line('Hello,everyone!'); end; select * from emp; --包含定义部分和执行部分的PL/SQL块 declare v_ename varchar2(5); begin select
【Nginx三】Nginx作为反向代理服务器 bit1129 nginx
Nginx一个常用的功能是作为代理服务器。代理服务器通常完成如下的功能：接受客户端请求将请求转发给被代理的服务器从被代理的服务器获得响应结果把响应结果返回给客户端实例本文把Nginx配置成一个简单的代理服务器对于静态的html和图片，直接从Nginx获取对于动态的页面，例如JSP或者Servlet，Nginx则将请求转发给Res
Plugin execution not covered by lifecycle configuration: org.apache.maven.plugin blackproof maven 报错
转：http://stackoverflow.com/questions/6352208/how-to-solve-plugin-execution-not-covered-by-lifecycle-configuration-for-sprin maven报错： Plugin execution not covered by lifecycle configuration:
发布docker程序到marathon ronin47 docker 发布应用
1 发布docker程序到marathon 1.1 搭建私有docker registry 1.1.1 安装docker regisry docker pull docker-registry docker run -t -p 5000:5000 docker-registry 下载docker镜像并发布到私有registry docker pull consol/tomcat-8.0
java-57-用两个栈实现队列&&用两个队列实现一个栈 bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; /* * Q 57 用两个栈实现队列 */ public class QueueImplementByTwoStacks { private Stack<Integer> stack1; pr
Nginx配置性能优化 cfyme nginx
转载地址：http://blog.csdn.net/xifeijian/article/details/20956605 大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装，修改这里或那里的几行配置，好了，你已经有了一个Web服务器了。而且，在大多数情况下，一个常规安装的nginx对你的网站来说已经能很好地工作了。然而，如果你真的想挤压出Nginx的性能，你必
[JAVA图形图像]JAVA体系需要稳扎稳打,逐步推进图像图形处理技术 comsci java
对图形图像进行精确处理，需要大量的数学工具，即使是从底层硬件模拟层开始设计，也离不开大量的数学工具包，因为我认为，JAVA语言体系在图形图像处理模块上面的研发工作，需要从开发一些基础的，类似实时数学函数构造器和解析器的软件包入手，而不是急于利用第三方代码工具来实现一个不严格的图形图像处理软件...... &nb
MonkeyRunner的使用 dai_lm android MonkeyRunner
要使用MonkeyRunner，就要学习使用Python，哎先抄一段官方doc里的代码作用是启动一个程序（应该是启动程序默认的Activity），然后按MENU键，并截屏 # Imports the monkeyrunner modules used by this program from com.android.monkeyrunner import MonkeyRun
Hadoop-- 海量文件的分布式计算处理方案 datamachine mapreduce hadoop 分布式计算
csdn的一个关于hadoop的分布式处理方案，存档。原帖：http://blog.csdn.net/calvinxiu/article/details/1506112。 Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同ja
以資料庫驗證登入 dcj3sjt126com yii
以資料庫驗證登入由於 Yii 內定的原始框架程式, 採用綁定在UserIdentity.php 的 demo 與 admin 帳號密碼: public function authenticate() { $users=array( &nbs
github做webhooks：[2]php版本自动触发更新 dcj3sjt126com github git webhooks
上次已经说过了如何在github控制面板做查看url的返回信息了。这次就到了直接贴钩子代码的时候了。工具/原料 git github 方法/步骤在github的setting里面的webhooks里把我们的url地址填进去。钩子更新的代码如下： error_reportin
Eos开发常用表达式蕃薯耀 Eos开发 Eos入门 Eos开发常用表达式
Eos开发常用表达式 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2014年8月18日 15:03:35 星期一 &
SpringSecurity3.X--SpEL 表达式 hanqunfeng SpringSecurity
使用 Spring 表达式语言配置访问控制，要实现这一功能的直接方式是在<http>配置元素上添加 use-expressions 属性： <http auto-config="true" use-expressions="true"> 这样就会在投票器中自动增加一个投票器：org.springframework
Redis vs Memcache IXHONG redis
1. Redis中，并不是所有的数据都一直存储在内存中的，这是和Memcached相比一个最大的区别。 2. Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。 3. Redis支持数据的备份，即master-slave模式的数据备份。 4. Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。 Red
Python - 装饰器使用过程中的误区解读 kvhur JavaScript jquery html5 css
大家都知道装饰器是一个很著名的设计模式，经常被用于AOP(面向切面编程)的场景，较为经典的有插入日志，性能测试，事务处理，Web权限校验， Cache等。原文链接：http://www.gbtags.com/gb/share/5563.htm Python语言本身提供了装饰器语法（@），典型的装饰器实现如下： @function_wrapper de
架构师之mybatis-----update 带case when 针对多种情况更新 nannan408 case when
1.前言. 如题. 2. 代码. <update id="batchUpdate" parameterType="java.util.List"> <foreach collection="list" item="list" index=&
Algorithm算法视频教程栏目记者 Algorithm 算法
课程：Algorithm算法视频教程百度网盘下载地址： http://pan.baidu.com/s/1qWFjjQW 密码: 2mji 程序写的好不好,还得看算法屌不屌！Algorithm算法博大精深。一、课程内容：课时1、算法的基本概念 + Sequential search 课时2、Binary search 课时3、Hash table 课时4、Algor
C语言算法之冒泡排序 qiufeihu c 算法
任意输入10个数字由小到大进行排序。代码： #include <stdio.h> int main() { int i,j,t,a[11]; /*定义变量及数组为基本类型*/ for(i = 1;i < 11;i++){ scanf("%d",&a[i]); /*从键盘中输入10个数*/ } for
JSP异常处理 wyzuomumu Web jsp
1.在可能发生异常的网页中通过指令将HTTP请求转发给另一个专门处理异常的网页中: <%@ page errorPage="errors.jsp"%> 2.在处理异常的网页中做如下声明： errors.jsp: <%@ page isErrorPage="true"%>，这样设置完后就可以在网页中直接访问exc