OceanBase数据库官方博客

BOSS 直聘：日增10亿数据的历史库，如何通过OceanBase节省70%存储成本？

BOSS 直聘是在全球范围内首创互联网“直聘”模式的在线招聘产品，目前已经成为了中国最大的招聘平台。本文谈到的 BOSS 直聘的业务场景主要是通过数据库对招聘过程中的聊天记录信息进行存储，数据量极大，且每天都有 5 亿到 10 亿的增量数据。和招聘相关聊天记录往往呈现流水型特征，写入一段时间后即不会再次访问或更新，写多读少。

面对快速增长的在线数据，尤其是访问频率很低甚至为 0 的历史聊天记录，其占用的在线业务库的存储空间达到 PB 级别，造成了大量硬件资源浪费，堆高了企业的 IT 成本。同时，随着数据量的增加，在线数据库体积臃肿、查询效率逐步降低，给后续数据变更、扩展造成阻碍。

为了解决这些问题，我们需要对历史聊天记录进行冷热数据分离。热数据所在的在线库是多个 MySQL 集群，采用分库分表的方式，每月定期清理过期数据，滚动写入历史归档库。

团队进行这次数据库选型的主要目的就是对超大容量的归档库进行选型，参加选型的几个数据库为：MySQL、ClickHouse、OceanBase、某开源分布式数据库(以下简称为 DB-U），主要从存储成本、高可用这两个方面对归档库进行评估。

（一）存储成本

我们的归档库需要保留三到五年的历史聊天数据，必须解决大容量存储的成本问题。首先我们对 MySQL、ClickHouse、OceanBase、DB-U（某开源分布式数据库）分别创建一张相同的用于存储用户历史消息的表，表结构如下：

然后分别写入 1 亿行相同的单副本数据，并对其磁盘的使用情况进行对比：

数据库	磁盘使用量
MySQL	130GB
DB-U（某开源分布式数据库）	60GB
ClickHouse	30GB
OceanBase	22GB

可以清楚地看到，基于列存进行存储的 ClickHouse 和拥有超高压缩率的 OceanBase 这两款数据库的存储成本明显低于 MySQL 和 DB-U，所以我们分别对 ClickHouse 和 OceanBase 的存储引擎进行了调研。

ClickHouse 存储引擎调研

ClickHouse 存储成本低的原因显而易见，就是因为它的存储引擎是基于列存的。相比行存存储引擎，ClickHouse 同一列中的数据属于同一类型，压缩效果显著。列存往往有着高达十倍甚至更高的压缩比，节省了大量的存储空间，降低了存储成本。

不过历史归档库一般都是写多读少的场景，像 ClickHouse 这种纯列存的存储引擎在这里并不能发挥出查询性能好的优势，相反列存引擎写入性能差的劣势还被放大了。

OceanBase 存储引擎调研

1. 存储引擎架构

OceanBase 的存储引擎基于 LSM-Tree 架构，将数据分为基线数据（放在 SSTable 中）和增量数据（放在 MemTable/SSTable 中）两部分，其中基线数据是只读的，一旦生成就不再被修改；增量数据支持读写。

数据库 DML 操作插入、更新、删除等首先写入内存里的 MemTable，所以在写入性能上就相当于内存数据库的写入性能，正好适合我们历史归档库写多读少的场景。等到 MemTable 达到一定大小时转储到磁盘成为增量的 SSTable（上图中红色箭头部分），转储到磁盘上的过程是批量的顺序写，相比 B+ 树离散的随机写，会大大提高写盘的性能。

当增量的 SSTable 达到一定规模的时候，会触发增量数据和基线数据的合并，把增量数据和基线数据做一次整合，基线数据在合并完成之后就不会发生变化了，直到下一次合并。同时每天凌晨的业务低峰期，系统也会自动进行每日合并。

但是 LSM-Tree 的架构也存在一个问题，就是读放大（上图中绿色箭头部分）。在进行查询时，需要分别对 SSTable 和 MemTable 进行查询，并将查询结果进行一次归并，然后再将归并后的查询结果返回 SQL 层。OceanBase 为了减小读放大带来的影响，在内存实现了多级的缓存，例如 Block Cache 和 Row cache，来避免对基线数据频繁的进行随机读。

2. 数据压缩技术

在这样的存储架构下， OceanBase 的数据压缩集中发生在 compaction 过程中 SSTable 的写入时，数据的在线更新与压缩得到了解耦。

OceanBase 支持不感知数据特征的通用压缩 ( compression ) 和感知数据特征并按列进行压缩的数据编码 ( encoding )。这两种压缩方式是正交的，也就是说，可以对一个数据块先进行编码，然后再进行通用压缩，来实现更高的压缩率。

批量落盘的特性使其采用更激进的压缩策略。OceanBase 是行列混存的微块存储格式（ PAX ），充分利用了同一列数据的局部性和类型特征，在微块内部对一组行以列存的方式存储，并针对数据特征按列进行编码。变长的数据块和连续批量压缩的数据也可以让 OceanBase 通过同一个 SSTable 中已经完成压缩的数据块的先验知识，对下一个数据块的压缩进行指导，在数据块中压缩尽量多的数据行，并选择更优的编码算法。

与部分在 schema 上指定数据编码的数据库实现不同， OceanBase 选择了用户不感知的数据自适应编码，在给用户带来更小负担的同时降低了存储成本。从历史归档库角度而言，也不需要针对数据做出过多压缩与编码相关的配置调整。

（二）高可用和稳定性

除了存储成本以外，我们还对归档库选型中的候选者 ClickHouse 和 OceanBase 的高可用能力和稳定性进行了对比。

ClickHouse

我们将 ClickHouse 拟作历史库选型对其进行了充分测试：通过 Replication（复制）来实现集群中不同服务器之间自动同步数据的功能，以此确保数据的高可用性和容错性；使用 ZooKeeper 来协调复制过程，跟踪所有副本的状态，并确保它们保持一致。Replication 和 ZooKeeper 保证了在不同的物理设备上有多个数据副本，减少了数据丢失的风险。

不过在使用 ClickHouse 的过程中，我们发现它的高可用方案在大数据量的场景下会存在一些问题。主要由于原生的 Replication 方案有太多的信息存在 ZooKeeper 上，而为了保证服务，一般会有一个或几个副本，但 ZooKeeper 不支持线性扩展，受单机服务能力限制,，当归档库集群的数据量持续增长时，整个服务很快会不可用。

实际上在 ClickHouse 使用时，大家往往都把 ZooKeeper 当成了多种服务的结合，而不仅仅把它当作一个 Coordinate service。例如常见做法中，还会把它当作 Log Service，很多行为日志等数字的信息也会存在 ZooKeeper 上；还会作为表的 catalog service，像表的一些 schema 信息也会在 ZooKeeper 上做校验，这就会导致 ZooKeeper 上接入的数量与数据总量会成线性关系。按照我们归档库的数据增长速度做预估，ClickHouse 搭配 ZooKeeper 无法支撑三到五年全量归档数据需求。

除此以外，ClickHouse 的复制功能高度依赖于 ZooKeeper。但 ZooKeeper 是一个外部的协调服务，本身的配置和维护增加了额外的复杂性，而且如果 ZooKeeper 自身出现问题，可能会影响到 ClickHouse 的复制过程。同时，这种高可用方案还增加了问题排查的链路长度和定位问题的难度，恢复过程也变得比较复杂，需要手动进行干预。我们在使用 ClickHouse 的过程中，很容易出现丢数据的情况。

OceanBase

OceanBase 是原生的分布式数据库，原生就可以保证多个数据副本之间的一致性，它们利用了基于 Paxos 分布式一致性协议保证了在任一时刻只有当多数派副本达成一致时，才能推选一个 Leader，保证主副本的唯一性来对外提供数据服务。也就是说，OceanBase 通过多副本和 Paxos 协议来保证数据库的高可用。

相比 MySQL 和 ClickHouse 的高可用方案方案，OceanBase 的高可用方案降低了我们的运维难度和业务变更难度。而且 OceanBase 的多地多副本架构和 Paxos 一致性协议，还能够支持数据副本分别存储在同城和异地，实现异地容灾。

因为 OceanBase 具备分布式特性，所以数据存储原生就具备了动态扩容的能力。当归档库的数据量持续增长时，只需要我们的 DBA 执行几条命令，就可以对机器的硬件或者整个集群的节点数进行扩容。在集群增加新节点之后，数据会自动在新、老节点之间完成负载均衡的过程，可以做到业务无感知的平滑扩容，保证业务扩容时不停机。同时还节省了业务量猛增后的数据库扩容和迁移成本，极大降低了数据库容量不足造成的各种风险。

对 OceanBase 进行扩容时，无论是增加单机的容量，还是增加 zone 内的节点数，亦或是为了保证更高的可用性而增加新的 zone，都可以直接通过白屏化的 OCP 工具来完成。下面就是我们把一个单副本的集群扩展成三 zone 三副本时的一张 OCP 截图：

相较于黑屏执行命令的方式，我们的 DBA 同学反馈使用 OCP 来进行 OceanBase 的部署和运维会更加方便，推荐大家使用。

综上所述：相比 MySQL 和 ClickHouse，在一致性方面，OceanBase 原生就有着强一致的存储保证，而不是去用最终一致性的妥协换取其他方面的能力，而且也不需要通过配置各种复杂的周边组件来对一致性进行保证。在高可用方面，OceanBase 的多副本容灾技术面向单个集群，事务日志持久化并在多个副本之间同步日志数据，基于 Paxos 协议保证日志数据在多数派副本持久化成功，整体上对用户提供了少数派故障时 RPO = 0，RTO < 8s 的高可用能力。在整个测试过程中，OceanBase 的表现相比 MySQL、 ClickHouse和DB-U，也要更加稳定。

综合考量各种数据库的存储成本、高可用能力、运维难度等方面之后，我们最终选择了 OceanBase 作为我们的历史归档库。

我们目前的在线库是主从结构的 MySQL，用于存储热数据，一般是最近一个月内的用户聊天记录；历史库是几个由 OCP 接管的 OceanBase 集群。每个月我们都会通过一个自研的 DTS 工具从 MySQL 在线库定期归档过期数据到通过 OceanBase 搭建的历史库，整体架构如下图：

我们现在已经用 OCP 接管了 8 个 OceanBase 归档业务集群，超过 20 个租户。在线库 MySQL 分表超过万张，仍然在源源不断地通过 App 按照用户的 ID hash 向 MySQL 写入数据，过期的历史数据现在会直接新导入到归档库 OceanBase 中。

我们曾经用过的一个旧 ClickHouse 归档库集群目前仍然提供部分历史数据的读取功能，不过由于考虑到 ClickHouse 的稳定性和数据安全问题，该归档集群会逐步被 OceanBase 替换掉。

首先，OceanBase 通过数据库内核的高压缩的能力，帮助我们轻松完成冷数据归档，并且节省了超过 70% 的存储资源。

其次，OceanBase 是原生的分布式系统，有着良好的扩展性。而且还可以对用户提供少数派故障时 RPO = 0，RTO < 8s 的高可用能力，让数据库在使用过程中更加稳定。

最后，OceanBase 自带一个智能化的白屏 OCP 平台工具，降低了我们 DBA 同学的部署和运维的门槛。OCP 对集群、租户、主机、软件包这些资源对象进行一个全生命周期管理，包括管理，安装、运维、性能监控、配置、升级这些功能。并且除了默认的监控告警之外，现在 OCP 还支持自定义告警，比如我们可以定制磁盘、内存达到怎样一个水位线的时候就会进行报警，满足了定制化的告警需求。除此以外，OCP 还支持备份恢复和在运维过程中可以支持进行一些自动化的诊断功能。

（一）在线库分布式能力支持

我们的在线库目前依然使用的是 MySQL，在 MySQL 中进行分库分表明显比在分布式数据库中使用单表的业务复杂度要高很多，而且数据一致性难以保证，当多个数据表或数据库之间的数据关联较为复杂时，维护数据的一致性难度也会增加很多。

除了一致性问题以外，在线库的运维难度也很高，需要对多个数据库或数据表进行管理和维护，增加了系统的故障排查和维护的难度。而且在分库分表的场景下，历史问题数据追溯问题是一个普遍存在的问题，由于数据被分散存储在多个数据库或数据表中，导致历史数据的追溯变得困难。

现在依然有很多上层业务都依赖在线库 MySQL，这些上层业务很多都是根据 MySQL 分库分表进行的设计和实现，所以在线库从 MySQL 替换成 OceanBase 还需要花一些时间。

但引入 OceanBase 数据库后，完善了 DB 侧对原生分布式库表的支持能力，对于大存储量、改造分库分表逻辑难度比较大的业务提供了更便捷的可行方案。

（二）使用 ODC 与 Binlog Server 等工具

我们了解到白屏化的 ODC 工具从 4.2.2 版本开始，就已经提供了从 MySQL 到 OceanBase 和从 OceanBase 到 OceanBase 的灵活数据归档能力，支持了多种维度的自动化任务配置。考虑到 OceanBase 的高压缩率及 ODC 的数据归档功能，用 OceanBase 做历史库方案就变得非常简单。

BOSS 直聘目前内部使用的 RDS 平台可以直接调用自研的 DTS 工具进行数据归档，所以业务同学目前会继续保持原有的 DTS 归档方法，当出现 DTS 解决不了的归档问题时，会利用 ODC 对 DTS 缺失的能力进行补位。后续，我们会继续研究 ODC 的其他功能完善 DB 侧的支持能力。

另外，由于在线业务的逐步接入，下游数据仓库等业务也提出了基于 Binlog 订阅等需求，OceanBase 4.2.1 版本提供了 Binlog Service，对于分库分表类业务的下游接入可以直接通过该服务来提供，降低了下游需要逐个 MySQL 集群订阅 Binlog 的复杂度。

(三）最佳实践探索

新数据库的引入对于 DBA 的考验也有所增加，在保证数据库稳定的前提下，也要充分对硬件、服务配置等维度进行合理的选型和持续优化，以便更好地挖掘OceanBase潜力。我们将持续与OceanBase团队一起实践和探讨，找到 OceanBase 最有效率和最具成本效益的使用方式，为业务的快速和稳定发展提供强有力的支撑。

喜讯！Apache SeaTunnel 荣获上海开源创新菁英荟优秀开源项目奖 SeaTunnel SeaTunnel 开源数据同步大数据 etl
近日，在2025上海开源创新菁英荟上，ApacheSeaTunnel凭借信创生态适配与智能化技术突破，荣获「优秀开源项目奖」。这个由中国团队孵化的开源项目，已成为全球数据集成领域的标杆。信创生态：支持20+国产数据库的无缝对接SeaTunnel深度适配华为OpenGauss、阿里OceanBase等20+主流国产数据库，支持CDC（变更数据捕获）与高性能加载。在证券行业信创转型中，SeaTunne
喜讯！Apache SeaTunnel 荣获上海开源创新菁英荟优秀开源项目奖数据库
近日，在2025上海开源创新菁英荟上，ApacheSeaTunnel凭借信创生态适配与智能化技术突破，荣获「优秀开源项目奖」。这个由中国团队孵化的开源项目，已成为全球数据集成领域的标杆。信创生态：支持20+国产数据库的无缝对接SeaTunnel深度适配华为OpenGauss、阿里OceanBase等20+主流国产数据库，支持CDC（变更数据捕获）与高性能加载。在证券行业信创转型中，SeaTunne
ORACLE数据库转国产阿里OceanBase数据库
1.BLOB类型修改将接口内oracle.sql.BLOB改为java.sql.Blob2.REGEXP_LIKE判断函数正则表达式中字符转义问题OB的正则表达式使用的是标准的Linux模式,oracle是黑盒子,在处理部分转义符([]+)的时候,Oracle无需使用转义符,OB务必使用转义符,加/转义处理,例如在regexp_like(t.xx,’^(+|[0-9]+)$’)改为regexp_l
OceanBase批量插入数据报错java.lang.ArrayIndexOutOfBoundsException:0 二宝哥 oceanbase java 开发语言
OceanBase数据库MySQL模式，插入数据报错，直接首先换了连接池，插入数据成功。参考文章：com.mysql.cj.jdbc.result.ResultSetMetaData.getCloumnType(ResultSetMetaData.java:188)空指针-CSDN博客批量插入数据时，报错如下：OceanBase社区中搜索批量插入报错，出现“ArrayIndexOutOfBound
构建全栈式数据库与消息队列服务治理体系：监控、告警与组件搭配实践喝醉酒的小白 DBA K8s 数据库
目录标题分类✅一、分类总览表✅二、详细分类说明1.关系型数据库（RDBMS）2.NoSQL数据库3.分布式系统协调组件4.消息队列系统✅三、按用途分类（实战参考）✅四、开源vs商业（闭源）分类全面的监控指标分类与告警模板清单✅一、通用结构✅二、数据库系统级别详细监控项与告警模板1.MySQL/TiDB/OceanBase2.PostgreSQL/openGauss/GaussDB/KingBase
【赵渝强老师】OceanBase数据库从零开始：Oracle模式
这里我们来介绍一下新上线的课程《OceanBase数据库从零开始：Oracle模式》，本门课程共11章，视频讲解如下：https://www.bilibili.com/video/BV1r4NCzHEka/?aid=114720556191...下面详细介绍一下每一章的主要内容：第01章-OceanBase的体系架构本章主要介绍OceanBase分布式数据库集群的体系架构，包括：OBServer节
【赵渝强老师】OceanBase OBServer节点的目录结构
OceanBaseOBServer节点工作目录下通常有audit、bin、etc、etc2、etc3、log、run、store等目录，但这些目录并非都是安装必须的。在启动OBServer节点前需要保证etc、log、run、store这4的目录存在，同时store下应该有clog、slog、sstable这3个目录。etc2、etc3是备份配置文件用的，由OBServer节点创建。audit下存
巧用OpenManus开发自动诊断Agent，解决复杂问题人工智能数据库agent
作者：杜振鹏，联通软件研究院数据库研发工程师首先为大家推荐这个OceanBase开源负责人老纪的公众号“老纪的技术唠嗑局”，会持续更新和#数据库、#AI、#技术架构相关的各种技术内容。欢迎感兴趣的朋友们关注！在自主可控背景下，联通软件研究院为了应对MySQL5.7停服风险、降低商用依赖以及提升软实力等几方面综合考虑，在三年前选择基于OceanBase社区版打造自研分布式CUDB产品。同时，聚焦数据
OceanBase 的探索与实践奔向理想的星辰大海图解技术 oceanbase
一、背景vivo作为一家以设计驱动创造伟大产品，以智能终端和智慧服务为核心的科技公司，服务全球5亿+用户，用户持续增长，同时数据量也持续增长，在数据库运维过程中遇到如下问题：分库分表：随着业务数据量的不断增长，MySQL实例数据量超过了单机容量限制，业务分库分表的需求越来越多，分库分表的改造成本和风险比较高，需要能够兼容MySQL的分布式数据库解决分库分表的问题。成本压力：业务用户基数比较大，每年
OceanBase品牌升级：启用中文名“海扬数据库” CSDN资讯 oceanbase 数据库
6月26日，国产数据库OceanBase正式启用中文品牌名“海扬数据库”，品牌战略全面升级。品牌升级现场，OceanBaseCEO杨冰表示，中文名的推出，一方面代表着OceanBase深耕本土市场的决心，也是OceanBase继续引领世界舞台上分布式数据库技术创新和应用的宣言。近二十年，移动互联网和数字经济的蓬勃发展带来了爆发式的数据量增长，在这样的背景下国产数据库迎来了巨大的发展机遇。历经15年
分布式存储引擎OceanBase，UpdateServer 实现机制——存储引擎「已注销」数据库
UpdateServer存储引擎如下图所示。UpdateServer存储引擎与Bigtable存储引擎看起来很相似，不同点在于：UpdateServer只存储了增量修改数据，基线数据以SSTable的形式存储在Chunkserver上,而Bigtable存储引擎同时包含某个子表的基线数据和增量数据；UpdateServer内部所有表格共用MemTable以及SSTable，而Bigtable中每个
OceanBase架构解析（一） weixin_38377637 分布式数据库分布式数据库
文章目录OceanBase架构解析（一）介绍基本架构核心特性OceanBase存储引擎OceanBase事务引擎OceanBaseSQL引擎部署方式OceanBase架构解析（一）一下内容来自一份PPT，只是大概介绍了OceanBase功能和突出的架构，没有详细的细节实现，有待后续继续学习和分析。介绍OceanBase是阿里巴巴、蚂蚁金服自主研发的通用关系型数据库；它基于分布式架构和普通PC服务器
在 OceanBase 中，如何应对存储引擎的读放大问题？数据库存储引擎
首先为大家推荐这个OceanBase开源负责人老纪的公众号“老纪的技术唠嗑局”，会持续更新和#数据库、#AI、#技术架构相关的各种技术内容。欢迎感兴趣的朋友们关注！前言OceanBase的LSM-Tree存储引擎天生具有高效的写入性能，而且既能够通过旁路导入高效处理定期的批量数据同步，又能够承载一些实时数据同步和历史库数据修改的场景。但任何事物都有两面性，LSM-Tree存储引擎虽然对写操作友好，
OceanBase公布AI新进展：OB Cloud服务数十家头部企业AI应用落地 CSDN资讯人工智能数据库 OceanBase 智能体
6月24日，独立数据库厂商OceanBase宣布，其云数据库OBCloud已实现AI能力的开发部署及生态集成，并已服务零售、金融、物流等行业的数十家头部企业，推动AI应用从概念走向实际落地。OceanBase正在全面拥抱AI时代，CTO杨传辉此前曾指出，致力于构建DataxAI能力，面向AI时代推动一体化数据库向一体化数据底座的战略演进。此次OBCloud对AI能力的部署集成与行业应用，被视为Oc
信创 CDC 实战｜国产数据库的数据高速通道：OceanBase 实时入仓 StarRocks 数据库
国产数据库加速进入核心系统，传统同步工具却频频“掉链子”。本系列文章聚焦OceanBase、GaussDB、TDSQL、达梦等主流信创数据库，逐一拆解其日志机制与同步难点，结合TapData的实践经验，系统讲解从CDC捕获到实时入仓（Doris、StarRocks、ClickHouse等）的完整链路构建方案，为工程师提供切实可行的替代路径与最佳实践。本篇任务：OceanBase→StarRocks
阿里、华为、浪潮等大厂争相布局，开源数据库真成 “香饽饽”了？ Java小梁同学 Java 数据库大数据人工智能区块链编程语言
6月1日，蚂蚁科技集团自主研发的分布式OceanBase数据库宣布正式开源，并成立OceanBase开源社区。而就在两天前，阿里云刚刚宣布对外开放关系型数据库PolarDB数据库forPostgreSQL的源代码。日前，华为的openGause、浪潮的ZNBase等也先后宣布开源。大厂们不约而同的躬身入局似乎透露出一个重要信号：开源数据库正在以前所未有的强势之姿挺进国内、乃至全球数据库市场。【参考
企业AI落地的挑战不止在大模型，还有数据底座技术领导力人工智能
数字化浪潮席卷全球，AI正成为社会进步与产业升级的核心驱动力。作为一体化分布式数据库，OceanBase致力于构建Data×AI能力，并于近期发布面向AI的应用产品PowerRAG，显著提升向量性能、混合检索等企业AI落地所需基础设施能力，以一体化数据底座助力把握AI时代机遇。OBCloud为用户提供多基础设施的一体化数据库服务，现已全面拥抱向量检索、PowerRAG等AI能力，可为客户提供更敏捷
国产数据库工具突围：SQLynx如何解决Navicat的三大痛点？深度体验报告代码配咖啡数据库
引言：Navicat的"中国困境"当开发者面对达梦数据库的存储过程调试，或是在人大金仓中处理复杂查询时，Navicat突然变得力不从心——这不是个例。真实痛点：某政务系统迁移至OceanBase后，开发团队发现Navicat无法识别国产数据库特有语法，导致运维效率下降40%行业趋势：2023年国产数据库市场占有率突破28%，但配套工具链严重滞后今天要评测的SQLynxMaicong:SQLEdit
OceanBase CEO杨冰：OceanBase达成“百行计划”，支持超190套核心系统 CSDN资讯 oceanbase 数据库人工智能分布式数据库
6月18日，2025中国国际金融展在上海开幕，自研分布式数据库OceanBaseCEO杨冰受邀在主会场发表题为《攻坚关键业务系统面向金融场景打造AI时代的一体化数据库》的演讲。杨冰表示，金融机构的数字化转型正进入关键时期，向核心系统全面迈进，核心系统采用分布式数据库已获行业共识。他透露，OceanBase已达成“百行计划”，为超过100家银行的190多套核心系统与1000多套关键业务系统提供数据库
OceanBase MERGE语句使用：合并插入与更新操作详解 Clf丶忆笙 OceanBase教程 oceanbase oracle 数据库
文章目录一、MERGE语句概述与基本原理1.1MERGE语句的定义与作用1.2MERGE语句的语法结构1.3MERGE语句的执行流程1.4MERGE与独立INSERT/UPDATE操作的对比二、MERGE语句核心组件详解2.1USING子句深入解析2.2ON条件子句详解2.3UPDATE子句技术细节2.4INSERT子句技术细节2.5错误处理子句三、MERGE语句高级应用技术3.1使用MERGE实
数据驱动下的泛互行业创新与变革，及数据库的新机遇数据库
本文摘自《OceanBase社区版在泛互场景的应用案例研究》电子书，感兴趣的朋友欢迎打开链接观看。首先为大家推荐这个OceanBase开源负责人老纪的公众号“老纪的技术唠嗑局”，会持续更新和#数据库、#AI、#技术架构相关的各种技术内容。欢迎感兴趣的朋友们关注！作者：刘华阳，现任泛互行业SaaS领域企业的数据库架构师。拥有20年数据库相关工作经验：从传统行业到泛互行业，涉及大型国企，知名股份制企业
国产数据库全解析：openGauss、OceanBase、TiDB与KingbaseES的核心优势与应用场景指南墨瑾轩一起学学数据库【一】数据库
一、引言近年来，国产数据库在技术实力、市场占有率、生态建设等方面取得了显著进步，逐步成为国内外企业信息化建设的重要选择。本文将深入剖析openGauss、OceanBase、TiDB和KingbaseES这四款主流国产数据库的核心内容，并针对国产化过程中给出使用建议，以帮助企业根据自身需求选择合适的数据库解决方案。二、国产数据库详解1.openGauss核心内容：内核基于PostgreSQL：op
千呼万唤始出来 —— OB 全文索引能力史诗级增强 sql大数据数据库
首先为大家推荐这个OceanBase开源负责人老纪的公众号“老纪的技术唠嗑局”，会持续更新和OceanBase相关的各种技术内容。欢迎感兴趣的朋友们关注！背景（WhatisOBFTS)随着4.3.5GA发布，OB全文索引从功能和性能方面带来了诸多增强与提升。与之前版本局限于协助业务验证选型不同，最新版本的全文索引能够帮助用户解决实际生产中的问题。例如在系统日志分析、用户行为和画像分析等场景里，全文
实践练习4.迁移 MySQL 数据到 OceanBase 集群 qinwen740 dba
掌握从MySQL向OceanBase迁移数据的基本方法：mysqldump、datax工具准备mysqldump是MySQL提供的用于导出MySQL数据库对象和数据的工具，非常方便。DataX是阿里云DataWorks数据集成的开源版本，在阿里巴巴集团内被广泛使用的离线数据同步工具/平台。DataX实现了包括MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、
实践练习-迁移 MySQL 数据到 OceanBase 集群 qq492328329 OceanBase 社区版 dba
一、实验目标1、使用mysqldump将mysql的表结构和数据同步到OceanBase的MySQL租户中。2、使用datax配置至少一个表的MySQL到OceanBase的MySQL租户的离线同步。二、实验环境OB环境如下ip部署内容备注192.168.35.101obproxy,obclientob代理及客户端192.168.35.102observerob集群zone1节点192.168.3
【赵渝强老师】使用obd快速体验OceanBase
obd全称为OceanBaseDeployer，是OceanBase安装部署工具，通过命令行部署或白屏界面部署的方式，将复杂配置流程标准化，降低集群部署难度。命令行支持编辑配置文件，可以更加灵活的进行配置调整，适用于需要深度了解OceanBase的用户，有一定的使用门槛；白屏界面配置简单，通过页面的引导配置即可完成集群部署，适用于需要快速体验，构建标准环境的用户。在集群部署之外，obd还提供了包管
SQLShift 重大更新：Oracle→PostgreSQL 存储过程转换功能上线！
6月，SQLShift迎来重大版本更新！作为国内首个支持Oracle->OceanBase存储过程智能转换的工具，SQLShift在过去一个月收获了众多用户的认可。本次升级，我们聚焦“多元异构数据库SQL方言转换”与“用户体验革新”，带来三大核心功能升级，快来看看新版本有哪些亮点吧~https://www.bilibili.com/video/BV11ETxzDEUj/?aid=114630160
【赵渝强老师】OceanBase中的租户赵渝强老师 OceanBase oceanbase 数据库
租户是一个逻辑概念。在OceanBase数据库中，租户是资源分配的单位，是数据库对象管理和资源管理的基础，对于系统运维，尤其是对于云数据库的运维有着重要的影响。租户在一定程度上相当于传统数据库的"实例"概念。租户之间是完全隔离的。在数据安全方面，OceanBase数据库不允许跨租户的数据访问，以确保用户的数据资产没有被其他租户窃取的风险。在资源使用方面，OceanBase数据库表现为租户"独占"其
【赵渝强老师】OceanBase中的租户数据库oceanbase
租户是一个逻辑概念。在OceanBase数据库中，租户是资源分配的单位，是数据库对象管理和资源管理的基础，对于系统运维，尤其是对于云数据库的运维有着重要的影响。租户在一定程度上相当于传统数据库的"实例"概念。租户之间是完全隔离的。在数据安全方面，OceanBase数据库不允许跨租户的数据访问，以确保用户的数据资产没有被其他租户窃取的风险。在资源使用方面，OceanBase数据库表现为租户"独占"其
【赵渝强老师】OceanBase部署工具
OceanBase是一款开源的国产分布式关系型数据库。通过使用OceanBase提供的obd和OCP均可以部署OceanBase数据库集群，视频讲解如下：https://www.bilibili.com/video/BV17pJNzrETC/?aid=114523239356...下面分别进行介绍。一、使用obd部署OceanBaseobd全称为OceanBaseDeployer，是OceanBa
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl

BOSS 直聘：日增10亿数据的历史库，如何通过OceanBase节省70%存储成本？

你可能感兴趣的:(oceanbase)