「拓数派(OpenPie)2022 发布会实录 」PieCloudDB Database 分布式引擎

10 月 24 日程序员节,拓数派发布了云原生数据库 PieCloudDB 社区版与商业版。本文整理自拓数派「OpenPie」2022 发布会的演讲,将从 PieCloudDB Database 的计算、存储、事务三个方面来介绍分布式引擎模块。

图片

计算

首先为大家介绍的方面是计算。PieCloudDB 通过重新打造云上的数据库内核,突破了 PC 时代计算平台的限制,实现云上存算分离。作为一款分布式数据库,能够处理 PB 级海量数据。其计算层主要具备以下特点:

  • eMPP
    PiecloudDB 实现了 eMPP 引擎。eMPP 全称是 elastic Massive Parallel Processing (弹性大规模并行处理),也就是将一个单一计算任务在大量独立的计算机上并行执行,利用大量计算资源来进行分布式加速计算。
  • 多租户、多集群
    作为一款云原生数据库,PieCloudDB 支持多租户模式,租户可以按需创建任意多个计算集群。
  • 弹性伸缩
    PieCloudDB 采用了存算分离的架构设计,计算资源可以独立于存储进行弹性伸缩。PieCloudDB 的计算能力支持三个维度的弹性伸缩:集群大小、集群类型和集群数量。
    用户可以根据需求,实时调整集群大小。可以根据不同的业务需求,创建不同类型的集群。例如,财务部可以单独创建用于财务数据计算的集群; 销售部可以创建用于销售数据计算的集群; 数据工程团队可以创建专门用于数据导入和数据清洗的集群。此外,用户可以创建任意数量的计算集群,按照需求动态增减集群数量。
  • 隔离性
    在传统的 MPP 数据库下,所有的用户共享同一个计算集群,不同部门、不同业务经常会相互竞争计算资源,用户体验难以得到保障。在 PieCloudDB 中,不同租户的计算资源可以做到完全隔离,互相不影响。由于用户可以为不同负载创建不同集群,因此可以做到不同负载之间不会有计算资源竞争。
  • 高可用
    PieCloudDB 在架构上采取了存算分离的设计,计算层可以做到完全无状态,当机器和集群出现故障时,可以实时将计算任务转移到新的机器或集群上,提供持续不间断的服务。
  • 可按使用量付费
    PieCloudDB 支持按使用量付费的模式,用户只为使用了的计算资源付费,在完成计算任务后,可以选择关掉集群,当集群关掉后,不再产生任何计算费用。
  • 无限算力
    在公有云上,PieCloudDB 利用云基础设施在几分钟或几秒钟内按需提供近乎无限的计算资源。客户只需为其使用的资源付费,从而动态地支持任何规模的用户和工作负载而不影响性能。

存储

PieCloudDB 分布式引擎的第二个方面是存储。PieCloudDB 存算分离,PieCloudDB 所有的用户数据都存储在分布式对象存储中。PieCloudDB 的存储具有以下特点:

  • 多租户隔离
    在 PieCloudDB 的多租户机制下,不同租户的数据和元数据是隔离的,每个租户只能看到自己的数据,无法访问到其它租户的数据。
  • 容量和带宽独立于计算伸缩
    PieCloudDB 的存算分离架构支持存储资源与计算资源的独立伸缩。存储资源主要分为两部分:存储容量和访问带宽。由于存算分离的特性,PieCloudDB 的存储容量和访问带宽都能独立于计算进行伸缩。
  • 按使用量付费
    传统数据仓库的模式下,客户需要提前购买充足的存储资源,用以应对未来一定时期的存储需求,因此难免有一定的程度的资源闲置而导致的浪费。在公有云上,PieCloudDB 支持用户按数据存储量和访问量来进行付费,使用了多少支付多少费用,不存在任何资源浪费的情况,相比于传统数据库,具有更高的性价比。
  • 高可用 / 可靠存储
    传统的数据仓库,客户必须用备份和数据恢复工具来保护自己的数据。作为一款云原生数据库, PieCloudDB 将数据的高可靠和高可用作为服务的一部分,支持跨多数据中心、多个云产商进行复制,数据的可用性和可靠性高于数据中心甚至云产商。
  • 可信单一数据源
    传统数据仓库,不同部门或业务通过数据复制来实现共享数据,这种模式除了引入了额外的存储成本,除此之外,由于数据存在多个副本,可能会出现数据副本之间不一致性的情况,从而导致数据的可信性降低。
    PiecloudDB 采用了存算分离架构,用户全局只需要存储一份数据,通过共享存储来实现数据共享,避免拷贝和维护多个数据副本,彻底摆脱数据不一致的可能性。

事务

PieCloudDB 存储引擎的第三个部分事务特性。PieCloudDB 的事务特性主要包括 ACID、扩展性、隔离性、和容错性。

PieCloudDB 支持完整的 ACID 语义。ACID 由四个属性组成,即原子性 (Atomicity)、一致性 (Consitency)、隔离性 (Isolation)、持久性 (Durability)。

原子性指的事是一个事务(transaction)中的所有操作,要么全部完成,要么全部不完成,不会结束在中间某个环节。事务在执行过程中发生错误,会被回滚(Rollback)到事务开始前的状态,就像这个事务从来没有执行过一样。

原子性是一种强大的容错语义,系统状态要么保持不变,要么进入到下一个状态,而不会处于一个任意的中间状态。作为一个数据存储系统,如果缺乏对多个数据项进行操作的原子性语义,对数据进行变更操作过程中发生任意异常,都会导致数据损坏。

一致性保证当一个事务开始和结束时,数据处于一致的状态。例如,在一个将资金从一个账户转移到另一个账户的应用程序中,一致性属性确保两个账户中的资金总值在每次交易开始和结束时是相同的。

隔离性主要用于对并发数据处理进行控制,使对数据的读写保持正确的时序(因果)关系。作为一个数据存储系统,如果缺乏对数据并发访问的控制,会容易导致数据损坏和因果关系的破坏。 PieCloudDB 目前支持读提交 (Read Committed) 和可重复读(Repeatable Read)两种隔离级别。

持久性保证在一个事务成功完成后,对数据的改变会持续下去,即使在系统故障的情况下也不会被撤销。例如,在一个将资金从一个账户转移到另一个账户的应用程序中,持久性属性确保对每个账户的更改不会被逆转。 Pie CloudDB 还提供了比传统数据库事务更强的持久性,实现了 Time Travelling 的机制,能够在指定的时期内的任何时间点访问历史数据,即使是那些已经更改或删除的数据。

PieCloudDB 在云上,对计算模型以更低成本提供指数级的存储和计算资源,帮助企业的业务模型发现新洞察或者提高精准度,从而建立竞争壁垒,实现数据价值最大化。


关于 PieCloudDB

PieCloudDB 是一款全新 eMPP 分布式技术的云原生分析型数据库。通过重新打造云上的数据库内核,突破了 PC 时代计算平台的限制,实现云上存算分离。旨在为企业提供包含实时处理、秒级扩缩容、弹性计算、集成数据分析等强大功能的云上数据存储和计算引擎。在云上,计算资源可按需启动,对计算模型以更低成本提供指数级的存储和计算资源,帮助企业的业务模型发现新洞察或者提高精准度,从而建立竞争壁垒。目前,PieCloudDB 在金融,医疗,汽车及制造等行业积累了一批种子用户,产品备受业界及用户的高度关注及认可。

你可能感兴趣的:(数据库云原生分布式)