Aerospike-Architecture系列之系统概述(System Overview)
Aerospike是一个分布式可扩展的NoSql数据库,为一下三个主要目标而构建:
最早发布于Proceedings of VLDB (Very Large Databases) in 2011,Aerospike架构包括三层:
Aerospike“智能客户端”为速度而设计。它被实现为一个开源可链接库用于C、c#、Java、PHP和Python开发,开发者可用自由按需发布或修改。客户端包括以下内容
这种架构减少了事务延迟,分流集群工作并消除开发者工作量。它确保在节点启停是应用不必重启。总之,它消除了对于额外集群管理服务器或代理服务器的需要。
Aerospike “shared nothing”架构被设计目的是可以可靠存储TB及数据并支持自动容错、复制、跨数据中心同步。本层实现线性扩展及ACID guarantees。分布层也旨在消除手工操作,实现系统所有集群管理功能的自动化。它包括3个模块:
Cluster Management Module用于追踪集群节点。关键算法是确定哪些节点是集群的一部分的Paxos-like一致投票过程。Aerospike实现专门的心跳检测(主动与被动),用于监控节点间的连通性。
当一个节点被添加或移除并且集群成员被确定,每个节点使用哈希算法讲主索引空间切分为数据切片并指派其拥有者。Data Migration Module(数据迁移模块)然后智能平衡跨集群中各节点的数据分布,并按照系统配置的复制因子确保每个数据块夸节点和夸数据中心复制。数据分割是纯粹算法,系统扩展无master,从而消除了在共享环境下的其他额外配置。
一旦启动集群,你可以在其他数据中心安装配置cross data-center replication的其他集群,如果集群崩溃,远端集群可以承接负载。
Aerospike以无模式数据模型存储键值对。组织数据的容器称作命名空间(namespaces),相当于RDBMS系统中库(databases
)的概念。在namespace中数据被细分为各个集合(set)(类似数据库中的表)和记录(records
)(类似数据库中的行)。在set中每个record有一个唯一的索引key以及一个或多个bin(类似数据库中的列)与之相关联。
为了快速访问,索引( primary keys 和 secondary keys)存储于内存,数据可以存储于内存或SSD硬盘。每个namespace可以分别配置,这样小的namespace可以存储在内存而大的namespace可以存储在SSD上。
在传统(非分布式)数据库系统中,安装完软件你需要设置schema、创建数据库和表。这与Aerospike数据库有很大不同。
在分布式数据库中,数据分布在集群中的各个服务器上。这意味着你不能在一台服务器上访问到所有数据。
使用Aerospike 数据库,将按如下步骤创建和管理数据库:
通过配置初始化数据库设置。按Aerospike的术语,当安装系统时一个库被称作一个namespace,集群中的每个节点必须指明每个namespace如何创建及副本数量。数据库讲在你重启服务的时候被创建
通过应用程序执行数据库操作。当应用程序第一次引用set和bin的时候数据库schema被创建,应用程序简单地将数据存储于指定的bin。在Aerospike数据库中,任务通常由DBA通过命令行程序执行。
根据需要修改配置文件。要更新namespace的配置参数,你需要动态修改或使用新的配置文件重启服务。
为满足性能和冗余需求,Aerospike需要规划和配置具体的节点数量,具体细节请参考 Capacity Planning
可以通过management utilities 和 monitoring tools管理和监控急群众的节点。当添加节点或因升级维护需要宕机时集群会自动配置。当节点发生故障集群会再平衡负载,以便达到对最终用户影响最小的目的。
一旦创建namespace,Aerospike提供了工具,允许您验证数据库存储数据正确性。在生产数据库,数据分布于集群当中。为了操作数据库你需要在应用程序中实例化智能客户端。智能终端是位置感知的,知道如何在集群中存储/检索数据而不影响性能。
Aerospike提供多种语言的API用于构建大数据应用程序。详情参考客户端手册
编译应用程序时,API函数库随智能终端被包含。为了在任何给定的时间确定数据位置,智能终端持续监控集群状态。智能客户端的位置感知技术确保在大多数情况下,可以再一跳之内检索到需要的数据。
当涉及到大数据应用时,例如基于web 的应用程序,情形如下:
智能客户端允许应用程序忽略数据分布细节。具体细节请参阅architecture guide