Greenplum数据库架构及主要的功能和优势

Greenplum数据库架构



               Greenplum数据库基本由PostgreSQL核心增强数据库实例组合并衔接成的数据库管理系统,即Greenplum数据在PostgreSQL基础上扩展开发,每个Greenplum数据库由1个master实例和2个或2个以上segment实例组成,客户端使用PostgreSQL规范与Master交互。以上的插图,展示Greenplum数据库实例由1个master和8 segement实例组成


        Master Host或Master实例就是GreenPlum数据服务端,服务端通过端口(默认端口5432)监听客户端连接。

        8个Segement部署在4个Segement Host,每个Segement Host是一台独立计算机含有操用系统、内存、CPU、存储、网络接口。与Master Host

类似,Segement Host也是独立计算机或虚拟机。
       每个Segement是数据库服务端分配并管理一部份数据存储,每个Segement在Segement Host采用独立端口监听。

       Master实例协调所有数据库实例、分布式请求Segement并且合并从Segement返回的结果。

Shared Nothing vs. Shared Disk

       GreenPlum数据库是Shared Nothing架构,因为每个Segement拥有自己的CPU、内存、硬盘来管理部份数据库。相反,基于共享磁盘的Shared Disk(或Shared Everything)架构的分布数据库管理系统拥有多个数据库服务实例管理单个数据库实例。Shared Nothing与Shared Disk架构有不同的优缺点。

    在磁盘共享系统中所有数据存储在本地数据库服务端,不需要通过网络发送数据到另一服务器执行连表查询;然而网络磁盘存储解决方案和软件

磁盘共享限制数据与数据库服务器数量添加到数据库集群。昂贵服务器和网络附属存储软件需要增加容量和保持可接受的查询响应时间。
    Shared Disk架构中, 每个CPU都有自己的内存, 但是所有CPU共享一组硬盘, 这些硬盘以SAN或者NAS的形式组织在一起。
    SD架构的缺点
       1. 连接CPU和硬盘驱动的连接会成为系统的瓶颈.
       2. 因为各个CPU都有自己的内存, 所以没有一个地方可以放置锁表(lock table)或者缓存池(buffer pool).

         为了设置锁, 只能在一个CPU上设置一个公共的锁管理器或者使用复杂的分布式锁协议. 当CPU数量增

         多 时, 上述两种两种方法的可扩展性都不是很好。
     Shared Nothing架构中, 每个CPU有自己的内存和硬盘. 数据按行被水平划分, 这样不同节点上存储的是不同行的数据. 每个节点只负责处理自己

硬盘上的数据. 每个节点有自己的锁表和缓存池, 这样就避免了复杂的分布式锁机制,SN的可扩展性非常好。

GreenPlum主要的功能和优势

SQL标准
通过SQL 2003 OLAP控制功能全面支持SQL-92和SQL-99。所有查询信息都并行地在整个系统上执行。

统一分析处理
可以在同一个并行数据流引擎上执行所有查询和分析(SQL、MapReduce、R等)操作,从而允许分析人员、开发人员和统计人员使用同一个基础构架进行数据分析。

可编程并行分析
为从事运算和统计工作的人员提供了更先进的并行分析功能,支持R、线性代数和机器学习功能。

数据库内压缩
采用了业内领先的压缩技术,提高性能的同时,显著地减少存储数据所需的空间。客户可以将所用空间减少3-10倍,并提高有效的I/O性能。

千万亿字节规模的数据加载操作
高性能的并行数据装载器可以在所有节点上同步执行操作,装载速度超过4.5TB/小时

随地访问数据
不管数据的位置、格式或存储介质如何,都可以从数据库向外部数据源执行查询操作,并行向数据库返回数据。

动态扩展
帮助公司对数据仓库进行便捷的小规模或大规模扩展,同时避免高成本的设备或SMP服务器升级。

工作负载管理
允许管理人员创建基于角色的资源队列,以便划分资源和管理系统负载。

集中管理
提供集群级管理工具和资源,帮助管理人员像管理一台服务器一样管理整个Greenplum数据库平台。

性能监控
通过图形化的性能监控功能,用户可以确定当前运行的情况和历史查询信息,并跟踪系统使用情况和资源信息。

支持索引
Greenplum支持二叉搜索树、哈希、位图、GiST和GIN,从而能够实现多种索引功能,提供给数据架构师实施优化设计所必需的工具。

工业标准接口
支持标准数据库接口(SQL、ODBC、JDBC、DBI),并且可以与市场上先进的商务智能和抽取/转换/加载(ETL)工具互相操作。


你可能感兴趣的:(greenplum,数据存储,数据库,架构)