Greenplum数据库(GPDB)总体架构

Greenplum数据库(GPDB)初识


1、特性

Greenplum数据库(GPDB),分布式数据库,数据仓库快速查询工具,特性:

1)GPDB完全支持ANSI SQL 2008标准和SQL OLAP 2003 扩展,从应用编程接口上讲,它支持ODBC和JDBC;和 NoSQL、NewSQL和Hadoop 等不支持 SQL不一样 ;

2)支持分布式事务,支持ACID;保证数据的强一致性。

3)分布式数据库,拥有良好的线性扩展能力。

我的一个简单理解就是:Hadoop和GPDB都是分布式集群(分布式存储和分布式计算),不同的是GPDB是支持SQL标准,或者说处理和存储结构化数据,适用OLAP和OLTP,适用数据集市和数据仓库的建设。


2、架构

Greenplum数据库(GPDB)总体架构_第1张图片


数据库由Master Severs和Segment Severs通过Interconnect互联组成。
1)Master主机负责:建立与客户端的连接和管理;SQL的解析并形成执行计划;执行计划向Segment的分发收集Segment的执行结果;Master不存储业务数据,只存储数据字典。  

2)Segment主机负责:业务数据的存储和存取;用户查询SQL的执行。 
Master类似于Hadoop平台的Namenode,而Segment则类似于Hadoop平台的Datanode。


 greenplum使用mpp架构。

Greenplum数据库(GPDB)总体架构_第2张图片

 greenplum部署体系

Greenplum数据库(GPDB)总体架构_第3张图片


3、Master节点:

Greenplum数据库(GPDB)总体架构_第4张图片


master node高可用,类似于hadoop的namenode和second namenode,实现主备的高可用。

Greenplum数据库(GPDB)总体架构_第5张图片


4、Segments节点

Greenplum数据库(GPDB)总体架构_第6张图片


5、管理

1)数据装载和性能监控

Greenplum数据库(GPDB)总体架构_第7张图片


2)并行备份和恢复

Greenplum数据库(GPDB)总体架构_第8张图片


3)数据访问流程

Greenplum数据库(GPDB)总体架构_第9张图片


4)查询流程:分查询创建和查询分发,计算后将结果返回

Greenplum数据库(GPDB)总体架构_第10张图片


5)分布存储

Greenplum数据库(GPDB)总体架构_第11张图片

数据的分布,分为hash分布和随机分布两种。

Greenplum数据库(GPDB)总体架构_第12张图片

在线数据分布:均匀分布

Greenplum数据库(GPDB)总体架构_第13张图片


 

你可能感兴趣的:(大数据,分布式,数据库)