Greenplum架构

架构概述

  • 基于PostgreSQL的分布式数据库,采用shared-nothing架构、主机、操作系统、内存、存储都是自我控制的,不存在共享
  • 采用了MPP,每个SMP节点运行自己的操作系统、数据库等,每个节点内的CPU不能访问另一个节点的内存,节点之间的信息交互是通过节点互联网络实现的(数据重分配)
  • master hostsegment hostinterconnect三大部分组成
  • 各个节点均可配置镜像节点,当主节点不可用时,自动切换至镜像节点,当主节点恢复并启动后,将自动同步变更,确保数据不丢失,实现数据库系统的高可用
  • 数据库中所有的表都是分布式的,每个segment会存放相应的数据片段,根据用户指定的hash key对表进行hash数据分布或者随机数据分布,或者复制表分布。当需要进行数据分析时,涉及到的segment同时工作,提升计算效率
  • 进行表关联或者group by时,当关联键与分布键不同时,即关联的相同值的行数据分布在不同的segment实例上,需要涉及到数据表的跨库关联

你可能感兴趣的:(数据库扫盲,架构)