20160509 GreenPlum1 简介

   1 数据管理解决方案:Teradate、GreenPlum、Hadoop Hive、Oracle Exadate、IBM Netteza等

    2 使用GP的公司:纳斯达克、纽约证券交易所、Skype.FOX 、T-Mobile,中国的企业有:中信实业银行、东方航空公司、阿里巴巴、华泰保险、中国远洋

 

    3 数据库类型:

                  OLTP(On-Line Transaction Processing)联机事务处理,也即为生产系统,时间驱动的,面向应用的,涉及的数据量较小,对响应时间要求较高,用户数量多,主要是操作人员,数据库的各种操作基于索引进行。

                  OLAP(On-Line Analytical Processing)联机分析处理,本身不产生数据,数据来源于生产系统中的操作数据,基于查询的分析系统,复杂查询常使用多表联结、全表扫描,响应时间与查询的东西有关,用户少,主要为从业者和管理者,业务问题不固定所以数据库的各种操作不能完全基于索引。

   

   4 GP是面向对象的的关系型数据库集群,是由很多独立的数据库服务组合成的逻辑数据库。

   5 架构:

     GP的架构是Shared-Nothing架构,这是一个分布式的架构,节点都是独立的,有很多数据节点Segment host和控制节点Master Host,每个数据节点能运行很多数据库。

     GP的优点就是能高效的处理IO数据吞吐和并发计算,需要存储的数据进入数据库时,会先进行数据分布的处理工作,将一个表中的数据平均分到每个节点,并为每个表制定一个分发列distribute Column ,之后根据Hash来分布数据。这样就能充分发挥每个节点处理IO的能力。这个过程中,控制节点就不承担计算任务了,只负责必要的逻辑控制和客户端交互,这样IO瓶颈的问题就可以解决。所以GP处理大数据量还是很有优势的。

 

你可能感兴趣的:(20160509 GreenPlum1 简介)