MPP数据库

MPP数据库定义

MPP即大规模并行处理(Massively Parallel Processor )。 在数据库非共享集群中,每个节点都有独立的磁盘存储系统和内存系统,业务数据根据数据库模型和应用特点划分到各个节点上,每台数据节点通过专用网络或者商业通用网络互相连接,彼此协同计算,作为整体提供数据 库服务。非共享数据库集群有完全的可伸缩性、高可用、高性能、优秀的性价比、资源共享等优势。

MPP数据库_第1张图片

大规模并行处理(MPP)架构

MPP数据库_第2张图片


Vertica无共享MPP的特点

  • 无特殊节点
  • 所有节点对等
  • 可通过任意节点查询或加载数据
  • 实时加载与查询同步进行

目前常见的MPP架构数据库

1.GREENPLUM

2.DB2 DPF架构数据库

3.vertica mpp数据库

为什么选择MPP

• PB级别的分析需求

  • 传统数据库无法支持大规模集群与PB级别数据量
  • 性能受限
  • 扩展性受限
  • 成本高昂

• 软硬件一体机成本高昂、扩展受限

  • 生产扩容、测试、开发、容灾都需新购同型号一体机(机柜)
  • 跨代兼容性问题

• In-memory技术太贵而且不成熟

  • 内存成本高
  • TB级别以下,不适合大数据量

• Hadoop技术的先天不足

  • Hive等sql-on-hadoop性能太慢
  • SQL兼容性与支持不足
  • 数据安全性无法保证

大数据之惑面对越来越庞大的数据,企业如何利用好大数据值得思考,HADOOP,MPP,PPT在精彩,还是一步步的转变。


你可能感兴趣的:(Hadoop)