企业级数据仓库-理论知识

D3 AM

企业级数据仓库-理论知识_第1张图片
企业级数据仓库-理论知识_第2张图片
企业级数据仓库-理论知识_第3张图片
企业级数据仓库-理论知识_第4张图片

企业级数据仓库-理论知识_第5张图片
企业级数据仓库-理论知识_第6张图片

企业级数据仓库-理论知识_第7张图片
企业级数据仓库-理论知识_第8张图片
企业级数据仓库-理论知识_第9张图片

大数据中间件

  • Hive:将SQL转化成分布式Map/Reduce进行运算,也支持转换成Spark,需要单独安装Hive集群才能访问Spark,支持60%的SQL,延迟比较大。
  • SparkSQL:属于Spark生态圈,Hive on Sqark。
  • HBase: NoSQL,高并发读,适合表结构频繁变动。
  • Impala: MPP架构的数据查询引擎,低层兼容Hive、Spark SQL,快速交互查询服务。
  • HAWQ:是Hadoop上的移植产品,属于分布式批处理架构+MPP
  • TIDB: New SQL, MPP+SMP架构,底层No SQL存储
    企业级数据仓库-理论知识_第10张图片
    企业级数据仓库-理论知识_第11张图片

你可能感兴趣的:(数据仓库,大数据,数据分析,数据仓库)