Hadoop和RDBMS的混合系统介绍

现在大数据概念被时常提起,社会各界对其关注度越来越高。往往越是火热的东西,人们越容易忽略它的本质。在 slides 中,我首先按照自己的理解,简单的理顺数据处理领域的发展历程。之后,落脚点是两个比较有代表性的混合的分布式系统:HadoopDB 和微软的 Polybase。由于缺乏实战经验,很多东西由各方论文和博文中得到,有不恰当的地方,欢迎大家拍砖讨论;)

slides 的提纲如下:

提纲

背景

  • RDBMS 的出现
  • 大数据时代到来
  • NoSQL 技术
  • 新时代的挑战

HadoopDB

  • PB 级数据分析
  • HadoopDB 是什么
  • 框架和组件介绍
  • 示例
  • 总结

Polybase

  • Polybase 总览
  • PDW 结构
  • Polybase 的实现
  • 性能分析

slides 在线展示:

slides 下载: 请戳这里

你可能感兴趣的:(hadoop)