一篇文章让你读懂SQL数据库和Hadoop

SQL(结构化查询语言)是针对结构化数据设计的,而Hadoop最初的许多应用针对的是文本这种非结构化数据。

主要区别如下:

  1. 用向外扩展代替向上扩展

Hadoop集群就是增加更多的机器。一个Hadoop集群的标配是十至数百台计算机。而不是专注于提高单台服务器的性能

  1. 用键/值对代替关系表

SQL 针对结构化查询语句 是结构化数据,hadoop针对的是非结构化数据,文本形式

关系数据库是 有一定格式,而存放文本、图片和xml文件 则应该用键值对的方式

  1. 用函数式编程(MapReduce)代替声明式查询(SQL)

hadoop读取出的数据,可以建立复杂的模型或者改变图片格式

  1. 用离线批量处理代替在线处理

Hadoop是专为离线处理和大规模数据分析而设计的,它并不适合那种对几个记录随机读写的在线事务处理模式。
想了解或者学习的小伙伴可以多多关注 想获取资料的可以加QQ群863529330

你可能感兴趣的:(一篇文章让你读懂SQL数据库和Hadoop)