SQL数据库和Hadoop 区别

SQL(结构化查询语言)是针对结构化数据设计的,而Hadoop最初的许多应用针对的是文本这种非结构化数据。

主要区别如下:
1. 用向外扩展代替向上扩展
Hadoop集群就是增加更多的机器。一个Hadoop集群的标配是十至数百台计算机。而不是专注于提高单台服务器的性能

2. 用键/值对代替关系表
SQL 针对结构化查询语句 是结构化数据,hadoop针对的是非结构化数据,文本形式
关系数据库是 有一定格式,而存放文本、图片和xml文件 则应该用键值对的方式

3. 用函数式编程(MapReduce)代替声明式查询(SQL)
hadoop读取出的数据,可以建立复杂的模型或者改变图片格式

4. 用离线批量处理代替在线处理
Hadoop是专为离线处理和大规模数据分析而设计的,它并不适合那种对几个记录随机读写的在线事务处理模式。

你可能感兴趣的:(hadoop)