Hive与传统数据库的差异

hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。


1.查询语言。专门针对Hive的特性设计了类SQL的查询语言HQL。。
2.数据存储。传统数据库则可以将数据保存在块设备或者本地文件系统中。Hive 是建立在 Hadoop之上的,所有 Hive的数据都是存储在 HDFS中的。
3.数据格式。传统数据库数据格式由系统决定,而Hive 中没有定义专门的数据格式,数据格式可以由用户指定。
4.数据更改。传统数据库中的数据通常是需要经常进行修改的。而Hive中不支持对数据的改写和添加,所有的数据都是在加载的时候中确定好的。
5.执行引擎。传统数据库通常有自己的执行引擎。Hive 中大多数查询的执行是通过 Hadoop提供的 MapReduce来实现的。
6.特性。传统数据库执行延迟低、可扩展性低、数据规模小,而Hive执行延迟高、可扩展性高、数据规模大

你可能感兴趣的:(hive,数据仓库,hadoop)