数据插入之insert into 和 insert overwrite

hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。通常hive包括以下四种数据导入方式:

(1)从本地文件系统中导入数据到Hive表;

(2)从HDFS上导入数据到Hive表;

(3)在创建表的时候通过从别的表中查询出相应的记录并插入到所创建的表中;

(4)从别的表中查询出相应的数据并导入到Hive表中。

两者的异同

insert into 与 insert overwrite 都可以向hive表中插入数据,但是insert into直接追加到表中数据的尾部,而insert overwrite会重写数据,既先进行删除,再写入。如果存在分区的情况,insert overwrite会只重写当前分区数据。

你可能感兴趣的:(数据插入之insert into 和 insert overwrite)