hive内部表和外部表的区别

我们在使用数据仓库时,一般会公司会使用hive作为首选数据仓库而不是性能更高Teradata(数据仓库配备性能最高、最可靠的大规模并行处理 (MPP) 平台,能够高速处理海量数据,其性能远远高于Hive)呢,这就是hive的最大的优点一个是原生hadoop生态系统完全兼容第二个就是不要钱。关于数据仓库是什么我之前做过解释,这里就添加一个面试常问的问题,hive内部表和外部表有什么区别?

其核心就一个:默认创建的内部表是存储在hive数据仓库的指定目录下面的/user/hive/warehouse/test.db下面,而如果是外部表,那么默认直接落地在HDFS下的/user目录下
衍生出来的结果就是,内部表在删除时会删除元数据和表数据,而外部表不在hive目录下,只删除元数据

你可能感兴趣的:(大数据,hive,内部表,外部表)